Tetra集群手機語音處理方法

時間：2013-12-24　來源：中國集群通信網(wǎng)　作者：陳曉亮　點擊：次

主頁（http://www.130131.com）：Tetra集群手機語音處理方法

權利要求(9)

1.一種TETRA集群手機語音處理方法，其特征在于包括以下步驟： 1)活動語音檢測，對TETRA語音信號按幀進行閾值判斷，按照語音幀的能量和語音幀的過零率進行雙參數(shù)判斷，采用對能量決策規(guī)則和過零率決策規(guī)則給予不同加權權重的非均勻加權決策規(guī)則； 2)若判斷該語音幀為活動語音，對該語音幀的能量幅度進行調整； 3)若判斷該語音幀為非活動語音，則用預存儲的舒適背景音覆蓋該語音幀。

2. 根據(jù)權利要求1所述的TETRA集群手機語音處理方法，其特征在于能量決策規(guī)則包括以下步驟：計算語音信號的能量，統(tǒng)計一個語音幀中全部240個數(shù)據(jù)的能量幅度值；設置活動語音檢測用的能量門限值，包括能量上限值和能量下限值，對計算出的語音信號的能量進行閾值判斷；當語音幀信號的能量大于能量上限值時，判定該語音幀為活動語音，當語音幀信號的能量小于能量下限值時，判定該語音幀為非活動語音，當語音幀信號的能量介于能量上限值和能量下限值二者之間時，狀態(tài)未定。

3. 根據(jù)權利要求2所述的TETRA集群手機語音處理方法，其特征在于語音信號幅度值采用Q15量化。

4. 根據(jù)權利要求1所述的TETRA集群手機語音處理方法，其特征在于過零率決策規(guī)則包括以下步驟：計算語音信號的過零率ZCR值，統(tǒng)計一個語音幀中全部240個數(shù)據(jù)的ZCR值；設置活動語音檢測用的過零率門限值，包括過零率上限值和過零率下限值，對計算出的語音信號的過零率進行閾值判斷；當語音幀信號的過零率大于過零率上限值時，判定該語音幀為非活動語音，當語音幀信號的過零率小于過零率下限值時，判定該語音幀為活動語音，當語音幀的過零率介于過零率上限值和過零率下限值二者之間時，狀態(tài)未定。

5. 根據(jù)權利要求4所述的TETRA集群手機語音處理方法，其特征在于過零率上限值的范圍是16-30，過零率下限值的范圍是8-10。

6. 根據(jù)權利要求1一5任一項權利要求所述的TETRA集群手機語音處理方法，其特征在于活動語音檢測參數(shù)數(shù)值是語音幀的能量決策規(guī)則輸出結果乘以能量決策的權重與過零率決策規(guī)則輸出結果乘以過零率決策的權重之和，若該語音幀的活動語音檢測參數(shù)數(shù)值大于或等于上限值，則判斷是活動語音，若該語音幀的活動語音檢測參數(shù)數(shù)值小于下限值，則判斷是非活動語音。

7. 根據(jù)權利要求1所述的TETRA集群手機語音處理方法，其特征在于非均勻加權決策規(guī)則中能量決策的權重大于過零率決策的權重。

8. 根據(jù)權利要求1所述的TETRA集群手機語音處理方法，其特征在于對活動語音信號數(shù)據(jù)的能量幅度進行調整包括如下步驟：計算當前活動語音幀的能量幅度值；設置能量門限值，包括門限值上限和門限值下限，對計算出的活動語音幀的能量幅度進行判斷；如果活動語音幀的能量幅度值大于門限值上限，則按照設定的語音能量減幅系數(shù)來降低此幀語音數(shù)據(jù)中各個采樣值的能量幅度；如果活動語音幀的能量幅度值小于門限值下限，則按照設定的語音能量增加系數(shù)來增加此幀語音數(shù)據(jù)中各個采樣值的能量幅度；如果活動語音幀的能量幅度值介于門限值上限和門限值下限之間，能量幅度值不變。

9. 根據(jù)權利要求8所述的TETRA集群手機語音處理方法，其特征在于語音處理方法的位置在語音編碼預處理階段，進行語音信號數(shù)據(jù)能量幅度調整的同時還要調整麥克的增益，如果語音信號能量的幅度大于門限值上限，則對語音信號進行減幅處理的同時，減小麥克的增益；如果能量的幅度小于門限值下限，則對語音信號進行增幅處理的同時，增大麥克的增益；其他情況麥克增益保持不變。

說明

TETRA集群手機語音處理方法

技術領域

本發(fā)明屬于集群通信終端技術領域，更具體地說涉及一種對TETRA集群手機的語音數(shù)據(jù)進行處理的技術領域。背景技術

集群通信是實現(xiàn)移動中指揮調度通信最有效的手段之一，也是指揮調度最重要的通信方式之一。它是一種共享資源、分擔費用、向用戶提供優(yōu)良服務的多用途、高效能的移動通信系統(tǒng)，集群通信系統(tǒng)隨著技術的日趨成熟，應用越來越廣泛，可以應用于智能交通、各種自然災害的救險行動、機場民航、城市地鐵等的指揮系統(tǒng)。

TETRA是一個強大的多功能數(shù)字集群移動通信系列標準，ETSI組織制定了 TETRA 標準的詳細內容，其中的ETS 300 395-2規(guī)定了TETRA語音編解碼的標準。上述標準并沒有對語音信號的活動語音檢測、能量調整等方面作出規(guī)定，

目前的TETRA集群手機存在的缺點，在于按照標準實現(xiàn)的系統(tǒng)對麥克采樣獲得的語音信號數(shù)據(jù)并不進行優(yōu)化，直接對語音信號的原始數(shù)據(jù)進行處理，造成了語音能量起伏過大的情況：當外界語音能量高時，容易造成語音信號能量過高而尖銳刺耳，當外界的語音能量低時，則容易造成語音信號能量過低而聽不清。

發(fā)明內容

本發(fā)明的目的就是為了解決目前TETRA集群手機的語音能量起伏過大的缺點，提供一種對TETRA集群手機的語音數(shù)據(jù)進行處理的方法，能夠獲得一種舒適的TETRA語音，本方法可以在TETRA語音編碼的預處理階段或者語音解碼的后處理階段或者預處理和后處理階段都進行處理，對語音信號數(shù)據(jù)進行優(yōu)化，使優(yōu)化后的語音在TETRA手機用戶通話時，聽覺上達到舒適的效果。在不違背TETRA語音編解碼標準的情況下很大程度上提高了語音感知上的舒適度。

為了實現(xiàn)上述目的，本發(fā)明包括以下步驟：

1、活動語音檢測，對TETRA語音信號按幀進行閾值判斷，按照語音幀的能量和語音幀的過零率進行雙參數(shù)判斷，采用對能量決策規(guī)則和過零率決策規(guī)則給予不同加權權重的非均勻加權決策規(guī)則；

2、若判斷該語音幀為活動語音，對該語音幀的能量幅度進行調整；3、若判斷該語音幀為非活動語音，則用預存儲的舒適背景音覆蓋該語音幀。其中能量決策規(guī)則包括以下步驟：

計算語音信號的能量，統(tǒng)計一個語音幀中全部240個數(shù)據(jù)的能量幅度值；

設置活動語音檢測用的能量門限值，包括能量上限值和能量下限值，對計算出的

語音信號的能量進行閾值判斷；

當語音幀信號的能量大于能量上限值時，判定該語音幀為活動語音，當語音幀信號的能量小于能量下限值時，判定該語音幀為非活動語音，當語音幀信號的能量介于能量上限值和能量下限值二者之間時，狀態(tài)未定。語音信號幅度值采用Q15量化。

其中過零率決策規(guī)則包括以下步驟：

計算語音信號的過零率ZCR值，統(tǒng)計一個語音幀中全部240個數(shù)據(jù)的ZCR值；設置活動語音檢測用的過零率門限值，包括過零率上限值和過零率下限值，對計算出的語音信號的過零率進行閾值判斷；

當語音幀信號的過零率大于過零率上限值時，判定該語音幀為非活動語音，當語音幀信號的過零率小于過零率下限值時，判定該語音幀為活動語音，當語音幀的過零率介于過零率上限值和過零率下限值二者之間時，狀態(tài)未定。

過零率上限制的范圍是16-30，過零率下限值的范圍是8-10。非均勻加權決策規(guī)則中能量決策的權重大于過零率決策的權重。步驟2中對活動語音信號數(shù)據(jù)的能量幅度進行調整包括如下步驟：計算當前活動語音幀的能量幅度值；

設置能量門限值，包括門限值上限和門限值下限，對計算出的活動語音幀的能量幅度進行判斷；

如果活動語音幀的能量幅度值大于門限值上限，則按照設定的語音能量減幅系數(shù) 來降低此幀語音數(shù)據(jù)中各個采樣值的能量幅度；

如果活動語音幀的能量幅度值小于門限值下限，則按照設定的語音能量增加系數(shù) 來增加此幀語音數(shù)據(jù)中各個采樣值的能量幅度；

如果活動語音幀的能量幅度值介于門限值上限和門限值下限之間，能量幅度值不變。

在TETRA語音編碼的預處理階段采用語音處理方法，在步驟2中，對語音信號數(shù) 據(jù)能量幅度進行調整的同時，優(yōu)選進行調整麥克的增益。

如果語音信號能量的幅度大于門限值上限，則對語音信號進行減幅處理的同時，減小麥克的增益；如果能量的幅度小于門限值下限，則對語音信號進行增幅處理的同時，增大麥克的增益；其他情況麥克增益保持不變。

舒適背景音的構造，根據(jù)本方法所采用的硬件和一般通話環(huán)境通過試驗獲得一個舒適背景音樣本，用此提前獲得的背景音數(shù)據(jù)填充數(shù)據(jù)緩沖區(qū)。

在TETRA語音編解碼處理中，在語音編碼的預處理階段或者語音解碼的后處理階段或者在語音編碼的預處理階段和語音解碼的后處理階段進行語音的能量調整和舒適背景音的產(chǎn)生。

采用本發(fā)明中的語音處理方法，能夠實現(xiàn)語音信號為活動語音時語音柔和，為非活動語音時聽到舒適的背景音的效果，提高了 TETRA集群手機通話時用戶聽覺上的舒

適度。附圖說明

下面結合附圖和實施例對本發(fā)明作進一步的描述。圖1是本發(fā)明中的硬件連接方框圖；圖2是本發(fā)明中語音數(shù)據(jù)處理的流程圖；圖3是非均勻加權決策規(guī)則的語音活動檢測圖。具體實施方式

如圖1所示，在TETRA手機中，語音信息經(jīng)麥克風或者帶麥克的耳機傳遞給音頻聲碼器CODEC,聲碼器把模擬的語音信號轉換成數(shù)字信號經(jīng)串行總線傳輸?shù)轿⑻幚砥?CPU中，并在DSP芯片中進行語音數(shù)字信號的編碼處理。播放聲音時，數(shù)字語音信號經(jīng)串行總線傳遞到微處理器CPU中，并在DSP芯片中進行數(shù)字解碼及語音處理，然后把處理后的數(shù)字語音信號在音頻聲碼器中轉換成模擬信號，經(jīng)功率放大器放大后，通過揚聲器輸出聲音信息。其中微處理器CPU負責控制、調度系統(tǒng)運行。

由于TETRA語音編解碼標準部分中沒有對活動語音檢測和能量幅度調整等處理作出規(guī)定，而目前TETRA手機沒有進行語音優(yōu)化的處理，按照標準實現(xiàn)的系統(tǒng)的語音效果比較差，所以本發(fā)明的技術方案是在TETRA語音編碼的預處理或語音解碼的后處理中對語音信號數(shù)據(jù)進行優(yōu)化處理，使處理后的語音在TETRA手機用戶通話時，聽覺上達到舒適的效果。

如圖2所示，首先對語音信號進行活動語音檢測，按照檢測的結果對不同的情況

進行相關的處理，如果檢測為活動語音，則調整語音能量的幅度；如果檢測為非活動

語音，則發(fā)送預構建的舒適語音信號，同時調整麥克的采樣增益，使得語音的幅度始

終處于一個穩(wěn)定的范圍，在原始語音數(shù)據(jù)的能量幅度高時語音不刺耳，語音能量幅度低時語音清晰，獲得舒適的語音；舒適語音處理在DSP芯片上實現(xiàn)，系統(tǒng)負載低，計算時間短，實用性高。

對要處理的語音信號數(shù)據(jù)進行活動語音檢測處理中，由于TETRA集群手機實時通信的特點，本方案中對于是否活動語音的判斷是按幀進行的，即對TETRA語音信號按幀對全部240個數(shù)據(jù)進行閾值判斷，按照情況將整個幀判定為活動語音或者非活動語

如圖3所示是非均勻加權決策規(guī)則的語音活動檢測，活動語音檢測采用能量、過零率雙參數(shù)方法進行判斷，包括能量決策規(guī)則和過零率決策規(guī)則，其中能量決策規(guī)則

的處理方法步驟描述如下：

l-l、計算語音信號的能量£:

計算能量^時，統(tǒng)計一個語音幀的全部240個能量信號的幅度值，令目前的信號為4"]， " = 0，2，3•••••，239，則以dB為單位，語音能量的計算方法按照理論應該如下計

£ = 101og

239

!>[i])2

(dB)

為了便于在DSP上實現(xiàn)，在本方法中其能量的計算方法修正如下：

239

1-2、活動語音的能量閾值判斷：

選取出兩個作為語音活動檢測(VAD)判斷用的能量門限值，第一個為能量上限值 £„，第二個為能量下限值^。當輸入語音幀信號能量大于此上限值i^時，將此語音

幀判定為活動語音，當輸入語音幀信號的能量小于此下限值A時，將此語音幀判定

為非活動語音。令輸出的結果為/£， /£值的計算方法總結成如下公式：「1,當£

0.5,其他

能量門限值&和A的設置根據(jù)語音信號幅度值的量化方式不同而不同，當語音

信號幅度值的量化采用Q15量化時，£(/可在0800 OOOOh-lOOO OOOOh范圍內根據(jù)實

7際環(huán)境設置，五i則可在0600 OOOOh-0400 OOOOh范圍內根據(jù)實際環(huán)境設置。

而過零率決策規(guī)則的處理方法步驟描述如下： 2-1、計算過零率ZCR:

計算過零率ZCR值時，取語音幀的全部240個數(shù)據(jù)進行計算，如下式所示:

<formula>formula see original document page 8</formula>

其中函數(shù)"gra(X[i])表示如下：

<formula>formula see original document page 8</formula>

2-2、活動語音的過零率閾值判斷；

選取出兩個活動語音判斷用的過零率門限值，第一個為過零率下限值z,，當輸

入語音幀信號的過零率小于此下限值時，將此語音幀判定為活動語音；第二個為過零率上限值2„，當輸入語音幀信號的過零率大于此上限值時，將此語音幀判定為非活

動語音。令過零率決策規(guī)則輸出之結果為/^a，厶^的計算方法總結成如下公式:

'1,當ZCR〉Z:

•/^cr 一

0,當ZCR〈Zz 0.5 ，其他

由于過零率受硬件環(huán)境的影響，其門限值需要根據(jù)實際試驗情況設置不同的數(shù) 值，一般情況K，其參數(shù)可在如下范圍內選�。哼^零率上限制Z。.的范圍在16-30之

間，過零率下限值Z,的范圍在8-10之間。

活動語音判斷規(guī)則采用能量、過零率雙參數(shù)方法，具體描述如下：

活動語音檢測判斷采用非均勻加權決策規(guī)則。非均勻加權決策規(guī)則的語音活動檢測方法在找出上述兩種決策規(guī)則的輸出值后，給予其不同加權權重，得到活動語音檢

測參數(shù)F。上述情況可用如下的方程式表示：

其中C^、 "^s分別為能量決策規(guī)則和過零率決策規(guī)則輸出值的加權權重。若最

后計算所得的活動語音檢測參數(shù)數(shù)值F大于或等于上門限值i^時，則判斷此幀語音數(shù)據(jù)為活動語音；若計算所得的數(shù)值尸小于下門限值Ft,時，則判斷此幀語音數(shù)據(jù)為非活動語音；位于二者之間時語音幀的狀態(tài)未定。

活動語音檢測的能量決策規(guī)則和過零率決策規(guī)則的加權權重值根據(jù)具體的手機硬件按照試驗結果進行確定，來確定不同參數(shù)在活動語音檢測中的作用，并且根據(jù)所取值來選定活動語音判定時的上下門限值。一般情況下"£、 ",^可采用非均勻權重

進行計算，即"£大于《20;;而i^的選定范圍則可以在0.5-1.0內，i^的選定范圍則

可以在0-0. 5內，具體取值根據(jù)硬件情況試驗確定。

活動語音檢測判斷后，按照活動語音檢測的判定結果再分別進行不同的處理。其中語音能量信號幅度的調整步驟：

當判定此幀數(shù)據(jù)為活動語音時，對語音信號數(shù)據(jù)能量幅度進行調整。計算當前幀

的能量幅度值i?，與能量門限值i?，相比較，如果當前幀的能量幅度值E大于門限值上限，則按照設定的語音能量減幅系數(shù)/^來降低此幀語音數(shù)據(jù)的各個采樣值的能量幅度；如果當前幀的能量幅度值^小于下限門限值五皿，則按照設定的語音能量增加系數(shù)厶£來增加此幀語音數(shù)據(jù)的各個采樣值的能量幅度；其他情況能量幅度值不變。其計算公式如下：

4"] = , 4"]*乂恥，當五<五肌

x[w],其它情況

對麥克增益的調整步驟：

因為TETRA集群手機中每幀語音的時間長度為30ms，而語音信號具有短時間內的平穩(wěn)性，可以認為在很短的時間間隔內，相鄰兩幀語音信號的能量幅度值是一致的，因此在調整語音數(shù)據(jù)信號能量的同時要調整麥克的增益。麥克的調整規(guī)則如下：增大語音信號能量幅度的同時增大麥克的增益，減小語音信號能量幅度的同時減小麥克的增益；能量幅度值不變時麥克的增益也不變。

當判定當前語音幀為靜音時，從語音的連續(xù)性和通話方的感受考慮，需用預先構

建的舒適背景音數(shù)據(jù)填寫當前語音幀，使通話方不致感到語音間隙之間的突兀和對通

話方活動通話進行提示。因為受使用的硬件環(huán)境和語音環(huán)境的影響比較大，舒適背景

音的構建方式采用試驗的方法獲得，根據(jù)使用環(huán)境的不同語音數(shù)據(jù)的內容存在差異。

當判定當前語音幀的狀態(tài)未定時，不對語音幀進行處理。

"=0,2,3..…,239本發(fā)明中的語音處理方法使用的位置可以在語音編碼的預處理階段或者語音解碼的后處理階段，由于TETRA編解碼階段本身的運算量的不同，后處理階段的計算量較小，所以放在語音處理的后處理階段對系統(tǒng)的影響較小，是一個優(yōu)選的方案。

(中國集群通信網(wǎng) | 責任編輯：陳曉亮)