主頁(http://www.130131.com):Tetra集群手機(jī)語音處理方法
權(quán)利要求(9)
2. 根據(jù)權(quán)利要求1所述的TETRA集群手機(jī)語音處理方法,其特征在于能量決策規(guī)則包括以下步驟:計(jì)算語音信號的能量,統(tǒng)計(jì)一個語音幀中全部240個數(shù)據(jù)的能量幅度值;設(shè)置活動語音檢測用的能量門限值,包括能量上限值和能量下限值,對計(jì)算出的語音信號的能量進(jìn)行閾值判斷;當(dāng)語音幀信號的能量大于能量上限值時,判定該語音幀為活動語音,當(dāng)語音幀信號的能量小于能量下限值時,判定該語音幀為非活動語音,當(dāng)語音幀信號的能量介于能量上限值和能量下限值二者之間時,狀態(tài)未定。
3. 根據(jù)權(quán)利要求2所述的TETRA集群手機(jī)語音處理方法,其特征在于語音信號幅度值采用Q15量化。
4. 根據(jù)權(quán)利要求1所述的TETRA集群手機(jī)語音處理方法,其特征在于過零率決策規(guī)則包括以下步驟:計(jì)算語音信號的過零率ZCR值,統(tǒng)計(jì)一個語音幀中全部240個數(shù)據(jù)的ZCR值;設(shè)置活動語音檢測用的過零率門限值,包括過零率上限值和過零率下限值,對計(jì)算出的語音信號的過零率進(jìn)行閾值判斷;當(dāng)語音幀信號的過零率大于過零率上限值時,判定該語音幀為非活動語音,當(dāng)語音幀信號的過零率小于過零率下限值時,判定該語音幀為活動語音,當(dāng)語音幀的過零率介于過零率上限值和過零率下限值二者之間時,狀態(tài)未定。
5. 根據(jù)權(quán)利要求4所述的TETRA集群手機(jī)語音處理方法,其特征在于過零率上限值的范圍是16-30,過零率下限值的范圍是8-10。
6. 根據(jù)權(quán)利要求1一5任一項(xiàng)權(quán)利要求所述的TETRA集群手機(jī)語音處理方法,其特征在于活動語音檢測參數(shù)數(shù)值是語音幀的能量決策規(guī)則輸出結(jié)果乘以能量決策的權(quán)重與過零率決策規(guī)則輸出結(jié)果乘以過零率決策的權(quán)重之和,若該語音幀的活動語音檢測參數(shù)數(shù)值大于或等于上限值,則判斷是活動語音,若該語音幀的活動語音檢測參數(shù)數(shù)值小于下限值,則判斷是非活動語音。
7. 根據(jù)權(quán)利要求1所述的TETRA集群手機(jī)語音處理方法,其特征在于非均勻加權(quán)決策規(guī)則中能量決策的權(quán)重大于過零率決策的權(quán)重。
8. 根據(jù)權(quán)利要求1所述的TETRA集群手機(jī)語音處理方法,其特征在于對活動語音信號數(shù)據(jù)的能量幅度進(jìn)行調(diào)整包括如下步驟:計(jì)算當(dāng)前活動語音幀的能量幅度值;設(shè)置能量門限值,包括門限值上限和門限值下限,對計(jì)算出的活動語音幀的能量幅度進(jìn)行判斷;如果活動語音幀的能量幅度值大于門限值上限,則按照設(shè)定的語音能量減幅系數(shù)來降低此幀語音數(shù)據(jù)中各個采樣值的能量幅度;如果活動語音幀的能量幅度值小于門限值下限,則按照設(shè)定的語音能量增加系數(shù)來增加此幀語音數(shù)據(jù)中各個采樣值的能量幅度;如果活動語音幀的能量幅度值介于門限值上限和門限值下限之間,能量幅度值不變。
9. 根據(jù)權(quán)利要求8所述的TETRA集群手機(jī)語音處理方法,其特征在于語音處理方法的位置在語音編碼預(yù)處理階段,進(jìn)行語音信號數(shù)據(jù)能量幅度調(diào)整的同時還要調(diào)整麥克的增益,如果語音信號能量的幅度大于門限值上限,則對語音信號進(jìn)行減幅處理的同時,減小麥克的增益;如果能量的幅度小于門限值下限,則對語音信號進(jìn)行增幅處理的同時,增大麥克的增益;其他情況麥克增益保持不變。
說明 TETRA集群手機(jī)語音處理方法 技術(shù)領(lǐng)域 本發(fā)明屬于集群通信終端技術(shù)領(lǐng)域,更具體地說涉及一種對TETRA集群手機(jī)的 語音數(shù)據(jù)進(jìn)行處理的技術(shù)領(lǐng)域。 背景技術(shù) 集群通信是實(shí)現(xiàn)移動中指揮調(diào)度通信最有效的手段之一,也是指揮調(diào)度最重要的 通信方式之一。它是一種共享資源、分擔(dān)費(fèi)用、向用戶提供優(yōu)良服務(wù)的多用途、高效 能的移動通信系統(tǒng),集群通信系統(tǒng)隨著技術(shù)的日趨成熟,應(yīng)用越來越廣泛,可以應(yīng)用 于智能交通、各種自然災(zāi)害的救險行動、機(jī)場民航、城市地鐵等的指揮系統(tǒng)。 TETRA是一個強(qiáng)大的多功能數(shù)字集群移動通信系列標(biāo)準(zhǔn),ETSI組織制定了 TETRA 標(biāo)準(zhǔn)的詳細(xì)內(nèi)容,其中的ETS 300 395-2規(guī)定了TETRA語音編解碼的標(biāo)準(zhǔn)。上述標(biāo)準(zhǔn) 并沒有對語音信號的活動語音檢測、能量調(diào)整等方面作出規(guī)定, 目前的TETRA集群手機(jī)存在的缺點(diǎn),在于按照標(biāo)準(zhǔn)實(shí)現(xiàn)的系統(tǒng)對麥克采樣獲得的 語音信號數(shù)據(jù)并不進(jìn)行優(yōu)化,直接對語音信號的原始數(shù)據(jù)進(jìn)行處理,造成了語音能量 起伏過大的情況:當(dāng)外界語音能量高時,容易造成語音信號能量過高而尖銳刺耳,當(dāng) 外界的語音能量低時,則容易造成語音信號能量過低而聽不清。 發(fā)明內(nèi)容 本發(fā)明的目的就是為了解決目前TETRA集群手機(jī)的語音能量起伏過大的缺點(diǎn),提 供一種對TETRA集群手機(jī)的語音數(shù)據(jù)進(jìn)行處理的方法,能夠獲得一種舒適的TETRA語 音,本方法可以在TETRA語音編碼的預(yù)處理階段或者語音解碼的后處理階段或者預(yù)處 理和后處理階段都進(jìn)行處理,對語音信號數(shù)據(jù)進(jìn)行優(yōu)化,使優(yōu)化后的語音在TETRA手 機(jī)用戶通話時,聽覺上達(dá)到舒適的效果。在不違背TETRA語音編解碼標(biāo)準(zhǔn)的情況下很 大程度上提高了語音感知上的舒適度。 為了實(shí)現(xiàn)上述目的,本發(fā)明包括以下步驟: 1、 活動語音檢測,對TETRA語音信號按幀進(jìn)行閾值判斷,按照語音幀的能量和 語音幀的過零率進(jìn)行雙參數(shù)判斷,采用對能量決策規(guī)則和過零率決策規(guī)則給予不同加 權(quán)權(quán)重的非均勻加權(quán)決策規(guī)則; 2、 若判斷該語音幀為活動語音,對該語音幀的能量幅度進(jìn)行調(diào)整;3、若判斷該語音幀為非活動語音,則用預(yù)存儲的舒適背景音覆蓋該語音幀。 其中能量決策規(guī)則包括以下步驟: 計(jì)算語音信號的能量,統(tǒng)計(jì)一個語音幀中全部240個數(shù)據(jù)的能量幅度值; 設(shè)置活動語音檢測用的能量門限值,包括能量上限值和能量下限值,對計(jì)算出的 語音信號的能量進(jìn)行閾值判斷; 當(dāng)語音幀信號的能量大于能量上限值時,判定該語音幀為活動語音,當(dāng)語音幀信 號的能量小于能量下限值時,判定該語音幀為非活動語音,當(dāng)語音幀信號的能量介于 能量上限值和能量下限值二者之間時,狀態(tài)未定。語音信號幅度值采用Q15量化。 其中過零率決策規(guī)則包括以下步驟: 計(jì)算語音信號的過零率ZCR值,統(tǒng)計(jì)一個語音幀中全部240個數(shù)據(jù)的ZCR值; 設(shè)置活動語音檢測用的過零率門限值,包括過零率上限值和過零率下限值,對計(jì) 算出的語音信號的過零率進(jìn)行閾值判斷; 當(dāng)語音幀信號的過零率大于過零率上限值時,判定該語音幀為非活動語音,當(dāng)語 音幀信號的過零率小于過零率下限值時,判定該語音幀為活動語音,當(dāng)語音幀的過零 率介于過零率上限值和過零率下限值二者之間時,狀態(tài)未定。 過零率上限制的范圍是16-30,過零率下限值的范圍是8-10。 非均勻加權(quán)決策規(guī)則中能量決策的權(quán)重大于過零率決策的權(quán)重。 步驟2中對活動語音信號數(shù)據(jù)的能量幅度進(jìn)行調(diào)整包括如下步驟: 計(jì)算當(dāng)前活動語音幀的能量幅度值; 設(shè)置能量門限值,包括門限值上限和門限值下限,對計(jì)算出的活動語音幀的能量 幅度進(jìn)行判斷; 如果活動語音幀的能量幅度值大于門限值上限,則按照設(shè)定的語音能量減幅系數(shù) 來降低此幀語音數(shù)據(jù)中各個采樣值的能量幅度; 如果活動語音幀的能量幅度值小于門限值下限,則按照設(shè)定的語音能量增加系數(shù) 來增加此幀語音數(shù)據(jù)中各個采樣值的能量幅度; 如果活動語音幀的能量幅度值介于門限值上限和門限值下限之間,能量幅度值不變。 在TETRA語音編碼的預(yù)處理階段采用語音處理方法,在步驟2中,對語音信號數(shù) 據(jù)能量幅度進(jìn)行調(diào)整的同時,優(yōu)選進(jìn)行調(diào)整麥克的增益。 如果語音信號能量的幅度大于門限值上限,則對語音信號進(jìn)行減幅處理的同時, 減小麥克的增益;如果能量的幅度小于門限值下限,則對語音信號進(jìn)行增幅處理的同時,增大麥克 的增益;其他情況麥克增益保持不變。 舒適背景音的構(gòu)造,根據(jù)本方法所采用的硬件和一般通話環(huán)境通過試驗(yàn)獲得一個 舒適背景音樣本,用此提前獲得的背景音數(shù)據(jù)填充數(shù)據(jù)緩沖區(qū)。 在TETRA語音編解碼處理中,在語音編碼的預(yù)處理階段或者語音解碼的后處理階 段或者在語音編碼的預(yù)處理階段和語音解碼的后處理階段進(jìn)行語音的能量調(diào)整和舒 適背景音的產(chǎn)生。 采用本發(fā)明中的語音處理方法,能夠?qū)崿F(xiàn)語音信號為活動語音時語音柔和,為非 活動語音時聽到舒適的背景音的效果,提高了 TETRA集群手機(jī)通話時用戶聽覺上的舒 適度。 附圖說明 下面結(jié)合附圖和實(shí)施例對本發(fā)明作進(jìn)一步的描述。 圖1是本發(fā)明中的硬件連接方框圖; 圖2是本發(fā)明中語音數(shù)據(jù)處理的流程圖; 圖3是非均勻加權(quán)決策規(guī)則的語音活動檢測圖。 具體實(shí)施方式 如圖1所示,在TETRA手機(jī)中,語音信息經(jīng)麥克風(fēng)或者帶麥克的耳機(jī)傳遞給音頻 聲碼器CODEC,聲碼器把模擬的語音信號轉(zhuǎn)換成數(shù)字信號經(jīng)串行總線傳輸?shù)轿⑻幚砥?CPU中,并在DSP芯片中進(jìn)行語音數(shù)字信號的編碼處理。播放聲音時,數(shù)字語音信號 經(jīng)串行總線傳遞到微處理器CPU中,并在DSP芯片中進(jìn)行數(shù)字解碼及語音處理,然后 把處理后的數(shù)字語音信號在音頻聲碼器中轉(zhuǎn)換成模擬信號,經(jīng)功率放大器放大后,通 過揚(yáng)聲器輸出聲音信息。其中微處理器CPU負(fù)責(zé)控制、調(diào)度系統(tǒng)運(yùn)行。 由于TETRA語音編解碼標(biāo)準(zhǔn)部分中沒有對活動語音檢測和能量幅度調(diào)整等處理作 出規(guī)定,而目前TETRA手機(jī)沒有進(jìn)行語音優(yōu)化的處理,按照標(biāo)準(zhǔn)實(shí)現(xiàn)的系統(tǒng)的語音效 果比較差,所以本發(fā)明的技術(shù)方案是在TETRA語音編碼的預(yù)處理或語音解碼的后處理 中對語音信號數(shù)據(jù)進(jìn)行優(yōu)化處理,使處理后的語音在TETRA手機(jī)用戶通話時,聽覺上 達(dá)到舒適的效果。 如圖2所示,首先對語音信號進(jìn)行活動語音檢測,按照檢測的結(jié)果對不同的情況 進(jìn)行相關(guān)的處理,如果檢測為活動語音,則調(diào)整語音能量的幅度;如果檢測為非活動 語音,則發(fā)送預(yù)構(gòu)建的舒適語音信號,同時調(diào)整麥克的采樣增益,使得語音的幅度始 終處于一個穩(wěn)定的范圍,在原始語音數(shù)據(jù)的能量幅度高時語音不刺耳,語音能量幅度低時語音清晰,獲得舒適的語音;舒適語音處理在DSP芯片上實(shí)現(xiàn),系統(tǒng)負(fù)載低,計(jì) 算時間短,實(shí)用性高。 對要處理的語音信號數(shù)據(jù)進(jìn)行活動語音檢測處理中,由于TETRA集群手機(jī)實(shí)時通 信的特點(diǎn),本方案中對于是否活動語音的判斷是按幀進(jìn)行的,即對TETRA語音信號按 幀對全部240個數(shù)據(jù)進(jìn)行閾值判斷,按照情況將整個幀判定為活動語音或者非活動語 如圖3所示是非均勻加權(quán)決策規(guī)則的語音活動檢測,活動語音檢測采用能量、過 零率雙參數(shù)方法進(jìn)行判斷,包括能量決策規(guī)則和過零率決策規(guī)則,其中能量決策規(guī)則 的處理方法步驟描述如下: l-l、計(jì)算語音信號的能量£: 計(jì)算能量^時,統(tǒng)計(jì)一個語音幀的全部240個能量信號的幅度值,令目前的信號 為4"], " = 0,2,3•••••,239,則以dB為單位,語音能量的計(jì)算方法按照理論應(yīng)該如下計(jì) £ = 101og 10 239 !>[i])2 (dB) 為了便于在DSP上實(shí)現(xiàn),在本方法中其能量的計(jì)算方法修正如下: 239 1-2、活動語音的能量閾值判斷: 選取出兩個作為語音活動檢測(VAD)判斷用的能量門限值,第一個為能量上限值 £„,第二個為能量下限值^。當(dāng)輸入語音幀信號能量大于此上限值i^時,將此語音 幀判定為活動語音,當(dāng)輸入語音幀信號的能量小于此下限值A(chǔ)時,將此語音幀判定 為非活動語音。令輸出的結(jié)果為/£, /£值的計(jì)算方法總結(jié)成如下公式: 「1,當(dāng)£ 0.5,其他 能量門限值&和A的設(shè)置根據(jù)語音信號幅度值的量化方式不同而不同,當(dāng)語音 信號幅度值的量化采用Q15量化時,£(/可在0800 OOOOh-lOOO OOOOh范圍內(nèi)根據(jù)實(shí) 7際環(huán)境設(shè)置,五i則可在0600 OOOOh-0400 OOOOh范圍內(nèi)根據(jù)實(shí)際環(huán)境設(shè)置。 而過零率決策規(guī)則的處理方法步驟描述如下: 2-1、計(jì)算過零率ZCR: 計(jì)算過零率ZCR值時,取語音幀的全部240個數(shù)據(jù)進(jìn)行計(jì)算,如下式所示: <formula>formula see original document page 8</formula> 其中函數(shù)"gra(X[i])表示如下: <formula>formula see original document page 8</formula> 2-2、活動語音的過零率閾值判斷; 選取出兩個活動語音判斷用的過零率門限值,第一個為過零率下限值z,,當(dāng)輸 入語音幀信號的過零率小于此下限值時,將此語音幀判定為活動語音;第二個為過零 率上限值2„,當(dāng)輸入語音幀信號的過零率大于此上限值時,將此語音幀判定為非活 動語音。令過零率決策規(guī)則輸出之結(jié)果為/^a,厶^的計(jì)算方法總結(jié)成如下公式: '1,當(dāng)ZCR〉Z: •/^cr 一 0,當(dāng)ZCR〈Zz 0.5 ,其他 由于過零率受硬件環(huán)境的影響,其門限值需要根據(jù)實(shí)際試驗(yàn)情況設(shè)置不同的數(shù) 值, 一般情況K,其參數(shù)可在如下范圍內(nèi)選。哼^零率上限制Z。.的范圍在16-30之 間,過零率下限值Z,的范圍在8-10之間。 活動語音判斷規(guī)則采用能量、過零率雙參數(shù)方法,具體描述如下: 活動語音檢測判斷采用非均勻加權(quán)決策規(guī)則。非均勻加權(quán)決策規(guī)則的語音活動檢 測方法在找出上述兩種決策規(guī)則的輸出值后,給予其不同加權(quán)權(quán)重,得到活動語音檢 測參數(shù)F。上述情況可用如下的方程式表示: 其中C^、 "^s分別為能量決策規(guī)則和過零率決策規(guī)則輸出值的加權(quán)權(quán)重。若最 后計(jì)算所得的活動語音檢測參數(shù)數(shù)值F大于或等于上門限值i^時,則判斷此幀語音數(shù)據(jù)為活動語音;若計(jì)算所得的數(shù)值尸小于下門限值Ft,時,則判斷此幀語音數(shù)據(jù)為 非活動語音;位于二者之間時語音幀的狀態(tài)未定。 活動語音檢測的能量決策規(guī)則和過零率決策規(guī)則的加權(quán)權(quán)重值根據(jù)具體的手機(jī) 硬件按照試驗(yàn)結(jié)果進(jìn)行確定,來確定不同參數(shù)在活動語音檢測中的作用,并且根據(jù)所 取值來選定活動語音判定時的上下門限值。 一般情況下"£、 ",^可采用非均勻權(quán)重 進(jìn)行計(jì)算,即"£大于《20;;而i^的選定范圍則可以在0.5-1.0內(nèi),i^的選定范圍則 可以在0-0. 5內(nèi),具體取值根據(jù)硬件情況試驗(yàn)確定。 活動語音檢測判斷后,按照活動語音檢測的判定結(jié)果再分別進(jìn)行不同的處理。其 中語音能量信號幅度的調(diào)整步驟: 當(dāng)判定此幀數(shù)據(jù)為活動語音時,對語音信號數(shù)據(jù)能量幅度進(jìn)行調(diào)整。計(jì)算當(dāng)前幀 的能量幅度值i?,與能量門限值i?,相比較,如果當(dāng)前幀的能量幅度值E大于門限值 上限,則按照設(shè)定的語音能量減幅系數(shù)/^來降低此幀語音數(shù)據(jù)的各個采樣值的能量 幅度;如果當(dāng)前幀的能量幅度值^小于下限門限值五皿,則按照設(shè)定的語音能量增加 系數(shù)厶£來增加此幀語音數(shù)據(jù)的各個采樣值的能量幅度;其他情況能量幅度值不變。 其計(jì)算公式如下: 4"] = , 4"]*乂恥,當(dāng)五<五肌 x[w],其它情況 對麥克增益的調(diào)整步驟: 因?yàn)門ETRA集群手機(jī)中每幀語音的時間長度為30ms,而語音信號具有短時間內(nèi)的 平穩(wěn)性,可以認(rèn)為在很短的時間間隔內(nèi),相鄰兩幀語音信號的能量幅度值是一致的, 因此在調(diào)整語音數(shù)據(jù)信號能量的同時要調(diào)整麥克的增益。麥克的調(diào)整規(guī)則如下:增大 語音信號能量幅度的同時增大麥克的增益,減小語音信號能量幅度的同時減小麥克的 增益;能量幅度值不變時麥克的增益也不變。 當(dāng)判定當(dāng)前語音幀為靜音時,從語音的連續(xù)性和通話方的感受考慮,需用預(yù)先構(gòu) 建的舒適背景音數(shù)據(jù)填寫當(dāng)前語音幀,使通話方不致感到語音間隙之間的突兀和對通 話方活動通話進(jìn)行提示。因?yàn)槭苁褂玫挠布h(huán)境和語音環(huán)境的影響比較大,舒適背景 音的構(gòu)建方式采用試驗(yàn)的方法獲得,根據(jù)使用環(huán)境的不同語音數(shù)據(jù)的內(nèi)容存在差異。 當(dāng)判定當(dāng)前語音幀的狀態(tài)未定時,不對語音幀進(jìn)行處理。 9
"=0,2,3..…,239本發(fā)明中的語音處理方法使用的位置可以在語音編碼的預(yù)處理階段或者語音解 碼的后處理階段,由于TETRA編解碼階段本身的運(yùn)算量的不同,后處理階段的計(jì)算量 較小,所以放在語音處理的后處理階段對系統(tǒng)的影響較小,是一個優(yōu)選的方案。 (中國集群通信網(wǎng) | 責(zé)任編輯:陳曉亮) |



