主頁(yè)(http://www.130131.com):帶你真正認(rèn)識(shí)了解聲碼器 聲碼器Vocoder由Voice Coder簡(jiǎn)化而來(lái),可以譯作“人聲編碼器”。它原來(lái)是一種分析與合成人工語(yǔ)言電子設(shè)備或系統(tǒng)。早期通過(guò)它認(rèn)識(shí)到語(yǔ)音的基本信息率很低,如果把它們分割成基本的成分,可以在很窄的通帶上傳送,然后在接收端重新組合。語(yǔ)言合成就這樣有趣地誕生了。聲碼器的工作原理是檢測(cè)語(yǔ)音的架構(gòu),或者它是具有基本頻率的元音;或者是噪音,例如輔音中的爆破音或唇齒音。 典型的聲碼器使用兩套濾波器庫(kù),一個(gè)分析,一個(gè)合成,再加一個(gè)激勵(lì)分析模塊。分析濾波器庫(kù)很象實(shí)時(shí)分析器中所使用的,音頻信號(hào)被送到并聯(lián)的帶通濾波器,輸出相應(yīng)的直流電壓。激勵(lì)分析模塊對(duì)基本頻率和噪聲屬性進(jìn)行檢測(cè)和編碼。重新合成的時(shí)候用編碼的直流電平混合以激勵(lì)分析模塊的輸出開(kāi)關(guān)各個(gè)帶通濾波器,組合成原始的語(yǔ)音信號(hào)。 如果你到互聯(lián)網(wǎng)上搜索關(guān)鍵詞“聲碼器”,可以查出很多有關(guān)條目,不過(guò)大多數(shù)是用于通訊技術(shù)的。我們下面介紹主要使用于音樂(lè)的聲碼器。 Keyboard雜志2000年第8期用許多篇幅刊登一組文章,專門(mén)談聲碼器。介紹了諸多硬件、軟件、合成器附帶的聲碼器,花樣繁多琳瑯滿目,有關(guān)內(nèi)容將來(lái)我們?cè)俳o大家介紹。作為開(kāi)始,我們先講聲碼器的工作原理。 為了懂得聲碼器,需要弄明白聲碼器使用的3個(gè)基本成分--帶通濾波器,包絡(luò)跟隨器和放大器。 帶通濾波器是一類僅允許規(guī)定頻帶的頻率通過(guò),阻擋其他的頻率的濾波器。例如一個(gè)帶通濾波器允許800到1200Hz的頻率通過(guò),更低的頻率(如500Hz)和更高的頻率(如2000Hz)都被阻擋不能通過(guò)。 對(duì)這個(gè)例子還要加以補(bǔ)充說(shuō)明:說(shuō)通帶的低端是800Hz,并不意味799Hz的信號(hào)完全不能通過(guò)。實(shí)際上通帶以外的信號(hào)只是被衰減到某一程度,并按照一條曲線逐漸衰減。頻率越低,衰減越大。這條曲線經(jīng)常用每個(gè)八度多少分貝來(lái)形容,上例中假定斜率為24分貝/八度,400Hz的信號(hào)(較800Hz低一個(gè)八度)通過(guò)時(shí)將有24分貝的衰減;200Hz的信號(hào)(較800Hz低兩個(gè)八度)通過(guò)時(shí)將有48分貝的衰減。高端的情況也一樣。 如果我們有一個(gè)基本頻率500Hz的樂(lè)音送到前述的帶通濾波器,它的基音和大部分諧波都將被阻擋,只有一次諧波1000Hz正處于濾波器的中心頻率,可以順利通過(guò)。二次諧波1500Hz在通頻帶之外,受到很大衰減,勉強(qiáng)漏過(guò)一些。四次諧波2000Hz就幾乎完全被濾掉了。 包絡(luò)跟隨器感知信號(hào)的響度,然后送出一個(gè)與響度相關(guān)的控制信號(hào),包絡(luò)曲線描繪出響度變化的情況。通常也有包絡(luò)參數(shù)可以由用戶控制包絡(luò)上升和衰退的特性。 放大器似乎不用多說(shuō),它是一個(gè)電路或軟件,能夠放大信號(hào),而且能控制放大量。聲碼器中的放大器根據(jù)包絡(luò)跟隨器輸出的控制信號(hào)改變放大量。較老的模擬設(shè)備使用電壓控制放大器,簡(jiǎn)稱VCA,新的數(shù)字設(shè)備使用數(shù)字信號(hào)控制,但經(jīng)常還按老習(xí)慣稱作VCA。 Vocoder聲碼器的主要設(shè)備包含2套帶通濾波器,這些濾波器有規(guī)定的中心頻率和帶寬,僅能通過(guò)選定的頻率。一套濾波器由若干濾波器庫(kù)組成,它們的頻率覆蓋了整個(gè)聽(tīng)覺(jué)范圍。例如使用一種帶寬一個(gè)八度的濾波器,每一個(gè)濾波器的中心頻率相差一個(gè)八度,如果一個(gè)濾波器的中心頻率為1000Hz,它上方相鄰的那一個(gè)中心頻率就是2000Hz,下方相鄰的那一個(gè)中心頻率就是500Hz。它們的頻率響應(yīng)曲線將在八度的中部重疊,這3個(gè)濾波器的覆蓋范圍從250Hz到3000Hz。窄一些的濾波器帶寬可以構(gòu)成更精密的庫(kù)(要使用更多的濾波器)。 一個(gè)來(lái)自合成器的信號(hào)送到濾波庫(kù)以后同時(shí)通過(guò)并聯(lián)的濾波器,在輸出端設(shè)有控制增益的部件(一個(gè)VCA),除了這個(gè)控制,其他工作情況很象是圖形均衡器。VCA通常是關(guān)閉的,給某一個(gè)VCA進(jìn)行控制,可以使這個(gè)帶通濾波器的頻率送往輸出端。 我們用另一個(gè)信號(hào),比方說(shuō)來(lái)自麥克風(fēng)的信號(hào)(稱為控制),通過(guò)另外一個(gè)結(jié)構(gòu)完全與前面所述相同的濾波庫(kù),對(duì)它們的輸出進(jìn)行測(cè)量,得出一系列直流電壓,用來(lái)控制前者相應(yīng)濾波器的VCA。這樣前一個(gè)濾波器庫(kù)輸出的各頻率成分受到進(jìn)入后一個(gè)濾波器庫(kù)信號(hào)中相應(yīng)頻率成分的控制,聲音發(fā)生變化。 聲碼器要求2個(gè)輸入信號(hào),一個(gè)叫語(yǔ)音(speech);另一個(gè)叫載體(carrier)。許多合成器上的聲碼器使用內(nèi)部的合成聲音作載體。 聲碼器的操作如,輸入的語(yǔ)音信號(hào)經(jīng)過(guò)一個(gè)帶通濾波器庫(kù),被分割成多條并行的帶,每條帶被限制在很窄的頻率范圍之內(nèi),然后送往自己的包絡(luò)跟隨器。 每條頻帶的包絡(luò)跟隨器測(cè)量指定時(shí)刻的聲音能量,如果一條帶內(nèi)的語(yǔ)音信號(hào)由一個(gè)或更多明顯的諧波,控制信號(hào)將送出高一些的包絡(luò);如果帶內(nèi)只有少量甚至沒(méi)有顯著幅度的諧波,控制信號(hào)將送出的包絡(luò)就低一些。 經(jīng)過(guò)帶通濾波器和包絡(luò)跟隨器的分析,語(yǔ)音信號(hào)此時(shí)變成多帶調(diào)制源,它的本身已經(jīng)沒(méi)有意義了。 語(yǔ)音信號(hào)被分析處理的同時(shí),載體信號(hào)通過(guò)自己的帶通濾波器庫(kù),它們的中心頻率設(shè)置得與語(yǔ)音部分完全一致。載體信號(hào)同樣被分割成多條并行的帶,每條帶被限制在很窄的頻率范圍之內(nèi)。 來(lái)自載體帶的信號(hào)送往放大器庫(kù),而包絡(luò)跟隨器的輸出則控制這些放大器的增益,這就造成載體帶被印上語(yǔ)音帶包絡(luò)形狀的印記。放大器的輸出混合后輸出,我們?cè)谳敵龆寺?tīng)到的是被改變了的載體聲音。 聲碼器的效果是帶通濾波器、包絡(luò)跟隨器和放大器相互作用的結(jié)果。如果語(yǔ)音信號(hào)在某一頻段包含許多諧波,相應(yīng)頻段載體中的諧波也將更多的通過(guò)放大器,因?yàn)榇藭r(shí)放大器大開(kāi)。但如果語(yǔ)音信號(hào)在某一頻段的能量少些,包絡(luò)跟隨器就是低電平輸出,這一頻段的放大器增益減少,載體中該段諧波通過(guò)放大器的就少些。如果語(yǔ)音信號(hào)在某一頻段完全沒(méi)有能量,這一段的包絡(luò)跟隨器輸出為0,放大器因此關(guān)閉,載體相應(yīng)頻段的諧波就被截止。 技術(shù)的考慮 總而言之,聲碼器僅僅能夠?qū)χC波作減法,而決不能加進(jìn)行的諧波。因此用作載體的聲音應(yīng)該含有豐富的諧波。如果你試圖用象長(zhǎng)笛那樣類似正弦波的音色作載體,將聽(tīng)不到聲碼器有什么效果。 早期的聲碼器只能分8到10個(gè)頻段,因?yàn)樗鼈兪褂梅至⒃䴓?gòu)成的硬件電路,每多加一段就會(huì)提高整機(jī)的成本。當(dāng)聲碼器改由軟件(DSP)來(lái)執(zhí)行,頻段很快就增加到16段以上。 人類發(fā)音器官的結(jié)構(gòu)使語(yǔ)音產(chǎn)生強(qiáng)烈的諧波共振,獨(dú)特的架構(gòu)。例如元音“ee”的聲音就與“oo”大不相同,常使聲碼器發(fā)生錯(cuò)覺(jué)。 語(yǔ)音信號(hào)經(jīng)常在極高音區(qū)包含有重要的信息,例如子音中的齒音“s”和摩擦音“f”,甚至展寬的鋸齒波合成音色被用于載體時(shí)也沒(méi)有上述子音在極高音區(qū)有那么多的能量。結(jié)果有的聲碼器就在極高頻區(qū)設(shè)一個(gè)開(kāi)關(guān),讓齒音和摩擦音直接混合到載體信號(hào),以增加清晰度。 少數(shù)聲碼器如Clavia的Nord Modular和CreamWare的Pulsar允許將包絡(luò)跟隨器的輸出交叉連接到非對(duì)應(yīng)頻段放大器,這樣做的結(jié)果語(yǔ)音就變成聽(tīng)不懂的,但載體仍保有一個(gè)輪廓,表情的形狀。交叉連接對(duì)打擊樂(lè)循環(huán)被當(dāng)作語(yǔ)音信號(hào)使用特別有效。你能選擇一個(gè)含有很多能量的頻段(例如低音鼓)連接到包含大量諧波的載體,載體的聲音中就獲得了低音鼓的節(jié)奏。這時(shí)的聲碼器實(shí)際已經(jīng)成為一個(gè)可以選頻率的門(mén)開(kāi)關(guān)。 還有的聲碼器讓你調(diào)整各頻段的輸出電平或?yàn)V波器的斜率,或者能對(duì)載體或語(yǔ)音庫(kù)之間的頻率偏移編程,使一個(gè)庫(kù)稍高(或低)與另一個(gè)以增加可理解度或創(chuàng)造一個(gè)變性效果。 Roland JP-8080的聲碼器算法走得更遠(yuǎn),它的包絡(luò)跟隨器輸出能用作調(diào)制源,控制各種合成器參數(shù)。這就使語(yǔ)音輸入可以成為多種合成效果的調(diào)制源。 (中國(guó)集群通信網(wǎng) | 責(zé)任編輯:李俊勇) |




