售前電話
135-3656-7657
售前電話 : 135-3656-7657
波形編碼的基本出發(fā)點是最小化原信號和重構(gòu)信號之間的差值信號,最小化判據(jù)一般為以"塊”為基礎(chǔ)的差分信號的均方差,塊可以小到單個話音抽樣。波形編碼的設(shè)計要求是獲得盡可能高的信噪比(SNR)。改進的編碼器還考慮人類聽覺系統(tǒng)的主觀感覺效果,為此可設(shè)置屏蔽濾波器,修正原信號和重構(gòu)信號。這樣SNR有可能下降,但主觀感覺質(zhì)量反而會提高。波形編碼器主要利用話音波形的短時相關(guān)性,特別是相鄰抽樣點之間的相關(guān)性來降低比特率,改進算法還考慮了長時相關(guān)性。
參數(shù)編碼的基本出發(fā)點是根據(jù)確定的成音模型確定模型參數(shù),雖然LPC聲碼器也是通過殘差信號的最小化進行計算的,但是其著眼點是要求模型參數(shù)的最佳值,而并非SNR的最大化。
參數(shù)編碼的精度主要取決于模型本身的正確性。圖3.12所示的話音生成數(shù)字模型和實際情況還是有差距的。例如,模型采用清/濁音二元判決,也就是說任一時刻的話音或者是純粹的清音,或者是純粹的濁音,實際情況并非完全如此,尤其是從一個音素到另一音素轉(zhuǎn)換的過渡階段比較復(fù)雜, 理論上應(yīng)采用多元判決。模型中激勵源只有兩個,每次只能產(chǎn)生一種音,但實際話音有許多部分的頻譜呈諧波頻譜和噪聲譜的組合頻譜。模型假設(shè)濁音激勵是規(guī)則的周期脈沖,這也是對實際情況的一種理想化近似。另外,模型參數(shù)是按照幀周期進行更新調(diào)整的,對于爆破音等快速變化音素的編碼來說就有較大的誤差。凡此決定了參數(shù)編碼的固有誤差,這是由模型本身所限定的,尤論怎樣增加參數(shù)的編碼比特率,減小量化誤差,都不能使重構(gòu)信號收斂于原信號。而波形編碼則不一樣,理論上只要預(yù)測階數(shù)足夠高,量化誤差足夠小,重構(gòu)信號將收斂于原信號。這是兩種編碼方式的顯著不同之處,這一概念可由圖3.15表示。但是參數(shù)編碼的一個重要優(yōu)勢是可以有效降低編碼比特率,從而得到越來越廣泛的應(yīng)用。
參數(shù)編碼標(biāo)準
有影響的話音參數(shù)編碼國際標(biāo)準和地區(qū)性標(biāo)準主要由ITU-T和數(shù)字蜂窩標(biāo)準組織制訂,其特性如表3.4所示。它們采用的都是線性預(yù)測編碼器和碼本激勵矢量量化技術(shù)。IP網(wǎng)絡(luò)電話應(yīng)用主要使用ITU定義的三個標(biāo)準。G.728比特率為16kbit/s,標(biāo)準研究始于1988年,其目的是建立
一個通用的16kbit/s長途質(zhì)量的話音編碼標(biāo)準。它的第一個應(yīng)用是H.320低比特率可視電話。G.728對具有背景噪聲的信號或音樂具有很好的健壯性,抗隨機比特差錯能力優(yōu)于G.711和G.721,可通過所有的網(wǎng)絡(luò)信令音,還能通過高達2400bit/s的低比特率modem信號。
CELP:碼激勵線性預(yù)測RPE-LTP:規(guī)則脈沖激勵一長期預(yù)測TIA:電信工業(yè)協(xié)會RCR:無線電系統(tǒng)研發(fā)中心
G.729比特率為8kbit/s。最初由ITU-R提出此項研究,其目的是用于第三代移動通信系統(tǒng)。G.729A是G.729的DSVD(話音和數(shù)據(jù)同時傳送數(shù)字系統(tǒng))型式。與G.729比特流兼容,即它們的編碼都能被對方的解碼器接收重建信號。但G.729A的復(fù)雜度降低了50%,代價是在某些運行條件下性能稍有下降。
G.723.1為雙速率話音編碼器,作為PSTN上可視電話標(biāo)準系列中的話音編碼標(biāo)準。其中,6.3khit/s比特率采用多脈沖LPC編碼,對于一般的話音信號,其話音質(zhì)量相當(dāng)于G.721,但對于童聲、音樂和具噪聲背景的話音輸入,其質(zhì)量不如ADPCM。5.3kbit/s比特率采用多脈沖算術(shù)碼本激勵,定義該速率的目的是增加系統(tǒng)設(shè)計的靈活性。如用于低速率通道時,可為視頻編碼器留出一些比特空間;可為復(fù)用系統(tǒng)提供lkhit/s的“虛信道”以傳送附加信息。該標(biāo)準確定重用編號G.723,但增加一層子序號以區(qū)別于被G.726取代的原來的G.723。