售前電話
135-3656-7657
售前電話 : 135-3656-7657
結(jié)構(gòu)原理
G.728、G.729和G.723.1都屬于同一類聲碼器,稱之為線性預測合成分析(I.PAS-LinearPredicfionAnalysis-by-Synthesis)編碼器,其原理結(jié)構(gòu)如圖4.1所示。
激勵生成器產(chǎn)生的激勵信號經(jīng)線性預測器后得到重構(gòu)的話音信號s(1),線性預測器模擬聲道特性,加強激勵信號的某些頻率域,減弱另一些頻率域,體現(xiàn)了話音的短時相關性。激勵信號則體現(xiàn)了話音的長時相關性,輸入線性預測器的激勵信號是量化后的增益和基音信號。由于臥化誤差的影響,重構(gòu)信號和輸入信號s(1)之間必然存在有限的差值e(1),稱之為殘差信號(residualsignal),最小化過程的日的就是調(diào)整激勵信號,使殘差的方差為最小,由此構(gòu)成確定激勵信號的閉環(huán)回路。為了減小量化比特,提高編碼效率,激勵生成器輸出的是殘差信號估值,而不是原信號估值。從頻域上來說,最小化過程使激勵信號暈化噪聲的能量集中在預測濾波器的低谷部分,從而使雇化噪聲呈現(xiàn)平坦的類似白噪聲的功率頻譜。
經(jīng)過最小化過程確定的激勵信號星化值就是聲碼器的輸出,接收端的解碼器根據(jù)此信號和同樣的線性預測器恢復原來的話音伈號(實際上圖4.1.1難框部分所示閉環(huán)回路的下半部分就是解碼器的結(jié)構(gòu),因此該結(jié)構(gòu)的編碼器己內(nèi)含解碼器。在話音編碼中,常稱編碼過程為語音分析,它的功能是將話音轉(zhuǎn)換為適于計算機存儲和網(wǎng)絡中傳輸?shù)臄?shù)字形式;稱解碼過程為語音合成,它的功能是將數(shù)字形式的話音數(shù)據(jù)重新轉(zhuǎn)換為可供人類使用的信號形式。按這樣的術語來解釋,反饋回路中的線性預測器是用來重建信號的,又稱為預測合成器,整個編碼器是通過內(nèi)含的語音合成來完成語音分析過程的,所以稱之為合成分析器。
由于聲道的形狀和大小是隨音素而變化的,因此預測合成器是一個線性時變系統(tǒng),其濾波器系數(shù)需定期更新。因此,LPAS的閉環(huán)回路實際上包含兩層反饋控制。內(nèi)層是線性預測濾波器的自適應控制,其過程和ADPCM相同,系數(shù)更新周期為一個幀長,典型值為10~30ms。外層是激勵信號的優(yōu)化,由于基音周期小于幀長,因此其更新周期較短,典型值為5~lOms。LPAS的關鍵技術是如何確定和量化激勵信號。
殘差激勵信號的量化有多種方法,它是不同LPAS系統(tǒng)的主要差別所在。一種廣為使用的方法稱之為多脈沖激勵(MPE-multi-pulseexcitation)編碼,該方法用于比特率為lOkbit/s左右的話音編碼器,其復雜度適中,有良好的話音質(zhì)量。與此類似的一種方法稱為規(guī)則脈沖激勵(RPE-egularpulseexcitation)編碼,該方法限定激勵脈沖的位置,復雜度較低,其比特率及質(zhì)量和多脈沖編碼類似。近年來得到廣泛使用的方法是碼本激勵線性預測(CELP-Code-excitedlinearPrediction)編碼,該方法采用矢量量化技術,用予定義的碼本(codebook)激勵替代脈沖激勵,碼本中的每一個向量對應一個量化信號,編碼信息轉(zhuǎn)化為碼本索引。這種方法具有很高的編碼效率,但是復雜度也很高,由于近年來高速DSP的出現(xiàn)才使這種方法成為實用,并以此為基礎演繹出多種低比特率聲碼器標準。