售前電話
135-3656-7657
售前電話 : 135-3656-7657
在現(xiàn)代通信技術中,信息處理的硬件大部分都是數(shù)字邏輯電路或數(shù)字計算機,因此音視頻信息進入系統(tǒng)必須進行數(shù)字化處理。模擬信號在時間上是連續(xù)的,而數(shù)字音視頻則對應一個時間離散的數(shù)字序列。為用數(shù)字形式傳輸和處理音視頻信息,首先要解決的問題是音視頻信息的數(shù)字化,這包括兩方面的內容:
•音頻信息時間上的離散化和圖像信息空間位置的離散化。
•音頻信息電平值和圖像灰度電平值的離散化。
上述過程涉及音視頻信號的采樣,量化和編碼。對于音頻信號而言,采樣就是使音頻信號在時間軸上離散化,每隔一個時間間隔在模擬聲音波形上取一個幅度值,采樣的時間間隔稱之為采樣周期。根據(jù)采樣定理,只要采樣頻率等于或大于音頻信號中最高頻率成份的兩倍,信息量就不會丟失,也就是說可以由采樣后的離散信號不失真地重建原始的模擬音頻信號,否則就會產(chǎn)生不同程度的失真。因此采樣頻率的選擇是音頻信息數(shù)字化的關鍵技術之一?,F(xiàn)代通信技術中通常選用的音頻采樣頻率有8kHz,11.025kHz,16kHz,22.05kHz,32kHz,44.1kHz和48kHz等。音頻信號通常采用8~20bit量化編碼。一般在允許失真條件下,盡可能選擇較低的采樣頻率,以免使數(shù)據(jù)速率過高。
對于視頻信號而言,采樣就是使圖像信號在空間位置上離散化。設F1(x、y)表示一個實際圖像的光強度函數(shù),x、y為空間坐標,它是一個連續(xù)的圖像場,在空間上覆蓋無窮大的區(qū)域,對于一個理想的抽樣函數(shù),將F1(x、y)乘上一個空間抽樣函數(shù)S(x、y),則得抽樣后的離散圖像。
FP(x,y)=F1(x,y)S(x,y) (1)
式(1)中
而△x及△y是δ函數(shù)無窮陣列的空間間隔。
對抽樣后離散圖像進行二維傅里葉變換,得到其頻譜表達式為
其中
由圖1可見:抽樣后圖像的頻率是在頻率軸上分別以間隔△u及△v將原圖像的頻譜無限重復構成的,當抽樣頻率滿足奈奎斯特準則,且原圖像的頻譜是有限帶寬時,抽樣后圖像的頻譜就不會出觀混疊。
圖1 抽樣前后圖像的頻譜
為了防止混疊失真的出現(xiàn),通常情況下在抽樣前要對視頻圖像信號進行低通濾波來限制帶寬。從抽樣后圖像的頻譜可以看出,利用一個低通濾波器將原圖像頻譜濾出,則可無失真地重建原圖像。
經(jīng)過抽樣后的音視頻信號,只是一系列時間或空間上的離散樣值,而每個樣值的取值仍是連續(xù)的,要想進行數(shù)字化表示必須將它轉換為有限個離散值,這個過程稱為量化。如果樣值等間隔分層量化,則稱之為均勻量化,若使用非等間隔進行量化,則稱為非均勻量化。在量化過程中,一個模擬信號樣本與一組判決電平作比較,如果樣本落在兩個判決電平之間,則它被量化到這個量化區(qū)內的一個固定電平上去,模擬值與量化值間的誤差稱之為量化誤差或量化失真。對圖像信號而言,在圖像亮度平坦區(qū)域這種量化噪聲看起來像顆粒狀,故稱之為顆粒噪聲;圖像量化帶來的另一種失真稱為偽輪廓現(xiàn)象。顯然,量化噪聲與偽輪廓現(xiàn)象都與量化精度有關,量化越精細量化噪聲越小,偽輪廓現(xiàn)象就會減輕,但這是以增加電平數(shù)(碼率)為代價的。在數(shù)字系統(tǒng)中被量化之后的音視頻信號其每個量化電平最終被賦予一個二進制碼字。因此音視頻信號數(shù)字編碼的實質是:在保證一定圖像或聲音質量(信噪比要求和主觀評價得分)的前提下,以最小比特數(shù)來表示音視頻信號。視頻信號通常采用6~10bit量化編碼。