ITU G.729CS_ACELP語音編碼系統－藍色情懷｜痞客邦

May 28 Sat 2005 02:05
ITU G.729CS_ACELP語音編碼系統

close

ITU G.729CS_ACELP語音編碼系統

畢衛紅 尋智峰 王凱

(燕山大學光電子工程系秦皇島066004)

摘要：應用共軛結構代數碼激勵線性預測(CS_ACELP)演算法的G.729協議是國際電信聯盟(ITU)頒佈的適用於多媒體通信的低比特率線性預測語音編碼標準。介紹了G.729語音聲碼器編解碼的基本結構，並對其性能指標：比特率、編解碼的複雜度、時延和合成語音品質進行了分析。
關鍵字：共軛結構代數碼激勵線性預測；線性預測；向量量化

近年來碼激勵線性預測(CELP)語音編碼技術已經廣泛應用於中低速語音壓縮，主要集中在4～16 kb/s的電話頻帶。本文將介紹一種以CELP編碼模型為基礎，採用共軛結構代數碼激勵線性預測(CS_ACELP)技術的語音編碼國際標準G.729。他是一種速率為8 kb/s，合成語音品質接近32 kb/s自適應差分脈衝編碼調製(ADPCM)編碼品質的語音編碼演算法。他將在無線移動網，數位多工系統和電腦通信中得到廣泛的應用。
1 G.729編解碼器的原理
1.1 編碼器原理
編碼器的構成如圖1所示。

CS_ACELP編碼器主要包括預處理、線性預測分析、感覺加權濾波器、自適應碼本搜索、固定碼本搜索等部分。每個部分又包括若干的處理過程。編碼的幀長為10 ms，對應8 k抽樣/s的80個語音樣點。每10ms幀分析語音信號，提取CELP模型的參數，包括線性預測濾波器係數、分數基音時延、固定碼本向量、自適應和固定碼本索引增益，將這些參數編碼並傳輸。
輸入的語音信號首先被高通濾波並做定標處理，預處理輸出信號是後面所有分析的輸入信號。線性預測分析和合成濾波是基於10階線性預測(LP)濾波器，LP合成濾波器定義為：

其中：是(量化的)線性預測(LP)係數。線性預測分析每一語音幀(10 ms)執行一次，使用30 ms不對稱窗的自相關方法。每80個抽樣點(10 ms)計算加窗語音信號的自相關係數並使用Levinson演算法轉化成LP係數，這些係數被轉化成線譜對(LSP)用於量化和內插。插值的量化及未量化的濾波器係數再轉回LP濾波器係數，以便為每個子幀建立加權和合成濾波器。
自適應的感覺加權濾波器是基於未量化的LP係數，由下式給出：

其中：權重因數γ₁和γ₂確定了感覺加權濾波器W(z)的頻率回應，A(z)是線性預測分析濾波器。適當的調整這些參數可以使加權更為有效。令γ₁和γ₂為輸入信號頻譜形狀的函數。頻譜形狀的特徵是平坦的(flat=1)或者是傾斜的(flat=0)。對於每個子幀，這個特徵通過對數域比例(LAR)O_i使用一個門限函數來得到。為了避免有較快地變化，根據前一幀的flat值形成一個滯後。如果子幀的插值譜為平坦的(flat=1),則γ₁=0.94，γ₂=0.6；如果子幀的插值譜為傾斜的(flat=0)，則γ_i=0.98，γ₂的值與LP合成濾波器中回應強度相適應，但限制在0.4～0.7之間。如果出現很強的回應，γ₂的值應該接近上限。子幀的加權語音信號為：

基於感覺加權的語音信號，每一幀(10 ms)做一次開環基音分析。為了減少搜索最佳自適應碼本時延複雜性，搜索範圍限定在候選時延T_op附近。通過感覺加權濾波器W(z)/(z)將LP的餘量信號r(n)濾波。這些濾波器的初始狀態通過將LP餘量信號和激勵信號之間的誤差濾波來更新。計算加權合成濾波器的脈衝回應h(n)。然後使用目標信號x(n)和脈衝回應h(n)，通過圍繞開環基音時延值搜索。使用1/3解析度的分數基音時延。一旦確定了基音，就可以通過在給定整數時延k和分數時延t處對後激勵信號u(n)插值計算自適應碼本向量v(n)：

插值濾波器b₃₀基於加漢明窗的sin(x)/x函數並在±29處截斷，在±30處添0。確定了自適應碼本時延後，自適應碼本增益g_p由式(5)得到：

固定碼本基於代數碼本結構，使用交織的單脈衝序列(ISPP)設計。碼本向量c(n)通過40維的零向量來構造，並在所得位置放置4個單脈衝，乘以他們對應的符號：

其中δ(0)是單脈衝。固定碼本通過最小加權語音和加權重構語音之間的均方誤差來搜索。閉環基音搜索中使用的是目標信號減去自適應碼本貢獻後更新，即：

其中是基於前固定碼本能量的預測增益，λ是校正因數。將自適應和固定碼本增益用7B向量量化。合成和加權濾波器的狀態更新是計算下一子幀目標信號所需要的，因而，要進行記憶體更新。 
1.2 解碼器原理
解碼器的構成如圖2所示。首先從接收碼流中提取出參數索引。解碼這些索引後得到相對應10ms語音幀的編碼參數，包括：LSP係數，兩個分數基音時延，兩個固定碼本向量，兩組自適應和固定碼本增益。在每個10 ms幀內對LSP係數做內插後轉換成LP濾波器係數，然後在每個5 ms幀內做以下運算：
    (1) 通過自適應和固定碼本向量由各自增益定標後相加來構造激勵信號。
    (2) 通過LP合成濾波器濾波激勵信號來得到重建的語音信號。
    (3)重建語音交由後處理模組處理。後處理模組包括3個部分：自適應後濾波處理、高通濾波處理和定標處理。

2 G.729編碼器的性能分析
語音編碼研究的主要問題是如何在給定編碼速率下能夠得到較好的重建語音品質，同時要求儘量減少編碼的時延和降低編碼的複雜度。
2.1 編碼速率
    G.729語音編碼演算法CS_ACELP的編碼速率為8Kb/s，這個速率的選擇主要是因為其符合第一代移動數位蜂窩標準(日本是6.7 Kb/s,美國是7.95Kb/s)。另外，這個演算法與其他的語音編碼標準相比屬於速率比較低的一種編碼，因而能夠較好地解決通信中的帶寬不足的問題，所以具有較好的應用前景。
2.2 編碼品質
衡量語音演算法的優劣最重要的就是語音品質，編碼品質的評價分為2類：客觀評價和主觀評價。
客觀評價通常有合成語音信噪比、加權語音信噪比和平均分段信噪比等。客觀評價對於16Kb/s以上的編碼速率能較好的反映人對語音品質的感覺，而對低於16Kb/s的語音品質的評價標準通常採用主觀評價的方法。對於G.729要求在無誤碼的條件下，語音品質不得比32 Kb/s ADPCM品質差。在3%幀刪除條件下，對比無誤碼32 Kb/s ADPCM，MOS（平均評價得分）降低少於0.5。
2.3 編碼的複雜度
編解碼演算法的複雜度與語音編碼品質密切相關，在同碼率的情況下，採用複雜度高的演算法往往能夠得到更好的語音品質。G.729演算法在稍微提高演算法複雜度的同時，大大降低了碼率，同時也能夠較好的保證語音品質。
2.4 編碼的時延
    G.729編碼器採用10 ms語音幀編碼，另外還有5 ms的預測時間，因此總的時延為15ms。在實際實現中由於以下幾個方面還會產生附加的時延：
    (1) 編碼及解碼操作所需的處理時間。
    (2) 通信鏈路上的傳輸時間。
    (3) 將語音資料與其他資料合成所需的複接時間。
3 結語
本文介紹了一種語音編碼的國際標準G729並分析了其性能。作為一種通用的語音編碼標準，他將廣泛的應用於個人移動通信、分組語音通信、衛星通信、微波接力通信以及未來的綜合業務資料網。目前，CELP語音編碼正在向更低速率和更高品質發展，已有方案表明，CELP有在2.4 Kb/s這一傳統聲碼器才能達到的編碼速率上實現高品質編碼的潛力。有理由相信，CELP演算法將在中低速語音編碼領域得到更廣泛的應用，從而進一步推動現代通信技術的發展。

參考文獻

［1］ITU-TRecommendationG729，1996，3
［2］Gerhard Schorder.Deutsche Telekom AG，et al.ITU 8 Kb/s Speech Coding Algorithm with Wireline Quality.IEEE Communications Magazine，1997，9
［3］Akitoshi Kataoka.Shinji HayashiTakehiro.Moriya，et al.Basic Algorithm of Conjugate-structure Algebraic CELP Speech Coder.NTT Review，1996，8(4)
［4］許麗紅，等.G.729 CS_ACELP語音編碼演算法的優化及其DSP實現.上海大學學報（自然科學版），2001，7(1)
［5］於增貴.ITU-T語音編碼標準介紹.通信技術，1997(4)

Bluelove1968

藍色情懷

Bluelove1968 發表在痞客邦留言(0) 人氣()

E-mail轉寄

留言列表