售前電話
135-3656-7657
售前電話 : 135-3656-7657
話音處理技術(shù)
IP網(wǎng)絡(luò)電路中的話音處理主要需解決兩個(gè)問題。一是在保證一定話音質(zhì)量的前提下盡可能降低編碼比特率,二是在IP網(wǎng)絡(luò)環(huán)境下保證一定的通話質(zhì)量。前者主要是話音編碼技術(shù),包括靜音檢測(cè);后者包括分組丟失補(bǔ)償和回波抵消技術(shù)。歐洲電信標(biāo)準(zhǔn)化委員會(huì)(ETSI)提出了關(guān)于IP網(wǎng)絡(luò)電話QoS的分級(jí)要求,如表1.1所示:
表中,MOS為話音質(zhì)量的主觀評(píng)測(cè)分,最高分為5分。在話音通信中,時(shí)延指標(biāo)是主要的,時(shí)延過大會(huì)使聽話者有不連續(xù)的感覺,而時(shí)延抖動(dòng)是次要的,聽話音對(duì)此感覺不很靈敏。
1.低比特率話音編碼
話音編碼算法需要考慮三個(gè)方面的問題:編碼比特率、話音質(zhì)量和算法復(fù)雜度,一般說來這些指標(biāo)是有矛盾的。比特率越低,線路利用率越高,但話音質(zhì)量會(huì)受到影響;在同樣比特率情況下,算法設(shè)計(jì)越復(fù)雜,話音質(zhì)量會(huì)有所提高,但處理時(shí)延將增加。因此,制訂一個(gè)編碼標(biāo)準(zhǔn),首先必需確定其應(yīng)用環(huán)境,據(jù)此給出其性能要求,然后才能設(shè)計(jì)出編碼方案和算法,實(shí)際上就是在上述三個(gè)指標(biāo)中取得某種折衷。
目前在PSTN中廣泛應(yīng)用的是PCM話音編碼,其比特率為64-kbit/s,話音采樣頻率是8kHz。它屬于波形編碼類型。一般說來,這類編碼的最低比特率為32khit/s,即ADPCM。若要進(jìn)一步降低其比特率,特別是低于16kbit/s的低比特率編碼方案,必須采用新的編碼原理,這就是參數(shù)編碼,又稱作聲碼器(Vocoder)技術(shù)。它是通過模擬人的發(fā)聲器官,提取模型參數(shù)來降低話音信息編碼率的。這種技術(shù)雖然早就提出,但是由于其算法太復(fù)雜未能實(shí)用。直至90年代,微電子業(yè)研制出了高性能的數(shù)字信號(hào)處理(DSP)專用芯片,其定點(diǎn)運(yùn)算能力可高達(dá)幾十個(gè)MIPS,才使聲碼器技術(shù)得以實(shí)際應(yīng)用。首先廣泛使用的是第二代移動(dòng)通信系統(tǒng),其比特率為2.4-13kbit/s。IP網(wǎng)絡(luò)電話推薦使用ITU-T定義的低比特率編碼標(biāo)準(zhǔn),其比特率為5.3-16kbit/s,均為中低復(fù)雜度編碼算法,話音分組長(zhǎng)度在30ms以下,話音質(zhì)量較好。
2.靜音檢測(cè)
靜音檢測(cè)又稱話音活動(dòng)性檢測(cè)(VAI)--VoiceActivityDetection),它是一種靜音壓縮技術(shù)。
在電話通信中,平均說來,每一方說話的時(shí)間和聽對(duì)方說話的時(shí)間大體上各占一半,即使在說話時(shí)也還有停頓間隙,因此任一方對(duì)線路的占用率,也就是話音活動(dòng)度大約只有40%左右。在電路交換中,即使通話者不說話,也要占用64-kbit/s的信道;在分組交換中,由于傳輸通道是統(tǒng)計(jì)復(fù)用的,因此在通話者不講話時(shí)就可以不發(fā)送話音分組,從而進(jìn)一步降低話音比特率。這一技術(shù)的關(guān)鍵就是如何檢測(cè)說話者處于不發(fā)聲狀態(tài),即VAD。檢測(cè)的基本原理是判斷話音信號(hào)能量,當(dāng)?shù)陀谝欢ㄩT限值就認(rèn)為是靜默狀態(tài)。
靜音檢測(cè)有兩個(gè)技術(shù)難點(diǎn)。一是如何在噪聲較大的環(huán)境中檢測(cè)靜音,二是"剪音"(clipping)問題。所謂剪音指的是話音還原時(shí)有一部分被剪切掉了,使人感到失真。其原因是通話者從說話到靜默以及從靜默到說話的檢測(cè)都是要有一定時(shí)間和一定判定門限的,因此當(dāng)通話者從靜默剛剛轉(zhuǎn)為說話時(shí),開始一段微弱話音部分就可能被作為靜默而丟棄了。解決這一問題的方法是在一組突發(fā)話音分組前增加一個(gè)話音分組進(jìn)行平滑,話音突發(fā)后沿剪音也可用同樣方法解決。
在實(shí)際使用中還有一個(gè)問題,如果靜音期不發(fā)任何分組,即完全無聲,收聽者反而會(huì)感到不自然,因此實(shí)用的靜音壓縮算法由兩部分組成:
.話音活動(dòng)性檢測(cè)器(VAD):制定輸入信號(hào)是話音還是背景噪聲。如果信號(hào)被確認(rèn)為話音,就以編碼算法規(guī)定的固定比特率對(duì)其編碼;如果信號(hào)被確認(rèn)為噪聲,就以非常低的比特率對(duì)其編碼,或者根本就不發(fā)送任何比特。
·舒適噪聲生成器(CNG):接收方采用某種機(jī)制重構(gòu)背景噪聲的主要特征。噪聲生成方法的設(shè)計(jì)必須保證解碼器和編碼器之間的同步;即使在某段時(shí)間內(nèi)編碼器未發(fā)出任何比特,解碼器也能正確理解,使得復(fù)原后話音的有音段和無音段之間有平滑的過渡。
3.分組丟失補(bǔ)償
在IP網(wǎng)絡(luò)中分組丟失是不可避免的,丟失的原因可能是線路誤碼或者網(wǎng)絡(luò)路由故障,更常見的原因則是傳輸時(shí)延過長(zhǎng)或網(wǎng)絡(luò)擁塞導(dǎo)致分組被丟棄。由于低比特率聲碼器都是基于線性預(yù)測(cè)編碼原理,其當(dāng)前值是通過以前歷史值線性組合而得,因此通過內(nèi)插的方法不難得到丟失分組的近似估計(jì)值。mJ-T定義的標(biāo)準(zhǔn)編碼的解碼器部分都已包含分組丟失補(bǔ)償這一功能。實(shí)際試驗(yàn)表明,如果Internet電話話音分組丟失兩個(gè)以上,則可能此時(shí)網(wǎng)絡(luò)連接狀態(tài)很差,將會(huì)有一大堆分組丟失。所以Internet電話分組丟失補(bǔ)償以處理一個(gè)分組丟失為主要目的。所幸的是,話音通信對(duì)分組丟失的容忍性遠(yuǎn)比數(shù)據(jù)通信強(qiáng),一般不會(huì)影響通話的可懂度。
4.回波抵消