首頁>>>技術(shù)>>>語音應(yīng)用>>>語音識別(ASR)  語音識別產(chǎn)品

聲紋識別的關(guān)鍵問題

2011/01/05

   聲紋識別可以說有兩個關(guān)鍵問題,一是特征提取,二是模式匹配(模式識別)。

  特征提取的任務(wù)是提取并選擇對說話人的聲紋具有可分性強、穩(wěn)定性高等特性的聲學(xué)或語言特征。與語音識別不同,聲紋識別的特征必須是“個性化”特征,而說話人識別的特征對說話人來講必須是“共性特征”。雖然目前大部分聲紋識別系統(tǒng)用的都是聲學(xué)層面的特征,但是表征一個人特點的特征應(yīng)該是多層面的,包括:
  1. 與人類的發(fā)音機(jī)制的解剖學(xué)結(jié)構(gòu)有關(guān)的聲學(xué)特征(如頻譜、倒頻譜、共振峰、基音、反射系數(shù)等等)、鼻音、帶深呼吸音、沙啞音、笑聲等;
  2. 受社會經(jīng)濟(jì)狀況、受教育水平、出生地等影響的語義、修辭、發(fā)音、言語習(xí)慣等;
  3. 個人特點或受父母影響的韻律、節(jié)奏、速度、語調(diào)、音量等特征。

  從利用數(shù)學(xué)方法可以建模的角度出發(fā),聲紋自動識別模型目前可以使用的特征包括:

  1. 聲學(xué)特征(倒頻譜);
  2. 詞法特征(說話人相關(guān)的詞n-gram,音素n-gram);
  3. 韻律特征(利用n-gram描述的基音和能量“姿勢”);
  4. 語種、方言和口音信息;
  5. 通道信息(使用何種通道);等等。

  根據(jù)不同的任務(wù)需求,聲紋識別還面臨一個特征選擇或特征選用的問題。例如,對“信道”信息,在刑偵應(yīng)用上,希望不用,也就是說希望弱化信道對說話人識別的影響,因為我們希望不管說話人用什么信道系統(tǒng)它都可以辨認(rèn)出來;而在銀行交易上,希望用信道信息,即希望信道對說話人識別有較大影響,從而可以剔除錄音、模仿等帶來的影響。

  總之,較好的特征,應(yīng)該能夠有效地區(qū)分不同的說話人,但又能在同一說話人語音發(fā)生變化時保持相對的穩(wěn)定;不易被他人模仿或能夠較好地解決被他人模仿問題;具有較好的抗噪性能;……。當(dāng)然,這些問題也可以通過模型方法去解決。

CTI論壇報道



相關(guān)閱讀:
聲紋識別技術(shù):利用人體生物特征進(jìn)行身份認(rèn)證 2011-01-05
聲紋識別的原理及其應(yīng)用 2011-01-05
聲紋識別的分類 2011-01-05
Nuance:車載信息平臺邁入語音時代 2010-12-27
臺達(dá)語音:讓消費者使用科技就像呼吸般簡單自然 2010-12-27

熱點專題:  語音合成TTS 語音識別ASR  
相關(guān)頻道:  聲紋識別    

亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 集贤县| 洛南县| 镇康县| 简阳市| 靖宇县| 龙陵县| 松江区| 东明县| 小金县| 襄城县| 会东县| 马关县| 河源市| 平舆县| 建平县| 久治县| 阆中市| 龙江县| 洞口县| 依安县| 饶阳县| 井研县| 华亭县| 洪湖市| 榆林市| 洪泽县| 菏泽市| 洪江市| 河北省| 东莞市| 青铜峡市| 新巴尔虎左旗| 正定县| 资讯 | 会泽县| 博爱县| 锦屏县| 洛浦县| 仁怀市| 清涧县| 大悟县| http://444 http://444 http://444 http://444 http://444 http://444