首頁(yè)>>廠商>>語(yǔ)音識(shí)別與合成>>得意音通

國(guó)際領(lǐng)先的“得意”聲紋識(shí)別引擎

2005/07/20

  得意公司的聲紋識(shí)別引擎(d-Ear VPR)包括聲紋辨認(rèn)版本和聲紋確認(rèn)版本,可以是文本無(wú)關(guān)的,也可以是文本相關(guān)的,而且均支持開集的識(shí)別方式。其中文本無(wú)關(guān)的版本同時(shí)具有文本和語(yǔ)言的無(wú)關(guān)性,對(duì)語(yǔ)音長(zhǎng)度的要求也非常低,通常訓(xùn)練只需要幾十秒有效語(yǔ)音,而識(shí)別階段只需幾秒鐘的有效語(yǔ)音即可。有很高的識(shí)別精度,也可以靈活地調(diào)整操作點(diǎn)參數(shù)從而適應(yīng)于不同應(yīng)用的需求。

"得意"聲紋識(shí)別引擎具備以下技術(shù)特征:
  1. 對(duì)聲紋的識(shí)別與所說(shuō)的文本和語(yǔ)言無(wú)關(guān)性。用戶訓(xùn)練系統(tǒng)和系統(tǒng)對(duì)用戶的聲音進(jìn)行鑒別和確認(rèn),可以是完全不同的文本,完全不同的語(yǔ)言。比如,在用戶在系統(tǒng)注冊(cè)聲音時(shí),可以使用中文說(shuō)一段文學(xué)章節(jié),而識(shí)別時(shí)用戶可以用英文談?wù)撚?jì)算機(jī)的發(fā)展方向。

  2. 對(duì)語(yǔ)音長(zhǎng)度沒有特殊要求。訓(xùn)練語(yǔ)音最長(zhǎng)8秒,使用時(shí)的測(cè)試語(yǔ)音2-4 秒,并可不斷累積調(diào)整聲紋模型精度;用戶訓(xùn)練系統(tǒng),讓其記住其聲紋,只需要幾秒種的聲音;而在識(shí)別時(shí),系統(tǒng)只要獲得被測(cè)試人幾秒的聲音,就可以進(jìn)行聲紋識(shí)別。

  3. 很高的精度。d-Ear VPR技術(shù)的辨認(rèn)和確認(rèn)準(zhǔn)確度都很高,說(shuō)話人辨認(rèn)的正確率不小于99%;說(shuō)話人確認(rèn)的誤識(shí)率和誤拒率均低于1%;

  4. 識(shí)別速度快,能確保實(shí)時(shí)識(shí)別。聲紋識(shí)別引擎具有十倍以上的實(shí)時(shí)率,可多路并發(fā)識(shí)別,即10秒的語(yǔ)音片斷,引擎1秒內(nèi)就可以處理完成。

  5. 操作點(diǎn)調(diào)整方便:根據(jù)"準(zhǔn)確率+不確定率+錯(cuò)誤率=100%",可按不同的應(yīng)用需求調(diào)整操作點(diǎn)閾值,使最終準(zhǔn)確率達(dá)到最高或使錯(cuò)誤率降到最低。

  6. 聲紋模型存儲(chǔ)空間小:每個(gè)人的聲紋模型存儲(chǔ)空間小于5KB。

  7. 高安全性,不怕錄音冒用:如果別人用各類錄音設(shè)備(比如錄音機(jī)、MP3、錄音電話、竊聽器、高精度的專業(yè)錄音系統(tǒng)等)事先錄下您的聲音,即使錄音設(shè)備很先進(jìn)、錄音效果非常好,在把錄音回放嘗試進(jìn)行聲紋身份認(rèn)證時(shí),聲音信號(hào)經(jīng)過模擬到數(shù)字、再?gòu)臄?shù)字到模擬的兩次信號(hào)轉(zhuǎn)換過程,聲音的頻譜就會(huì)有明顯的衰減和失真,這種失真很容易被聲紋加密鎖的認(rèn)證程序分辯出來(lái)。所以依靠錄音去嘗試登錄,不能通過聲紋認(rèn)證,也就是說(shuō),通過錄音不能冒用身份。


"得意"聲紋識(shí)別技術(shù)與其他聲紋識(shí)別技術(shù)的比較

 
得意聲紋識(shí)別技術(shù)
其他聲紋識(shí)別技術(shù)
1 具文本無(wú)關(guān)性,確保了身份確認(rèn)的安全性和用戶的方便性
  對(duì)聲紋的識(shí)別與所說(shuō)的文本和語(yǔ)言無(wú)關(guān),用戶訓(xùn)練系統(tǒng)和系統(tǒng)對(duì)用戶的聲音進(jìn)行鑒別和確認(rèn),可以是完全不同的文本,完全不同的語(yǔ)言。比如,在用戶在系統(tǒng)注冊(cè)聲音時(shí),可以使用中文說(shuō)一段文學(xué)章節(jié),而識(shí)別時(shí)用戶可以用英文談?wù)撚?jì)算機(jī)的發(fā)展方向。
與文本相關(guān),安全性和使用方便性都顯不足
   對(duì)聲紋的識(shí)別與所說(shuō)的文本和語(yǔ)言相關(guān),用戶訓(xùn)練系統(tǒng)和系統(tǒng)對(duì)用戶的聲音進(jìn)行鑒別和確認(rèn),必須是完全一致的文本,使用相同的語(yǔ)言,容易導(dǎo)致口令的外泄。
2 對(duì)語(yǔ)音長(zhǎng)度沒有特殊要求,方便實(shí)際的應(yīng)用
   使用時(shí)的測(cè)試語(yǔ)音2-4 秒,并可不斷累積調(diào)整聲紋模型精度;用戶訓(xùn)練系統(tǒng),讓其記住其聲紋,只需要幾秒種的聲音;而在識(shí)別時(shí),系統(tǒng)只要獲得被測(cè)試人幾秒的聲音,就可以進(jìn)行聲紋識(shí)別。
要求進(jìn)行特定的語(yǔ)音訓(xùn)練,用戶需跟著朗讀和學(xué)習(xí),方便性和實(shí)用性不強(qiáng)
3 很高的精度
   得意的技術(shù)辨認(rèn)和確認(rèn)準(zhǔn)確度都很高,說(shuō)話人辨認(rèn)的正確率不小于99%;說(shuō)話人確認(rèn)的誤識(shí)率和誤拒率均低于1%
精度一般
  識(shí)別精度約為90%,誤識(shí)率和誤拒率相對(duì)較高
4 操作點(diǎn)調(diào)整方便
  可根據(jù)實(shí)際情況和環(huán)境,按不同的應(yīng)用需求調(diào)整操作點(diǎn)閾值,使最終準(zhǔn)確率達(dá)到最高或使錯(cuò)誤率降到最低。
沒有操作點(diǎn)調(diào)整功能
  不同用戶和不同的環(huán)境使用只能使用同一模型,不能確保高的安全性和準(zhǔn)確率
5 聲紋模型存儲(chǔ)空間小
   每個(gè)人的聲紋模型存儲(chǔ)空間小于5KB,能可靠地存儲(chǔ)于加密鑰匙內(nèi),與硬件緊密結(jié)合能最高程度地保證系統(tǒng)的安全性,防止非法的攻擊和竊取
聲紋模型存儲(chǔ)空間小
   不能存儲(chǔ)于加密鑰匙內(nèi),沒有硬件的保護(hù),不能有效防止非法的攻擊和竊取

得意音通公司供稿 CTI論壇編輯



相關(guān)鏈接:
得意珠三角綜合智能信息增值平臺(tái)項(xiàng)目中標(biāo) 2009-08-20
北京軟件產(chǎn)品質(zhì)量檢測(cè)檢驗(yàn)中心對(duì)《海量語(yǔ)音文件的目標(biāo)說(shuō)話人篩選系統(tǒng)》進(jìn)行測(cè)試 2009-06-25
廣東政府和清華大學(xué)舉行了全面開展產(chǎn)學(xué)研合作協(xié)議簽約儀式 2009-06-25
得意中文整句輸入法V1.0開源for Windows Mobile5.0 2009-01-23
得意聲紋識(shí)別VPR4.0_b20080808新版本發(fā)布 2008-08-27

相關(guān)頻道:           文摘   技術(shù)_語(yǔ)音識(shí)別_文摘
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 永安市| 西青区| 屏边| 灵山县| 突泉县| 中山市| 山丹县| 石嘴山市| 诸暨市| 潢川县| 颍上县| 怀远县| 利辛县| 岐山县| 鄂州市| 闻喜县| 克什克腾旗| 三河市| 府谷县| 金堂县| 德庆县| 玉田县| 会同县| 拜城县| 阳城县| 平谷区| 扶绥县| 久治县| 石林| 彭水| 北票市| 黄浦区| 永兴县| 建平县| 金塔县| 离岛区| 高尔夫| 游戏| 宁河县| 丹江口市| 南宁市| http://444 http://444 http://444 http://444 http://444 http://444