• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
     首頁 > 技術(shù) > 應(yīng)用案例 > 科大訊飛電話語音識別InterReco 2.0產(chǎn)品簡介

    科大訊飛電話語音識別InterReco 2.0產(chǎn)品簡介

    2008-08-11 00:00:00   作者:   來源:   評論:0 點(diǎn)擊:


    2008/08/11

    一、產(chǎn)品概述

      InterReco2.0在復(fù)雜環(huán)境的識別效果均有不俗表現(xiàn),產(chǎn)品考慮了呼叫中心、增值服務(wù)中的不同應(yīng)用特點(diǎn),易于開發(fā)集成及進(jìn)行業(yè)務(wù)開發(fā),主要功能有如下:

    • 大詞匯量、獨(dú)立于說話人的健壯識別功能

    •   識別系統(tǒng)能對多種語言進(jìn)行大詞匯量的識別,在中文識別方面使用了訊飛TTS引擎使用的詞典和文本分析技術(shù),能夠?qū)φZ法內(nèi)容進(jìn)行分詞處理,保證多音字的識別效果。

    • 端點(diǎn)檢測與打斷(End Pointer && Barge-In)

    •   端點(diǎn)檢測是對輸入的音頻流確定語句的起始和終止的處理過程。當(dāng)找到語句的起始和終止點(diǎn)后,語句區(qū)向前后分別延伸預(yù)定的長度。一旦檢測到語句的起始點(diǎn),語音開始流向識別引擎,直到檢測到語句的終止點(diǎn)。通過這種方式,識別引擎在用戶在講話的同時(shí),已經(jīng)開始處理講話的內(nèi)容,而又不需要處理語音的起止處多余的靜音,從而節(jié)約CPU時(shí)間和網(wǎng)絡(luò)帶寬。

        打斷功能使用戶可以打斷提示、作出響應(yīng),無需等到提示音結(jié)束播放。打斷功能使得用戶和系統(tǒng)間的交流更加快捷、自然,特別是系統(tǒng)的熟練用戶。

    • 多識別結(jié)果和置信度(N-Best && CM)

    •   對于有些應(yīng)用程序,可能需要識別引擎產(chǎn)生可能的識別結(jié)果集,而不是一個(gè)最好的結(jié)果。系統(tǒng)提供了可能的識別結(jié)果列表,并按可能性從高到低排列。

        語音識別引擎在返回識別結(jié)果時(shí)會攜帶該識別結(jié)果的置信度,對多個(gè)識別結(jié)果給出其可能性的指標(biāo),準(zhǔn)確的置信度輸出可以為識別結(jié)果的分析和后續(xù)處理提供依據(jù),改善在用戶語音不清晰、語義不明確時(shí)的效果體驗(yàn)。

    • 語音錄入(Voice Enrollment)

    •   允許用戶通過本人語音來向動態(tài)語法增加命令或詞表。這種方式不但能夠有效利用用戶個(gè)性化的語音,提高系統(tǒng)的識別準(zhǔn)確率;而且能夠提高用戶輸入詞表的方便性和靈活性。例如,在語音通訊錄的應(yīng)用中,用戶可以通過語音的方式來添加通訊錄,從而使用戶可以隨時(shí)隨地修改自己的通訊錄。

    • 動態(tài)語法

    •   動態(tài)語法是由應(yīng)用程序在運(yùn)行時(shí)動態(tài)創(chuàng)建和修改的語法。這在應(yīng)用程序詞匯必須在運(yùn)行時(shí)才能完全確定的情況下是必不可少的。

    • 呼叫日志(Call Logging)

    •   語音識別的調(diào)用日志在系統(tǒng)中有著非常重要的作用,該日志記錄了輸入的音頻、加載的語法、識別過程的中間結(jié)果、識別模塊調(diào)用過程、識別使用的各種參數(shù)、識別結(jié)果以及當(dāng)時(shí)的系統(tǒng)環(huán)境信息。這些數(shù)據(jù)是效果分析的依據(jù),詳盡的Call-Log是效果優(yōu)化的基礎(chǔ)。

    • 說話人自適應(yīng)

    •   當(dāng)用戶多次使用同一識別系統(tǒng)時(shí),識別引擎能夠逐步適應(yīng)其口音,使該使用者的識別效果逐步提高。同時(shí),如果預(yù)先給定特定說話人的數(shù)據(jù),系統(tǒng)可以針對特定說話人進(jìn)行自適應(yīng)訓(xùn)練以獲得更加適合其發(fā)音特征的語音模型,使該說話人在使用系統(tǒng)時(shí),識別效果更好。

    • 多槽識別

    •   語音識別的槽(Slot)代表一個(gè)關(guān)鍵字,即在一次識別中可以識別多個(gè)關(guān)鍵字,這種識別模式可以提高語音識別的使用效率和用戶體驗(yàn)。

    • 模型自適應(yīng)

    •   針對每個(gè)應(yīng)用專門優(yōu)化通用模型從而更加適合應(yīng)用:包括方言和口音的說話人特征,無線設(shè)備、VoIP設(shè)備等通道特征,詞匯和環(huán)境噪聲等應(yīng)用特征。
      InterReco2.0除了在核心技術(shù)指標(biāo)上一系列優(yōu)異的表現(xiàn)外,針對語音識別集成開發(fā)和業(yè)務(wù)實(shí)現(xiàn)難的問題,InterReco2.0還提供了一整套易用的開發(fā)接口和工具,使語音識別應(yīng)用的合作伙伴可以基于該引擎方便的開發(fā)應(yīng)用系統(tǒng),并通過所提供的工具及時(shí)發(fā)現(xiàn)開發(fā)中出現(xiàn)的問題。此外InterReco2.0在業(yè)務(wù)實(shí)現(xiàn)階段,提供了簡單易用的語法設(shè)計(jì)和實(shí)現(xiàn)方式,用戶甚至寫漢字就可以實(shí)現(xiàn)語音識別語法的編寫,系統(tǒng)還提供了語法向?qū)В渲幸呀?jīng)內(nèi)置了常用業(yè)務(wù)語法,使用戶可以更簡單的使用語音識別系統(tǒng)。相信隨著科大訊飛發(fā)布國際領(lǐng)先的電信級中文語音識別產(chǎn)品,通過和合作伙伴的共同努力,語音識別將為合作伙伴帶來更大的增值空間,中文語音識別產(chǎn)業(yè)將獲得更快的發(fā)展。

    CTI論壇編輯

    相關(guān)閱讀:

    分享到: 收藏

    專題

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 汉阴县| 吉木萨尔县| 大荔县| 汉源县| 泰和县| 田东县| 鄂尔多斯市| 绥江县| 城步| 阿图什市| 商都县| 建平县| 乌兰浩特市| 巴东县| 新干县| 永昌县| 太仆寺旗| 于田县| 象州县| 汾西县| 易门县| 大庆市| 雷山县| 黄浦区| 峨眉山市| 五寨县| 六安市| 高陵县| 轮台县| 利辛县| 鸡东县| 巴林右旗| 奈曼旗| 林甸县| 沿河| 广灵县| 遵化市| 称多县| 龙里县| 福鼎市| 朝阳区| http://444 http://444 http://444 http://444 http://444 http://444