• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當前的位置是:  首頁 > 新聞 > 國際 >
     首頁 > 新聞 > 國際 >

    Google更新云端語音轉文字服務、聽寫電話出錯率減少54%

    2018-04-10 16:47:48   作者:   來源:CTI論壇   評論:0  點擊:


      Cloud Speech-to-Text服務大改版,提供命令與搜尋、電話、影片與預設4種模式,其中強化後的電話模式聽寫電話的錯誤率降低了54%,而與YouTube加上字幕技術雷同的影片模式轉錄錯誤率也降低了64%。
      繼上個月發(fā)表云端文字轉語音(Cloud Text-to-Speech)服務之後,Google在周一(4/9)更新了云端語音轉文字(Cloud Speech-to-Text)服務,提供全新的影片及電話轉錄模型,也新增了自動化標點符號功能。相較於原本的電話模型,新的強化版電話轉錄模型(enhanced phone_call model)讓語音辨識的錯誤率減少了54%。
      Google於2016年發(fā)表的Cloud Speech-to-Text原名為Cloud Speech API,可辨識包括中文在內的逾120種語言,本周則是該服務建立以來最大規(guī)模的改版,它提供了4種客制化模式,包括命令與搜尋(command_and_search)、電話(phone_call)、影片(video)與預設(default),其中,電話模型適用於基於8khz取樣率記錄的電話內容,而預設模型則多用在音質較好、時間較長、取樣率高於16khz以上的音頻,使用者可依照不同的使用情境選擇適用的模型,以順利將語音轉換成文字。
      Google Cloud AI產品經理Dan Aharon表示,有許多云端供應商利用客戶的請求來改善相關服務,但基於資料及隱私保護的立場,Google并不打算采用這樣的作法,取而代之的是推出業(yè)界首創(chuàng)的「選擇加入計畫」( opt-in program),讓客戶主動提供資料供Google紀錄與分析,而首個成品就是強化版電話轉錄模式,該計畫成功地讓Cloud Speech-to-Text的電話轉錄服務減少了54%的錯誤。
      至於新的影片模式則可用來將影片中的語音轉換成文字,或是轉錄同時有多人開講的語音,該模式所使用的機器學習技術與YouTube自動化字幕背後的技術雷同,相較於原本的預設模式,影片模式的轉錄錯誤率也降低了64%。
      不管是強化版的語音模式或影片模式現在都只支援英文,預計很快就會擴張至其它語言。
      除了全新的語音及影片模式之外,新版的Cloud Speech-to-Text還準備在將語音轉成文字之後,自動加入標點符號,以讓文字更容易閱讀,目前該模式仍屬於測試階段,可提供逗點、句號或問號等標點符號的建議。
      除了影片模式每15秒的收費為0.012美元之外,其它模式的費用皆為每15秒0.006美元,為了推廣全新的影片模式,截至今年5月31日可享用每15秒0.006美元的優(yōu)惠價。
    【免責聲明】本文僅代表作者本人觀點,與CTI論壇無關。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

    專題

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 即墨市| 甘肃省| 咸宁市| 桓仁| 临泽县| 枞阳县| 三门县| 沁源县| 二手房| 且末县| 临高县| 吉林省| 吉木萨尔县| 余干县| 西乌珠穆沁旗| 长海县| 普宁市| 广西| 万年县| 凌云县| 永靖县| 容城县| 石狮市| 砀山县| 汝阳县| 宣城市| 龙江县| 育儿| 洱源县| 芦山县| 文山县| 通江县| 宜章县| 望都县| 格尔木市| 鸡泽县| 台南县| 波密县| 福州市| 马尔康县| 蕲春县| http://444 http://444 http://444 http://444 http://444 http://444