• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當前的位置是:  首頁 > 資訊 > 文章精選 >
     首頁 > 資訊 > 文章精選 >

    陳根:Meta又有新動作——開發(fā)支持128種語言的模型

    2021-11-24 13:47:20   作者:   來源:CTI論壇   評論:0  點擊:


      今年10月28日,F(xiàn)acebook正式宣布將母公司改名為Meta,而Facebook成為其母公司旗下眾多產(chǎn)品之一。Meta一詞源于科幻元宇宙Metaverse,反映出該公司搭建元宇宙的決心。
      此前,為了提升元宇宙中的觸感交互,Meta公司的研究團隊開發(fā)了一款觸覺手套,這種手套舒適、可定制,最重要的是能夠在虛擬世界中再現(xiàn)一系列感覺,包括紋理、壓力和振動等。
      近日,Meta公司又有新動作。其發(fā)布了自監(jiān)督語音處理模型XLS-R,該模型共支持128種語言,目的是助力元宇宙中的跨語種交流。
      當今,有據(jù)可考的語言有7000余種。盡管現(xiàn)在的翻譯系統(tǒng)越來越強大,但要用AI完全實現(xiàn)這些語言的互通并非易事。一般來說,語料庫的豐富程度決定了語言翻譯模型的質量,現(xiàn)有的語音翻譯一般集中于大語種之間,小語種語料往往比較匱乏,因此使用這類母語的人往往較難通過AI獲得較高的翻譯質量。
      但XLS-R通過自監(jiān)督技術對10倍的語音數(shù)據(jù)進行訓練,大大改善了以前的多語言模型,尤其是小語種的處理。因此母語不同的人,比如一位說英語,一位說漢語的人,兩人可以靠XLS-R在元宇宙中進行無障礙對話。
      XLS-R基于的是Facebook去年發(fā)布的wav2vec 2.0技術。該技術通過多層卷積神經(jīng)網(wǎng)絡對語音音頻進行編碼,以及對產(chǎn)生的潛伏語音表征進行跨度遮蔽,能夠建立捕捉整個序列信息的表征。
      這樣訓練出的模型,可以預測音頻中被掩蔽部分的正確語音單元,同時也可以學習新的語音單元。在此基礎上開發(fā)的XLS-R,不僅能夠建立上下文表征,還可以捕獲整個潛伏表征序列上建立的依賴關系。
      XLS-R共有20億參數(shù),它在測試的37種語言中,表現(xiàn)優(yōu)于大多數(shù)語種先前的工作。甚至在老撾語等小語種識別上,也能低于之前的錯誤率。此外,XLS-R也讓低資源語言與英語之間的翻譯大幅改進,例如從印度尼西亞語到英語的翻譯,準確性平均翻了一番。
      目前,XLS-R還只是一個預訓練模型,為了能更好的應用于具體任務,還需要對其進行相關改進。
    【免責聲明】本文僅代表作者本人觀點,與CTI論壇無關。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

    相關閱讀:

    專題

    CTI論壇會員企業(yè)

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 定襄县| 丽江市| 漠河县| 缙云县| 濮阳县| 应城市| 枣阳市| 凤凰县| 姜堰市| 古田县| 英山县| 潍坊市| 安国市| 娄底市| 武强县| 凯里市| 从化市| 古交市| 大埔县| 阿瓦提县| 茶陵县| 玛纳斯县| 黔东| 淄博市| 泰安市| 高陵县| 抚松县| 宁南县| 兴文县| 玉溪市| 长葛市| 晴隆县| 都兰县| 汉中市| 雅安市| 色达县| 遂宁市| 沐川县| 洛隆县| 聂荣县| 姚安县| http://444 http://444 http://444 http://444 http://444 http://444