• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當(dāng)前的位置是:  首頁 > 技術(shù) > 技術(shù)動(dòng)態(tài) >
     首頁 > 技術(shù) > 技術(shù)動(dòng)態(tài) > 谷歌最新AI大語言模型PaLM2數(shù)據(jù)量擴(kuò)充5倍 比現(xiàn)有的任何模型都更加強(qiáng)大

    谷歌最新AI大語言模型PaLM2數(shù)據(jù)量擴(kuò)充5倍 比現(xiàn)有的任何模型都更加強(qiáng)大

    2023-05-17 10:29:09   作者:   來源:C114通信網(wǎng)   評(píng)論:0  點(diǎn)擊:


      據(jù)報(bào)道,谷歌上周發(fā)布的最新大語言模型使用的訓(xùn)練數(shù)據(jù),幾乎是 2022 年的上一代模型的 5 倍。得益于此,該模型在編程、數(shù)學(xué)和創(chuàng)意寫作方面的表現(xiàn)更為優(yōu)秀。

      谷歌是在其 I / O 開發(fā)者大會(huì)上發(fā)布最新通用大語言模型 PaLM2 的。內(nèi)部文件顯示,該模型采用了 3.6 萬億個(gè)令牌(token)進(jìn)行訓(xùn)練。令牌指的是單詞串,這是訓(xùn)練大語言模型的重要基礎(chǔ),因?yàn)檫@可以教給模型如何預(yù)測(cè)字符串中可能出現(xiàn)的下一個(gè)單詞。

      之前版本的 PaLM 發(fā)布于 2022 年,當(dāng)時(shí)使用的令牌為 7800 億個(gè)。

      雖然谷歌很希望展示其人工智能技術(shù)的實(shí)力,以及嵌入搜索、電子郵件、字處理和電子表格后的效果,但該公司卻不愿發(fā)布其訓(xùn)練數(shù)據(jù)的規(guī)模和其他細(xì)節(jié)。微軟支持的 OpenAI 也對(duì)其最新的 GPT-4 大語言模型的細(xì)節(jié)信息保密。

      這些公司表示,之所以不披露這些信息,是出于商業(yè)競(jìng)爭(zhēng)考慮。谷歌和 OpenAI 都在努力吸引想要用聊天機(jī)器人代替?zhèn)鹘y(tǒng)搜索引擎,從而直接獲取答案的用戶。

      但隨著人工智能軍備競(jìng)賽日趨白熱化,相關(guān)研究人員也呼吁企業(yè)加大透明度。

      自從發(fā)布 PaLM2 之后,谷歌一直表示新的模型比之前的大語言模型更小,這就意味著該公司的技術(shù)效率得以提升,但卻可以完成更加復(fù)雜的任務(wù)。內(nèi)部文件顯示,PaLM2 基于 3400 億個(gè)參數(shù)訓(xùn)練 —— 這項(xiàng)指標(biāo)可以說明該模型的復(fù)雜程度。最初的 PaLM 則基于 5400 億個(gè)參數(shù)訓(xùn)練。

      目前,谷歌尚未對(duì)此置評(píng)。

      谷歌在一篇關(guān)于 PaLM2 的博文中表示,該模型使用了一種名為“計(jì)算機(jī)優(yōu)化擴(kuò)張”的新技術(shù)。這就讓大語言“更高效、整體性能更好,包括加快推理速度、減少參數(shù)調(diào)用和降低服務(wù)成本。”

      在宣布 PaLM2 時(shí),谷歌證實(shí)了此前的媒體報(bào)道,計(jì)該模型針對(duì) 100 種語言進(jìn)行訓(xùn)練,可以執(zhí)行更廣泛的任務(wù)。它已經(jīng)被用于 25 項(xiàng)功能和產(chǎn)品,包括該公司的實(shí)驗(yàn)性聊天機(jī)器人 Bard。按照從小到大的規(guī)模劃分,該模型共有 4 種,分別是壁虎(Gecko)、水獺(Otter)、野牛(Bison)和獨(dú)角獸(Unicorn)。

      根據(jù)公開披露的信息,PaLM2 比現(xiàn)有的任何模型都更加強(qiáng)大。Facebook 在 2 月份宣布的的 LLaMA 大語言模型采用 1.4 萬億個(gè)令牌。OpenAI 上一次披露 GPT-3 的訓(xùn)練規(guī)模時(shí)表示,它當(dāng)時(shí)基于 3000 億個(gè)令牌。OpenAI 今年 3 月發(fā)布 GPT-4 時(shí)表示,它在許多專業(yè)測(cè)試中展示出“與人類媲美的表現(xiàn)”。

      LaMDA 是谷歌兩年前推出的一個(gè)對(duì)話型大語言模型,在今年 2 月還與 Bard 一同對(duì)外宣傳。該模型基于 1.5 萬億個(gè)令牌訓(xùn)練。

      隨著新的人工智能應(yīng)用快速進(jìn)入主流,圍繞底層技術(shù)的爭(zhēng)議也越來越激烈。

      谷歌高級(jí)研究科學(xué)家艾爾 邁赫迪 艾爾 麥哈麥迪(El Mahdi El Mhamdi)于今年 2 月辭職,主要原因就是人工智能技術(shù)缺乏透明度。本周二,OpenAI CEO 山姆 阿爾特曼(Sam Altman)出席美國(guó)國(guó)會(huì)針對(duì)隱私和技術(shù)舉行的聽證會(huì),他也認(rèn)為需要設(shè)立一套新的制度來應(yīng)對(duì)人工智能的潛在問題。

      “對(duì)于一種全新的技術(shù),我們需要一套全新的框架。”阿爾特曼說,“當(dāng)然,像我們這樣的公司應(yīng)當(dāng)為我們推出的工具承擔(dān)許多責(zé)任。”

    【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。

    相關(guān)閱讀:

    專題

    CTI論壇會(huì)員企業(yè)

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 禹州市| 青州市| 榆树市| 沙田区| 东阳市| 什邡市| 巴中市| 丹阳市| 廊坊市| 凯里市| 杭州市| 陇南市| 舞阳县| 石家庄市| 涿鹿县| 成都市| 万全县| 土默特左旗| 曲沃县| 天长市| 钦州市| 张家川| 东宁县| 莒南县| 隆昌县| 扎鲁特旗| 桃江县| 小金县| 白玉县| 习水县| 察雅县| 甘德县| 永寿县| 丘北县| 温州市| 石林| 易门县| 抚州市| 万荣县| 武清区| 丁青县| http://444 http://444 http://444 http://444 http://444 http://444