• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當(dāng)前的位置是:  首頁 > 資訊 > 國內(nèi) >
     首頁 > 資訊 > 國內(nèi) >

    華為云奪得國際權(quán)威大賽WSDM Cup 2020金牌

    2020-02-21 13:55:24   作者:   來源:CTI論壇   評(píng)論:0  點(diǎn)擊:


      近日,在美國休斯敦閉幕的第13屆網(wǎng)絡(luò)搜索與數(shù)據(jù)挖掘國際會(huì)議(WSDM 2020)上,華為云帶領(lǐng)的聯(lián)合團(tuán)隊(duì)摘得WSDM Cup 2020大賽“論文引用意圖識(shí)別任務(wù)”金牌。

      WSDM被譽(yù)為全球信息檢索領(lǐng)域最有影響力也最權(quán)威的會(huì)議之一,會(huì)議關(guān)注社交網(wǎng)絡(luò)上的搜索與數(shù)據(jù)挖掘,尤其關(guān)注搜索與數(shù)據(jù)挖掘模型、算法設(shè)計(jì)與分析、產(chǎn)業(yè)應(yīng)用和提升準(zhǔn)確性與效果的實(shí)驗(yàn)分析。今年已經(jīng)是WSDM的第十三屆會(huì)議。

      本次WSDM Cup共有三個(gè)賽題任務(wù),華為云奪金賽題內(nèi)容為“論文引用意圖識(shí)別”:

      “比賽提供一個(gè)論文庫(約含80萬篇論文),同時(shí)提供對(duì)被引用論文的引用文本描述,參賽選手需要根據(jù)論文引用描述從論文庫中匹配三篇最相關(guān)的論文。”

      論文是人類最前沿知識(shí)的媒介,如果可以理解論文中的數(shù)據(jù),可以極大地?cái)U(kuò)充計(jì)算機(jī)理解知識(shí)的能力和范圍。

      在論文中,作者經(jīng)常會(huì)引用其他論文,并對(duì)被引論文做出對(duì)應(yīng)描述。如果通過計(jì)算機(jī)可以自動(dòng)地理解、識(shí)別描述對(duì)應(yīng)的被引論文,不僅可以加深我們對(duì)科研脈絡(luò)的理解,還能在科研知識(shí)圖譜、科研自動(dòng)問答系統(tǒng)和自動(dòng)摘要系統(tǒng)等領(lǐng)域有所進(jìn)步。

      華為云語音語義創(chuàng)新Lab帶領(lǐng)華南理工大學(xué)、華中科技大學(xué)、武漢大學(xué)、江南大學(xué)學(xué)生組成的聯(lián)合團(tuán)隊(duì),針對(duì)該問題制定了“整體召回+重排+集成”的方案。

      在整體召回階段:

      通過輕量化的文本相似度計(jì)算方法(如BM25、TFIDF、Word2Vec等),以較少的計(jì)算代價(jià)從大規(guī)模論文庫中檢索出給定查詢的可能相關(guān)的論文集合。

      在重排階段:

      通過計(jì)算量大但更準(zhǔn)確的方法對(duì)這些候選論文中的每一篇論文計(jì)算和引用描述的相似度值并重新排序,例如采用基于深度學(xué)習(xí)的預(yù)訓(xùn)練語言模型BERT等。華為云團(tuán)隊(duì)觀察到,賽題中所給語料都是生物醫(yī)學(xué)領(lǐng)域,因此采用了基于生物醫(yī)藥和科學(xué)領(lǐng)域語料進(jìn)行預(yù)訓(xùn)練的BioBERT和SciBERT語言模型對(duì)論文進(jìn)行重排。

      在集成階段:

      通過對(duì)所有模型的結(jié)果進(jìn)行集成,最終得到三篇最相關(guān)的論文。

      華為云在本次比賽中運(yùn)用的文本匹配技術(shù),可廣泛用于搜索、對(duì)話機(jī)器人、知識(shí)圖譜構(gòu)建等領(lǐng)域。

      憑借在自然語言處理領(lǐng)域的全棧技術(shù)積累,華為云連續(xù)斬獲了多個(gè)相關(guān)領(lǐng)域權(quán)威比賽冠軍。

      2019年10月華為云在DigSci科學(xué)數(shù)據(jù)挖掘大賽(學(xué)術(shù)論文搜索匹配大賽)上奪冠,精準(zhǔn)率超過第二名5個(gè)百分點(diǎn)。

      在2019 CCF大數(shù)據(jù)與計(jì)算智能大賽決賽中,華為云獲得金融實(shí)體級(jí)情感分析大賽冠軍,體現(xiàn)了在文本情感分析和知識(shí)圖譜領(lǐng)域的實(shí)力。

      目前,華為云語音語義相關(guān)服務(wù)已經(jīng)成功應(yīng)用于政務(wù)、金融、油氣、醫(yī)療、汽車、物流、保險(xiǎn)、電商、稅務(wù)、媒體等具有語音識(shí)別、語言理解、知識(shí)管理等需求的業(yè)務(wù)領(lǐng)域。
     

    【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。

    專題

    CTI論壇會(huì)員企業(yè)

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 留坝县| 淳化县| 略阳县| 望江县| 图木舒克市| 阳泉市| 德兴市| 吉木萨尔县| 莱西市| 清流县| 丰原市| 库尔勒市| 凤冈县| 三门峡市| 潜山县| 平邑县| 哈巴河县| 新丰县| 福州市| 新宁县| 延长县| 古交市| 明水县| 康保县| 海门市| 新泰市| 威海市| 铁力市| 林甸县| 朝阳区| 离岛区| 邵阳县| 沽源县| 南丹县| 旌德县| 军事| 天柱县| 新宁县| 玉龙| 响水县| 仁化县| http://444 http://444 http://444 http://444 http://444 http://444