近日，阿里AI開源了新一代人機對話模型Enhanced Sequential Inference Model(ESIM)。ESIM是一種專為自然語言推斷而生的加強版LSTM，據(jù)阿里介紹，該算法模型自2017年被提出之后，已被谷歌、facebook在內(nèi)的國際學(xué)術(shù)界在論文中引用200多次，更曾在國際頂級對話系統(tǒng)評測大賽(DSTC7)上獲得雙料冠軍，并將人機對話準(zhǔn)確率的世界紀(jì)錄提升至94.1%。

　　ESIM模型在智能客服、導(dǎo)航軟件、智能音箱等場景均具有廣泛的應(yīng)用前景。阿里AI發(fā)布了相關(guān)論文介紹了該模型，雷鋒網(wǎng)AI科技評論將其編譯如下。

　　ESIM引入背景

　　極具潛力和商業(yè)價值的人機對話系統(tǒng)正在受到越來越多的關(guān)注。隨著近來深度學(xué)習(xí)模型的引入，我們在構(gòu)建端到端的對話系統(tǒng)過程中有了更高的成功幾率。然而這一對話系統(tǒng)的構(gòu)建仍然充滿了挑戰(zhàn)，它要求系統(tǒng)記憶并理解多輪對話文本，而不是像單輪對話系統(tǒng)那樣僅僅考慮當(dāng)前的話語內(nèi)容。

　　多輪對話系統(tǒng)建�？煞譃榛谏晌谋镜姆椒ê突跈z索的方法�；跈z索的方法將從多輪對話的候選池中選擇最佳回復(fù)，該方法可視為對多輪回復(fù)文本選擇任務(wù)的執(zhí)行。選擇回復(fù)文本的典型方法主要包括基于序列的方法和基于層級信息的方法�；谛蛄械姆椒ㄍǔυ掃B接成一個長序列，而基于層級信息的方法通常會分別對每個對話文本進行建模，然后再對話語之間的交互進行建模。

　　最近，有研究工作稱基于層級信息的方法與復(fù)雜神經(jīng)網(wǎng)絡(luò)結(jié)合可以實現(xiàn)比基于序列方法更顯著的增益效果。但在本文中，我們依然選擇研究基于序列的方法即增強序列推理模型(ESIM)的有效性，該模型最初是為了自然語言推理(NLI)任務(wù)而開發(fā)。

　　在DSTC7對話回復(fù)選擇挑戰(zhàn)賽中，我們的模型在兩個數(shù)據(jù)集(即Advising和Ubuntu數(shù)據(jù)集)中都排名第一。除此之外，我們的模型在兩個大型公共基準(zhǔn)數(shù)據(jù)集(LowesUbuntu)上都比以前所有模型的效果更好，其中也包括上面所提到的最先進的基于層級信息的模型。我們的開源代碼可在https://github.com/alibaba/ESIM上獲得。

　　基于層級信息的方法通常會使用額外的神經(jīng)網(wǎng)絡(luò)來對多輪對話之間的關(guān)系進行模擬，該方法需要將多輪對話中的文本進行分段截取，使其具有相同的長度并且短于最大長度。然而，每輪對話的長度通常在實際任務(wù)中會有很大的變化，當(dāng)使用較大的最大長度值時，我們則需要在基于層級信息的方法中添加大量的0進行填充，這將極大地增加計算復(fù)雜性和內(nèi)存成本；而當(dāng)使用較小的最大長度時，我們則可能在多輪對話環(huán)境中丟失一些重要信息。

　　我們建議在多輪對話回復(fù)選擇任務(wù)中使用基于序列的ESIM模型來有效地解決基于層級信息方法所遇到的上述問題。該方法將多輪對話內(nèi)容連接成一個長序列，并將多輪對話回復(fù)選擇任務(wù)轉(zhuǎn)換為一個句子對的二進制分類(即下一個句子是否是當(dāng)前對話的回復(fù))任務(wù)。

　　與基于層級信息的方法相比，ESIM有兩個主要優(yōu)點。首先，由于ESIM不需要使每個話語具有相同的長度，因此它具有較少的零填充，可以比基于層級信息的方法更具計算效率。其次，ESIM以一種有效的方式隱式地模擬對話中話語之間的交互，而并沒有使用額外復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)，詳情如下文中「模型說明」部分所述。

　　任務(wù)描述

　　對話系統(tǒng)技術(shù)挑戰(zhàn)賽(DSTC7)劃分了三個不同的賽道，而我們提出的方法則是針對「端到端的回復(fù)選擇」主題的賽道。該賽道側(cè)重于面向目標(biāo)的多輪對話，著重于從一組對話候選文本中選擇正確的回復(fù)。參與該賽道的比賽系統(tǒng)不能使用基于人工數(shù)據(jù)或基于規(guī)則的數(shù)據(jù)，而需要使用比賽方提供的Ubuntu和Advising這兩個數(shù)據(jù)集，這些在「實驗部分」我們會做詳細的介紹。

亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩,日本久久久久,日本-区二区三区免费精品,中文字幕日本亚洲欧美不卡

阿里 AI 新一代人機對話模型介紹

評論排行

推薦閱讀

專題

大家都在看

CTI論壇會員企業(yè)