• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當前的位置是:  首頁 > 資訊 > 國內(nèi) >
     首頁 > 資訊 > 國內(nèi) >

    智能質(zhì)檢新實踐:“雙模”質(zhì)檢

    2020-03-05 16:52:24   作者:   來源:CTI論壇   評論:0  點擊:


      上篇文章,我們介紹了新一代智能質(zhì)檢模式——基于深度學習技術(shù)的“非正則”質(zhì)檢落地應用效果:在很多質(zhì)檢項上遠超“關(guān)鍵詞+正則”的傳統(tǒng)模式,能多找出2~10倍數(shù)量的目標通話,并且介紹了其工作原理與“關(guān)鍵詞+正則”的區(qū)別。
      隨著自然語言處理(NLP)領域技術(shù)的發(fā)展,以“非正則”質(zhì)檢模式為主、“關(guān)鍵詞+正則”模式為輔的方案已成為未來發(fā)展趨勢。兩種模式將長期共存,因為它們各有其更擅長做的事情、更適配的場景。
      “關(guān)鍵詞+正則”模式的2種適配場景
      在實際應用中,“關(guān)鍵詞+正則”作為一種基礎質(zhì)檢模式,越來越難以滿足企業(yè)在質(zhì)檢效果和效率上的精細化需求。但是,這種模式也有它的優(yōu)勢:上手快。
      當企業(yè)提出一個新的、此前從未用過的質(zhì)檢項時,質(zhì)檢項的標準尚未完全確定,因此可以用“關(guān)鍵詞+正則”模式先跑起來,快速進行探索和迭代。其后根據(jù)初步探索和迭代的結(jié)果,再判斷是否可以升級到基于深度學習技術(shù)的“非正則”模式。這是適配“關(guān)鍵詞+正則”模式的第一種場景。
      第二種場景:當一個質(zhì)檢項命中的目標通話量比較少,只有幾百甚至幾十條,就無法產(chǎn)生足夠的“正例”給機器學習模型進行訓練,只能繼續(xù)采用“關(guān)鍵詞+正則”模式。這是一種被動場景,也是比較常見的場景。
      還有一種場景比較特殊:有些質(zhì)檢項命中的目標通話比較多,原則上可以用來訓練機器學習模型,但是因為“關(guān)鍵詞+正則”已經(jīng)得出不錯的結(jié)果,既找得全(術(shù)語叫召回率高),又找得準(術(shù)語叫準確率高),兩個值都超過90%,那么暫時就不迫切需要升級到“非正則”質(zhì)檢模式了。比如很多企業(yè)需要的正向質(zhì)檢項——“禮貌問候”,因為可以窮舉出大部分“禮貌問候”的用詞,用“關(guān)鍵詞+正則”模式就能得到雙90%的結(jié)果。
      不過,這種場景非常少見。大部分情況下,“關(guān)鍵詞+正則”質(zhì)檢模式相比基于深度學習技術(shù)的“非正則”質(zhì)檢模式,在找全率和找準率上有很大差距。
      “非正則”模式的2種適配場景
      在實際應用中,基于深度學習技術(shù)的“非正則”質(zhì)檢模式(原理細節(jié)可參考上一篇文章),可以大幅提升質(zhì)檢效率,更好地解決企業(yè)質(zhì)檢任務的痛點:傳統(tǒng)“關(guān)鍵詞+正則”的模式,很難找得全和找得準目標通話,大大影響工作效率——如果找不全,就意味著會遺漏很多目標通話;如果找不準,就意味著在人工復檢時會浪費大量人力。
      我們之前分享過實際對比的例子,貸后資產(chǎn)管理領域的基礎質(zhì)檢項“恐嚇威脅”,采用基于深度學習技術(shù)的“非正則”質(zhì)檢模式找出的違規(guī)通話量是“關(guān)鍵詞+正則”的9倍。
      考慮到在實際使用中,質(zhì)檢項與命中的目標通話量之間的關(guān)系也存在“二八法則”——20%的質(zhì)檢項貢獻了80%的質(zhì)檢量,所以將質(zhì)檢量大的少數(shù)質(zhì)檢項升級到“非正則”模式,往往可以大幅提升整個質(zhì)檢任務的找全率和找準率。這是“非正則”質(zhì)檢模式的第一種適配場景,也是主要的適配場景。
      第二種場景:某些質(zhì)檢項,雖然從某一家企業(yè)的角度看,所命中的目標通話量不算大,但是這個質(zhì)檢項是整個行業(yè)中較為成熟的、通用的質(zhì)檢項,其他企業(yè)也都在用,那么就可以采用基于深度學習技術(shù)的“非正則”模式進行模型訓練。因為其他企業(yè)都可以比較快速的復用或者經(jīng)過簡單調(diào)整之后復用,所以“非正則”模式帶來的收益就更高。比如,消費金融領域的正向質(zhì)檢項“提示逾期天數(shù)”;客服領域的負向質(zhì)檢項“暴露客戶隱私”等都是各自領域或行業(yè)通用的。
      與“關(guān)鍵詞+正則”質(zhì)檢模式相比,基于深度學習技術(shù)的“非正則”模式,不再需要既懂業(yè)務又懂正則的稀缺人才編寫規(guī)則和迭代規(guī)則,只需要普通人快速進行數(shù)據(jù)標注即可訓練算法模型,而且通常能得到更好的效果。唯一顯著的缺陷就是,如果沒有數(shù)千條數(shù)據(jù),很難訓練出效果好的模型。
      “雙模”質(zhì)檢,各司其職
      當前階段,質(zhì)檢項應該采取哪種模式,主要取決于該質(zhì)檢項產(chǎn)生的目標通話量大小——通常數(shù)量大,才能快速標注數(shù)據(jù)、訓練出更好的算法模型,采用“非正則”模式,否則仍需要繼續(xù)使用“關(guān)鍵詞+正則”模式。
      其次也要考慮到質(zhì)檢項的成熟度——太新的、標準尚不明確的質(zhì)檢項,適合先用“關(guān)鍵詞+正則”模式迭代起來,再決定何時升級到基于深度學習技術(shù)的“非正則”模式。
      綜合來看,在實踐中采用“雙模”方案,讓兩種模式各司其職,可以最大程度提升質(zhì)檢效率。
    【免責聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

    專題

    CTI論壇會員企業(yè)

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 革吉县| 昭平县| 沾化县| 西安市| 长沙市| 文登市| 历史| 绥江县| 双鸭山市| 阿克苏市| 休宁县| 武汉市| 九寨沟县| 松原市| 曲阜市| 许昌县| 南安市| 土默特右旗| 双牌县| 东阳市| 徐州市| 五家渠市| 会同县| 苗栗市| 黄山市| 大埔县| 新干县| 手机| 田东县| 镇赉县| 泰宁县| 宁德市| 云南省| 台南县| 镇巴县| 页游| 潞城市| 当阳市| 夏邑县| 博白县| 九寨沟县| http://444 http://444 http://444 http://444 http://444 http://444