问答知识库快速构建技术解析及行业实践
對話式AI類產品,已經在各行各業中實現規模化的應用。隨著科技創新支撐下的高質量行業發展,人工智能已成為數字經濟時代的核心生產力。其中對話式AI,作為人工智能技術的一個分支,隨著深度學習、預訓練模型等技術的突破,逐漸在各行各業中實現了從產品測試到規模化應用的落地。比如:智能客服、外呼機器人、語音助手等產品應用。
據艾瑞咨詢2022年《中國對話式AI行業發展白皮書》所示,預計到2026年,對話式AI的核心產品規模將達到108億元,帶動相關產業規模超385億元,2021~2026年的年均復合增長率(CAGR)分別為18.9%和25%;對話式AI作為“替代與輔助人工”的核心應用,為市場最原始直觀的“降本增效”價值訴求提供了先行落地的有效解決方案。眾多企業將引入“對話式AI”作為智能化轉型的首要試驗田。
艾瑞咨詢:2019-2026年中國對話式AI產品及帶動相關產業規模
企業在應用對話式AI產品中,通常會遇到以下兩個痛點:
1、部署階段-問答知識庫構建周期長,用戶冷啟動門檻高。主要表現在:1、企業數據分散在會話日志、網頁等多種文檔中,需要人工收集。2、企業數據積累較少,需要業務專家介入梳理。3、人工標注成本居高不下,易受個人主觀意識左右,影響模型訓練效果。
2、運營階段-AI服務效果不穩定,且缺乏有效的監控手段,不能及時進行模型調優。主要表現在:1、系統中人工構建知識庫質量不可控,導致AI服務效果不穩定。2、系統對未覆蓋知識無法做到及時發現,導致無法回答,用戶體驗差。3、系統無法對錯誤案例(BadCase)及時分析,模型無法及時更新。
上述兩個痛點說明,對話式AI產品若要實際滿足用戶需求,僅擁有對話能力是不夠的,更需要完善的問答知識庫作為底層支撐。換句話說,問答知識庫的規模和質量直接決定了對話式AI產品的整體服務效果。然而僅靠人力堆積的模式來構建和運營知識庫,不僅服務質量得不到保證,而且項目運營成本也存在失控的風險,早已無法適應市場的要求和增速。
問答知識庫的快速構建及閉環運營能力,是解決上述兩個痛點的關鍵。
問答知識庫快速構建及閉環運營的核心技術介紹
問答知識庫的構建和運營是一項系統工程,冷啟動階段運用系統工具輔助人工快速構建知識體系,推進對話式AI落地;運營階段運用大數據挖掘技術,實現價值數據自動回流,知識庫持續更新。兩套體系搭建完成后將形成數據閉環,并相輔相成,逐步形成“雙飛輪”的自運營體系。其整體運行邏輯如下圖:
?知識構建及閉環運營工具流程圖
?如圖所示:冷啟動階段運用知識挖掘、智能標注、智能薦句、質量檢查等工具輔助人工快速構建知識體系;運營階段運用新知識發現、BadCase分析、質量檢查等工具保持模型持續迭代。其中用到的核心技術主要有文本聚類、樣本增廣、知識質量檢查等。下面就針對這些核心技術做下介紹。
?1、文本聚類技術,可以為知識庫持續挖掘和發現新的知識:
文本聚類技術在知識構建及閉環運營工具中,主要用于新知識的發現(無法聚到現有的任何一個意圖類別中)和拒識問題的歸納(可以聚到現有意圖體系中,但是現在無法應答,需要人工處理)。當前的主流算法為無監督句向量表示+聚類算法,聚類算法常采用K-means、DBSCAN等,目前常用的無監督句向量表示方法有:
?表1.目前常用的無監督句向量表示方法
隨著深度學習的發展,預訓練模型目前是向量表示的主流方法。最簡單的方式是使用BERT的[CLS]token對應的embedding作為整句話的句向量表示。但是該向量存在向量坍塌的問題,即使差異性非常大的兩個句子,相似度得分也可能會比較高。因此引入了對比學習,對比學習主要思想是讓相似的文本對應的向量表示盡可能接近,不相似的文本對應的向量盡可能遠離,目前預訓練+對比學習是獲取無監督句向量的主流方法。
經過調研,研究院團隊將句向量的獲取方式由無監督升級為了半監督,將少量帶標注的先驗知識融入模型,使模型能夠學習到更具區分性的向量表示,從而進一步提升了文本聚類的效果。下圖為某電商場景半監督聚類和無監督聚類效果對比,可以明顯看出半監督聚類結果更加內聚(半監督對于相似的文本只聚出了3類,而無監督聚出了7類)。
?
表2.某電商場景半監督聚類和無監督聚類效果對比
我們也在公開數據集上對比了各種聚類算法的效果,半監督模型+對比學習的效果提升明顯。
?
表3.公開數據集上各聚類算法的效果對比
聚類效果評價指標:
NMI(Normalized Mutual Information, 標準化互信息)
AMI(Adjusted Mutual Information, 調整互信息)
AR(Adjusted Rand, 調整蘭德指數)
文本聚類在實踐中發現的新知識和重新歸納的拒識問題經人工審核,采用率可達87%。大大降低了運營人員人力投入。為提升聚類速度,我們使用batch K-means替換K-means算法,在聚類效果不變的情況下,速度提升了近3倍。
2、樣本增廣技術,可以解決知識庫語料稀少和不平衡的問題:
樣本增廣技術,主要應用在智能薦句工具中解決知識庫語料稀少和不平衡問題。當前主流樣本增廣算法如下:
?
表4.當前主流樣本增廣算法
中關村科金人工智能研究院結合一線運營人員與客戶的實際應用反饋,系統分析了上述各方案的優缺點之后,創造性地提出了一種融合了文本檢索和生成式樣本增廣的技術,作為最終的樣本增廣方案。
其中文本檢索是利用研究院積累的大量真實行業知識語料(已脫敏)作為檢索底庫,基于文本語義向量匹配技術從底庫中獲取語義相似樣本,可以同時兼顧增廣樣本的多樣性、準確性和真實性。我們采用融合了對比學習的半監督預訓練模型獲取文本語義向量,用余弦相似度作為度量指標,為提升檢索速度,使用了milvus向量索引。生成式樣本增廣我們采用了Prefix_LM結構模型,然后在生成結果基礎上做了進一步的數據后處理。
大致流程為:當用戶輸入待增廣樣本,系統先從歷史積累的語料庫中檢索相似樣本,當檢索數量能達到用戶需求時,直接返回檢索結果;如果數量不足,再通過生成式樣本增廣算法進行擴充。考慮到生成式樣本增廣的不可控問題,我們做了兩個數據后處理操作,進一步提升生成樣本的質量。一是通過計算生成樣本與原始樣本的相似度,如果相似度太低則不采納該生成結果;二是通過語言模型對生成樣本進行打分,如果分數太低也不采納。最終增廣樣本的人工采用率近70%,大大降低了運營人員人力投入成本。下面以“怎么提現呢”為例,樣本增廣效果對比如下:
?
表5.樣本增廣效果對比
3、知識質量檢查技術,可以檢測數據標注質量并對潛在錯誤樣本進行矯正:
知識質量檢查技術主要用于評估數據標注質量并挑選出潛在的標注錯誤樣本。我們采用了Cleanlab工具,對標注樣本進行了1~5的噪音指數評分,值越高說明人工標注結果越有可能存在錯誤,需要對標注進行復核糾正。經過質量檢查和標注矯正后,意圖識別準確率平均可提升6%~15%。以保險領域的一部分知識為例,質量檢查結果如下:
?
表6.某保險場景部分知識質量檢查結果
問答知識庫構建技術助力多行業快速落地對話式AI
中關村科金人工智能研究院自主研發的問答知識庫快速構建工具,目前已在保險、電商、銀行、零售等多個行業,永安保險、步步高等多個頭部企業中,實現落地應用。在上述場景中,基于文本聚類技術進行新知識發現,可發現占對話日志總量2%~3%的無法應答的新知識,經人工審核,采用率可達87%;智能薦句工具通過樣本增廣技術為每條知識平均增廣10條相似樣本,經過人工審核,采用率近70%;知識質量檢查工具可以在減少85%人工審核工作量下提升10%的意圖識別準確率;BadCase分析及回流工具平均每周可以自動回流一次知識庫并重新訓練一次模型。
實踐證明,問答知識庫快速構建及閉環運營工具可至少節省2/3的知識庫運營和維護人力,使冷啟動和知識庫更新時間縮短近70%。
總結與展望
現階段對話式AI技術應用的業界難題,主要是新場景中對話機器人的冷啟動問題。上面介紹了我們在快速構建問答知識庫上的工作,在一定程度上解決了冷啟動問題,使冷啟動和知識庫更新時間縮短近70%,但是仍然需要一定的人力在工具的輔助下進行知識庫審核和構建。目前流行的基于提示學習prompt的小樣本學習,可充分利用預訓練模型在大量無監督數據集上學習到的豐富知識,進一步減少冷啟動所需要的數據量和人力投入。
未來,中關村科金將利用現有的知識庫快速構建技術,結合最新的小樣本學習方法,進一步縮短對話式AI的部署周期,為企業的智能化轉型和對話式AI的大規模快速落地提供有力的支持。
作者:李寬 中關村科金人工智能研究院高級算法研究員
總結
以上是生活随笔為你收集整理的问答知识库快速构建技术解析及行业实践的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 误读千年的几句话
- 下一篇: Http请求体被转义