知识中台,驱动产业智能化升级
隨著人工智能技術的進步,智能化成為產業轉型升級的關鍵抓手,但企業在提升數字化和智能化水平的實踐過程中,面臨多種挑戰,如:移動應用的普及,帶來異構數據呈幾何級數增長,企業需要深度挖掘數據價值以賦能業務,以及傳統 IT 系統缺乏智能化的技術手段,難以有效支撐企業挖掘、組織、管理和運用知識的需要等。
企業急需建立全新的信息和知識處理平臺,以智能化的手段推動數據轉換為知識,支撐企業創新業務的快速落地和迭代。
2021年12月,在以“知識中臺驅動產業智能化升級”為主題的2021云智技術論壇-知識智能化專場上,多位百度專家共同探討企業該如何通過構建全新的知識智能化體系,打造以知識為核心的競爭優勢,來重塑未來發展格局。
01 百度智能云知識中臺,助力企業加速智能化升級
百度技術委員會主席吳華表示,“智能化是產業轉型升級的重要抓手,如今人工智能、大數據、5G 等技術在產業智能化升級中扮演著越來越重要的角色。企業要實現智能化升級,不僅需要數據,更需要數據中蘊含的信息和知識,因此企業知識智能化解決方案變得尤為重要。”
產業智能化是數字經濟發展的新階段,深入挖掘產業數據價值,從海量數據中提取知識,實現智能化的應用,是產業智能化的必由之路。在這個過程中,面臨以下四大挑戰:
1、數據海量
企業在數字化的過程中,產生體量巨大的數據,且數據規模不斷極速增長,傳統 IT 架構已無法應對。
2、數據形態復雜
企業存在大量的隱性知識,其專業性強、結構化程度低,行業數據呈現復雜化、多模化發展,這將給數據處理和知識挖掘帶來巨大挑戰。
3、數據利用率低
企業內部數據分布在不同的業務系統中,呈現碎片化、孤島化的特點,存在大量冗余和噪音。傳統的數據處理技術難以對這些數據和信息進行語義化的理解,導致數據的利用率低下。
4、應用多態
企業內部應用和業務系統紛繁復雜,傳統的知識管理面臨成本高、效率低、體驗差等問題,知識應用缺乏系統化的能力。
為應對上述挑戰,幫助企業實現智能化升級,百度智能云發布知識中臺解決方案。該方案基于百度知識圖譜、自然語言處理、跨模態內容理解等核心技術,提供面向企業知識應用全生命周期的一站式解決方案,覆蓋企業的知識生產、知識組織、知識應用的全流程核心能力。百度智能云知識中臺可通過應用組件、標準化產品、定制化服務、集成化方案等多種靈活的方式對外輸出,助力企業高效生產知識,靈活組織知識,智能應用知識,全面提升企業運行效率和決策的智能化水平。
02 百度智能云知識中臺背后的技術支撐
百度智能云知識中臺助力企業智能化升級的背后,離不開百度強大的 AI 技術支持,如知識圖譜、自然語言處理、知識增強的跨模態內容理解、面向多模態的復雜知識挖掘,以及知識增強的場景子圖推理等。
1、知識圖譜
百度知識圖譜經過近10年的發展,打造從通用到行業的知識圖譜完整技術體系,構建了業界規模最大的多源異構知識圖譜,目前擁有5500億知識的多源異構超大規模知識圖譜,除了基礎的由實體、屬性、關系構成的通用知識圖譜,還針對不同應用場景和知識形態,構建了事件圖譜、多模態圖譜、行業知識圖譜等多種圖譜。通過持續獲取和積累知識,認知能力和智能化水平不斷升級,從而可以更好地支撐不同的應用場景。
為了解決行業應用中最后一公里的問題,百度智能云從架構機制、策略算法到平臺流程進行全面的升級和優化,構建高效可遷移的行業知識圖譜平臺。該平臺優勢有:一是專業性強,面向專業復雜知識,實現基于超圖的知識表達;二是效率高,支持低資源的學習機制,通過人機協同的方式,相對傳統人工構建方式,效率提升百倍以上;三是可遷移性,實現從通用到行業,跨行業的多層次遷移學習,目前已覆蓋一百多個行業場景。
2、自然語言處理
百度研發了世界一流的語義理解、語言生成、智能問答、智能對話、機器翻譯等自然語言處理技術。2021年百度智能云發布“知識增強大模型”文心 ERNIE 3.0,該模型基于深度學習平臺飛槳的分布式訓練技術,首次在百億級參數預訓練模型中引入大規模知識圖譜,一舉刷新54個中文 NLP 任務基準,并在全球權威榜單“SuperGLUE”上排名第一。
3、知識增強的跨模態內容理解
百度自研知識增強的跨模態深度語義理解技術,通過知識關聯跨模態信息,解決不同模態語義空間融合表示的難題,突破了跨模態語義理解的瓶頸,讓機器像人類一樣,通過語言、聽覺和視覺等獲得對真實世界的統一認知,實現對復雜場景的理解。
4、面向多模態的復雜知識挖掘
在知識挖掘層,針對行業多態輸入數據,百度智能云知識中臺基于 Prompt Learning 技術,對實體關系和事件等信息抽取進行統一建模和多任務訓練,利用領域語言模型中蘊含的大量知識,使得模型具備良好的零樣本遷移和小樣本學習的能力,除了傳統的本體以及簡單的 SPO 三元組外,還可挖掘時序類、因果類、流程類等復雜知識。并針對從知識體系的設計到系統落地部署的全部流程,知識中臺提供全鏈條按需定制工具,高效支持跨行業、跨場景的知識挖掘需求。
5、知識增強的場景子圖推理
在知識中臺的應用中存在大量的推理場景,因此除了推理的結果準確性要求外,結果的可解釋性尤為關鍵。另外,行業場景需要隨著情境的變化做連續推理,這對推理過程的邏輯性、一致性帶來巨大的挑戰。針對這些難題,百度智能云知識中臺將數據與知識驅動相結合,首創知識增強的場景子圖推理,運用子圖來刻畫情境,使結果更可解釋、邏輯性和連續一致性。
基于以上強大 AI 技術加持,百度智能云知識中臺幫助企業便捷地從數據提煉知識,通過搜索、問答、推理、可視化等方式高效地將知識應用,將分散在企業各處的知識進行集約化管理,起到凝練知識、賦能業務、助力企業提升智能化水平的作用。
03 揭秘百度智能云知識中臺的機制
百度智能云 AI 產品業務部解決方案總監楚暢表示,企業數據知識化轉型建設過程需經歷數據治理、知識生產、知識組織、知識應用、知識運營環節。從整體來看,還可分成知識的生產、運用和運營等三大階段。
作為企業知識智能化中樞,百度智能云知識中臺解決方案打造了數據接入、知識生產、知識組織、智能應用、運營管理模塊。
第一個環節是數據接入,百度智能云知識中臺支持通過 API 方式或直連方式對接企業現有的數據平臺、數據庫、文檔系統等數據源,來獲取包括結構化、半結構化和非結構化等多源異構數據信息。使用靈活可配置的調度工具,支持一次性全量數據導入、分批分時配置導入數據、實時在線逐條讀取數據。數據接入后,系統會對數據進行適配、加工、轉換和分發等操作,形成知識體系。百度智能云知識中臺支持單日十億級數據吞吐量,可同時對接百萬級數據源,做到數據分鐘級的更新。
接入數據后,在知識生產環節中將接入數據加工成為各種各樣的知識體系。百度智能云知識中臺提供七大知識生產方式:知識圖譜、問答知識、全文知識、標簽知識、事件知識、多模態知識、因果知識生產等方式。
1、知識圖譜生產
傳統知識圖譜生產由業務專家采用自上而下的方式對某業務領域的實體、屬性、關系進行抽取和建模,形成 Schema 體系。百度智能云的智能知識圖譜的生產,通過人機結合和算法驅動的方式,用 AI 算法模型來驅動和訓練,可從企業沉淀的數據或文檔里抽取生成初步的 Schema 體系,再結合業務專家進行少量的人工審閱、調整,可大幅提升圖譜構建的效率。
百度智能云的知識圖譜生產,一方面可大幅提升知識圖譜的構建效率,另一方面是有時候業務專家沒有考慮到的屬性和實體,可以通過系統自動獲取,有效完成細節補充,確保整個圖譜構建結果更加完善和科學。比如在傳統本體構建環節,靠傳統方式由專家梳理整個知識體系與本體體系,周期需幾周甚至大幾周;而采用人機結合與算法驅動的方式,只需幾天就能構建完成整個知識與本體體系。
2、問答知識生產
問答知識生產是通過系統自動到數據源中產生一系列的問答對,即問題和答案。將這種問答對作為知識的一種形態,存儲在應用平臺中,用于后續問答場景。
問答知識生產可細分為三種方式,一是將企業預先準備好的問答對保存在文檔里,再導入到平臺中;二是企業提供原始文檔材料,系統自動用人工智能模型從材料里挖掘出可能的問答對,再結合人工檢查來生成問答知識。三是閱讀理解式問答,這是百度的在線實時閱讀理解式問答生成技術,區別于前兩種問答知識生產方式,做到在用戶真正具體提出問題、搜索答案時,通過語義分析來理解問題,在線輸出匹配答案。
3、全文知識生產
全文知識生產主要用于全文檢索類場景。區別于傳統全文檢索方式,全文知識生產在數據導入階段,除了可以生成傳統的倒排索引外,還可以基于行業專業詞匯訓練行業相關 AI 模型,用模型從導入的數據源中提取信息,生成語義索引。在具體檢索環節,傳統全文檢索方式是通過匹配文本關鍵字,去檢索相關信息。而智能化全文知識生產,結合語義索引、文本相關性、倒排索引等,生成基礎排序,再綜合基礎排序和文檔的時間性、質量分析等指標,以及百度智能云在行業領域長期積累的詞庫,產生精確排序結果,即“精排結果”,從而得出最終搜索結果。全文知識生產方式使得基于文本匹配的傳統搜索方式,進化為基于語義搜索的智能化方式。
4、標簽知識生產
標簽知識生產的第一個階段是標簽提取和優化,通過訓練人工智能模型對樣本數據標注,訓練出相關人工智能的語義模型,后續 AI 模型從數據源里自動地抽取出標簽,完善標簽體系。第二階段是基于標簽體系做場景化應用。除了單獨應用標簽知識做分類外,還可結合上述知識圖譜等的生產方式,更深度做個性化推薦操作。
5、事件知識生產
事件知識生產一般來說是從網頁爬蟲抓取事件新聞,再由訓練好的 AI 模型和分析技術,從獲取的事件內容里做語義分析,提取出與事件相關的實體信息、論元角色,從而構建出事件的關系脈絡體系,后續從該脈絡體系進行事件脈絡的搜索、情報分析、智能寫作等應用。
6、多模知識生產
多模知識生產是綜合運用視頻理解、圖像分類、目標檢測、語音識別、OCR 識別等多種人工智能技術,從視頻中進行圖像、聲音、字幕等知識分析,進行知識理解、情景理解,構建出知識子圖、結構化語義信息,用于后續場景化應用。
7、因果知識生產
因果知識生產是基于因果規律分析的智能輔助預測方式,通過“導致”“由于”“因此”等因果關系的詞匯來挖掘上下文內容,再進行語義分析理解,形成多層次的因果傳導關系,便于后續做輔助預測。基于該體系,進行某些場景化應用如分析股價下跌因果傳導過程、電網斷電后續影響等。
通過上述的七大知識生產方式,生產出不同種類的知識后,通過圖譜鏈接,形成統一組織形態的有序組織體系,服務于企業搜索、智能知識庫、智能推薦、智能客服、智能文檔分析以及如流等通用型應用,全方位滿足企業對知識應用的需求。
此外,在知識運營環節里,楚暢建議應做好以下工作:一是內容運營,引入更多生態內容來補充整個知識體系;二是用戶運營,通過話題討論、推廣活動來激勵和活躍用戶讓主動參與到這個知識體系里。三是功能完善,我們在后續使用過程中不斷迭代演進平臺,建設 AI 模型訓練、優化效果、進行策略迭代演進等。
04 百度智能云知識中臺,助力行業智能化應用實踐
目前,百度智能云知識中臺在能源、醫療、金融、電信、媒體、政務等行業擁有豐富實踐和落地應用,助力企業提質增效。
在能源行業,基于我國雙碳目標下,為推進企業生產過程智能化,培育新型生產方式,全面提升企業生產、管理和服務的智能化水平,百度智能云與國能(綏中)發電有限責任公司共同提出,用知識圖譜對企業賦能,提供針對性解決方案。最終在知識圖譜的技術加持下,打通了資金流、物料流、事件流等流程之間的障礙壁壘,建立不同系統之間的數據關聯,全方面、全過程、全場景的對生產經營業務進行刻畫分析,為作業成本法等財務比對分析提供幫助。其次,挖掘沉沒的歷史信息,完善崗位責任及與之對應的相關知識,建立符合特定單位管理需求的崗位知識管理體系,輔助完成上崗培訓等人力資源管理業務。并建立智能辦公網絡系統,實現了知識智能推薦、數據即搜即得,提高企業辦公效率。
在金融領域,百度智能云知識中臺幫助某大型商業銀行優化手機銀行搜索,基于精排搜索和知識圖譜,豐富手機銀行的搜索場景,提升手機銀行的搜索準確度,優化用戶體驗。協助用戶通過搜索實現知識獲取、精準交易輔助等功能,檢測問題賬戶準確度達97%以上,滿足多業務場景的需求。另外,基于百度領先的圖計算和圖數據庫技術,幫助銀行企業構建圖推理引擎的金融風控系統。
在法律領域,百度智能云知識中臺為上海某法院搭建智能庭審系統,有效提取爭議要素,歸納訴求關鍵點,推演案件關鍵情形,準確95%+。基于案情語義的類案推薦,涵蓋2800萬判決書,案情相似度97%+。庭審材料結構化呈現,可解釋推理量刑,庭審效率提升3~10倍。
在醫療領域,百度智能云知識中臺通過輔助診斷等知識運用方式來服務于智慧醫療,實現數據與知識雙擎驅動,提供智慧醫療解決方案。項目服務數超萬名醫生,觸達27個省市、300多家醫院和1500+家基層醫療機構,惠及患者數超過千萬,累計服務人次2500萬+。
05 AI+知識管理,開啟智能工作新時代
后疫情時代,宏觀經濟形式劇變,企業適應變化需要變得更敏捷、可持續,企業需要更智能的新工作模式。 因此百度提出了以“AI+知識管理”驅動工作方式智能化變革的新理念,激發企業創新能力,提升企業核心競爭力。
基于“AI+知識管理”理念,百度研發了新一代智能工作平臺——如流。據百度智能辦公平臺部主任架構師和為表示,如流在百度智能云、百度 AI 中臺和知識中臺的支撐下,通過強大的 AI 和知識管理技術,深度賦能企業工作的各個環節。其核心是通訊流、工作流和知識流三大板塊。通訊流聚焦人與人之間觸手可得的連接,核心產品是即時通信和智能會議;工作流主打高效協同,核心產品是千人千面的智能工作臺、工作卡和企業一站式應用中心;知識流的核心產品是智能知識庫、統一搜索和智能推薦等。
在如流的幫助下,企業的知識經過知識創造、知識沉淀、知識流動和知識應用的環節,形成閉環,讓企業的知識高效流轉。以知識創造為例,如流通過一系列 AI 技術重塑了會議的全流程。在開會前,AI 助手自動協調參會人的時間,節約溝通成本;在會議中,通過實時語音識別技術將會議語音轉化成文字,AI 技術自動識別出哪些是關鍵信息并標記;在會后,自動提取會議紀要,幫助人們總結會議待辦任務,并智能分發給相關的人。不但會議全流程變得更高效,更重要的是,整個會議過程變得可沉淀、可回溯,會議成為知識創造的典型場景。
在知識沉淀方面,如流的智能知識庫,擁有多人實時協同編輯的在線文檔和企業網盤等基礎能力。同時,部門知識庫產品,支持以組織為基本單元實現知識的有序沉淀。此外,通過對知識庫文檔的深度語義理解,如流可以自動地把企業的員工、項目、會議、OKR 等各種實體有序關聯起來,形成龐大的企業知識圖譜。基于圖譜可以推導實體間的關聯關系,計算語義距離。
在知識流動方面,如流的知識星鏈產品,可以在會話溝通、文檔協作中快速分發知識卡片,使企業知識在工作場景中高效流轉,隨時隨地連接員工與知識。
以智能工作平臺如流為基礎,可幫助企業實現工作模式的智能化升級。在 AI 技術的賦能下,通訊信息、工作和知識高效流動,無縫融合,員工能效迅速提升。同時,企業知識有序沉淀、快速流轉,賦能并加快業務創新速度。
06 百度醫療知識中臺,推動醫療行業智能化升級
在本次大會上,百度攜手畢馬威等合作伙伴重磅發布《醫療知識中臺白皮書》,并邀請中華醫學會雜志社領導出席發布儀式。醫療知識中臺,能夠幫助醫療機構、醫療從業人員、醫療健康產業機構等獲取權威專業的醫療知識,滿足快速搭建場景化應用的需要,幫助醫療行業智能化升級。
百度醫療知識中臺是遵循醫療邏輯的智能化開放平臺,具備開放智能的醫療知識加工能力和開箱即用的醫療知識服務能力。同時專注于醫學知識的生產、組織建設,通過基礎工具抽取經典權威的醫學教科書、專家共識、臨床指南、路徑規則標準等醫學知識,經過加工后形成機器可識別的標準化醫學知識,對外提供智能化醫療知識服務。百度醫療知識中臺可作為醫療行業智能化升級的關鍵抓手,助力醫療行業發展。
醫療知識中臺白皮書下載入口
作為企業將數據知識化、實現智能應用的中樞,百度智能云知識中臺以科技創新促進產業創新,不斷賦能金融、能源、醫療、媒體、政務等各行各業。期待在不久的將來,百度智能云能夠攜手更多合作伙伴,用知識中臺助力更多行業實現智能化升級。
還想了解更多百度智能云知識中臺前沿資訊?訪問鏈接,觀看精彩回顧:
https://cloud.baidu.com/techday/index
總結
以上是生活随笔為你收集整理的知识中台,驱动产业智能化升级的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 金融运营智能化搞不定?百度智能云有妙方
- 下一篇: 百度AICA再添57位“首席AI架构师”