丁力 | cnSchema:中⽂知识图谱的普通话
本文轉載自公眾號:大數據創新學習中心。
?? ?? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
3月10日下午,復旦大學知識工場聯手北京理工大學大數據創新學習中心舉辦的“知識圖譜前沿技術課程暨學術研討會”上,OpenKG聯合發起?、海知智能CTO丁力博士分享了以“cnSchema:中?知識圖譜的普通話”為主題展開報告,主要介紹了面向中文信息處理的cnSchema.org,特別介紹了其核心本體設計以及其在知識圖譜驅動的智能問答與智能分析中的應用案例。
首先,丁博士介紹了中文開放知識圖譜(簡稱 OpenKG.CN)和cnSchema。
OpenKG.CN旨在促進中?知識圖譜數據的開放與互聯,促進知識圖譜和語義技術的普及和?泛應?。目前已與多個高校、機構、企業等聯盟合作,開展活動和業務。
cnSchema.org,作為OpenKG社區的Schema規范,面向中文信息處理,支持快速領域知識建模,支持跨數據源、跨領域、跨語言的開放數據自動化處理,提供schema層面的支持與服務。
緊接著,丁博士簡要介紹了知識圖譜的基礎與發展歷程:
1. 知識圖譜中常見的知識表示方法:RDF三元組、圖數據庫、深度學習
2. 知識圖譜的五個層次:實體 -> 結構 -> 關系 -> 本體 -> 融合
3. 知識圖譜大事記
(1)Semantic Network (1956)
以節點表示實體,鏈表示關系。
優點:表示方式“自然”、靈活且易于理解。
缺點:缺乏標準,難以實現未知語言現象的處理。
(2)The Web (1989)
The Web作為一個信息空間,其目標不僅有助于人際溝通,還能使機器參與進來并提供幫助。
(3)The Semantic Web (2001)
提出三個設想:
①在網絡上發布結構化數據;
②用本體實現共同理解;
③使用可用數據實現智能又酷炫的應用。
4、Linked Open Government Data (2010)
與政府的政治、經濟、健康等多方面數據掛鉤。
(5)Journey to Web Schema,Schema.org(2011)
網絡Schema由標準第一(1996年起)過渡到數據第一(2004年起)再發展為用戶第一(2008年起)。
2011年出現了schema.org。
知識圖譜境界變遷的總結:
在簡要介紹了知識圖譜的一些基礎知識和重要發展歷程之后,丁博士為我們詳細講解了cnSchema。
1. cnSchema生態
2. cnSchema 核?本體設計
3. cnSchema實體定義更加明確
4. 基于cnSchema的KBQA
接下來,丁博士為我們詳細分析了cnSchema在知識圖譜驅動的智能問答與智能分析中的應用案例。目前cnSchema在智能家居、智能客服和企業內部的智能化等領域已形成了AI應用落地成果。
領域知識圖譜構建的關鍵方法和技術包括:領域詞匯抽取,實體識別,實體分類;領域知識抽取:抽取關系、抽取事件、抽取深層次結構;語義關聯,搜索、匹配與排序;基于active learning技術,提升標注效率:基于領域語料的NLP技術。
1. 智能機器人(Bots)
Bots是基于Ruyi.AI第三方技能開方平臺的搜索引擎后新興的人機接口,對話中的信息粒度縮小到短文本、實體和關系,而且多輪對話還要求更豐富的上下文知識。cnSchema是中文知識圖譜接口的關鍵,schema自身對接中文自然語言處理以及針對中文信息中特有概念的處理都需要其支持。
2. 基于cnSchema的智能分析
以甲子光年的AI公司評價體系為例,利用NLP分類器,對AI公司數據進行清洗與篩選;使用基于深度學習的神經網絡算法構建learning to rank模型,在輿論力指數、團隊力指數、商業力指數、資本力指數四個大的評價維度下,劃分出眾多具體細化的模型參評因素,高時效性地動態評估這些發展中的AI公司。
3. 基于cnSchema的領域知識圖譜
目前,基于cnSchema的領域知識圖譜涵蓋了音樂、工商、醫院、新聞、履歷和飲食等多個領域。如音樂和飲食知識圖譜,圖中介紹了知識圖譜的模塊劃分和關聯。
最后,丁力博士表示cnschema是開放的中文知識圖譜schema,致力通過最佳實踐幫助垂直領域合作者擴展領域知識圖譜,以支持數據發布和應用,支持大家快速實現應用落地。
大數據創新學習中心
讓學習成為一種樂趣
長按掃碼關注我們
OpenKG.CN
中文開放知識圖譜(簡稱OpenKG.CN)旨在促進中文知識圖譜數據的開放與互聯,促進知識圖譜和語義技術的普及和廣泛應用。
點擊閱讀原文,進入 OpenKG 博客。
總結
以上是生活随笔為你收集整理的丁力 | cnSchema:中⽂知识图谱的普通话的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 银行技术类2020校园招聘笔试
- 下一篇: 【Python】解决urllib返回ht