知识图谱(历史回顾及技术挑战)
知識圖譜的基礎(chǔ)知識
什么是知識?
知識的形成分為下面四個部分,數(shù)字附上量綱信息結(jié)合生活嘗試變成知識,如今天13度,直接穿件衣服就出去啦
知識的體系主要有陳述性知識和程序性知識,右側(cè)游戲規(guī)則需要認(rèn)為設(shè)置,AlphaGo Zero還是需要知識
10年谷歌提取出來,以前搜索主要是字符串匹配,后來谷歌將零散的信息結(jié)合起來,變成知識圖譜
沒有出現(xiàn)知識圖譜之前,搜索愛因斯坦,會出現(xiàn)字符串匹配現(xiàn)象如下左圖,右圖是出現(xiàn)知識圖譜之后,會出現(xiàn)信息卡片,愛因斯坦經(jīng)歷、名人等信息,Google提出應(yīng)用
1、知識圖譜歷史回顧
主要三個時代:本體時代、語義網(wǎng)時代、知識圖譜時代
本體時代:
本體是一個不同實(shí)體間共享的概念,例如家具,床、椅子,家具被人使用
知識圖譜例子:
WordNet計算機(jī)可讀的詞典
自然語言處理中的基礎(chǔ)組件
語義網(wǎng)時代:
互聯(lián)網(wǎng)中的知識通過網(wǎng)頁鏈接起來,語義網(wǎng)主要以RDF形式構(gòu)建知識圖譜
數(shù)據(jù)來源
知識圖譜時代:
語義時代是以RDF形式構(gòu)建知識圖譜代表比較大,后來大家紛紛推出自己的知識圖譜,以屬性圖管理的方式構(gòu)建
知識圖譜比較火的原因如下幾條:1、機(jī)器學(xué)習(xí)成熟 2、圖數(shù)據(jù)庫成熟 3、行業(yè)成功案例涌現(xiàn) 4、自然語言處理技術(shù)成熟
?
小結(jié):
知識圖譜是一種實(shí)體之間關(guān)系的語義描述,形式化表示(如:RDF,RDFS,OWL)
實(shí)體(Entities):
? ? ? 真實(shí)世界對象(things,places,people)
? ? ? 抽象概念(genres,religions,professions)
關(guān)系(Relationships)
? ? ? 將實(shí)體按語義關(guān)系連接成一張大網(wǎng)
語義描述(Semantic descriptions)
? ? ? 類別和屬性
上面是按照時代發(fā)展角度來考慮知識圖譜的,從技術(shù)角度來考慮知識圖譜:
? ? 人工構(gòu)建知識圖譜
? ? ? ? ? WordNet
? ? ? ? ? CYC
? ? 基于Wikipedia的開放知識圖譜
? ? ? ? ?Yago:Wikipedia + WordNet
? ? ? ? ?DBPedia:基于社區(qū)抽取Wikipedia結(jié)構(gòu)化信息
? ? ? ? ?Wikidata、BabelNet
? 基于文本抽取知識圖譜
? ? ? ? NELL、Knowledge Vault、Probase
? 領(lǐng)域知識圖譜
? ? ? ?金融、公安等
現(xiàn)有知識圖譜不足,對時空性的建模不足
2、知識圖譜生命周期概述
知識圖譜的生命周期
知識圖譜技術(shù)生態(tài)
3、構(gòu)建領(lǐng)域知識圖譜的挑戰(zhàn)
去做領(lǐng)域知識圖譜構(gòu)建
信息融合,數(shù)據(jù)融合需求迫切
個人服務(wù)和企業(yè)服務(wù)隱私等都有不同
我們需要:可自由擴(kuò)展的數(shù)據(jù)模式
企業(yè)迫切需要將非結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)化
行業(yè)智能問答大幅降低數(shù)據(jù)使用門檻
基于事實(shí)圖譜數(shù)據(jù)存儲、融合、分析統(tǒng)一平臺,為用戶提供統(tǒng)一的消費(fèi)入口,以不同的形態(tài)(檢索、分析、可視化)展示給用戶
?
總結(jié)
以上是生活随笔為你收集整理的知识图谱(历史回顾及技术挑战)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 深度图像理解
- 下一篇: 知识图谱(知识图谱构建)