知识图谱演进
http://blog.csdn.net/yczws1/article/details/16993989
知識圖譜技術(shù)的演進(jìn)
簡述
“圖譜”是指進(jìn)過系統(tǒng)編輯并根據(jù)實(shí)物描述或攝制的圖,是研究某一學(xué)科所用的資料。“圖譜”中的“圖”指的是地圖,“譜”指系統(tǒng),圖與譜合一則是空間與時(shí)間動態(tài)變化的統(tǒng)一表述。圖譜主要表現(xiàn)事物和現(xiàn)象的形態(tài)結(jié)構(gòu)、成因機(jī)制、組成物質(zhì)、動態(tài)變化等綜合性、復(fù)雜性規(guī)律,往往以系列圖的形式表示時(shí)空動態(tài)變化[12]。
知識圖譜,也被稱為科學(xué)知識圖譜、知識域可視化或知識域映射地圖,是顯示科學(xué)知識的發(fā)展進(jìn)程與結(jié)構(gòu)關(guān)系的的一系列各種不同的圖形。它用可視化技術(shù)描述知識資源及其載體,挖掘、分析、構(gòu)建、繪制和顯示知識及它們之間的相互聯(lián)系。文獻(xiàn)[4]也將科學(xué)知識圖譜譯為Scientific?Knowledge?Map,在上述概念的基礎(chǔ)上認(rèn)為科學(xué)知識圖譜可以在組織內(nèi)創(chuàng)造知識共享的環(huán)境,從而最終達(dá)到促進(jìn)知識交流和研究深入的目的。
?
具體來說,知識圖譜是把應(yīng)用數(shù)學(xué)、圖形學(xué)、信息可視化技術(shù)、信息科學(xué)等學(xué)科的理論與方法與計(jì)量學(xué)引文分析、共現(xiàn)分析等方法結(jié)合,用可視化的圖譜形象地展示學(xué)科?的核心框架、發(fā)展歷史、前沿領(lǐng)域以及整體知識架構(gòu)的多學(xué)科融合的一種研究方法。它把復(fù)雜的知識領(lǐng)域通過數(shù)據(jù)挖掘、信息處理、知識計(jì)量和圖形繪制而顯示出?來,揭示知識領(lǐng)域的動態(tài)發(fā)展規(guī)律,為學(xué)科研究提供切實(shí)的、有價(jià)值的參考[12]。
?
Google知識圖譜(Knowledge?graph),通過用戶搜索query,能夠顯示關(guān)于這個(gè)query相關(guān)的更多的實(shí)時(shí)信息。使得搜索智能化,根據(jù)用戶的意圖得到用戶想要的結(jié)果。
知識圖譜,可將搜索結(jié)果進(jìn)行知識系統(tǒng)化。一個(gè)關(guān)鍵詞搜索也能獲得多維度的相關(guān)信息,呈現(xiàn)在有結(jié)構(gòu)化的知識卡上。為用戶提供有完整知識體系的搜索結(jié)果。
相比于之前的搜索結(jié)果看來,“知識圖譜”將在三個(gè)方面提高Google搜索的最終結(jié)果:
找到正確的結(jié)果。由于一個(gè)關(guān)鍵詞可能代表多重含義,所以知識圖譜會將最全面的信息展現(xiàn)出來,讓用戶找到自己最想要的那種含義。
最好的總結(jié)。有了知識圖譜,Google?可以更好的理解用戶搜索的信息,并總結(jié)處相關(guān)的內(nèi)容和主題。當(dāng)你搜“瑪麗·居里”時(shí),你不僅可以獲得這個(gè)關(guān)鍵詞的所有相關(guān)內(nèi)容,還能獲得居里夫人的詳細(xì)生平介紹。
更深、更廣。由于“知識圖譜”會給出搜索結(jié)果的完整知識體系,所以用戶往往會發(fā)現(xiàn)很多不知道的東西(知識)。當(dāng)你搜索一個(gè)即將去玩的地方時(shí),可能你會發(fā)現(xiàn)一個(gè)以此命名的餐館,甚至還可能發(fā)現(xiàn)還有一本小說就叫這個(gè)名字,并且已經(jīng)改編成了同名電影。
涉及到的方面
??1.復(fù)雜的數(shù)據(jù)模型構(gòu)建:freebase?的namespace?domain?type?property,其中的相互關(guān)聯(lián)關(guān)系。
????? 2.?數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)存儲、圖數(shù)據(jù)存儲
????? 3.?數(shù)據(jù)收集困難:這種結(jié)構(gòu)化的數(shù)據(jù),添加困難,需要的字段比較多。
?? ?? 4.?完整的體系:freebase的體系價(jià)值很大,需要內(nèi)部構(gòu)建基礎(chǔ)的數(shù)據(jù),同時(shí)需要定制規(guī)則,讓?其他數(shù)據(jù)源接入,商業(yè)合作類型的。需要大量的人工進(jìn)行審核和規(guī)范。
特點(diǎn)
1、能夠利用對自然語言查詢進(jìn)行深入的理解,并從語義層面解析用戶查詢意圖;
2、能夠利用海量的結(jié)構(gòu)化知識庫,針對用戶查詢提供準(zhǔn)確的答案。
????? ? 3、充分利用結(jié)構(gòu)化大數(shù)據(jù),深入理解用戶自然語言查詢并針對查詢出準(zhǔn)確的答案,能夠更好地給出準(zhǔn)確的答案,能夠更好地滿足人類對知識獲取的需求,同時(shí)也代表計(jì)算和搜索的未來。
背后的支持?
??????? 知識圖譜的背后是龐大的信息庫。知識圖譜的信息搜集工作始于2010年收購的Metaweb。Metaweb專注于將不同文字表述與同一個(gè)實(shí)體連接起來,并探索這些實(shí)體的屬性和彼此之間的關(guān)系,最終提供一種新的搜索形式。Metaweb的數(shù)據(jù)來源主要來源與Freebase?,而google的信息來源較廣。
發(fā)展趨勢
?????? 知識圖譜:未來的數(shù)據(jù)挖掘,基于海量數(shù)據(jù)之上的數(shù)據(jù)管理平臺(DMP)。搭建使用即反饋的個(gè)性化數(shù)據(jù)產(chǎn)品平臺。根據(jù)用戶的任何需求,追究映射其根源,實(shí)時(shí)個(gè)性化推薦。在需求和產(chǎn)品上精益求精個(gè)性化。更加符合用戶的需求。
對比
相比與Goggle提出的knowledge?graph?,Facebook也于2013年1月15日推出了圖譜搜索(Graph?search)。該功能基于社交圖譜(social?graph)的語義搜索服務(wù)。目的:讓一切信息可搜索化、可被發(fā)現(xiàn)用戶登錄使用臉譜搜索框時(shí),能在下拉菜單中中使用好友、照片、地點(diǎn)和興趣等新的搜索選項(xiàng)。與基于關(guān)鍵詞匹配的傳統(tǒng)網(wǎng)絡(luò)搜索引擎相比,圖譜搜索能夠支持更自然、復(fù)雜的查詢輸入,并針對查詢直接給出答案。與搜索引擎關(guān)鍵詞自動補(bǔ)足功能類似,圖譜搜索會在用戶輸入時(shí)同步預(yù)測用戶搜索意圖,并根據(jù)用戶選擇進(jìn)行查詢擴(kuò)展。
圖譜搜索是基于社交圖譜構(gòu)建起來的搜索服務(wù),與基于關(guān)鍵詞匹配的傳統(tǒng)網(wǎng)絡(luò)搜索引擎相比,圖譜搜索能夠支持更自然、復(fù)雜的查詢輸入,并針對查詢直接給出答案。
除臉譜外,信息技術(shù)領(lǐng)域的其他巨頭也先后推出了類似的基于結(jié)構(gòu)化數(shù)據(jù)的搜索產(chǎn)品或服務(wù),作為其進(jìn)軍和探索下一代搜索引擎技術(shù)的橋頭堡和試驗(yàn)田。
谷歌提出了知識圖譜[9]?的概念,并推出了基于知識圖譜的新型搜索服務(wù)。知識圖譜從本質(zhì)上講是一個(gè)知識庫,基于知識圖譜的搜索服務(wù)則可以看作是一個(gè)典型的自動問答系統(tǒng)。與傳統(tǒng)網(wǎng)頁搜索相比,基于知識圖譜的搜索能夠更好地理解用戶的搜索意圖,并對相關(guān)內(nèi)容和主題進(jìn)行總結(jié)。例如,當(dāng)輸入“Bill?Gates”時(shí),用戶不僅可以獲得這個(gè)關(guān)鍵詞的全部信息,還能獲取關(guān)于Bill?Gates?的介紹。知識圖譜還能夠提供搜索結(jié)果的詳細(xì)知識體系,幫助用戶從更多角度了解搜索結(jié)果的相關(guān)信息。
有趣的事情[13]
在關(guān)于臉譜搜索的演進(jìn)中,必不可少的兩個(gè)人是:扎克伯格、拉斯穆森。前者不用多說,后者是Google?Maps的締造者,不用多說,想想有多牛逼。拉斯穆森加入Facebook搜索團(tuán)隊(duì)后,開始這個(gè)劃時(shí)代的的產(chǎn)品。他提到:讓這一搜索引擎幾乎能回答任何問題。給出的結(jié)果是:絕不可能,隨便輸入想要的東西然后就能變魔術(shù)一樣彈出一個(gè)包含相關(guān)內(nèi)容的頁面,這種事情不是通過自然語言所能實(shí)現(xiàn)的,更別說為所有這些內(nèi)容編制索引了。在?Facebook?上有超過?1?萬億個(gè)用戶關(guān)系,將這些關(guān)系索引化,還要隨意利用它們,這絕對是一個(gè)巨大的技術(shù)挑戰(zhàn)!但如果能實(shí)現(xiàn),這將是非常棒的一個(gè)產(chǎn)品。With?Google's?words:?you?must?implement?it!??Facebook?就像一個(gè)巨大的數(shù)據(jù)庫,而你在其中查找匹配的搜索結(jié)果,而搜索結(jié)果本身也是根據(jù)搜索目的進(jìn)行量身定制的。
?
相比于Google和Facebook,Microsoft同時(shí)也在做出努力。通過提取網(wǎng)頁中的非結(jié)構(gòu)化數(shù)據(jù),構(gòu)建了結(jié)構(gòu)化的知識庫Satori[11],用于從語義層面提高和改進(jìn)必應(yīng)的搜索質(zhì)量。此外,與谷歌的知識圖譜搜索類似,當(dāng)用戶輸入的查詢語句能夠被后臺自然語言處理模塊解析時(shí),必應(yīng)將觸發(fā)自動問答模塊,基于Satori?知識庫生成答案,并將生成的結(jié)果及其相關(guān)知識直接返回給用戶。
愿景
讓我們追到遠(yuǎn)古的需求,展現(xiàn)盡美。
Vision:?Let?all?the?information?searchable,can?be?found.
?
?
?
參考內(nèi)容:
[1]http://www.36kr.com/p/109843.html
[2]http://www.36kr.com/p/202209.html
[3]http://blog.sina.com.cn/s/blog_7d26e1ac01015itb.html
[4]http://blog.sina.com.cn/s/blog_4caedc7a0102e
[5]http://searchengineland.com/google-launches-knowledge-graph-121585vz6.html
[6]http://blog.sina.com.cn/s/blog_4caedc7a0102evz6.html
[7]http://www.zhihu.com/question/21371605
[8]http://news.cnet.com/8300-5_3-0.html?keyword=knowledge+graph
[9]?http://searchengineland.com/google-launches-knowledge-graph-121585
http://www.google.com/insidesearch/features/search/knowledge.html
[11]?Gallagher,?Sean.?How?Google?and?Microsoft?taught?searchto?understand?the?Web.?2012
[12]http://blog.sina.com.cn/s/blog_7d26e1ac01015itb.html
[13]http://www.guokr.com/article/436673/
總結(jié)
- 上一篇: Striving For Simplic
- 下一篇: [深度学习论文笔记][Visualizi