[新手解答]带你了解什么是倒排索引!
大家對于索引量是應(yīng)該比較熟悉的,但是對于倒排索引新手就肯定不是很明白,其實(shí)簡單來講,倒排索引源于實(shí)際應(yīng)用中需要根據(jù)屬性的值來查找記錄。這種索引表中的每一項(xiàng)都包括一個(gè)屬性值和具有該屬性值的各記錄的地址。由于不是由記錄來確定屬性值,而是由屬性值來確定記錄的位置,因而稱為倒排索引。帶有倒排索引的文件我們稱為倒排索引文件,簡稱倒排文件。這就是它的基本概念。那么接下來就讓小編帶你了解什么是倒排索引!
一、倒排索引簡介
倒排索引(英文:Inverted Index),是一種索引方法,常被用于全文檢索系統(tǒng)中的一種單詞文檔映射結(jié)構(gòu)。現(xiàn)代搜索引擎絕大多數(shù)的索引都是基于倒排索引來進(jìn)行構(gòu)建的,這源于在實(shí)際應(yīng)用當(dāng)中,用戶在使用搜索引擎查找信息時(shí)往往只輸入信息中的某個(gè)屬性關(guān)鍵字,如一些用戶不記得歌名,會(huì)輸入歌詞來查找歌名;輸入某個(gè)節(jié)目內(nèi)容片段來查找該節(jié)目等等。
面對海量的信息數(shù)據(jù),為滿足用戶需求,順應(yīng)信息時(shí)代快速獲取信息的趨勢,聰明的開發(fā)者們在進(jìn)行搜索引擎開發(fā)時(shí)對這些信息數(shù)據(jù)進(jìn)行逆向運(yùn)算,研發(fā)了“關(guān)鍵詞——文檔”形式的一種映射結(jié)構(gòu),實(shí)現(xiàn)了通過物品屬性信息對物品進(jìn)行映射時(shí),可以幫助用戶快速定位到目標(biāo)信息,從而極大降低了信息獲取難度。倒排索引又叫反向索引,它是一種逆向思維運(yùn)算,是現(xiàn)代信息檢索領(lǐng)域里面最有效的一種索引結(jié)構(gòu)。
二、倒排索引概述:
在關(guān)系數(shù)據(jù)庫系統(tǒng)里,索引是檢索數(shù)據(jù)最有效率的方式,但對于搜索引擎,它并不能滿足其特殊要求:
1、海量數(shù)據(jù):搜索引擎面對的是海量數(shù)據(jù),像Google、百度這樣大型的商業(yè)搜索引擎索引都是億級甚至百億級的網(wǎng)頁數(shù)量 ,面對如此海量數(shù)據(jù) ,使得數(shù)據(jù)庫系統(tǒng)很難有效的管理。
2、數(shù)據(jù)操作簡單:搜索引擎使用的數(shù)據(jù)操作簡單 ,一般而言 ,只需要增、 刪、 改、 查幾個(gè)功能 ,而且數(shù)據(jù)都有特定的格式 ,可以針對這些應(yīng)用設(shè)計(jì)出簡單高效的應(yīng)用程序。而一般的數(shù)據(jù)庫系統(tǒng)則支持大而全的功能 ,同時(shí)損失了速度和空間。最后 搜索引擎面臨大量的用戶檢索需求 ,這要求搜索引擎在檢索程序的設(shè)計(jì)上要分秒必爭 ,盡可能的將大運(yùn)算量的工作在索引建立時(shí)完成 ,使檢索運(yùn)算盡量的少。一般的數(shù)據(jù)庫系統(tǒng)很難承受如此大量的用戶請求 ,而且在檢索響應(yīng)時(shí)間和檢索并發(fā)度上都不及我們專門設(shè)計(jì)的索引系統(tǒng)。
總結(jié)
以上是生活随笔為你收集整理的[新手解答]带你了解什么是倒排索引!的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 如何调整iPhone手机手电筒亮度?
- 下一篇: 人脸识别测颜值捷径安装使用教程