solr为什么比MySQL快_Solr原理?为什么要用Solr?Solr为什么比较快?
什么是Solr?
Solr是一個用java開發的基于lucene引擎的 全文搜索 平臺,原理是倒排索引,從關鍵字到文檔的過程,Solr的資源都是以Doc為對象進行存儲的,每個文檔都由一系列的field構成,每個field表示資源的一個屬性,文檔的fied可以被索引,用于提高性能的搜索效率,一般情況下文檔都包含一個能唯一表示該文檔的id字段。
Solr原理?
倒排索引
通過value查找key,假設文章1 內容為123,文章2 內容為 456,文章3 內容為 789,
Solr有個功能是分詞,先把文章123導入到服務器后,文章1切成1,2,3 ,原本123是文章內容,分詞后,123變為三個 單獨的索引,1,2,3相當于key,文章為value,文章2 和3與1類似,切成456789六個索引,他們的value就是文章序號2和3.
索引為什么快?
索引以文件的形式存儲在磁盤上,所以只使用更少的磁盤io 次數的數據結構更適合做索引。b 樹和b+樹是是多叉樹,樹的度大,所以高度低。內存和磁盤交互的單位是頁,將b 樹和b+樹的一個節點的大小設置為一個頁,能保證一次io 就能讀到一個頁,同時磁盤采用預讀策略,一次性讀取相鄰的幾個頁,讀入內存后在進行二分查找。
簡單說就是因為索引使用B+樹,空間換時間 。
為什么要用Solr?
隨意的數據不可能是根據數據庫的字段查詢的,那是怎么查詢出來的呢,為什么千奇百怪的關鍵字都可以查詢出來呢?
答案就是全文檢索工具的實現,luncence采用了詞元匹配和切分詞。舉個例子:北京天安門----luncence切分詞:北京 ?京天 ?天安 ?安門 ?等等這些分詞。所以我們搜索的時候都可以檢索到。
有一種分詞器就是IKanalyzer中文分詞器,它有細粒度切分和智能切分,即根據某種智能算法。
這就使用solr的最大的好處:檢索功能的實現。
Solr為什么比較快?
倒排索引,使用solr的分詞過后嗎,通過二分法與排序好的索引進行匹配,進而快速查到定位文檔
空間換時間
操作:
主要是SolrTemplate完成文檔操作和搜索
SolrTemplate、Query、Criteria
solr會考慮集群
solr索引庫在商品狀態發生改變的時候(審核通過、刪除),會通過activeMQ通知更新。
solr搜索結果,可以通過redis緩存
總結
以上是生活随笔為你收集整理的solr为什么比MySQL快_Solr原理?为什么要用Solr?Solr为什么比较快?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 录音文件下载_拒绝敲键盘,在线版免费好用
- 下一篇: Mybatis insert返回主键ID