當前位置：首頁 > 运维知识 > 数据库 >内容正文

数据库

solr为什么比MySQL快_Solr原理？为什么要用Solr？Solr为什么比较快？

發布時間：2023/12/10 数据库 22 豆豆

生活随笔收集整理的這篇文章主要介紹了 solr为什么比MySQL快_Solr原理？为什么要用Solr？Solr为什么比较快？小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

什么是Solr?

Solr是一個用java開發的基于lucene引擎的全文搜索平臺，原理是倒排索引，從關鍵字到文檔的過程，Solr的資源都是以Doc為對象進行存儲的，每個文檔都由一系列的field構成，每個field表示資源的一個屬性，文檔的fied可以被索引，用于提高性能的搜索效率，一般情況下文檔都包含一個能唯一表示該文檔的id字段。

Solr原理？

倒排索引

通過value查找key，假設文章1 內容為123，文章2 內容為 456，文章3 內容為 789，

Solr有個功能是分詞，先把文章123導入到服務器后，文章1切成1,2,3 ,原本123是文章內容，分詞后，123變為三個單獨的索引,1,2,3相當于key，文章為value,文章2 和3與1類似，切成456789六個索引，他們的value就是文章序號2和3.

索引為什么快？

索引以文件的形式存儲在磁盤上，所以只使用更少的磁盤io 次數的數據結構更適合做索引。b 樹和b+樹是是多叉樹，樹的度大，所以高度低。內存和磁盤交互的單位是頁，將b 樹和b+樹的一個節點的大小設置為一個頁，能保證一次io 就能讀到一個頁，同時磁盤采用預讀策略，一次性讀取相鄰的幾個頁，讀入內存后在進行二分查找。

簡單說就是因為索引使用B+樹，空間換時間。

為什么要用Solr？

隨意的數據不可能是根據數據庫的字段查詢的，那是怎么查詢出來的呢，為什么千奇百怪的關鍵字都可以查詢出來呢？

答案就是全文檢索工具的實現，luncence采用了詞元匹配和切分詞。舉個例子：北京天安門----luncence切分詞：北京 ?京天 ?天安 ?安門 ?等等這些分詞。所以我們搜索的時候都可以檢索到。

有一種分詞器就是IKanalyzer中文分詞器，它有細粒度切分和智能切分，即根據某種智能算法。

這就使用solr的最大的好處：檢索功能的實現。

Solr為什么比較快？

倒排索引，使用solr的分詞過后嗎，通過二分法與排序好的索引進行匹配，進而快速查到定位文檔

空間換時間

操作：

主要是SolrTemplate完成文檔操作和搜索

SolrTemplate、Query、Criteria

solr會考慮集群

solr索引庫在商品狀態發生改變的時候(審核通過、刪除)，會通過activeMQ通知更新。

solr搜索結果，可以通過redis緩存

總結

以上是生活随笔為你收集整理的solr为什么比MySQL快_Solr原理？为什么要用Solr？Solr为什么比较快？的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：录音文件下载_拒绝敲键盘，在线版免费好用
下一篇： Mybatis insert返回主键ID