當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Lucene学习总结之二：Lucene的总体架构

發(fā)布時間：2024/1/23 编程问答 22 豆豆

生活随笔收集整理的這篇文章主要介紹了 Lucene学习总结之二：Lucene的总体架构小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

Lucene總的來說是：

在Lucene in action中，Lucene 的構架和過程如下圖，

說明Lucene?是有索引和搜索的兩個過程，包含索引創(chuàng)建，索引，搜索三個要點。

讓我們更細一些看Lucene的各組件：

那么如何應用這些組件呢？

讓我們再詳細到對Lucene API 的調用實現(xiàn)索引和搜索過程。

索引過程如下：
- 創(chuàng)建一個IndexWriter?用來寫索引文件，它有幾個參數(shù)，INDEX_DIR?就是索引文件所存放的位置，Analyzer?便是用來對文檔進行詞法分析和語言處理的。
- 創(chuàng)建一個Document?代表我們要索引的文檔。
- 將不同的Field?加入到文檔中。我們知道，一篇文檔有多種信息，如題目，作者，修改時間，內容等。不同類型的信息用不同的Field?來表示，在本例子中，一共有兩類信息進行了索引，一個是文件路徑，一個是文件內容。其中FileReader?的SRC_FILE?就表示要索引的源文件。
- IndexWriter?調用函數(shù)addDocument?將索引寫到索引文件夾中。
搜索過程如下：
- IndexReader?將磁盤上的索引信息讀入到內存，INDEX_DIR?就是索引文件存放的位置。
- 創(chuàng)建IndexSearcher?準備進行搜索。
- 創(chuàng)建Analyer?用來對查詢語句進行詞法分析和語言處理。
- 創(chuàng)建QueryParser?用來對查詢語句進行語法分析。
- QueryParser?調用parser?進行語法分析，形成查詢語法樹，放到Query?中。
- IndexSearcher?調用search?對查詢語法樹Query?進行搜索，得到結果TopScoreDocCollector?。

以上便是Lucene API函數(shù)的簡單調用。

然而當進入Lucene的源代碼后，發(fā)現(xiàn)Lucene有很多包，關系錯綜復雜。

然而通過下圖，我們不難發(fā)現(xiàn)，Lucene的各源碼模塊，都是對普通索引和搜索過程的一種實現(xiàn)。

此圖是上一節(jié)介紹的全文檢索的流程對應的Lucene實現(xiàn)的包結構。(參照http://www.lucene.com.cn/about.htm?中文章《開放源代碼的全文檢索引擎Lucene》)

以上是生活随笔為你收集整理的Lucene学习总结之二：Lucene的总体架构的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內容還不錯，歡迎將生活随笔推薦給好友。