搜索引擎汇总
Lucene是一種功能強(qiáng)大且被廣泛使用的搜索引擎,以下列出8種基于Lucene的搜索引擎,你可以想象他們有多么強(qiáng)大...
Apache Solr
Solr是一個(gè)高性能,采用Java5開(kāi)發(fā),基于Lucene的全文搜索服務(wù)器。文檔通過(guò)Http利用XML加到一個(gè)搜索集合中。查詢?cè)摷弦彩峭ㄟ^(guò) http收到一個(gè)XML/JSON響應(yīng)來(lái)實(shí)現(xiàn)。它的主要特性包括:高效、靈活的緩存功能,垂直搜索功能,高亮顯示搜索結(jié)果,通過(guò)索引復(fù)制來(lái)提高可用性,提 供一套強(qiáng)大Data Schema來(lái)定義字段,類型和設(shè)置文本分析,提供基于Web的管理界面等。http://lucene.apache.org/solr/?
Elastic Search
ElasticSearch是一個(gè)基于Lucene構(gòu)建的開(kāi)源,分布式,RESTful搜索引擎。設(shè)計(jì)用于云計(jì)算中,能夠達(dá)到實(shí)時(shí)搜索,穩(wěn)定,可靠,快速,安裝使用方便。支持通過(guò)HTTP使用JSON進(jìn)行數(shù)據(jù)索引。http://www.elasticsearch.com
Index Tank
IndexTank, 一套基于Java的索引-實(shí)時(shí)全文搜索引擎實(shí)現(xiàn),Includes features like variables (boosts), categories (facets), faceted search, snippeting, custom scoring functions, suggest, and autocomplete。IndexTank的設(shè)計(jì)分離了相關(guān)性標(biāo)記和文檔內(nèi)容,因?yàn)橄嚓P(guān)性標(biāo)記的生命周期和文檔本身是不一樣的,特別是在用戶創(chuàng)建的內(nèi) 容的情況下,例如 分享次數(shù),Like按鈕,+1按鈕等等。https://github.com/linkedin/indextank-engine
Katta
Katta是一個(gè)可擴(kuò)展的、故障容錯(cuò)的、分布式實(shí)施訪問(wèn)的數(shù)據(jù)存儲(chǔ)。
Katta可用于大量、重復(fù)、索引的碎片,以滿足高負(fù)荷和巨大的數(shù)據(jù)集。這些索引可以是不同的類型。當(dāng)前該實(shí)現(xiàn)在Lucene和Hadoop?mapfiles
?http://katta.sourceforge.net/?
Bobo Search?
bobo-browse 是一用java寫(xiě)的lucene擴(kuò)展組件,通過(guò)它可以很方便在lucene上實(shí)現(xiàn)分組統(tǒng)計(jì)功能。
比如說(shuō)搜索電腦,可以得到cpu是intel的有幾條命中記錄,cpu是amd的有幾條命中記錄。
?https://github.com/javasoze/bobo?
Compass
Compass是一個(gè)強(qiáng)大的,事務(wù)的,高性能的對(duì)象/搜索引擎映射(OSEM:object/search engine mapping)與一個(gè)Java持久層框架.Compass包括:??
* 搜索引擎抽象層(使用Lucene搜索引薦),
?* OSEM (Object/Search Engine Mapping) 支持,
?* 事務(wù)管理,
?* 類似于Google的簡(jiǎn)單關(guān)鍵字查詢語(yǔ)言,?
?* 可擴(kuò)展與模塊化的框架,
?* 簡(jiǎn)單的API.
?http://www.compass-project.org/?
Summa
Summa是一種由java開(kāi)發(fā)的,快速模塊化和可擴(kuò)展的搜索引擎. Summa 有如下特點(diǎn):
-
綜合搜索. Summa 能夠同時(shí)訪問(wèn)許多不同的數(shù)據(jù)和資料來(lái)源,并以一個(gè)統(tǒng)一的接口公開(kāi)
-
模塊化設(shè)計(jì).Summa 搜索系統(tǒng)由一系列獨(dú)立模塊組成, 這樣使得它更簡(jiǎn)單容易地被維護(hù)和升級(jí)
-
可擴(kuò)展性. Summa 支持分布式架構(gòu)而且能夠按比例的擴(kuò)大或縮小以處理任何數(shù)量的數(shù)據(jù)
-
開(kāi)放標(biāo)準(zhǔn). Summa 基于現(xiàn)代web技術(shù)與標(biāo)準(zhǔn), 不包含任何私有代碼或原理.
-
故障容錯(cuò). 如果某單一數(shù)據(jù)資源或服務(wù)出錯(cuò), Summa 將會(huì)繼續(xù)運(yùn)行而不受出錯(cuò)部分限制.
http://wiki.statsbiblioteket.dk/summa/?
Constellio
Constellio 是一個(gè)開(kāi)源的搜索解決方案,適合企業(yè)級(jí)的搜索。基于 Apache Solr 項(xiàng)目構(gòu)建,使用 Lucene 做為搜索引擎,并提供基于 Web 的網(wǎng)頁(yè)和文檔的檢索。可選擇文檔類型、文件夾以及文件名進(jìn)行檢索。http://constellio.com/
總結(jié)
- 上一篇: 前端的工程化
- 下一篇: jQuery幻灯片skitter-sli