solr5.3.1 mysql_Solr5.3.1 dataimport 导入mysql数据
最近需要計算制造業(yè)領(lǐng)域大詞表每個詞的idf,詞表里一共九十多萬個詞,語料一共三百七十多萬篇分詞后文獻(xiàn)。最開始嘗試用程序詞表循環(huán)套語料循環(huán)得到每個詞的idf,后來又嘗試把語料存入mysql然后建立全文索引再循環(huán)用sql語句去查每個詞的idf,效率都十分不理想。
最新的想法是利用solr搜索引擎的速度來做,所以首先要把mysql的數(shù)據(jù)導(dǎo)入solr。
一、開啟Solr服務(wù)
1、下載solr-5.3.1.tgz包,解壓之后為solr-5.3.1
2、通過bin/solr start命令開啟solr服務(wù)
3、開啟服務(wù)之后,默認(rèn)是開啟8983端口,此時就可以使用localhost:8983/solr/進(jìn)行訪問了
二、從Mysql數(shù)據(jù)庫中導(dǎo)入數(shù)據(jù)
1、創(chuàng)建core或collection:bin/solr create -c 集合名
2、從mysql官網(wǎng)中下載一個mysql-connector-java-5.1.25.zip壓縮包,解壓出一個mysql-connector-java-5.1.25-bin.jar包,將它分別copy到solr-5.3.1/server/lib和solr-5.3.1/server/solr-webapp/webapp/WEB-INF/lib當(dāng)中(只copy到第一個路徑應(yīng)該就可以)
3、將solr-dataimporthandler-5.3.1.jar和solr-dataimporthandler-extras-5.3.1.jar從solr-5.3.1/dist/文件夾下copy到solr-5.3.1/server/solr-webapp/webapp/WEB-INF/lib當(dāng)中(只copy第一個文件應(yīng)該就可以)
4、修改solr-5.3.1/server/solr/集合名/conf/managed-schema文件為schema.xml
5、在schema.xml添加field(根據(jù)實際情況),如下:
6、修改solr-5.3.1/server/solr/collection/conf/下的solrconfig.xml的配置文件,增加一段添加數(shù)據(jù)庫數(shù)據(jù)的xml,如下:
data-config.xml
7、在solr-5.3.1/server/solr/collection/conf/下創(chuàng)建data-config.xml文件,配置訪問數(shù)據(jù)庫的用戶名、密碼、查詢語句,column對應(yīng)數(shù)據(jù)庫中字段、name對應(yīng)solr的schema.xml中字段(根據(jù)實際情況),文件內(nèi)容如下:
8、重啟服務(wù)bin/solr restart
9、
總結(jié)
以上是生活随笔為你收集整理的solr5.3.1 mysql_Solr5.3.1 dataimport 导入mysql数据的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 真的换不动手机了?2022年全球智能手机
- 下一篇: 保险公司怎么投诉 怎么投诉保险公司