ElasticSearch 之中文分词器
生活随笔
收集整理的這篇文章主要介紹了
ElasticSearch 之中文分词器
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
4,中文分詞器
4.1.? smartCN(這個是參照別人的安裝方法安裝的有興趣可以試一下)
一個簡單的中文或中英文混合文本的分詞器
這個插件提供?smartcn?analyzer 和?smartcn_tokenizer?tokenizer,而且不需要配置
# 安裝 bin/elasticsearch-plugin install analysis-smartcn # 卸載 bin/elasticsearch-plugin remove analysis-smartcn測試一下
可以看到,“今天天氣真好”用smartcn分析器的結果是:
[ 今天 , 天氣 , 真 , 好 ]如果用standard分析器的話,結果會是:
[ 今 ,天 ,氣 , 真 , 好 ]4.2 我們一般都會用? ? ?IK分詞器(我們就具體搭建一下ik中文分詞器)
下載對應的版本,這里我下載6.8.6:https://github.com/medcl/elasticsearch-analysis-ik/releases/tag/v6.8.6?
linux下使用wget命令(進入es插件目錄)
cd /usr/local/java/elasticsearch-6.8.6/plugins wget https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.8.6/elasticsearch-analysis-ik-6.8.6.zip然后,在Elasticsearch的plugins目錄下建一個ik目錄,將剛才下載的文件解壓到該目錄下
unzip elasticsearch-analysis-ik-6.8.6.zip最后,重啟Elasticsearch
查看es啟動情況
su esuser cd /usr/local/java/elasticsearch-6.8.6/bin ps -ef | grep elasticsearch重啟
./elasticsearch?重啟完成下面我們看下IK中文分詞器的如何使用
IK有兩種顆粒度的拆分:
ik_smart: 會做最粗粒度的拆分
ik_max_word: 會將文本做最細粒度的拆分
1) ik_smart 拆分
GET /_analyze {"text":"中華人民共和國國徽","analyzer":"ik_smart" }?
2)ik_max_word 拆分
GET /_analyze {"text":"中華人民共和國國徽","analyzer":"ik_max_word" }?
java學習討論群:725562382
?
總結
以上是生活随笔為你收集整理的ElasticSearch 之中文分词器的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Mysql: SQL JOIN 子句详解
- 下一篇: Java开发:(执行系统(例cmd)命令