mysql 分词搜索_MySQL5.7分词全文检索思路
通常我們在進(jìn)行模糊查詢時,都是通過SQL語句的Like來查詢的,例如搜索文章標(biāo)題中帶“蘋果”兩個字的,就搜索 where title like ‘%蘋果%’這樣來得到結(jié)果。但有些時候用戶輸入的是一句話,例如用戶輸入:都挺好第一集,而數(shù)據(jù)庫中對應(yīng)的文章標(biāo)題可能是:《都挺好》第一集,因為加了書名號的原因,通過like來模糊搜索就搜索不到了。解決辦法就是使用全文檢索。
添加全文索引
將title字段設(shè)置為FULLTEXT索引
如果是英文檢索,默認(rèn)已經(jīng)可以使用了,因為英文單詞是通過空格來分隔的,然后中文沒有分隔,都是連一起的,所以就需要分詞。
設(shè)置最小分詞索引長度
首先查詢當(dāng)前的分詞索引長度,如果沒設(shè)置過,默認(rèn)是4
SHOW?VARIABLES?LIKE?'ft_min_word_len'如果是4,則代表對4個字及其以上才建立索引,而中文有時候是兩個字甚至1個字,所以建議設(shè)置為1,設(shè)置辦法:打開my.ini,在[mysqld]的最后一行添加:
ft_min_word_len=1重啟MySQL并重建索引:
REPAIR TABLE 表名 QUICK;新建一個title_word字段,添加全文索引
title_word字段用于存儲標(biāo)題的分詞。例如將《都挺好》第一集拆分成:都挺好 第一集兩個詞語,然后存儲在title_word字段中。
將用戶搜索的句子也分詞
現(xiàn)在用戶輸入:都挺好第一集,首先將都挺好第一集拆分成:都挺好 第一集兩個詞語,然后在進(jìn)行全文檢索:
SELECT * FROM `articles` where MATCH(`title_word`) AGAINST ('都挺好 第一集')這樣就可以搜索到結(jié)果了。
如果是低于5.7版本的MySQL,也可以將漢字分詞轉(zhuǎn)為區(qū)位碼或者base64encode后,就變成了英文和數(shù)字,也可以使用全文索引,參考:https://www.mdaima.com/jingyan/43.html
參考文章:https://www.cnblogs.com/ibook360/p/5073313.html
總結(jié)
以上是生活随笔為你收集整理的mysql 分词搜索_MySQL5.7分词全文检索思路的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: mongodb更新某个字段_直播 | M
- 下一篇: neo4j 知识图谱_知识图谱里的知识存