當(dāng)前位置：首頁 > 运维知识 > 数据库 >内容正文

数据库

mysql 分词搜索_MySQL5.7分词全文检索思路

發(fā)布時間：2025/3/20 数据库 14 豆豆

生活随笔收集整理的這篇文章主要介紹了 mysql 分词搜索_MySQL5.7分词全文检索思路小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

通常我們在進(jìn)行模糊查詢時，都是通過SQL語句的Like來查詢的，例如搜索文章標(biāo)題中帶“蘋果”兩個字的，就搜索 where title like ‘%蘋果%’這樣來得到結(jié)果。但有些時候用戶輸入的是一句話，例如用戶輸入：都挺好第一集，而數(shù)據(jù)庫中對應(yīng)的文章標(biāo)題可能是：《都挺好》第一集，因為加了書名號的原因，通過like來模糊搜索就搜索不到了。解決辦法就是使用全文檢索。

添加全文索引

將title字段設(shè)置為FULLTEXT索引
如果是英文檢索，默認(rèn)已經(jīng)可以使用了，因為英文單詞是通過空格來分隔的，然后中文沒有分隔，都是連一起的，所以就需要分詞。

設(shè)置最小分詞索引長度

首先查詢當(dāng)前的分詞索引長度，如果沒設(shè)置過，默認(rèn)是4

SHOW?VARIABLES?LIKE?'ft_min_word_len'

如果是4，則代表對4個字及其以上才建立索引，而中文有時候是兩個字甚至1個字，所以建議設(shè)置為1，設(shè)置辦法：打開my.ini，在[mysqld]的最后一行添加：

ft_min_word_len=1

重啟MySQL并重建索引：

REPAIR TABLE 表名 QUICK;

新建一個title_word字段，添加全文索引

title_word字段用于存儲標(biāo)題的分詞。例如將《都挺好》第一集拆分成：都挺好第一集兩個詞語，然后存儲在title_word字段中。

將用戶搜索的句子也分詞

現(xiàn)在用戶輸入：都挺好第一集，首先將都挺好第一集拆分成：都挺好第一集兩個詞語，然后在進(jìn)行全文檢索：

SELECT * FROM `articles` where MATCH(`title_word`) AGAINST ('都挺好第一集')

這樣就可以搜索到結(jié)果了。

如果是低于5.7版本的MySQL，也可以將漢字分詞轉(zhuǎn)為區(qū)位碼或者base64encode后，就變成了英文和數(shù)字，也可以使用全文索引，參考：https://www.mdaima.com/jingyan/43.html

參考文章：https://www.cnblogs.com/ibook360/p/5073313.html

總結(jié)

以上是生活随笔為你收集整理的mysql 分词搜索_MySQL5.7分词全文检索思路的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： mongodb更新某个字段_直播 | M
下一篇： neo4j 知识图谱_知识图谱里的知识存