mac solr mysql 配置文件_Solr配置文件浅析
接上一篇Linux下安裝solr7.4,來談談solr的配置文件schema.xml和db-data-config.xml
首先看schema.xml:
id
field標簽用來定義solr core中的字段。這里列出的三個字段如果沒有特殊原因盡量保留。字段id被聲明為uniqueKey,是讓id來唯一標明一個solrdocument。通過這個id來對solrdocument進行操作。
type對應的是字段的屬性,solr在schema中定義了很多屬性,當然也可以自己定義屬性。這里常見的屬性有pint,pdate,string,boolean等。
不常見或者自定義的屬性:
該屬性type="text_ws"定義的字段通過空格去分割文本變成一個一個的詞,然后可以通過被分割的詞去查找該document。
這里用到的逆向索引是solr的精髓,將分好的詞作為key,文檔標簽作為value,對key建索引,去查詢文檔。
indexed屬性如果為true則說明該字段將被建索引。
stored屬性如果為true,則將該字段內容進行存儲。
multiValued如果設置為true,則表明該字段是由多個字段值組成的。比如上面例子中的text字段,它是由content和title字段組成。對text字段的操作就是對content和title字段進行操作。
上面這一段配置的意思是:有兩個字段title和content,他們是自定義的text_hanlp屬性,含有這屬性的字段都接受hanlp的分詞。這兩個字段不創建索引,只做存儲。text字段負責組合title和content字段,并創建索引用來檢索。
required屬性表明該字段值是否必須。
自定義屬性text_hanlp來達到中文分詞效果
因為solr常用的ik分詞、mmseg4j都已經不維護了。所以這里使用還有大神維護的Hanlp分詞器。
配置Hanlp分詞可以參考教程
將hanlp-portable.jar和hanlp-lucene-plugin.jar共兩個jar放入${tomcat}/webapps/solr/WEB-INF/lib下
配置好之后,可以在solr admin界面查看分詞效果:
solr分詞
定義動態字段
dynamicField定義的就是動態字段,只要符合_i結尾的字段都可以被這個字段所定義。同樣的,schema.xml中已經定義好了很多動態字段。可以直接拿來用。
db-data-config.xml配置文件
該文件主要配置數據庫連接和字段對應關系。用來做全量和增量索引的創建,相對schema.xml簡單很多。
下面看下主要配置:
url="jdbc:mysql://127.0.0.1:3306/database?
useUnicode=true&characterEncoding=UTF-8"
user="root"
batchSize="-1"
password="123456"/>
dataSource用來定義數據庫連接,batchSize設為-1是為了避免查詢創建索引導致內存溢出。
query="select * from tableName" >
這里做了一個簡單的定義,看著很清楚。columen標明的是數據庫查出的字段,name標明的屬性和schema中定義的字段對應。
deltaQuery="select id from item where last_modified > '${dataimporter.last_index_time}'">
deltaQuery用來做增量索引的創建。
當文件配置好之后,重啟tomcat。訪問solr/index.html。
solr創建索引
選擇1,然后2可以選擇全量索引或者創建增量索引。勾選clean會清楚上次的索引,點選commit創建索引進行提交。點擊execute進行執行。
下一篇,更新spring boot 中集成solrJ對solr進行操作。
創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎總結
以上是生活随笔為你收集整理的mac solr mysql 配置文件_Solr配置文件浅析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: java mysql nullpoint
- 下一篇: mysql 更改root密码字段不存在_