Solr建立索引时,过滤HTML标签
原文地址? http://www.joyphper.net/article/201306/188.html
?
1、在數(shù)據(jù)庫的讀取文件data-config.xml 中的entity 標(biāo)記里邊添加 transformer=”HTMLStripTransformer” 代碼。
<entity name="edusystem" pk="url" transformer="HTMLStripTransformer" query="SELECT description? from table">
??????????? <field column="description" name="description" stripHTML="true"/>
</entity>?
2、在field 字段需要過濾html代碼的字段添加 stripHTML=”true”
<entity name="edusystem" pk="url" transformer="HTMLStripTransformer" query="SELECT description from table">
???????????? <field column="description" name="description" stripHTML="true"/>
</entity>
3、修改schema.xml文件中的fieldType標(biāo)記中的內(nèi)容,添加如下代碼<charFilter class=”solr.HTMLStripCharFilterFactory” />
<analyzer type="query">
????<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory"? mode="simple" reload="true" />
????<filter class="solr.LowerCaseFilterFactory" />
????<charFilter class="solr.HTMLStripCharFilterFactory" />
</analyzer>
轉(zhuǎn)載于:https://www.cnblogs.com/fengh/p/4795126.html
總結(jié)
以上是生活随笔為你收集整理的Solr建立索引时,过滤HTML标签的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 怎么让泰山风景区成为更具可持续发展的旅游
- 下一篇: 为啥泰山有这么多不同的植物种类?