solr–中文分词器使用
一、简介
solr7以前的版本对于中文分词支持不好,通常会用IK分词器。对于solr7,可以直接使用提供的分词器。
二、solr7中文分词器使用步骤
1、复制lucene-analyzers-smartcn-7.2.0.jar(在contrib/analysis-extras/lucene-libs目录下)到server/solr-webapp/webapp/WEB-INF/lib目录下
2、在managed-schema(在server/solr/stu/conf目录下,这里选的自定义core即stu)文件中添加新分词器
<fieldType name="text_hmm_chinese" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
</fieldType>
3、字段重新添加新增的字段类型
<field name="stu_id" type="text_hmm_chinese" indexed="true" stored="true"/>
4、在页面Core Admin重新加载自定义的core即stu
版权声明:本文为chinabestchina原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。