solr–中文分词器使用

文章目录

solr--中文分词器使用
- - 一、简介
  - 二、solr7中文分词器使用步骤

一、简介

solr7以前的版本对于中文分词支持不好，通常会用IK分词器。对于solr7，可以直接使用提供的分词器。

二、solr7中文分词器使用步骤

1、复制lucene-analyzers-smartcn-7.2.0.jar（在contrib/analysis-extras/lucene-libs目录下）到server/solr-webapp/webapp/WEB-INF/lib目录下

2、在managed-schema（在server/solr/stu/conf目录下，这里选的自定义core即stu）文件中添加新分词器

<fieldType name="text_hmm_chinese" class="solr.TextField" positionIncrementGap="100">
    <analyzer type="index">
      <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
    </analyzer>
    <analyzer type="query">
      <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
    </analyzer>
</fieldType>

3、字段重新添加新增的字段类型

<field name="stu_id" type="text_hmm_chinese"  indexed="true" stored="true"/>

4、在页面Core Admin重新加载自定义的core即stu

原文链接：https://blog.csdn.net/chinabestchina/article/details/104910638