【Solr7】——配置中文分析器

    上篇文章中讲解如何安装单机版的solr,作为国内的网站,分析肯定是配置中文分析器!

    在solr4.4中我们使用的是IKAnalyzer中文分词器V2012版,现在都是2017年了啊!在升级过程中我本来还是使用这种方式进行的配置,但是solr7已经不支持了,那是因为solr7本身提供了更好的方式!

    在solr7本身提供中文的分词jar包,只需要我们进行简单的配置即可!

1、创建一个core

    solr5有两种运行模式,独立模式和云模式,独立模式是以core来管理,云模式是以collection来管理。我搭建的只是个单机版的内容,所以独立模式足可以使用。

solr create -c core1

2、配置jar

在/usr/local/solr-7.1.0/contrib/analysis-extras/lucene-libs目录下找到


复制到webapp的lib目录下

/usr/local/solr-7.1.0/server/solr-webapp/webapp/WEB-INF/lib

配置文件添加FieldType类型

<!-- ChineseAnalyzer -->
    <fieldType name="text_ik" class="solr.TextField" positionIncrementGap="100">
      <analyzer type="index">
        <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
      </analyzer>
      <analyzer type="query">
        <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
      </analyzer>
    </fieldType>

3、启动solr,测试


【总结】

     配置solr的中文分词器到现在为止就算配置完成了,但是这真是solr学习的万里长征的第一步啊,后面的学习还是需要继续深入啊!


版权声明:本文为jiadajing267原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。