上篇文章中讲解如何安装单机版的solr,作为国内的网站,分析肯定是配置中文分析器!
在solr4.4中我们使用的是IKAnalyzer中文分词器V2012版,现在都是2017年了啊!在升级过程中我本来还是使用这种方式进行的配置,但是solr7已经不支持了,那是因为solr7本身提供了更好的方式!
在solr7本身提供中文的分词jar包,只需要我们进行简单的配置即可!
1、创建一个core
solr5有两种运行模式,独立模式和云模式,独立模式是以core来管理,云模式是以collection来管理。我搭建的只是个单机版的内容,所以独立模式足可以使用。
solr create -c core12、配置jar
在/usr/local/solr-7.1.0/contrib/analysis-extras/lucene-libs目录下找到
复制到webapp的lib目录下
/usr/local/solr-7.1.0/server/solr-webapp/webapp/WEB-INF/lib配置文件添加FieldType类型
<!-- ChineseAnalyzer -->
<fieldType name="text_ik" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
</fieldType>3、启动solr,测试
【总结】
配置solr的中文分词器到现在为止就算配置完成了,但是这真是solr学习的万里长征的第一步啊,后面的学习还是需要继续深入啊!
版权声明:本文为jiadajing267原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。