- 知识准备
https://blog.csdn.net/tongxin_tongmeng/article/details/126752683
https://blog.csdn.net/tongxin_tongmeng/article/details/126850376 - IK下载(ES版本对应)
https://github.com/medcl/elasticsearch-analysis-ik/releases - IK上传Linux
elasticsearch-analysis-ik-8.4.1.zip本地下载解压后上传/home/elasticsearch/elasticsearch-8.4.1/plugins
IK加载(重启ES服务)
1.查看ES:ps -ef | grep -i elasticsearch 2.关闭ES:kill -9 进程号 3.启动ES:elasticsearch -d 4.ES插件:elasticsearch-plugin list
- IK分词效果
1.粗粒度分词(字词不重复):"analyzer": "ik_smart" 2.细粒度分词(字词会重复):"analyzer": "ik_max_word"
自定义字典
1.创建/home/elasticsearch/elasticsearch-8.4.1/plugins/elasticsearch-analysis-ik-8.4.1/config/my.dic 2.编辑/home/elasticsearch/elasticsearch-8.4.1/plugins/elasticsearch-analysis-ik-8.4.1/config/IKAnalyzer.cfg.xml <entry key="ext_dict">my.dic</entry> 3.编辑/home/elasticsearch/elasticsearch-8.4.1/plugins/elasticsearch-analysis-ik-8.4.1/config/my.dic 添加:童心同萌 4.重启ES服务后再次对"童心同萌是中国人"分词,发现"童心同萌"被当做了一个词
版权声明:本文为tongxin_tongmeng原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。