ElasticSearch IK 安装&使用

2023-11-05

中文分词器

在ES中支持中文分词器非常多 如 smartCNIK 等,推荐的就是 IK分词器

安装IK

开源分词器 Ik 的github:GitHub - medcl/elasticsearch-analysis-ik: The IK Analysis plugin integrates Lucene IK analyzer into elasticsearch, support customized dictionary.

  • 注意 IK分词器的版本要你安装ES的版本一致

  • 注意 Docker 容器运行 ES 安装插件目录为 /usr/share/elasticsearch/plugins

# 1. 下载对应版本
- [es@linux ~]$ wget https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.14.0/elasticsearch-analysis-ik-7.14.0.zip

# 2. 解压
- [es@linux ~]$ unzip elasticsearch-analysis-ik-6.2.4.zip #先使用yum install -y unzip

# 3. 移动到es安装目录的plugins目录中
- [es@linux ~]$ ls elasticsearch-6.2.4/plugins/
	[es@linux ~]$ mv elasticsearch elasticsearch-6.2.4/plugins/
	[es@linux ~]$ ls elasticsearch-6.2.4/plugins/
	 	elasticsearch
	[es@linux ~]$ ls elasticsearch-6.2.4/plugins/elasticsearch/
		commons-codec-1.9.jar    config                               httpclient-4.5.2.jar  		plugin-descriptor.properties
		commons-logging-1.2.jar  elasticsearch-analysis-ik-6.2.4.jar  httpcore-4.4.4.jar
		
# 4. 重启es生效

# 5. 本地安装ik配置目录为  
- es安装目录中/plugins/analysis-ik/config/IKAnalyzer.cfg.xml

IK使用

IK有两种颗粒度的拆分:

  • ik_smart: 会做最粗粒度的拆分

  • ik_max_word: 会将文本做最细粒度的拆分

POST /_analyze
{
  "analyzer": "ik_smart",
  "text": "中华人民共和国国歌"
}

POST /_analyze
{
  "analyzer": "ik_max_word",
  "text": "中华人民"
}

 

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

ElasticSearch IK 安装&使用 的相关文章

随机推荐

  • Unity工程里的Library、Plugins、StreamingAssets、Standard Assets等东东

    1 特殊文件夹 Unity工程根目录下 有三个特殊文件夹 Assets Library ProjectSettings Assets Unity工程中所用到的所有Asset都放在该文件夹中 是资源文件的根目录 很多API都是基于这个文件目录
  • Qt程序打包发布记录使用windeployqt工具

    Qt 官方开发环境使用的动态链接库方式 在发布生成的exe程序时 需要复制一大堆 dll 如果自己去复制dll 很可能丢三落四 导致exe在别的电脑里无法正常运行 因此 Qt 官方开发环境里自带了一个工具 windeployqt exe 首
  • Vue3和Vue2的区别

    目录 前言 概览 一 新特性 二 差异 详情 一 vue3新特性 1 组合式API setup 2 ref创建响应式数据 3 Teleport 传送门 4 多根节点 5 style中使用变量 二 区别 1 v if和v for的优先级 2
  • ios 获取服务器js文件是否存在,使用js的XMLHttpRequest对象,在ios中获取服务器上的txt,经常失败…...

    但是在pc上还没发现过失败 ios上失败时候的症状是 XMLHttpRequest readyState到2之后就没有东西了 以下是代码 ajax video music20 0music list txt function data if
  • 使用pygame.display.set_mode()函数的时候,遇到TypeError: argument 1 must be 2-item sequence, not int 问题

    screen pygame display set mode ai settings screen width ai settings screen height TypeError argument 1 must be 2 item se
  • 动画制作如何选择动作捕捉动画制作服务

    近日 长宁ART PARK 大融城迎来了首位虚拟代言人 光艺 拥有着极具感染力的笑容 数字人形象辨识度极高 在裸眼3D巨屏中 为市民带来虚实交互体验 而这种数字人动画的背后 大多以动作捕捉动画制作技术为主 素材源于网络 在动画制作中 想要全
  • 手把手教你封装高德地图组件

    背景 最近的一个项目中需要用到地图功能 经过一番调研 决定对于国内用户采用高德地图API 对于国外用户采用谷歌地图API 本期讲讲如何在vue项目中封装高德地图组件 下一期讲述如何封装谷歌地图组件 本次组件所满足的大致需求是 传入经纬度数据
  • 运行项目报错 proxy error: could not proxy request...

    今天跑项目的时候遇到一个问题 早上跑的时候还好好的 午休完起来一看 页面报错了 弹窗提示 proxy error could not proxy request from 我本地 to 目标地址 终端报错 Proxy error Could
  • android设备之间屏幕共享

    近期公司在开发一款android的设备把屏幕投射到手机上 同一时候手机还能够触控 键盘操作 这样 就达到了屏幕共享的目的 思考了一下 主要思路 1 将截图所获取的位图用ffmpeg编码成视频流 2 将视频流用live555进行流媒体分发 手
  • 复变函数与积分变换

    复变函数与积分变换 一 拉普拉斯变换 1 拉氏变换的性质 a 线性性质 b 相似性质 c 微分性质 例子 例子 拉式变换 象函数的微分性质 例子 例子 积分性质 象函数的积分性质 例子 例子 延迟性质 位移性质 拉氏变换的应用 一 拉普拉斯
  • keytool命令来生成证书缺少MD5

  • Stream篇(四)

    FileStream 如何去理解FileStream 通过前3章的学习相信大家对于Stream已经有一定的了解 但是又如何去理解FileStream呢 请看下图 我们磁盘的中任何文件都是通过2进制组成 最为直观的便是记事本了 当我们新建一个
  • SpringMVC使用Ajax请求返回中文乱码

    使用 ResponseBody标记返回参数 当类型为String时 返回的中文可能会出现乱码问题 而当返回值是Map
  • QTableWidget设置代理 添加QCombox

    一 实现功能 向QTableWidget上添加QCombox 显示效果 双击鼠标才显示Combox组件 如下图所示 未双击效果图 双击效果图 二 向第二列添加combox代码如下 ui tableWidget TestItems gt ve
  • MATLAB入门实战版

    写在前面 众所周知 MATLAB是理工科不可不知的利器 其功能之广 之强可谓万金油 其在科研 数模竞赛 课设等当中有着广泛的用途 甚至也有地方专门开了MATLAB的相关课程 学习MATLAB 对于非计算机专业的理工科选手而言还是很有用的 M
  • main函数,printf函数,和库函数

    main函数 printf函数和库函数 在C语言的入门学习中 细心的朋友们可以发现 一个C语言程序无论有多长 都有一个main函数 而在代码中想要输出结果 就需要用到printf函数 print函数其实就是一个库函数 而库函数有很多 接下来
  • 联想小新Air2020ill版换硬盘及安装Win11详细过程

    打开后盖 先拧下背后的7颗螺丝 红色的可以取下来 绿色的是固定在底板上的 拧松后不能取下来 紫色区域存在一个卡扣 在后文会提到 打开一个缝隙 b站官方拆机视频里的方法https www bilibili com video BV1L7411
  • BASE64转换为图片格式,并上传图片

    基本的把base64 转成图片 将BASE64转换为图片格式 代码 java public static final String JPG jpg public MessageBody
  • Python 爬虫详解

    一 爬虫概述 1 爬虫简介 要对数据进行处理和分析 首先就要拥有数据 在当今这个互联网时代 大量信息以网页作为载体 网页也就成了一个很重要的数据来源 但是 网页的数量非常之多 如果以人工的方式从网页上采集数据 工作量相当巨大 从本章开始就要
  • ElasticSearch IK 安装&使用

    中文分词器 在ES中支持中文分词器非常多 如 smartCN IK 等 推荐的就是 IK分词器 安装IK 开源分词器 Ik 的github GitHub medcl elasticsearch analysis ik The IK Anal