elasticsearch中index.highlight.max_analyzed_offset设置

2023-11-10

elasticsearch中设置index.highlight.max_analyzed_offset

Caused by: java.lang.IllegalArgumentException: 
The length of [message] field of [VqCNQHkBFO-4K4CU-7tq] doc of [xxxx-node02-xxxx-2021.05.06] 
index has exceeded [1000000] - maximum allowed to be analyzed for highlighting. 
This maximum can be set by changing the [index.highlight.max_analyzed_offset] index level setting.
For large texts, indexing with offsets or term vectors is recommended!

浏览官网可知:

突出显示没有偏移或术语向量的索引文本,需要在搜索请求期间实时分析内存中的该文本。对于大文本,此分析可能需要大量时间和内存。为了防止这种情况,将分析的最大字符数限制为 1000000。可以使用 index 设置为特定索引更改此默认限制index.highlight.max_analyzed_offset

max_analyzed_offset 用于高亮请求的可分析最大字符数量,仅对无offsetsterm vectors的文本高亮请求有效。默认值1000000

1、通过kibana进行配置:

PUT /_settings
 {
    "index" : {
        "highlight.max_analyzed_offset" : 100000000
    }
}

2、通过java进行配置

完整的配置类,我这里采用的是更新设置的请求方法,也可使用新增,主要得根据自己的情况。
因为我的创建索引是在实体类中以@Document(indexName = INDEXNAME,createIndex = true)来创建。所以我设置以更新的方式UpdateSettingsRequest.

import org.apache.http.HttpHost;
import org.elasticsearch.action.admin.indices.settings.put.UpdateSettingsRequest;
import org.elasticsearch.client.RequestOptions;
import org.elasticsearch.client.RestClient;
import org.elasticsearch.client.RestHighLevelClient;
import org.elasticsearch.common.settings.Settings;
import org.springframework.beans.factory.annotation.Value;
import org.springframework.context.annotation.Bean;
import org.springframework.stereotype.Component;

import java.io.IOException;
import java.time.Duration;

/**
 * es配置
 */

@Component
public class ESConfig {

    @Value("${es.ip}")
    private String ip;

    @Value("${es.port}")
    private int port;

    @Value("${es.indexHighlightMaxAnalyzedOffset}")
    private Long indexHighlightMaxAnalyzedOffset;

    @Bean
    public RestHighLevelClient restHighLevelClient() throws IOException {
        RestHighLevelClient client = new RestHighLevelClient(
                RestClient.builder(
                        new HttpHost(ip, port, "http")
                )
                        .setHttpClientConfigCallback(httpClientBuilder -> {
                            httpClientBuilder.setKeepAliveStrategy(((httpResponse, httpContext) -> Duration.ofMinutes(5).toMillis()));
                            httpClientBuilder.disableAuthCaching();
                            return httpClientBuilder;
                        })
        );

       //索引偏移量设置/更新  index.highlight.max_analyzed_offset
        UpdateSettingsRequest updateSettingsRequest = new UpdateSettingsRequest(INDEXNAME);
        updateSettingsRequest.settings(Settings.builder().put("index.highlight.max_analyzed_offset",indexHighlightMaxAnalyzedOffset));
        client.indices().putSettings(updateSettingsRequest, RequestOptions.DEFAULT);

        return client;
    }
}

index.highlight.max_analyzed_offset的大小虽然不能过小,但建议也不要过大,会对内存带来负担。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

elasticsearch中index.highlight.max_analyzed_offset设置 的相关文章

随机推荐

  • 一文带你读懂聚类

    1 聚类思想 作为无监督学习的一个重要方法 聚类是将样本集D划分为若干互不相交的子集 即样本簇 聚类的思想就是把属性相似的样本归到一类 对于每一个数据点 我们可以把它归到一个特定的类 同时每个类之间的所有数据点在某种程度上有着共性 比如空间
  • 写给程序员的机器学习入门 (四) - 训练过程中常用的技巧

    人工智能学习离不开实践的验证 推荐大家可以多在FlyAI AI竞赛服务平台多参加训练和竞赛 以此来提升自己的能力 FlyAI是为AI开发者提供数据竞赛并支持GPU离线训练的一站式服务平台 每周免费提供项目开源算法样例 支持算法能力变现以及快
  • python手机端下载-Python3,x:如何进行手机APP的数据爬取

    Python3 x 如何进行手机APP的数据爬取 一 简介 平时我们的爬虫多是针对网页的 但是随着手机端APP应用数量的增多 相应的爬取需求也就越来越多 因此手机端APP的数据爬取对于一名爬虫工程师来说是一项必备的技能 我们知道 网页爬取的
  • SQLI-LABS Less-17

    Update 数据库更新注入 具体情况 具体分析 函数 check input 对 uname 进行检查 从 uname 处是无法注入了 而对 passwd 进行了更新 可以利用这个 updata 进行注入 注意 这里必须的 uname 必
  • 因为计算机中丢失VCRUNTIME140怎么办?为什么会丢失VCRUNTIME140.dll

    vcruntime140 dll是一个Windows动态链接库 其主要功能是为C C 编译的程序提供运行时支持 这个库在Microsoft Visual Studio 2015中被引入 其名称中的 140 代表版本号 在我们打开运行软件或者
  • MySQL的索引类型和实现原理

    一 按表列属性分类 1 单列索引 以表的单个列字段创建的索引 2 联合索引 以表的多个列字段组合创建的索引 在查询条件使用索引的从左字段顺序才会生效 遵循最左匹配原则 单列索引和联合索引又包括 普通索引 非主键 非唯一列的索引 主键索引 基
  • 计蒜客T1115——字符串判等

    水题不解释 考研复习压力偶尔写一道换换心情还不错 这里有一个比较有趣的知识点 对于同时输入多个字符串时还要允许空格的输入 那么普通的cin函数就不能满足要求了 这里采用getline函数解决 如下 string s1 s2 getline
  • Docker基本命令使用——(1)

    Docker常用命令 docker images 列出本地主机上的镜像 a 列出本地所有的镜像 含中间映像层 q 只显示镜像ID digests 显示镜像的摘要信息 no trunc 显示完整的镜像信息 docker search xxx
  • 3000帧动画图解MySQL为什么需要binlog、redo log和undo log

    全文建立在MySQL的存储引擎为InnoDB的基础上 先看一条SQL如何入库的 这是一条很简单的更新SQL 从MySQL服务端接收到SQL到落盘 先后经过了MySQL Server层和InnoDB存储引擎 Server层就像一个产品经理 分
  • produces在@requestMapping中的使用方式和作用

    转载自 https blog csdn net jaryle article details 72965885 produces可能不算一个注解 因为什么呢 它是注解 requestMapping注解里面的属性项 它的作用是指定返回值类型
  • 1787.使所有区间的异或结果为零

    题意 给你一个整数数组 nums 和一个整数 k 区间 left right left lt right 的 异或结果 是对下标位于 left 和 right 包括 left 和 right 之间所有元素进行 XOR 运算的结果 nums
  • ROS 仿真

    欢迎访问我的博客首页 ROS仿真 1 依赖与官方包 参考 1 依赖与官方包 我们需要一些 ROS 官方给出的包 可以使用 apt 命令安装 也可以下载源码编译 编译这些包需要用到的依赖及其安装方法是 sudo apt get install
  • 记一次线程爆满导致服务器崩溃的问题排查

    记一次线程爆满导致服务器崩溃的问题排查 1 重启服务器 2 修改最大线程数 3 查找线程最大的java程序 4 导出问题程序的线程日志 5 找到问题代码 6 解决方案 问题介绍 测试服务器突然无法连接 ssh登录不上 只有重启才能解决 重启
  • Redis第七讲 Redis存储模型详解

    Redis存储模型 每次在Redis数据库中创建一个键值对时 至少会创建两个对象 一个是键对象 一个是值对象 而Redis中的每个对象都是由 redisObject 结构来表示 redisObject的结构与对象类型 内存编码 内存回收 共
  • SDA、SFDA、CFDA改名为NMPA

    再见CFDA 国家药监局英文简称改为NMPA 通知公告 1 新成立的国家药品监督管理局 是否还监管食品 答 国家药品监督管理局作为新组建的政府部门 隶属于新成立的国家市场监督管理总局 相比较原来的国家食品药品监督管理总局 国家药品监督管理局
  • JavaScript与生俱来的特性---异步与回调

    线程是建立在进程的基础上的一次程序运行单位 一个进程中可以有多个线程 js单线程就意味着 所有任务需要排队 前一个任务结束 才会执行后一个任务 如果前一个任务耗时很长 后一个任务就不得不一直等着 如果是因为计算量大 CPU忙不过来 倒也合乎
  • 使用VLC开源库开发播放器

    使用VLC开发播放器 分为如下几步 1 下载VLC开源库 下载VLC开源库 可在官网上下载 地址如下 http download videolan org pub videolan vlc 可以在该网站下载想要的版本 32位或64位 Rel
  • npm&yarn使用

    一 npm与yarn介绍 NPM Node Package Manager 作为Node js的依赖包管理器便应运而生 而YARN则是针对NPM的一些不太优秀的地方设计开发的 NPM无需单独安装 安装完Node js即自带NPM 若想安装y
  • MFC(VS2010)编程实例之一(Edit Control控件)

    Edit Control是在MFC对话框中最频繁的使用的控件之一 获取Edit Control的值与赋值是常见的操作 Edit Control对应的MFC类为CEdit类 而CEdit是继承自CWnd类的 所以也继承了来自CWnd类的Get
  • elasticsearch中index.highlight.max_analyzed_offset设置

    elasticsearch中设置index highlight max analyzed offset Caused by java lang IllegalArgumentException The length of message f