Elasticsearch 中 -1 refresh_interval 到底是什么意思？

2024-04-02

我读了很多关于 Elasticsearch 中索引刷新的文章。我理解大于 0 的不同间隔的含义，这是连续段刷新之间经过的时间，使它们可用于搜索。但是，我不确定什么refresh_interval: -1确实如此。根据我的理解，这是禁用自动索引刷新的一种方法，但不是完全禁用。尽管 Elasticsearch 仍然会时不时地刷新段refresh_interval设置为-1。我想知道如果自动刷新被禁用，哪种机制会控制这种刷新活动。

抱歉，我知道我没有太多代码要发布，所以我将介绍一些我所追求的背景。我的应用程序不需要近乎实时的搜索；它只需要最终一致性。然而，这种可能性应该是合理的，即在几秒到不到一分钟内，而不是半小时内。我想知道是否可以让 Elasticsearch 决定何时最好在方便时刷新，而不是定期刷新。原因是因为禁用自动刷新确实会给我的应用程序带来一些性能方面的好处，例如在垃圾收集间隔期间，JVM 堆大小使用量的增长幅度较小（参见下图）

你的理解有点混乱。刷新索引和写入磁盘是两个不同的过程，并且不一定相关，因此即使您观察到段仍在写入，即使refresh_interval is -1.

当文档被索引时，它会被添加到内存缓冲区中并附加到 translog 文件中。当刷新发生时，缓冲区中的文档将被写入新的段中，没有 fsync，该段被打开以使其对搜索可见，并且缓冲区被清除。这translog 尚未清除实际上没有任何东西被持久化到磁盘上（因为没有fsync).

现在想象刷新没有发生：没有索引刷新，您无法搜索文档，段不会在缓存中创建。

设置here https://www.elastic.co/guide/en/elasticsearch/reference/current/index-modules-translog.html#_flush_settings将指示何时发生刷新（写入磁盘）。默认情况下，当 translog 大小达到 512mb 时，或 30 分钟后。这实际上是将数据持久保存在磁盘上，其他所有内容都在文件系统缓存中（如果节点死亡或机器重新启动，缓存就会丢失，translog 是唯一的救赎）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

elasticsearch

Elasticsearch 中 -1 refresh_interval 到底是什么意思？的相关文章

使用批量/更新方法将“标签”应用于数百万个文档

我们的 ElasticSearch 实例中有大约 55 000 000 个文档我们有一个带有 user ids 的 CSV 文件最大的 CSV 有 9M 个条目我们的文档以 user id 作为键所以这很方便我发布这个问题是因为我
ElasticSearch Spring-Data 日期格式总是很长

当使用 spring data 插入 Date 类型的 Elasticsearch 文档时我无法获得正确的日期格式日期格式始终为 Long 这是java代码 Entity java import java util Date impor
Elasticsearch 通过另一个文档查找文档

我想在elasticsearch中搜索与id docId给定文档具有完全相同字段的文档例如用户使用 docId 调用 api 我想过滤文档以便返回的所有文档都满足 docId 中的某些参数例如我可以像这样查询 Elasticsear
Django-Haystack 使用具有 IAM 凭证的 Amazon Elasticsearch 托管

我希望使用 Amazon 的 Elasticsearch 服务器来支持 Django 数据库中长文本字段的搜索然而我也不想将此搜索暴露给那些没有登录并且不想通过模糊或某些 IP 限制策略来依赖安全性的人除非它可以很好地与现有的 her
如何在桶聚合中进行过滤器聚合？

我有以下要求我有一些如下所示的记录作为示例 agreementid 1 lastdispositioncode PTP feedbackdate 30 11 2020 agreementid 1 lastdispositioncode
如何使用 python 的 elasticsearch DSL 访问响应对象

我有以下代码 s Search using Elasticsearch http user passwd ipaddress index myindex q Q multi match query some query fields all
elasticsearch中@timestamp和timestamp字段的区别

当我使用日志存储向弹性搜索记录一些请求时它将 timestamp 字段作为时间当我使用 NEST 记录这些请求并设置时间戳字段时它会放置时间戳字段当我使用 kibana 查看数据时这两个字段具有单独的名称他们之间有什么区别 ti
AWS Elasticsearch 和 CORS

我正在试用 AWS Elasticsearch 服务 https aws amazon com elasticsearch service https aws amazon com elasticsearch service 设置非常简单
Elasticsearch 过滤器/计算嵌套字段

我有带有嵌套字段的文档如下所示 results id 1234 name asdf id 5678 name jkl ip 1 2 3 4 嵌套字段的映射如下所示 results type nested properties id typ
在ElasticSearch中搜索没有时间的日期字段值

我的数据中有一个日期字段为 type date format dateOptionalTime 现在我的日期字段和值是 INITIAL EXTRACT DATE 2015 04 02T06 47 57 78 05 30 在搜索时我仅根据
如何在弹性搜索（aws）中存储日期范围数据并搜索范围？

我正在尝试在弹性搜索中存储酒店房间可用性然后我需要搜索从某个日期到另一个日期可用的房间我想出了存储数据以确保可用性的两种方式如下这里可用性字典存储了所有日期每个日期键的值是 true 或 false 代表其可用那天与否 id
在 ElasticSearch 7+ 中，如何搜索所有文本字段？

我想在 Elasticsearch 7 3 中存储的文档中搜索单词我希望在以前版本的 Elasticsearch 上运行的一个示例是 query bool must match all oliver must not should fro
按字段关联 ELK 中的消息

相关在ELK中合并日志和查询 https stackoverflow com questions 28429607 combine logs and query in elk 我们正在设置 ELK 并希望在 Kibana 4 中创建可视化
Elasticsearch 中的嵌套与对象

有人可以解释 Elasticsearch 文档中对象和嵌套字段之间的区别吗我知道默认情况下字段被定义为对象我还知道我可以用这样的点访问对象字段 my field name my field title 等对象的文档 http
在elasticsearch结果中显示不匹配的单词

我想显示返回文档的多单词查询不匹配哪些单词是否有查询类型或参数来实现此目的通常此类不匹配的单词会以删除线字体显示给用户我得到答案后的示例查询 POST posts search query bool should match nam
弹性搜索模糊匹配，精确匹配首先显示

我想在查询中使用模糊匹配但精确匹配显示在结果的顶部我已经尝试过以下方法 return this gt client gt search array index gt self INDEX type gt self TYPE body g
ElasticSearch JavaAPI (SearchScroll)- search_context_missing_exception","reason":"找不到 id 的搜索上下文

我正在获取超过100k使用一个索引中的文档searchScroll并在所有字段中再添加一个字段100K文件然后再次将这些文档插入到另一个新索引中我正在使用SearchScrollapi 也在设置大小searchSourceBuilder
随着索引和文档数量恒定，elasticsearch 批量索引会随着时间的推移而变慢

我遇到了使用 NET NEST 客户端和 ElasticSearch 进行批量索引的性能随着时间的推移索引数量和文档数量恒定而降低的情况我们正在奔跑ElasticSearch Version 0 19 11 JVM 23 5 b02在具
从中间部分匹配完成建议elasticsearch

我有一个名为搜索建议具有以下 search suggest type completion analyzer simple payloads true preserve separators false preserve position
如何使用 django-haystack 和 elasticsearch 后端进行模糊搜索？

看起来好像elasticsearch支持模糊查询 http www elasticsearch org guide reference query dsl fuzzy query http www elasticsearch org gui

随机推荐

球衣中后台调用的正确处理

我必须在 Web 应用程序中对 Web 服务进行一些后台调用电话的响应并不是真正的时间紧迫而且对我来说几乎没有兴趣它仅在极少数情况下发生变化在这种情况下我会通过抛出异常或记录失败或其他方式对其做出反应我现在的具体问题是指在 Je
避免 ssh 会话超时

我正在远程工作服务器在 5 分钟不活动后会自动注销以下是它执行此操作时通常提供的消息 Read from remote host XXXXXXX Operation timed out 我通常会打开多个会话大约每隔 30 分钟使用一次
在 ngModel 中对 Angular 中的 INPUT 元素使用管道

我有一个 HTML 输入字段
使用 double.PositiveInfinity WPF 进行测量控制

我正在开发一个具有自定义面板的自定义控件在自定义面板内我有一个小而简单的MeasureOverride传递大小的方法double PositiveInfinity给它的孩子MeasureOverride方法自定义面板应该负责布局并且应
是否可以使用子字符串而不必将它们存储在单独的变量中

我希望能够检查字符串中的第一个子字符串 random string fox is bright orange 不需要分割字符串然后从列表中读取或将其存储在其他变量中是否有可能做到这一点我在这里使用的字符串只是一个示例因此没有使用指
如何将GIT非Eclipse Java项目导入到Eclipse中？

我在将 Java 项目导入工作区时遇到一些问题我正在关注本教程 http www vogella de articles EGit article html respository checkoutproject 但是我不能使用最后的导入
我可以将对 System.Core.dll (.net 3.5) 的引用添加到 .net 2.0 应用程序并使用它吗

我可以将对 System Core dll net 3 5 的引用添加到 net 2 0 应用程序并使用它吗我试图通过引用 System Core dll 来使用仅在 net 3 5 中可用的 TimeZoneInfo 类或者它们是
元“viewport”设备宽度：Opera Mobile 9.7 上的错误宽度小（10 个作品）

对于我当前的移动 Web 项目我使用元 viewport 标签来指示移动浏览器使用设备宽度的 1 1 比例这适用于 IE mobile iPhone Safari 甚至 Opera 10 beta 但不适用于 Opera 9 7 默认情
将数组的一部分作为函数参数传递

我有一个数组int arr 5 10 2 3 5 1 我想将最后 4 个元素基本上是从索引 1 到索引 4 作为数组传递到参数中因此 2 3 5 1 有没有一种方法可以非常简单地做到这一点就像在 Ruby 中如何执行 arr 1 4
使用传单中的测量工具时禁用弹出窗口

我在传单中使用测量插件工具但是当我尝试在标记之间测量时弹出窗口会干扰有没有办法解决这个问题我读过一些关于 oddclicks 的内容我尝试使用它但没有成功 leaflet control measure click functio
编辑 Django 用户管理模板

我需要编辑显示的用于编辑特定用户的模板我需要显示一些不适合包含样式的附加数据我对这个简短的问题表示歉意但这就是目前的全部内容如果你不能通过子类化来完成你想要的事情admin ModelAdmin 您可以在模板目录中创建一个目录 ad
MVC 将 Base64 字符串转换为图像，但是... System.FormatException

我的控制器正在以下代码中的请求对象中获取上传的图像 HttpPost public string Upload string fileName Request Form FileName string description Request
如何快速知道Gimp中的图层尺寸？

每次我想知道 Gimp 中的图层尺寸时我都会打开缩放图层对话框来获取它有没有更好的方法可以一目了然可能是一些配置选项将其显示在图层名称的底部右侧或底部栏中也许这可能是 Gimp 功能请求谢谢你 GIMP 确实有方法配置状态
接收来自 N 个客户端的响应，以回复通过 UDP 的广播请求

我正在为特定类型的网络多媒体设备实现一种 IP 查找器我想找出 LAN 中该类型的所有活动设备及其 IP 地址和其他详细信息设备有自己的设备发现方式其工作原理如下客户端通过 UDP 通过 LAN 发送广播请求目的端口号是固定的作
即使启动复制命令的 lambda 函数已超时，如何使复制命令继续在 redshift 中运行？

我正在尝试运行一个复制命令将大约 100 GB 的数据从 S3 加载到 redshift 我每天都使用 lambda 函数来启动此复制命令这是我当前的代码 from datetime import datetime timedelta
使用 Python + Pylons + SQLAlchemy 进行多个数据库连接

我正在尝试在 Python Pylons 下为多个数据库实现正确的架构我无法将所有内容都放入配置文件中因为其中一个数据库连接需要来自先前数据库连接分片的连接信息实施此类基础设施的最佳方式是什么 Pylons的模板配置数据库在con
Rails 4 中自动加载 lib 文件

我在初始化程序中使用以下行来自动加载我的代码 lib开发时的目录配置初始化程序 custom rb RELOAD LIBS Dir Rails root lib rb if Rails env development from Rail
C++11 标准是否要求实现者优先考虑 std::vector 的 noexcept 移动构造函数而不是 const 复制构造函数？

Reading this https stackoverflow com questions 28627348 and this https stackoverflow com questions 26224112 and 23 3 6 5
将 Mercurial 文件夹转换为 Git 存储库

我对 Mercurial 没有丰富的经验我主要是一个 Git 爱好者我希望在 git 存储库中镜像特定的 Mercurial 文件夹文件我实际上想做的是将文件的历史记录从 Mercurial 存储库导出到 Git 并能够使其与未来的
Elasticsearch 中 -1 refresh_interval 到底是什么意思？

我读了很多关于 Elasticsearch 中索引刷新的文章我理解大于 0 的不同间隔的含义这是连续段刷新之间经过的时间使它们可用于搜索但是我不确定什么refresh interval 1确实如此根据我的理解这是禁用自动索引刷

Elasticsearch 中 -1 refresh_interval 到底是什么意思？

Elasticsearch 中 -1 refresh_interval 到底是什么意思？ 的相关文章

随机推荐

热门标签

Elasticsearch 中 -1 refresh_interval 到底是什么意思？的相关文章