创建/更新文档日期的摄取管道

2023-11-27

我正在尝试实现类似于 Mysql 的行为，为我通过 ES 管道索引的每个文档的元数据添加 insert_at/updated_at 。

我的管道是这样的：

{
  "description": "Adds createdAt and updatedAt style timestamps",
  "processors": [
    {
      "set": {
        "field": "_source.indexed_at",
        "value": "{{_ingest.timestamp}}",
        "override": false
      }
    },
    {
      "set": {
        "field": "_source.updated_at",
        "value": "{{_ingest.timestamp}}",
        "override": true
      }
    }
  ]
}

我没有映射，只尝试添加一个文档：

POST test_pipelines/doc/1?pipeline=timestamps
{
  "foo": "bar"
}

管道创建成功indexed_at and updated_at:

{
  "_index": "test_pipelines",
  "_type": "doc",
  "_id": "1",
  "_score": 1,
  "_source": {
    "indexed_at": "2018-07-12T10:47:27.957Z",
    "updated_at": "2018-07-12T10:47:27.957Z",
    "foo": "bar"
  }
}

但如果我尝试更新 doc 1 字段indexed_at每次更新文档的日期都会发生变化。

更新请求示例：

POST test_pipelines/doc/1?pipeline=timestamps
{
  "foo": "bor"
}

有什么方法可以告诉处理器不要更新indexed_at field?

发生这种情况的原因是因为set处理器只会在您发送的文档的上下文中运行，而不是在存储的文档（如果有）的上下文中运行。因此，override此处无效，因为您发送的文档既不包含indexed_at nor updated_at，这就是为什么在每次调用时都设置这两个字段的原因。

当你PUT第二次您的文档，您没有更新它，您实际上是从头开始重新索引它（即您正在覆盖您发送的第一个版本）。摄取管道不适用于更新操作。例如，如果您尝试以下更新调用，它将失败。

POST test_pipelines/doc/1/_update?pipeline=timestamps
{
  "doc": {
    "foo": "bor"
  }
}

如果您想坚持使用摄取管道，使其发挥作用的唯一方法是GET首先更新文档，然后更新所需的字段。例如，

# 1. index the document the first time
PUT test_pipelines/doc/1?pipeline=timestamps
{
  "foo": "bar"
}

# 2. GET the indexed document
GET test_pipelines/doc/1

# 3. update the foo field and index it again
PUT test_pipelines/doc/1?pipeline=timestamps
{
  "indexed_at": "2018-07-20T05:08:52.293Z",
  "updated_at": "2018-07-20T05:08:52.293Z",
  "foo": "bor"
}

# 4. When you GET the document the second time, you'll see your pipeline worked
GET test_pipelines/doc/1

这将返回：

{
  "indexed_at": "2018-07-20T05:08:52.293Z",
  "updated_at": "2018-07-20T05:08:53.345Z",
  "foo": "bor"
}

我绝对同意这确实很麻烦，但是我上面给出的链接列举了更新操作不支持管道的所有原因。

另一种让它按照您喜欢的方式工作（没有管道）的方法是使用脚本化的 upsert 操作（其工作方式类似于上面的步骤 2 和 3，即在单个原子操作中 GET 和 PUT 文档），这也可以工作与您的批量通话。基本上是这样的。首先，您需要存储一个脚本，您将调用该脚本来执行索引和更新操作：

POST _scripts/update-doc
{
  "script": {
    "lang": "painless",
    "source": "ctx._source.foo = params.foo; ctx._source.updated_at = new Date(); if (ctx._source.indexed_at == null) ctx._source.indexed_at = ctx._source.updated_at;"
  }
}

然后，您可以像这样第一次索引您的文档：

POST test_pipelines/doc/1/_update
{
  "script": {
    "id": "update-doc",
    "params": {
      "foo": "bar"
    }
  },
  "scripted_upsert": true,
  "upsert": {}
}

索引文档将如下所示：

{
    "updated_at": "2018-07-20T05:57:40.510Z",
    "indexed_at": "2018-07-20T05:57:40.510Z",
    "foo": "bar"
}

您可以在更新文档时使用完全相同的调用：

POST test_pipelines/doc/1/_update
{
  "script": {
    "id": "update-doc",
    "params": {
      "foo": "bor"             <--- only this changes
    }
  },
  "scripted_upsert": true,
  "upsert": {}
}

更新后的文档将如下所示，正是您想要的：

{
    "updated_at": "2018-07-20T05:58:42.825Z",
    "indexed_at": "2018-07-20T05:57:40.510Z",
    "foo": "bor"
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

elasticsearch

创建/更新文档日期的摄取管道的相关文章

NEST 1.0：请参阅 Fiddler 上的请求

我刚刚更新到 NEST 1 0 我在远程服务器不是本地主机上有 Elastic Search 通常我在使用 Fiddler 发送和接收请求时没有任何问题更新后 bammm 没有检测到任何请求但我的应用程序发出这些请求没有任何问题你
为 Logstash 中的新字段设置 Elasticsearch Analyzer

通过使用GROK filter 我们可以向Logstash添加新字段但是我想知道如何为该特定字段设置分析器例如我有一个新的 id 字段其中有一个字段例如a b 但是 Elasticsearch 附带的普通分析器会将其分解为a a
自动完成建议中的输出字段

当我想在 elasticsearch 中索引文档时会发生此问题 message MapperParsingException failed to parse nested IllegalArgumentException unknown
ElasticSearch - 尝试在 Windows 上启动服务时出错

昨天我在 Windows Server 2012 R2 上完成了 ElasticSearch 的安装并且能够正常启动 ElasticSearch 服务今天我安装了 Kibana 和 X Pack 但在尝试启动 ElasticSear
在elasticsearch中转义特殊字符

我正在使用Elasticsearch python 客户端 https elasticsearch py readthedocs io en master 对我们托管的 elasticsearch 实例进行一些查询我注意到一些字符需要转义
Elasticsearch 通过搜索返回拼音标记

我用语音分析插件 https www elastic co guide en elasticsearch plugins current analysis phonetic html由于语音转换从弹性搜索中进行一些字符串匹配我的问题是
当我使用完成建议器时，如何获得没有重复的独特建议？

我在我的环境中使用弹性 5 1 1 我在字段名称上选择了完成建议器post hashtags带有一个字符串数组来提供建议我收到前缀 inv 的响应如下 Req POST hashtag search pretty filter path
在 ElasticSearch 中，我应该对单独但相关的实体使用多个索引吗？

添加索引的开销有详细记录但我无法找到有关何时针对要建立索引的各种文档类型使用多个索引的良好信息这是一个说明问题的通用示例假设我们有以下实体产品名称产品 ID 产品类别 ID 商店列表产品类别名称 ProductCategor
如何在elasticsearch索引中一起使用ngram和edge ngram tokenizer？

我有一个包含 3 个文档的索引 firstname Anne lastname Borg firstname Leanne lastname Ray firstname Anne middlename M
Elasticsearch：带有停用词消除功能的带状疱疹

我正在尝试实现一个 Elasticsearch 映射来优化大量文本中的短语搜索根据中的建议本文 http www elasticsearch org blog searching with shingles 我使用 shingle 过滤器
如何修改 Elasticsearch 文档的 _source 字段

问题有没有办法从文档的 source 中清除 html html 的剥离可以是周期性的触发的或者理想情况下是在索引时即时进行的我将数据输入到elasticsearch中并针对分析器进行索引该分析器在索引之前剥离不需要的htmls
field 和 field.keyword 之间的区别

如果我将一个包含多个字段的文档添加到 Elasticsearch 索引中当我在 Kibana 中查看它时我每次都会得到相同的字段两次其中之一将被称为 some field 另一个将被称为 some field keyword 这种行为
Elasticsearch 5.1 完成建议中的输出字段有什么好的替代方案吗？

在 ES 5 1 中索引数据时遇到的第一个错误是包含输出字段的完成建议映射 message MapperParsingException failed to parse nested IllegalArgumentException unk
ElasticSearch - 定义自定义字母顺序进行排序

我正在使用 ElasticSearch 2 4 2 通过 Java 的 HibernateSearch 5 7 1 Final 我在字符串排序方面遇到问题我的应用程序的语言有变音符号它们有特定的字母顺序订购例如直接在之后L 追随O
在 Elasticsearch php API 中使用多种类型或索引

我想使用查询多种类型和索引Elasticsearch PHP API 但我不知道怎么办我应该将类型和索引的数组传递给 params params index index array of indices params type types
如何使用 Jest 从 ElasticSearch 获取索引列表

我正在尝试使用 Jest 检索索引列表但我只得到 Stats statistics new Stats Builder build result client execute statistics 如何从结果中检索索引列表除了统计之外
在嵌套热门点击聚合中包含父 _source 字段

我正在尝试聚合一个字段并使用top hits但我想在响应中包含未包含在嵌套属性映射中的其他字段目前如果我指定 source include 我只能获取当前嵌套属性中的字段这是我的映射 my cart mappings propertie
`docker-compose up` 与使用环境变量的 `docker compose up`

我正在尝试使用 Docker Compose 将三节点 Elasticsearch 集群部署到 Azure 容器实例我松松地跟随这个例子 https www elastic co guide en elasticsearch refere
如何使用 Fluent 为 Elasticsearch 添加时间戳和密钥

我已经配置了 fluidd 和 elasticsearch 它们都工作正常我正在跟踪一个文件然后读取其数据并将其发布到elasticsearch 下面是json数据 time 2018 05 14T11 37 30 339593 Dat
Elasticsearch 与 Cassandra 对比 Elasticsearch 与 Cassandra

我正在学习 NoSQL 并正在寻找满足客户要求之一的不同选项在提出这个问题之前我已经查阅了各种资源一个对NoSQL知之甚少的人我需要以更快的速度存储数据并读取数据完全故障安全且易于扩展能够搜索数据进行分析我最终得到了一个简短的清

随机推荐

在詹金斯工作中通过 FTP 下载文件？

似乎只能使用以下命令通过 FTP 上传文件 https wiki jenkins ci org display JENKINS Publish Over FTP Plugin 但是我需要通过 FTP 下载一个文件我可以为此编写一个 gro
数组之前的 Ruby * 运算符[重复]

这个问题在这里已经有答案了可能的重复理解范围和数组中的 ruby splat 谁能告诉我下面代码中的作用是什么 line name yabbi language ruby Hash line split Thanks 是 splat
jquery validate需要点击submit两次才能提交表单

我在模态中有一个表单用户必须填写表单否则验证将显示必填字段错误消息然后单击提交输入类型它什么也不做然后再次单击它然后它将通过ajax发布并返回谢谢消息我已经浏览了 Stackoverflow 并应用了我遇到的问题的答案
CPAN 首次启动（代理配置）

我需要通过代理运行 cpan 但是当我尝试配置时出现错误并且第一次无法进入 cpan root srv linux01 cpan CPAN pm requires configuration but most of it can be d
使用 ASP.NET 日历控件时如何隐藏周末？

有时在显示日历时需要防止显示周末日期和日期标题中的周末名称有没有办法使用ASP NET 日历控件由于提供了控件因此在不重写控件的情况下无法执行此操作执行此操作的一种方法是覆盖当天渲染 and Render在将输出发送回客户端之前
在应用程序购买中，用户在应用程序处于后台时取消交易：交易状态保持在购买状态

当应用程序处于后台且用户尚未登录商店时我在应用程序购买沙盒环境中取消用户时出现一些奇怪的行为流程如下用户未登录未在设置 gt 商店中设置应用程序 ID 用户点击购买按钮这调用 SKPaymentQueue defaultQ
动态地将可调用对象添加到类作为实例“方法”

我实现了一个元类它拆除用它创建的类的类属性并根据这些参数的数据构建方法然后将这些动态创建的方法直接附加到类对象所讨论的类允许轻松定义 Web 表单对象在网络测试框架中使用它一直工作得很好但现在我需要添加一种更复杂类型的方法为了
在ios中使用查询字符串创建NSURLRequest

我在 ios 中创建了一个用户查询表单我使用 php 作为服务器端我在 IOS 中构造了如下所示的查询字符串 http www mydomain in androidmail enquiry php name Vinoth Kumar
如何将包含单引号的字符串保存到 PostgreSQL 中的文本列

我在 Smartwcm Web 应用程序 SDK 中使用 hibernate 和 PostgreSQL 作为数据库我在其中一个表中有一个字段其数据类型是文本当我尝试使用 hibernate 使用相应的 POJO 将值插入表中时如果我
无法使用 VS 2013 RTM 编译 OpenCV 2.4.5

有人用 VS 2013 RTM 编译过 openCV 吗我尝试在 IlmImf 模块中获取一堆 min 不属于命名空间 std max 不属于命名空间 std 并且 opencv features2d 无法编译并出现以下错误 opencv
如何设置
元素的箭头样式？

我正在使用这段代码另请参阅JSFiddle 以更改悬停时箭头的背景颜色但是这不起作用因为箭头仅在单击时更改其颜色 summary webkit details marker color B6B6B6 font size 20px m
ClassInitialize 中生成的数据驱动测试：不再在 Visual Studio 2012 中工作

我已从 Visual Studio 2010 升级到 Visual Studio 2012 在我的单元测试项目中我有一个 ClassInitialize 方法它生成一个 CSV 文件然后使用连接到 CSV 的 DataSource 将
数据库如何自动生成唯一标识符？

我有一个带有 id guid 列的 sql 表如何强制数据库为每条新记录自动生成新的 guid Add DEFAULT newid
Global.asax 中的 ASP.NET 路由

我试图通过以下方式在我的 Web 表单应用程序中添加一条路线 http msdn microsoft com en us library cc668201 aspx adding routes to a web forms applicat
faces-redirect 和后退按钮导致其他链接无法正常工作

我有一个关于面孔导航的问题所以我有一个页面它采用请求参数来加载特定用户此页面显示 commandLink 列表单击该列表后将使用隐式导航重定向到另一个页面通过调用 preRenderView 中的方法来加载用户我们重定向到的页
如何将协作者添加到 Firebase 应用程序？

在最新版本的Firebase 在 Google I O 2016 期间宣布如何将我想要的其他人添加到我的项目或应用程序中collaborate和我通过以下途径认识了 IAM 角色Settings gt Permissions 这是正确的
Bootstrap Tour 不记得我离开的地方

当我到达第二页时我在多页游览中启动 Bootstrap Tour 时遇到问题我以点击事件开始游览localStorage被设定为false 游览从单击事件开始正常但是当我转到游览的第二步并加载新页面时游览不会从中断处继续如何在这个
使 WCHAR 为空终止

我有这个 WCHAR 文件名 1 作为函数的返回值它是 sys 32 函数因此我无法更改返回的类型我需要使 fileName 以 null 结尾因此我尝试将 0 附加到它但似乎没有任何效果一旦我得到一个以 null 结尾的 WC
Jasper Reports 使用 comparatorExpression 进行交叉表排序

我正在尝试根据某些自定义方案对交叉表中的动态列进行排序在文档中我发现提到了comparatorExpression 交叉表组存储桶比较器表达式这个表达式的结果是用于按升序或降序对存储桶进行排序如果没有比较器指定表达式时将使用自
创建/更新文档日期的摄取管道

我正在尝试实现类似于 Mysql 的行为为我通过 ES 管道索引的每个文档的元数据添加 insert at updated at 我的管道是这样的 description Adds createdAt and updatedAt styl

创建/更新文档日期的摄取管道

创建/更新文档日期的摄取管道 的相关文章

随机推荐

热门标签

创建/更新文档日期的摄取管道的相关文章