ElasticSearch Ingest Pipeline：创建和更新时间戳字段

2024-01-05

要在我的索引上创建时间戳字段，根据this https://stackoverflow.com/a/66958236/758836回答，我创建了一个摄取管道 https://www.elastic.co/guide/en/elasticsearch/reference/current/ingest.html运行特定索引：

PUT _ingest/pipeline/auto_now_add
{
  "description": "Assigns the current date if not yet present and if the index name is whitelisted",
  "processors": [
    {
      "script": {
        "source": """
          // skip if not whitelisted
          if (![ "my_index_1",
                 "my_index_2"
              ].contains(ctx['_index'])) { return; }
          
          // always update updated_at
          ctx['updated_at'] = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date());
          
        """
      }
    }
  ]
}

然后我将所有索引设置应用为默认管道

PUT _all/_settings
{
  "index": {
    "default_pipeline": "auto_now_add"
  }
}

之后，我开始将我的对象索引到这些索引中。当我查询索引项时，我将使用以下命令获取该项updated_at索引时更新的字段，例如：

{
  _index: 'my_index_1',
  _type: '_doc',
  _id: 'r1285044056',
  _version: 11,
  _seq_no: 373,
  _primary_term: 2,
  found: true,
  _source: {
    updated_at: '2021-07-07 04:35:39',
    ...
  }
}

我现在想要一个created_at字段，仅在第一次更新，所以我尝试以这种方式更新上面的脚本：

PUT _ingest/pipeline/auto_now_add
{
  "description": "Assigns the current date if not yet present and if the index name is whitelisted",
  "processors": [
    {
      "script": {
        "source": """
          // skip if not whitelisted
          if (![ "my_index_1",
                 "my_index_2",
                 "..."
              ].contains(ctx['_index'])) { return; }
          
           // always update updated_at
          ctx['updated_at'] = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date());
          // don't overwrite if present
          if (ctx != null && ctx['created_at'] != null) { return; }
          
          ctx['created_at'] = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date());
        """
      }
    }
  ]
}

但这个解决方案似乎不起作用：条件

if (ctx != null && ctx['created_at'] != null) { return; }

总是会失败，从而导致更新created_at在索引上的每个对象更新时，以相同的方式updated_at场，使其无用。那么，如何防止这种情况发生，并确保该字段created_at由摄取管道创建后是否存在？

正如@Val 在中所描述的这个答案 https://stackoverflow.com/a/51435984/8160318:

...摄取管道处理器将仅运行在上下文中 https://www.elastic.co/guide/en/elasticsearch/painless/7.13/painless-ingest-processor-context.html#painless-ingest-processor-context您发送的文档，而不是存储的文档（如果有）。

因此，您将无权访问底层_source nor doc因为摄取管道是为ingest阶段，而不是update phase.

您当然可以保留您的auto_now_add自动添加管道updated_at，你可以用它来扩展它created_at（如果尚未存在于摄取有效负载中）通过检查ctx.containsKey- 自从ctx本质上是一个javaMap:

PUT _ingest/pipeline/auto_now_add
{
  "description": "Assigns the current date if not yet present and if the index name is whitelisted",
  "processors": [
    {
      "script": {
        "source": """
          // skip if not whitelisted
          if (![ "my_index_1",
                 "my_index_2",
                 "..."
              ].contains(ctx['_index'])) { return; }
          
          def now = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date());
          
          // guaranteee updated_at
          ctx['updated_at'] = now;
          
          // add created_at only if nonexistent in the payload
          if (!ctx.containsKey('created_at')) {
            ctx['created_at'] = now;
          }  
        """
      }
    }
  ]
}

但是，这仅在您第一次摄取文档时有效！

Running:

POST my_index_1/_doc/some_id
{ 
  "some": "param"
}

将产生：

{
  "some" : "param",
  "updated_at" : "2021-07-08 10:35:13",
  "created_at" : "2021-07-08 10:35:13"
}

现在，为了自动递增updated_at每次更新文档时，你还需要一个脚本— 这次存储在_scripts, not _ingest/pipeline:

PUT _scripts/incement_update_at__plus_new_params
{
  "script": {
    "lang": "painless", 
    "source": """
      // add whatever is in the params
      ctx._source.putAll(params);
      
      // increment updated_at no matter what was in the params
      ctx._source['updated_at'] = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date());
    """
  }
}

然后，当你运行你的_update打电话，通过提到上述内容来做到这一点script:

POST my_index_1/_doc/some_id/_update
{
  "script": {
    "id": "incement_update_at__plus_new_params",
    "params": {
      "your": "new params"
    }
  }
}

这会增加updated_at不碰created_at并添加任何其他参数：

{
   "some":"param",
   "updated_at":"2021-07-08 10:49:44",    <--
   "created_at":"2021-07-08 10:39:55",
   "your":"new params"                    <--
}

无耻插件：我讨论管道和脚本 https://elasticsearchbook.com/learn-elasticsearch/post-indexing-updates-488d69498920464999ef35e36e3e8095非常详细地在我的Elasticsearch 手册 https://elasticsearchbook.com/.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

elasticsearch

elasticsearch7

ElasticSearch Ingest Pipeline：创建和更新时间戳字段的相关文章

如何在elasticsearch中使用冒号搜索模式？

我在 Elasticsearch 中有一个字段其值为 ft 05 08 2015 13 01 27 358 cgn 4189 当我想使用查询字符串 cgn 4189 进行搜索时我没有结果我尝试像 cgn 4189 一样转义冒号但有语
在ElasticSearch中搜索没有时间的日期字段值

我的数据中有一个日期字段为 type date format dateOptionalTime 现在我的日期字段和值是 INITIAL EXTRACT DATE 2015 04 02T06 47 57 78 05 30 在搜索时我仅根据
分割多重多边形

我可以直接取出零件并把它们取出来作为它们自己的功能吗或者这会涉及更复杂的东西吗我正在尝试将其中一张地图拆分为较小的部分以对它们进行索引 https github com simonepri geo maps https github c
在 ElasticSearch 7+ 中，如何搜索所有文本字段？

我想在 Elasticsearch 7 3 中存储的文档中搜索单词我希望在以前版本的 Elasticsearch 上运行的一个示例是 query bool must match all oliver must not should fro
Elasticsearch 中的嵌套与对象

有人可以解释 Elasticsearch 文档中对象和嵌套字段之间的区别吗我知道默认情况下字段被定义为对象我还知道我可以用这样的点访问对象字段 my field name my field title 等对象的文档 http
在elasticsearch结果中显示不匹配的单词

我想显示返回文档的多单词查询不匹配哪些单词是否有查询类型或参数来实现此目的通常此类不匹配的单词会以删除线字体显示给用户我得到答案后的示例查询 POST posts search query bool should match nam
Logstash删除类型并保留_type

我有一个logstash 客户端和服务器客户端将带有logstash的udp输出的日志文件发送到服务器服务器也运行logstash来获取这些日志在服务器上我有一个 json 过滤器它会在实际日志的字段中提取 json 格式的消息
如何在弹性搜索中生成多个布尔查询的查询

我想使用 spring 框架在 elasticsearch 中动态生成多个布尔运算的查询我在elasticsearch中的数据就像 masterID
从 App Engine 连接到 Kubernetes 引擎

我们希望使用应用程序引擎灵活的流程来更新位于 Google Kubernetes Engine 上的 ElasticSearch 索引我们需要通过 http s 地址连接到 ElasticSearch 推荐的方法是什么我们不想将集群暴露
如何使用 django-haystack 和 elasticsearch 后端进行模糊搜索？

看起来好像elasticsearch支持模糊查询 http www elasticsearch org guide reference query dsl fuzzy query http www elasticsearch org gui
ElasticSearch 嵌套查询 - 排除父文档

尝试排除其中子文档之一与查询不匹配的顶级文档对于下面的示例我尝试排除其嵌套作业之一具有的所有文档current true 并与company name Elastic 但由于嵌套作业文档之一与current false和公司name E
ElasticSearch - 仅获取与搜索响应中所有顶级字段匹配的嵌套对象

假设我有以下文档 id 1 name xyz users name abc surname def name xyz surname wef name defg surname pqr 我只想获取与搜索响应中的所有顶级字段匹配的嵌套对象我
我们可以同时使用拼音标记和同义词吗？

我正在尝试同时启用语音分析器和同义词这似乎不起作用它们一起使用有错吗在下面的实现中我希望使用同义词转换搜索查询然后使用语音分析器来检索结果但我的同义词在这里完全被忽略了如果我在创建索引时删除语音分析器那么同义词就可以正常工作
如何使用ElasticSearch来实现社交搜索？

我正在尝试使用 ElasticSearch 创建具有社交功能的商业搜索我有一个企业目录用户可以通过不同的方式与这些企业进行交互通过查看它们检查它们等当用户搜索商家时我希望能够在结果顶部向他们显示他们的朋友与之互动过的商家或根据
如何修复从 React 对 Elasticsearch 进行 API 调用时的“混合内容：”错误

我正在使用 firebase 的 elasticsearch 的 bitnami 版本我发现它只能连接到http并不是https当我使用邮递员尝试时我的create react app已部署到 firebase 我得到Mixed Con
尝试在 ElasticSearch 中查询和聚合，但聚合不起作用 - elasticsearch.js 客户端

我尝试查询我的数据集有两个目的匹配一个术语可转售 true 按价格对结果进行排序最低到最高数据集文档是 data resellable true startingPrice 0 id 4emEe r x5DRCc5 buyNowP
NEST 1.0：请参阅 Fiddler 上的请求

我刚刚更新到 NEST 1 0 我在远程服务器不是本地主机上有 Elastic Search 通常我在使用 Fiddler 发送和接收请求时没有任何问题更新后 bammm 没有检测到任何请求但我的应用程序发出这些请求没有任何问题你
Elasticsearch Nest 通配符查询（带空格）

简洁版本我想使用 Nest 编写一个弹性搜索查询来获取完整的索引项 ContentIndexables在我的例子中作为我的自定义类型已被索引该查询受 some string 术语查询的约束即 String StartsWith 其中
如何使用scala获取elasticsearch中_delete_by_query api的状态

我正在 scala 中向 elasticsearch 发送 HTTP post Http s http elkIp 5051 indexName delete by query postData s query terms zip id k
设置 verify_certs=False 但 elasticsearch.Elasticsearch 因证书验证失败而引发 SSL 错误

self host KibanaProxy 自我端口 443 self user 测试 self password 测试我需要禁止证书验证使用选项时它与curl一起使用 k在命令行上但是在使用 Elasticsearch pytho

随机推荐

navigator.mediaDevices 在 Chrome 62 的 iOS 上为 null？

从最新版本的 Chrome 62 开始仅在 iOS 11 设备下当我尝试使用navigator mediaDevices 它是空的文档中没有任何内容表明此功能已被删除在此期间我开了一个Chrome 下的错误 https bugs c
按特定字母对 JS 字符串数组进行排序

我必须像这样对字符串数组进行排序 var arr akaw waka kawa akwa 排序类型必须是特定字母在本例中为 W 因此我的函数必须返回此数组 arr waka kawa akwa akaw 这是一个动态数组我不知道数组中有
错误：任务“：app：processDebugAndroidTestManifest”执行失败

这就是我更新 buildToolsVersion 时发生的情况26 0 1 to 26 0 2 错误任务 all processDebugAndroidTestManifest 执行失败清单合并失败属性元数据 android supp
Android 应用程序中的所有图像都被视为图标吗？

这已经困扰我一段时间了我可能反应过度了如果是的话请告诉我但是我觉得向 Android Studio 项目添加图像资源比应有的困难不一定说这很难做到但我觉得这应该是最容易做的事情之一我对 AS 有点陌生所以我在这里可能有点不合
如何检测iPhone上的左/右滑动？

有没有简单的方法来检测 iPhone 的此类手势我可以使用touchesBegan touchesMoved touchesEnded 但我该如何实现这些手势呢 thz u 您将使用 UISwipeGestureRecognizer 对象
绕着正方形滚动一个圆

近一个月后我仍然停留在这个问题上我设法决定圆圈或我所说的行人是否应该向左向右或向上向下移动但我需要有可能移动行人around一座建筑物这意味着他们必须转角基本上无论方向如何他们只需要转90度非常感谢 import nu
Python 中单下划线“_”变量的用途是什么？

是什么意思 after for在这段代码中 if tbh bag n 0 for in tbh bag atom set n 1 Python 中有 3 个主要的常规用途保存交互式中最后执行的表达式的结果口译会议参见docs http
防止 iOS safari 移动网页窗口，以便发生拖动事件

我使用 Pep js 进行多点触控上的动态拖动但我的拖动事件没有被注册因为当我尝试在 Safari 中拖动对象时在 iOS 窗口中窗口本身会移动并跟随我的拖动如何防止浏览器窗口跟随我的拖动以便 div 在我的网页中可以拖动吗这
SPRING REST：请求被拒绝，因为未找到多部分边界

我为 Spring 3 Rest 多部分文件上传做了一个 POC 它工作正常但是当我尝试与我的应用程序集成时我遇到了问题它抛出以下异常 org springframework web multipart MultipartExcept
是否可以创建没有锁的线程安全集合？

这纯粹是出于兴趣问题欢迎任何类型的问题那么是否可以创建没有任何锁的线程安全集合呢我所说的锁是指任何线程同步机制包括互斥锁信号量甚至互锁所有这些是否可以在用户级别而不调用系统函数好吧可能实施效果不佳我对理论上的可能性感兴
如何更改可序列化 python 对象的 json 编码行为？

更改不可 JSON 序列化的对象的格式很容易例如 datetime datetime 出于调试目的我的要求是改变一些自定义对象从基本对象扩展的方式例如dict and list 以json格式序列化代码 import datetim
PHP-REGEX - 多项选择类型

我有一个像这样的字符串 str 1 What is love a Haddaway b Haxxaway c Hassaway d Hannaway 2 What is love a Haddaway b Haxxaway c Hassaw
用户名密码验证器和证书

我有一个使用 net tcp 绑定和自定义 UserNamePasswordValidator 的 Web 服务用户名和密码由客户端在 Credentials UserName UserName 和 Credentials UserNam
这个 DB2 游标是循环吗？

无论是命运还是运气我正在致力于将 DB2 存储过程转换为 SQL Server 存储过程 One thing I could not completely understand in DB2 is cursors1 By looking
Java-如何在不扩展比较器的情况下对包含句点/点的字符串数组进行排序？

这里是Java菜鸟我想对包含句点点的字符串数组进行从小到大的排序所以一个数组包含 1 0 3 1 0 12 1 0 2 排序错误如下 1 0 12 1 0 2 1 0 3 排序时正确地应该 1 0 2 1 0 3 1 0 12 这是我
如何识别 C++ 中的 RTL 字符串

我需要在打印之前知道文本的方向我正在使用 Unicode 字符我怎样才能在 C 中做到这一点如果你不想使用ICU 你可以随时手动解析统一码数据库 http www unicode org Public UNIDATA UnicodeD
为什么Log4j认为我的项目运行在Servlet环境中

我有一个简单的java项目 maven 它构建了一个 jar 我们在它上面执行 main 方法但当我跑步时mvn clean test在项目中我从 log4j 得到一条日志行说 INFO Log4j appears to be runni
如何向 UINavigationBar 添加按钮？

如何以编程方式向 UINavigationBar 添加按钮设置的示例代码rightbutton on a NavigationBar UIBarButtonItem rightButton UIBarButtonItem alloc in
STM32 暂停调试器时冻结外设

当到达断点或用户暂停代码执行时调试器可以停止 Cortex 中代码的执行但是当皮质停止在暂停状态下执行代码时调试器是否会冻结其他外设例如 DMA UART 和定时器您只能保留时间 r 取决于外围设备我在进入主函数时调用以下代码
ElasticSearch Ingest Pipeline：创建和更新时间戳字段

要在我的索引上创建时间戳字段根据this https stackoverflow com a 66958236 758836回答我创建了一个摄取管道 https www elastic co guide en elasticsearch

ElasticSearch Ingest Pipeline：创建和更新时间戳字段

ElasticSearch Ingest Pipeline：创建和更新时间戳字段 的相关文章

随机推荐

热门标签

ElasticSearch Ingest Pipeline：创建和更新时间戳字段的相关文章