Elasticsearch - 合并多个文档中的字段

2024-03-30

假设我有一堆这样的文档：

{
    "foo" : [1, 2, 3]
}

{
    "foo" : [3, 4, 5]
}

对于针对这些文档运行的查询，我正在寻找一种方法来返回所有值的数组foo（最好是唯一的值，但重复也可以）：

{
    "foo" : [1, 2, 3, 3, 4, 5]
}

我研究了聚合 API，但我不知道如何实现这一点（如果可能的话）。我当然可以在代码中手动编译结果，但是我可能有数千个文档，并且以这种方式获得结果会干净得多。

您可以使用脚本化指标聚合 https://www.elastic.co/guide/en/elasticsearch/reference/current/search-aggregations-metrics-scripted-metric-aggregation.html with a 减少脚本 https://www.elastic.co/guide/en/elasticsearch/reference/current/search-aggregations-metrics-scripted-metric-aggregation.html#_scope_of_scripts.

设置一些测试数据：

curl -XPUT http://localhost:9200/testing/foo/1 -d '{ "foo" : [1, 2, 3] }'
curl -XPUT http://localhost:9200/testing/foo/2 -d '{ "foo" : [4, 5, 6] }'

现在尝试这个聚合：

curl -XGET "http://localhost:9200/testing/foo/_search" -d'
{
  "size": 0,
  "aggs": {
    "fooreduced": {
      "scripted_metric": {
        "init_script": "_agg[\"result\"] = []",
        "map_script":  "_agg.result.add(doc[\"foo\"].values)",
        "reduce_script": "reduced = []; for (a in _aggs) { for (entry in a) { word = entry.key; reduced += entry.value } }; return reduced.flatten().sort()"

      }
    }
  }
}'

该调用将返回：

{
  "took": 50,
  "timed_out": false,
  "_shards": {
    "total": 6,
    "successful": 6,
    "failed": 0
  },
  "hits": {
    "total": 2,
    "max_score": 0,
    "hits": []
  },
  "aggregations": {
    "fooreduced": {
      "value": [
        1,
        2,
        3,
        4,
        5,
        6
      ]
    }
  }
}

也许有一个解决方案，无需.flatten() http://docs.groovy-lang.org/latest/html/groovy-jdk/java/util/Collection.html，但我还不太热衷于寻找这样的解决方案。而且我不能说这个聚合的性能有多好，你必须自己测试一下。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Elasticsearch - 合并多个文档中的字段的相关文章

参数声明 [] 和 *（数组）

在函数定义中的形式参数之间例如 void change int s s 0 42 还有另一个定义 void change int s s 0 42 我认为它们是相同的因为 a 0 是相同的a 0 有理由选择其中一种而不是另一种吗请注意
将数组文字传递给 PostgreSQL 函数

我有一个包含 select 语句的 Postgres 函数我需要使用包含字符串值数组的传入变量添加条件 CREATE OR REPLACE FUNCTION get questions vcode text RETURN return v
GCC：数组类型具有不完整的元素类型

我已经宣布了struct 我尝试传递这些结构的数组以及double双精度数组和一个整数到一个函数中我得到一个数组类型具有不完整的元素类型当我编译它时来自 gcc 的消息我在通过考试的过程中犯了什么错误struct到函数 type
如何使用ElasticSearch来实现社交搜索？

我正在尝试使用 ElasticSearch 创建具有社交功能的商业搜索我有一个企业目录用户可以通过不同的方式与这些企业进行交互通过查看它们检查它们等当用户搜索商家时我希望能够在结果顶部向他们显示他们的朋友与之互动过的商家或根据
如何将数组与 setState 一起使用？

我目前正在使用以下命令将数组映射到 setState 但没有设置任何内容也没有记录任何错误如果我明确地逐行写出它它就会起作用关于如何解决这个问题有什么想法或建议吗使用数组设置状态不设置状态 const myData messag
数组和关联数组合并

如何实现第三个数组合并Array1和Array2 在 PHP 中做到这一点的最佳方法是什么非常感谢 Array2 具有类似索引键即 Array1 中 id 的关联值 Array1 Array 0 gt Array id gt 56
将数组传递给函数名称冲突

Specs GNU bash 版本 3 1 17 无法升级 Premise 我一直在摆弄数组我想知道是否有任何方法可以让函数的本地变量与所述函数外部的数组同名 Example 在下面的示例中我将尝试显示该问题 Working bin b
将二维数组拆分为每行数组的最Pythonic方法是什么？

我有一个函数 foo 返回形状为 1000 2 的数组如何将其拆分为两个数组 a 1000 和 b 1000 我正在寻找这样的东西 a b foo 我正在寻找一个可以轻松推广到形状为 1000 5 左右的情况的答案 The zip idi
一起使用“过滤”和“排序”的 Google 表格

这是我的第一个问题我希望一切都好我是使用谷歌表格的新手但我正在慢慢进步我正在尝试构建一个工作表其中包含工作表 1 中的所有数据在工作表 2 上我想过滤工作表 2 中 D 列中标有数字 1 的所有数据为此我正在使用 FILT
Elasticsearch 关于“空索引”的查询

在我的应用程序中我使用了几个elasticsearch索引它们在初始状态下不包含索引文档我认为这可以称为空该文档的映射是正确且有效的该应用程序还有一个包含实体的关系数据库这些实体可能具有在 elasticsearch 中关联的
C - 对浮点数组进行排序，同时跟踪索引

我有一个包含 3 个浮点值的数组 float norms 3 norms 0 0 4 norms 1 3 2 norms 2 1 7 我想按降序对这个数组进行排序同时跟踪数组中值的原始索引换句话说给定数组norms 0 4 3 2 1
合并具有一个共同元素的集合 R

我有一个这样的列表 lista list lista 1 c 1 2 4 6 8 9 10 11 12 19 32 34 35 36 37 38 lista 2 c 7 8 lista 3 c 13 14 16 26 27 28 29 30
Java 数组操作

我有一个名为 resize 的函数它接受源数组并将大小调整为新的宽度和高度我认为我正在使用的方法效率低下我听说有更好的方法可以做到这一点无论如何当scale是一个int时下面的代码有效然而还有第二个函数称为 half 它使
如何在不使用 LINQ 的情况下按降序对 FileInfo 对象数组进行排序

我必须降级我的代码才能在 NET 2 0 上工作因为它不支持 LINQ 目前该代码对数组进行排序FileInfo对象由他们FullName属性使用 LINQ 如下所示 Dim files As FileInfo files files
PHP：将数组添加在一起

有人可以帮我解释一下吗我有两段代码其中一个按我的预期工作但另一个则不然这有效 a array a gt 1 b gt 2 b array c gt 3 c a b print r c Output Array a gt 1 b gt
Java中如何对对象数组进行排序？

我的数组不包含任何字符串但它包含对象引用每个对象引用都通过 toString 方法返回名称 id 作者和发布者 public String toString return name n id n author n publisher n
在这种情况下 b 是标量对象吗？

include
保存和恢复陷阱状态？管理多个陷阱处理程序的简单方法？

有什么好的方法可以覆盖bash陷阱处理程序不会永久破坏可能已设置或尚未设置的现有处理程序动态管理任意陷阱例程链怎么样有没有办法保存陷阱处理程序的当前状态以便以后可以恢复在 Bash 中保存和恢复陷阱处理程序状态我将提交以下堆栈实现
在 PHP 中创建关联数组

我有一个多维数组 shop array array appn1 pub1 pub2 pub3 array appn2 pub1 array appn3 pub1 pub2 每个数组中的第一项是申请编号每个数组中的其余部分是出版号我得到每个
如何连接/组合两个数组以连接成一个数组？

我正在尝试将 JavaScript 中的 2 个数组合并为一个 var lines new Array a b c lines new Array d e f 这是一个简单的例子我希望能够将它们组合起来这样当读取第二行时数组中的第四个

随机推荐

DNN 9.8 - EventLogController 已过时 - 有没有人有关于如何使用依赖注入方法来修复此错误的示例？

有人可能有一个示例来替换 DNN 模块中旧的错误日志记录吗我看过以下文章 https dnncommunity org forums aft 1527 https dnncommunity org forums aft 1527 有人在
Spring boot @RequestParam unix时间戳到LocalDateTime [重复]

这个问题在这里已经有答案了假设我的 RestController 中有 GetMapping public list RequestParam LocalDateTime date 我使用日期请求参数作为 unix 时间戳发出 GET 请
python 3.9 中的类型注释约束（`ValueRange`/`MinLen` 等）在哪里？

看到很棒的新产品后Annotatedpython 3 9 中的类型注释可变类型约束我赶紧升级以便可以检查它们 https docs python org 3 library typing html highlight valuer
在 Swift 编程语言中隐藏文本字段的键盘

我对 Objective C 的经验很少我想使用 Swift 编程语言隐藏文本字段的键盘我也尝试过这个 func textFieldShouldReturn textField UITextField gt Bool called wh
使用final关键字声明一个List字段

如果我在课堂上有以下声明Synapse是一个抽象类型 private final List
writeToFile 和 writeToURL 有什么区别？

也许有人可以在这里解释一下或者发送给我正确的文档我已经阅读了 IOS 文档但仍然无法得到它我什么时候使用 writeToURL 方法也许问题出在我身上如果除了我之外的其他人都明白这一点但如果有人可以帮助我我将非常感激不同之处
如何从大气噪声中获得随机数？

我最近讨论了寻找一种生成真正随机数的方法讨论最终讨论了使用大气噪声有人这样做过吗这个过程涉及什么有人创建了一个返回从噪声中获得的随机数的网络服务吗整个网站基于使用大气噪声生成的真正随机数字他们有一个 API 如果您愿意您可
如何在 Python 中进行按位非运算？

为了测试使用更基本的构建块在我的例子中使用 Nand Or 和 And 构建 Xor 操作我需要能够执行 Not 操作内置的not似乎只用单个位来做到这一点如果我做 x 0b1100 x not x 我应该得到0b0011但我只是得
sql查询获取已删除的记录

你有一张桌子table1其中包含id列即int 11 not null auto increment并从 1 开始假设您有 10 000 条记录可以看出最后一条记录的id是10000 一旦删除了 3 条记录表中就有 9 997 条记
HttpWebRequest 的 URL 被特殊字符截断

我需要调用的 Web 服务的 URL 包含一个包含自由格式文本的参数我不知道为什么它是这样设计的因为它是使用 POST 发送的并且包含许多字段作为 POST 的一部分但是这给我带来了一个问题对于井号和等某些字符 URL 在遇到
如何在ireport中为堆积条形图中的条形设置不同的颜色？

我需要为堆积条形图中的每个条形设置唯一的颜色无论我在一个条中看到什么颜色它都不应该在任何其他条或任何其他堆栈中重复例如我的报告中有 5 个栏每个栏有 3 个不同的堆栈我想将红色相关颜色应用于第一个条形及其堆栈第二条应该有蓝色相
JTextField - setColumns() 方法对我不起作用

我的问题是我的 JTextField setColumns int field1 setColumns 5 不起作用我猜这是布局管理器的问题不过我正在从练习册上学习我所知道的唯一布局是 flowLayout borderLayout
JQuery同步动画

在很多情况下我希望动画能够同步执行特别是当我想制作一系列连续的动画时有没有一种简单的方法来制作 jQueryanimate函数调用同步我想到的唯一方法是在动画完成时将标志设置为 true 并等待该标志 jQuery 无法制作同步动画
response.sendRedirect() 和 request.getRequestDispatcher().forward(request,response) 有什么区别[重复]

这个问题在这里已经有答案了我使用JAVA时出现页面跳转的问题如果我使用 response sendRedirect login jsp 然后我得到这个网址 http localhost 8080 login jsp 但如果我使用 req
Android：寻找不同的 TimePicker 样式

大家好一个简短的问题我一直在寻找这种风格的 TimePicker 但到目前为止没有结果如图所示机器人绘图 http www droiddraw org widgetguide html 我开始怀疑这种风格的存在 P 任何知道如何获得
在 Helm 值属性中传递数组

我想将数组作为 Helm 中 yaml 值文件中的属性传递我尝试过的 Attempt elasticsearch uri 127 0 0 1 9200 127 0 0 2 9200 Error ReadString 期望或n 但发现
阻止设计者调用 getter（VS 2008，WinForms）

我有一个简单的用户控件其中包含一个最初为空的组合框该 CB 的 setter 向其添加项目而 getter 返回选定的项目当将此 UC 添加到 Form 时设计者会自动调用空 CB 的 getter 稍后会调用用项目填充 CB 的
获取下周一的日期

如何在 JavaScript 中获取下周一我在互联网上找不到任何相关内容我也尝试了很多代码并对此有所了解但我无法真正做到这一点这是我的代码 var d new Date var day d getDay d new Date d s
访问 PHP 中的活动会话

如何获取服务器上所有活动 PHP 会话的列表并从一个用户的实例中访问它们激励案例是显示网站上所有当前活动用户的列表其中用户名存储在每个用户的 PHP 会话中注意我知道我可以通过数据库甚至文件系统创建自己的状态但我正在寻找一种利
Elasticsearch - 合并多个文档中的字段

假设我有一堆这样的文档 foo 1 2 3 foo 3 4 5 对于针对这些文档运行的查询我正在寻找一种方法来返回所有值的数组foo 最好是唯一的值但重复也可以 foo 1 2 3 3 4 5 我研究了聚合 API 但我不知道如何实现这

Elasticsearch - 合并多个文档中的字段

Elasticsearch - 合并多个文档中的字段 的相关文章

随机推荐

热门标签

Elasticsearch - 合并多个文档中的字段的相关文章