向 ElasticSearch 术语聚合添加其他字段

2024-04-22

索引文档如下：

{
  id: 1, 
  title: 'Blah',
  ...
  platform: {id: 84, url: 'http://facebook.com', title: 'Facebook'}
  ...
}

我想要的是按平台计数和输出统计数据。为了计数，我可以使用术语聚合platform.id作为要计数的字段：

aggs: {
  platforms: {
    terms: {field: 'platform.id'}
  }
}

这样我就可以收到多个桶的统计数据，如下所示{key: 8, doc_count: 162511}，正如预期的那样。

现在，我可以以某种方式添加到这些桶中吗platform.name and platform.url（为了获得漂亮的统计数据）？我带来的最好的看起来像：

aggs: {
  platforms: {
    terms: {field: 'platform.id'},
    aggs: {
      name: {terms: {field: 'platform.name'}},
      url: {terms: {field: 'platform.url'}}
    }
  }
}

事实上，它是有效的，并且在每个存储桶中返回相当复杂的结构：

{key: 7,
  doc_count: 528568,
  url:
   {doc_count_error_upper_bound: 0,
    sum_other_doc_count: 0,
    buckets: [{key: "http://facebook.com", doc_count: 528568}]},
  name:
   {doc_count_error_upper_bound: 0,
    sum_other_doc_count: 0,
    buckets: [{key: "Facebook", doc_count: 528568}]}},

当然，可以从这个结构中提取平台的名称和 url（例如bucket.url.buckets.first.key），但是有没有更干净、更简单的方法来完成任务？

看来表达意图的最好方式是top hits https://www.elastic.co/guide/en/elasticsearch/reference/current/search-aggregations-metrics-top-hits-aggregation.html聚合：“从每个聚合组中仅选择一个文档”，然后从中提取平台：

aggs: {
  platforms: {
    terms: {field: 'platform.id'},
    aggs: {
      platform: {top_hits: {size: 1, _source: {include: ['platform']}}}
  }
}

这样，每个 Bucket 将如下所示：

{"key": 7,
  "doc_count": 529939,
  "platform": {
    "hits": {
      "hits": [{
       "_source": {
        "platform": 
          {"id": 7, "name": "Facebook", "url": "http://facebook.com"}
        }
      }]
    }
  },
}

这有点太深了（就像通常的 ES 一样），但是很干净：bucket.platform.hits.hits.first._source.platform

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

elasticsearch

向 ElasticSearch 术语聚合添加其他字段的相关文章

将 Spark Dataframe 保存到 Elasticsearch - 无法处理类型异常

我设计了一个简单的作业使用 Spark 从 MySQL 读取数据并将其保存在 Elasticsearch 中这是代码 JavaSparkContext sc new JavaSparkContext new SparkConf setA
AWS ElasticSearch：如何将策略应用于索引

我们有一个 AWS ElasticSearch 域正在向其中写入记录文档我现在已经在 Kibana 中创建了索引状态生命周期管理 ISM ILM 策略并且可以将该策略应用于 Kibana 中的索引现在我想在从处理索引写入的 J
当结果少于scrollSize设置时，Scroll SearchResponse不可迭代

我有一个这样的循环 while true scrollResp client prepareSearchScroll scrollResp getScrollId setScroll new TimeValue 600000 execute
在elasticsearch中截断索引

等效操作是什么elasticsearch为了做 TRUNCATE mytable 我要截断的索引称为 myindex 换句话说在操作之后我希望索引 myindex 中有零个文档您需要删除索引然后重新创建它虽然这需要您再次设置映射
Logstash 错误 Java::JavaLang::NoClassDefFoundError 无法解决

我是elasticsearch ES 和logstash 的新手我已经使用它成功设置了elasticsearch和kibanalink https www youtube com watch v hVgrXi 9L6Y 之后我尝试使用lo
如何在elasticsearch中使用冒号搜索模式？

我在 Elasticsearch 中有一个字段其值为 ft 05 08 2015 13 01 27 358 cgn 4189 当我想使用查询字符串 cgn 4189 进行搜索时我没有结果我尝试像 cgn 4189 一样转义冒号但有语
Elasticsearch 对字符串排序未返回预期结果

当对包含多个单词的字符串字段进行排序时 Elasticsearch 会拆分字符串值并使用最小值或最大值作为排序值即当对值为老虎之眼的字段进行升序排序时排序值为 Eye 当按降序排序时排序值为 Tiger 假设我的索引中有老虎之
Elastic Search 5.x 嵌套多个查询 C#

我将 C 与这些 nuget 包一起使用
LogStash 无法从许可证中检索许可证信息。响应代码“401”通过 URL“http://elasticsearch:9200/_xpack”联系 Elasticsearch

我正在努力让 Docker LogStash 连接到 Docker ElasticSearch 并启用 xpack 安全性主要日志有 logstash 1 2020 05 20T22 41 03 950 WARN deprecation
为什么我在elasticsearch中需要“store”：“yes”？

我真的不明白为什么核心类型链接 http www elasticsearch org guide reference mapping core types 它在属性描述中说例如对于数字 store 设置为 yes 将实际字段存储在索引中
在elasticsearch中过滤facet

我有一个如下查询 query query query string query s q filter ids values list ids facets destination terms field destination en hot
match_none 有什么用？

我浏览了docs https www elastic co guide en elasticsearch reference current query dsl match all query html query dsl match no
如何使用elasticsearch进行分页？来自 vs 滚动 API

我使用elasticsearch作为数据库来存储大量日志数据我知道有两种方法可以进行分页使用大小并来自 API 使用滚动API 现在我使用 from 进行分页从前端和后端获取页面和大小参数 Java searchSourceBuild
如何将2个匹配查询加入到elasticsearch的查询中？

我想查询以下数据user id is 1 and name is John 写一个常用的SQL很容易 select from t where user id 1 and name John 但对我来说进行elasticsearch的查询并不
如何使用 django-haystack 和 elasticsearch 后端进行模糊搜索？

看起来好像elasticsearch支持模糊查询 http www elasticsearch org guide reference query dsl fuzzy query http www elasticsearch org gui
如何编写Elasticsearch多个必须脚本查询？

我想使用查询来比较多个字段我有字段 1 到 4 我想搜索字段 1 大于字段 2 的数据并且下面的查询工作正常 size 0 source field1 field2 field3 field4 sort query bool filte
在弹性搜索中使用 GET/POST 时的不同结果

我正在通过 Elastic Search Head 插件尝试弹性搜索当我通过 POST 提交查询时结果符合预期但是当我使用 GET 尝试相同的查询时我总是会返回索引中的所有值那么如何通过 GET 将查询传递到弹性搜索服务器以
在Windows Xampp上安装和使用elasticsearch php客户端

我下载的是elasticsearch 5 1 1 zip来自https www elastic co downloads elasticsearch https www elastic co downloads elasticsearch
Elasticsearch 单个字段的多个分析器

我使用严格的预定义映射将不同类型的文档存储在单个索引中它们都有一些字段例如 body 但我希望在索引时对它们进行稍微不同的分析例如对特定文档使用不同的标记过滤器并在搜索时以相同的方式处理据我所知分析器不能按文档指定我还考虑使
弹性搜索 - search_after 参数

我读了这个doc https www elastic co guide en elasticsearch reference 5 0 search request search after html要理解 search after 并有两个

随机推荐

使用 webpack 生成捆绑 TypeScript 定义文件

我目前正在使用 gulp 来生成我的包的定义文件如下所示 dtsGenerator default name ngFramework project out Typings raw index d ts 但是我正在迁移到 webpack
在 Selenium 中捕获 JavaScript 错误

有没有办法捕获发生的错误DOM in Selenium并且可能与页面中的错误标记相同举一个简单的例子假设我试图在一个不存在的 HTML 控件上绑定一个事件我的浏览器会抛出一个错误 element abcd not found in t
pyqt5不显示窗口[重复]

这个问题在这里已经有答案了我真的希望有人能帮助我解决这个问题我正在尝试开始使用pyqt5 并且几乎从我正在学习的课程中复制了这段代码代码似乎执行没有任何问题但我应该看到的窗口根本没有出现我做错了什么我正在尝试ubuntu 18顺
Pycharm交互式控制台不起作用

我对 python 和 Pycharm 都很陌生因此请毫不犹豫地指出我哪里做错了以及如何解决问题问题是IPython无法像往常一样导入我想要执行的函数即使 python 文件运行后我也无法在 IPython 控制台中导入该文件中的
我收到内存异常“System.IO.out of exception”错误

对于小目录大小代码工作正常当目录文件大小很大时它会给出此错误消息我的代码 IEnumerable
首选项列表仅显示第一个元素

我正在开发一个PreferenceActivity与定制Preference意见我的问题是我创建了一个视图ListView它只显示第一个元素我发布我的代码和图像 http imageshack us photo my images 54
大括号 {} 替换 Racket 中的“开始”

是否可以有一个宏使用大括号来表示一个语句块从而替换 begin 关键字因此代替 if condition begin statement1 statement2 statement3 statement4 else stateme
协议类型的 inout 变量是否被禁止？

下面的代码 protocol SomeProtocol class SomeClass SomeProtocol private func doSomethingWith inout someVar SomeProtocol private
同步ScrollView滚动位置 - android

我的 android 布局中有 2 个 ScrollView 如何同步它们的滚动位置 ScrollView中有一个方法 protected void onScrollChanged int x int y int oldx int oldy
什么是 MVC 框架以及为什么它是必要/有用的？

我知道 MVC 框架允许您分离业务逻辑数据库访问和表示但为什么我们需要一个框架来做到这一点我们不能将我们的类分开也许对模型视图和控制器类使用不同的包文件夹吗在我看来你所说的是 MVC 模式而不是特定的框架当然您可以将所
修复文件“project.pch”已被修改，因为预编译头在 Xcode 中构建错误

我最近在 info plist 部分中处理我的应用程序因为我的应用程序将无法在我的测试设备上运行自构建预编译头以来文件 project pch 已被修改需要注意的是该应用程序在模拟器中运行良好编辑现在我收到此错误而不是另一个错
为什么我的自定义图形项目在基于 Qt 的 C++ GUI 应用程序中不断重新绘制？

我的应用程序有一个 QMdiArea 其中显示子窗口其中包含 QGraphicsView 派生视图 GfxInteractiveView 的实例这些视图又可视化包含自定义 QGraphicsItem 派生项目的场景 An image i
vim 中更有用的状态栏？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
Python Dask - 2 个 DataFrame 的垂直串联

我正在尝试垂直连接两个 Dask DataFrame 我有以下 Dask DataFrame d A B C D E F 1 4 8 1 3 5 6 6 2 2 0 0 9 4 5 0 6 35 0 1 7 10 9 4 0 7 2 6 1
Angular Digest 循环正在运行，但 ng-bind 值未更新

我有一个包含导航栏的父视图在该视图内部我有一个 div 渲染我所在的任何子视图的元素我想根据子视图的路线有条件地显示隐藏父视图中的导航栏现在我有这个 div
在 gdb 中设置应用程序关联

有没有一种简单的方法可以设置我正在调试的应用程序的亲和力而无需将 gdb 锁定到同一核心我问的原因是应用程序以实时优先级运行并且需要在单核上运行目前我使用这个命令行 taskset c 3 gdbserver 1234 app ou
AngularJS 中的 jQuery .one() 相当于什么？

如何创建一个仅触发一次并在之后自毁的事件发射器相当于 jQuery 的 one 函数实际上您可以通过 jqLit e 库在 AngularJS 中使用 one jsLite 是 jQuery 的精简版本是支持 Angular 所需的
最好的文档类型是什么？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
更新 KB 2687323 后，VB6 IDE 无法加载 MSCOMCTL.OCX

Windows 更新安装安全更新后KB2687323 http support microsoft com kb 2687323 我的 VB6 项目无法加载显示的错误消息是无法加载 project vbp path MSCOMCTL O
向 ElasticSearch 术语聚合添加其他字段

索引文档如下 id 1 title Blah platform id 84 url http facebook com title Facebook 我想要的是按平台计数和输出统计数据为了计数我可以使用术语聚合platform id作为

向 ElasticSearch 术语聚合添加其他字段

向 ElasticSearch 术语聚合添加其他字段 的相关文章

随机推荐

热门标签

向 ElasticSearch 术语聚合添加其他字段的相关文章