减去具有不同时间戳的两个文档之间的数字字段

2024-03-01

假设我有这些数据样本：

{
    "date": "2019-06-16",
    "rank": 150
    "name": "doc 1"
}

{
    "date": "2019-07-16",
    "rank": 100
    "name": "doc 1"
}

{
    "date": "2019-06-16",
    "rank": 50
    "name": "doc 2"
}

{
    "date": "2019-07-16",
    "rank": 80
    "name": "doc 2"
}

预期结果是从具有不同日期（旧日期 - 新日期）的两个相同名称的文档中减去排名字段：

{
    "name": "doc 1",
    "diff_rank": 50
}

{
    "name": "doc 2",
    "diff_rank": -30
}

并按diff_rank如果可能的话，否则我会在得到结果后手动排序。

我尝试过的是使用date_histogram and serial_diff但有些结果缺少diff_rank我确信数据存在的某种价值：

{
   "aggs" : {
        "group_by_name": {
            "terms": {
                "field": "name"
            },
            "aggs": {
                "days": {
                    "date_histogram": {
                        "field": "date",
                        "interval": "day"
                     },
                    "aggs": {
                        "the_rank": {
                            "sum": {
                                "field": "rank"
                            }
                        },
                        "diff_rank": {
                           "serial_diff": {
                              "buckets_path": "the_rank",
                              "lag" : 30 // 1 month or 30 days in this case
                           }
                        }
                    }
                }
            }
        }
    }
}

非常感谢您帮助解决我的上述问题！

最后，我从官方文档中找到了一个方法，使用Filter https://www.elastic.co/guide/en/elasticsearch/reference/6.5/search-aggregations-bucket-filter-aggregation.html, 桶脚本 https://www.elastic.co/guide/en/elasticsearch/reference/6.5/search-aggregations-pipeline-bucket-script-aggregation.html聚合和桶排序 https://www.elastic.co/guide/en/elasticsearch/reference/6.5/search-aggregations-pipeline-bucket-sort-aggregation.html对结果进行排序。这是最终的代码片段：

{
    "size": 0,
    "aggs" : {
        "group_by_name": {
            "terms": {
                "field": "name",
                "size": 50,
                "shard_size": 10000
            },
            "aggs": {
                "last_month_rank": {
                    "filter": {
                        "term": {"date": "2019-06-17"}
                     },
                    "aggs": {
                        "rank": {
                            "sum": {
                                "field": "rank"
                            }
                        }
                    }
                },
                "latest_rank": {
                    "filter": {
                        "term": {"date": "2019-07-17"}
                     },
                    "aggs": {
                        "rank": {
                            "sum": {
                                "field": "rank"
                            }
                        }
                    }
                },
                "diff_rank": {
                    "bucket_script": {
                        "buckets_path": {
                          "lastMonthRank": "last_month_rank>rank",
                          "latestRank": "latest_rank>rank"
                        },
                        "script": "params.lastMonthRank - params.latestRank"
                    }
                },
                "rank_bucket_sort": {
                    "bucket_sort": {
                        "sort": [
                            {"diff_rank": {"order": "desc"}}
                        ],
                        "size": 50
                    }
                }
            }
        }
    }
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

elasticsearch

减去具有不同时间戳的两个文档之间的数字字段的相关文章

使用 elasticsearch-dsl-py 对另一个字段中包含的字段创建术语查询

我在用elasticsearch dsl py https github com elasticsearch elasticsearch dsl py并希望过滤包含在另一个术语中的术语如下所示 slug foo foo slug bar
如何在elasticsearch中配置synonym_path

我对 elasticsearch 很陌生我想使用同义词我在配置文件中添加了这些行 index analysis analyzer synonym type custom tokenizer whitespace filter synon
Logstash 错误 Java::JavaLang::NoClassDefFoundError 无法解决

我是elasticsearch ES 和logstash 的新手我已经使用它成功设置了elasticsearch和kibanalink https www youtube com watch v hVgrXi 9L6Y 之后我尝试使用lo
Spark任务仅在一个执行器上运行

大家好首先我知道这个线程的存在 Spark 中的任务仅在一个执行器上运行 https stackoverflow com questions 53425983 task is running on only one executor in
Elasticsearch 过滤器/计算嵌套字段

我有带有嵌套字段的文档如下所示 results id 1234 name asdf id 5678 name jkl ip 1 2 3 4 嵌套字段的映射如下所示 results type nested properties id typ
将 pandas 数据框索引到 Elasticsearch 中，无需使用 elasticsearch-py

我想将一堆大型 Pandas 数据帧大约数百万行和 50 列索引到 Elasticsearch 中在寻找如何执行此操作的示例时大多数人会使用elasticsearch py 的批量辅助方法 https elasticsearch p
如何连接Kafka和Elasticsearch？

我是Kafka的新手我使用kafka通过logstash收集netflow 可以并且我想将数据从kafka发送到elasticsearch 但是存在一些问题我的问题是如何将 Kafka 与 Elasticsearch 连接起来 net
Elasticsearch 中的分析器有什么用？

我在理解弹性搜索分析器时遇到一些问题它的用途是什么以及如何使用它 From 本文 https www elastic co blog found text analysis part 1 有来自源文本的分词器和分词过滤器我是否无法理解来
将 Elasticsearch 结果导出到 CSV 文件

我正在尝试将使用以下查询找到的结果导出到桌面上的 CSV 中这是我第一次使用 Elasticsearch 和 cURL 所以我对如何做到这一点感到困惑 from elasticsearch import Elasticsearch es
在ElasticSearch中搜索没有时间的日期字段值

我的数据中有一个日期字段为 type date format dateOptionalTime 现在我的日期字段和值是 INITIAL EXTRACT DATE 2015 04 02T06 47 57 78 05 30 在搜索时我仅根据
Elastic Search 5.x 嵌套多个查询 C#

我将 C 与这些 nuget 包一起使用
按字段关联 ELK 中的消息

相关在ELK中合并日志和查询 https stackoverflow com questions 28429607 combine logs and query in elk 我们正在设置 ELK 并希望在 Kibana 4 中创建可视化
ElasticSearch JavaAPI (SearchScroll)- search_context_missing_exception","reason":"找不到 id 的搜索上下文

我正在获取超过100k使用一个索引中的文档searchScroll并在所有字段中再添加一个字段100K文件然后再次将这些文档插入到另一个新索引中我正在使用SearchScrollapi 也在设置大小searchSourceBuilder
随着索引和文档数量恒定，elasticsearch 批量索引会随着时间的推移而变慢

我遇到了使用 NET NEST 客户端和 ElasticSearch 进行批量索引的性能随着时间的推移索引数量和文档数量恒定而降低的情况我们正在奔跑ElasticSearch Version 0 19 11 JVM 23 5 b02在具
在弹性搜索中使用 GET/POST 时的不同结果

我正在通过 Elastic Search Head 插件尝试弹性搜索当我通过 POST 提交查询时结果符合预期但是当我使用 GET 尝试相同的查询时我总是会返回索引中的所有值那么如何通过 GET 将查询传递到弹性搜索服务器以
ElasticCloud 的 ElasticSearch 身份验证错误？

我刚刚在 ElasticCloud 上设置了一个新的 ElasticSearch 集群我正在尝试遵循帮助文档 https cloud elastic co help 它说您可以按如下方式发布文档 curl https
无法使用docker在Apple Mac芯片M1上启动elasticsearch

在发布这个问题之前我浏览了许多链接例如 Kibana 无法在 Mac M1 上使用 docker 连接到 ElasticSearch https stackoverflow com questions 73160632 kibana c
Nest Elastic - 构建动态嵌套查询

我必须使用 Nest 查询嵌套对象但是查询是以动态方式构建的下面的代码演示了以静态方式对嵌套书籍进行查询 QueryContainer qry qry new QueryStringQuery DefaultField name D
从 node.js 创建对 AWS ES 实例的有效签名请求

我试图找到一个示例说明如何连接到 Node js 中的 AWS ES 实例然后通过一个简单的请求访问 ES 集群我正在尝试使用elasticsearch节点包 https www npmjs com package elasticse
尝试在 ElasticSearch 中查询和聚合，但聚合不起作用 - elasticsearch.js 客户端

我尝试查询我的数据集有两个目的匹配一个术语可转售 true 按价格对结果进行排序最低到最高数据集文档是 data resellable true startingPrice 0 id 4emEe r x5DRCc5 buyNowP

随机推荐

Textblock 中的标签自动换行不起作用

我有一个包含相当多对象的 WPF 页面在所有这些项目的底部我有一个标签需要在内容中进行文字环绕答案很简单通过使用 Textblock 这应该是小菜一碟然而即使我使用了这些项目我仍然无法让文本换行所以我假设其他对象中必须有其
使用集合对值进行排序

使用集合进行排序很漂亮对我来说比使用比较器要好得多因为我有多个相同的值并且我希望它们不要被扔进垃圾桶但 Collections 有它自己的问题它似乎认为 2 组的重复数量小于其实际较小的对应部分示例有这些键和值 katy 1 m
一组图像中颜色（色调）值 (0-359) 出现次数的总和

我有一个装满图像的文件夹我想找到出现次数最少的色相值为此我为所有色调值创建一个长度为 360 的数组获取文件夹中的所有图像遍历它对于每个像素我在数组中代表色调值的索引处添加 1 例如如果我的像素中的色调值为 0 我会在数组中
[Hive]查询 hive 数据库时出现“ArrayIndexOutOfBoundsException”

当我查询配置单元基础 hive 0 11 0 和 hive 0 12 0 时我总是得到 ArrayIndexOutOfBoundsException 但有时不会这是错误 java lang RuntimeException Hive R
Python Dataframe 在微秒内重新采样

我正在处理重新采样数据帧它可以在几小时几天几分钟内工作但重新采样的时间不会少于秒即使时间跨度很短程序也会挂起那么我错过了什么吗我尝试了 0 000001S U 等到目前为止没有任何效果我的时间格式 2015 08 29
Networkx：获取节点之间的距离

我是使用 NetworkX 的初学者我正在尝试找到一种方法来检测哪些节点彼此之间的距离为 x 我开始使用这个算法来获取所有对 path nx all pairs dijkstra path G 但我仍然不确定如何使用 for 循环检测节点
对 (->) 作为 monad 和 functor 的实例感兴趣

我很感兴趣 gt 当我查找有关信息时 gt 在 ghci 中它说 data gt a b Defined in GHC Prim 到目前为止一切都很好但是当它说时它变得非常有趣 instance Monad gt r Defined i
VBA - 从 Access 生成 Excel 文件（查询表）

我有一个项目基本上目标是使用 VBA 在 Access 中单击按钮来生成 Excel 报告该报告的内容是 SQL Server 数据库存储过程的结果错误行 With MeuExcel Worksheets 4 QueryTables
如何从父组件修改组件的样式？

我需要从其父组件修改 Vue 组件的一些 CSS 属性它将覆盖组件内定义的 CSS 我首先期望对于一个组件
我可以使用 Firestore 获取使用 batch().set 创建的文档的生成 ID 吗？

有没有一种方法可以获取使用 Firestore 批量创建的文档的自动生成 ID 使用时 add 我可以轻松获得 ID db collection posts add title Hello World then function docRe
部署在 Web 服务器上时 Crystal Report 图标/工具栏不起作用

我构建了一个网页其中包含使用 Visual Studio 2008 中包含的 Crystal 库构建的 Crystal Report It 在我的机器上工作 http jcooney net archive 2007 02 01 4299
JSF 读取托管 bean 中的动态输入元素

我有一个非常复杂的 JSF 页面我们使用带有 Facelet 的 JSF2 我必须在其中插入一个纯 html 表单部分它代表稍后将创建为 Pdf 的文档的所见即所得模板页面看起来非常简化
从字符中获取 KeyCode？

我需要能够读取字符并获取与其语言和键盘布局相关的键我知道如何看待文化背景和语言但是我怎样才能知道像英语中的 S 这样的字母并且知道它在键盘上是什么键呢或者对于更难的问题我如何取出字母并知道它在键盘上的键是什么用一个示例程序可能比
无法使用 iOS6.1 sdk 构建 Google Maps SDK for IOS 版本 1.7.0

我刚刚更新到 GMS 版本 1 7 0 无法成功构建基础SDK iOS6 1 我可以使用 Base SDK iOS7 0 成功构建 GMS 版本 1 7 0 我还可以使用 Base SDK iOS6 0 或 7 0 成功构建旧的 GMS 版
MongoDb 区域副本集 - 每个区域的主节点？

给定一个具有区域用户区域为北美欧洲亚洲的应用程序如何创建允许 HK 用户写入最近节点的副本集目标是香港的用户读取和写入其本地节点而不会遭受写入美国的延迟我的假设是我可以在每个区域设置一个应用程序堆栈通过副本集在所有区域之
两种颜色的背景 - React Native

有没有办法让背景有两种颜色如下所示两种颜色 https i stack imgur com 0DPHC png我尝试过使用线性渐变但那只是渐变我不知道如何在主视图标签中放置两种颜色作为背景有什么建议么如果视图的尺寸无法帮助您请
go中如何将[][]byte转换为**char

我想从 go byte 转换为 C char 换句话说我在 go 中有一个字节矩阵我想将其转换为 C 中的 char 双指针请假设我必须有一个 byte 作为输入和一个 char 作为输出我知道可以通过执行以下操作从 byte 转换
Lambda 的结果角色定义中的可信实体是什么？

下面是 SAM 模板 Resources HelloWorldFunction Type AWS Serverless Function Properties CodeUri hello world Handler app LambdaHa
在 Visual Studio 中哪里可以修改详细的 C# 编译器优化设置？

在Visual Studio C C 项目中可以很容易地在属性页 C C 优化中修改编译器的优化设置例如我们可能会给出不同的优化级别例如 O2和 O3 以及高级优化例如省略帧指针但是我无法简单地在 Visual Stud
减去具有不同时间戳的两个文档之间的数字字段

假设我有这些数据样本 date 2019 06 16 rank 150 name doc 1 date 2019 07 16 rank 100 name doc 1 date 2019 06 16 rank 50 name doc 2 da

减去具有不同时间戳的两个文档之间的数字字段

减去具有不同时间戳的两个文档之间的数字字段 的相关文章

随机推荐

热门标签

减去具有不同时间戳的两个文档之间的数字字段的相关文章