使用elasticsearch按一天中的时间累积流量

2024-04-19

我正在接收来自大量客户端应用程序的请求/事件。我想使用elasticsearch 来找出我的最高流量点是什么时候。

我尝试过的一件事是使用嵌套直方图进行过滤器聚合，然后使用嵌套的“术语”聚合，通过脚本字段获取一天中的不同时间。以下是我的尝试，它的性能非常糟糕（正如我所期望的，因为我正在每个文档执行一个脚本）。

{
  "aggs": {
    "sites_within_range": {
      "filter" : { 
        "range" : { 
          "occurred" : { 
            "gt" : "now-1M"
          }
        } 
      },

      "aggs": {
        "sites_over_time": {
          "date_histogram": {
            "field": "occurred",
            "interval": "week"
          },
          "aggs":{
            "site_names": {
              "terms": {
                "script": "doc['occurred'].date.getHourOfDay()",
                "size": 10000
              }
            }
          }
        }
      }

    }
  }
}

我还考虑过将我想要查询的日期元素存储为文档的不同部分，例如：

{
    "date": "actual datetime",
    "day": "monday",
    "hour": 8
    "minute": 37
}

这对我来说也像是错误的答案。

经过一番调查，看起来我可能对 1.1 中的新基数/百分比聚合感兴趣？

同类问题已经解决了这个线程 https://stackoverflow.com/questions/29002152/how-to-show-day-names-using-date-histogram-aggregation-in-elascticsearch.

根据您的问题调整解决方案，我们需要编写一个脚本将日期转换为一天中的小时：

Date date = new Date(doc['created_at'].value) ; 
java.text.SimpleDateFormat format = new java.text.SimpleDateFormat('HH');
format.format(date)

并在查询中使用它：

{
    "aggs": {
        "perWeekDay": {
            "filter" : { 
                "range" : { 
                    "occurred" : { 
                        "gt" : "now-1M"
                    }
                } 
            },
            "aggs": {
                "terms": {
                    "script": "Date date = new Date(doc['created_at'].value) ;java.text.SimpleDateFormat format = new java.text.SimpleDateFormat('HH');format.format(date)"
            }
        }
    }
}

并且您可以了解一天中各个小时的流量。

注意：在文档中存储小时/天/分钟是进行此类聚合的最有效方法。我的回答假设您不想存储该信息。脚本通常效率不高。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

elasticsearch

Histogram

使用elasticsearch按一天中的时间累积流量的相关文章

Django-Haystack 使用具有 IAM 凭证的 Amazon Elasticsearch 托管

我希望使用 Amazon 的 Elasticsearch 服务器来支持 Django 数据库中长文本字段的搜索然而我也不想将此搜索暴露给那些没有登录并且不想通过模糊或某些 IP 限制策略来依赖安全性的人除非它可以很好地与现有的 her
如何在桶聚合中进行过滤器聚合？

我有以下要求我有一些如下所示的记录作为示例 agreementid 1 lastdispositioncode PTP feedbackdate 30 11 2020 agreementid 1 lastdispositioncode
深层嵌套类型的Elasticsearch聚合

之前我问过this https stackoverflow com questions 31841542 elasticsearch metric aggregation number of elements in array 318464
排除elasticsearch结果数据中的_id和_index字段

如果简单地点击 api 每个文档中有 5 个字段但我只想要这两个字段 user id 和 loc code 所以我在字段列表中提到但它仍然返回一些不必要的数据如 shards hits time out等使用下面的查询在 chrom
范围过滤器不适用于“gt”运算符，但适用于“lt”

我正在使用弹性搜索来索引我的文档并希望根据特定属性过滤文档这是我的代码 filter push range audience ethnicity asian gt 50 它不适用于 gt 运算符发回不一致的结果但适用于 lt 运算符
在elasticsearch中截断索引

等效操作是什么elasticsearch为了做 TRUNCATE mytable 我要截断的索引称为 myindex 换句话说在操作之后我希望索引 myindex 中有零个文档您需要删除索引然后重新创建它虽然这需要您再次设置映射
将带有脚本的管道聚合转换为 kibana

Can 管道聚合 https www elastic co guide en elasticsearch reference current search aggregations pipeline html在elasticsearch中转
AWS Elasticsearch 和 CORS

我正在试用 AWS Elasticsearch 服务 https aws amazon com elasticsearch service https aws amazon com elasticsearch service 设置非常简单
Spark任务仅在一个执行器上运行

大家好首先我知道这个线程的存在 Spark 中的任务仅在一个执行器上运行 https stackoverflow com questions 53425983 task is running on only one executor in
未能向 master 发送加入请求

我使用的是elasticsearch版本1 3 0 重启数据节点后无法检测到主节点我收到错误failed to send join request to master 在错误日志中 app101 dGRBqTFTQfae76IFCjsM
将 pandas 数据框索引到 Elasticsearch 中，无需使用 elasticsearch-py

我想将一堆大型 Pandas 数据帧大约数百万行和 50 列索引到 Elasticsearch 中在寻找如何执行此操作的示例时大多数人会使用elasticsearch py 的批量辅助方法 https elasticsearch p
如何在 Elasticsearch 中同时按父字段和嵌套字段排序？

我需要同时按父字段和嵌套字段在 Elasticsearch 中排序我的数据是这样的 id 1 rank 8 price 12 45 offers id 777 rank 12 price 45 75 id 2 rank 35 price
为什么我在elasticsearch中需要“store”：“yes”？

我真的不明白为什么核心类型链接 http www elasticsearch org guide reference mapping core types 它在属性描述中说例如对于数字 store 设置为 yes 将实际字段存储在索引中
在elasticsearch中过滤facet

我有一个如下查询 query query query string query s q filter ids values list ids facets destination terms field destination en hot
如何提高elasticsearch中的索引类型？

我以前是这样搜索的 curl XGET localhost 9200 users search 但 users 包含用户 a b c 如下所示 curl XGET localhost 9200 users a b c search user
在同一个图表上绘制两个直方图，并将它们的列总和为 100

我有两组不同大小的数据我想将它们绘制在同一个直方图上然而由于一组有约 330 000 个值另一组有约 16 000 个值因此它们的频率直方图很难比较我想绘制一个比较两组的直方图使得 y 轴是该箱中出现的百分比我下面的代码与此
为 hist2d 子图添加一个颜色条并使它们相邻

我正在努力调整情节我一直在努力我面临两个问题这些图应该是相邻的并且 wspace 和 hspace 为 0 我将两个值都设置为零但图之间仍然有一些空格我想为所有子图使用一个颜色条它们的范围都相同现在代码向最后一个子图添加了一
如何将2个匹配查询加入到elasticsearch的查询中？

我想查询以下数据user id is 1 and name is John 写一个常用的SQL很容易 select from t where user id 1 and name John 但对我来说进行elasticsearch的查询并不
ElasticSearch 多滚动 Java API

我想从索引中获取所有数据由于项目数量对于内存来说太大我使用滚动很好的功能 client prepareSearch index setTypes myType setSearchType SearchType SCAN setScro
从 App Engine 连接到 Kubernetes 引擎

我们希望使用应用程序引擎灵活的流程来更新位于 Google Kubernetes Engine 上的 ElasticSearch 索引我们需要通过 http s 地址连接到 ElasticSearch 推荐的方法是什么我们不想将集群暴露

随机推荐

反应本机打字稿“字符串”不可分配给“从不”类型的参数。使用中导航

我不断收到错误消息提示字符串不能分配给反应本机打字稿中从不类型的参数我不知道为什么有人可以帮我修复这个错误吗先感谢您代码片段 const loadReport id string gt setPostId id navig
如何从联合结果中进行选择？

我有一个像这样的 MySQL 脚本 SELECT FROM WHERE UNION ALL SELECT FROM WHERE 现在如何从并集结果中再次选择这不起作用 SELECT FROM SELECT FROM WHERE UNION
Java 应该将数组视为对象吗？

我经常认为允许使用数组作为适当的对象及其自己的方法而不是依赖于 Arrays Arrays 和 ArrayUtils 等辅助类是一个好主意例如 ints sort Arrays sort ints int onemore ints add
我如何知道电子表格单元格是否使用 Google Apps 脚本合并

在 Google 文档电子表格中如果合并单元格A1和A2 有办法吗使用谷歌应用程序脚本确认它们已合并 GAS中有合并功能https developers google com apps script class range merge
jQuery 中的 attr() 是否强制小写？

我正在尝试操作 svg viewBox 属性它看起来像这样
运行时检查失败 #2 - 变量“索引”周围的堆栈已损坏

好吧我想我知道问题是什么我只是很难调试它我正在使用 directx api 并尝试根据我拥有的一本书生成一个沿 x 和 z 轴的平面问题是当我创建索引时我认为我设置的值超出了索引数组的范围我只是很难弄清楚我做错了什么我不熟悉这
使用 Python 进行 requests.get() 后 PDF 文件损坏

我正在尝试使用 requests get 下载 PDF 文件它适用于我发现的大多数测试 PDF 文件但对于本例则不起作用并且文件已损坏如果我用浏览器打开 URL 并保存文件它就可以正常工作我尝试使用 Stream 分块下载它但
您是否正在尝试将目录挂载到文件上（或反之亦然）？

我有一个带有版本的docker17 06 0 ce 当我尝试使用 docker 和命令安装 NGINX 时 docker run p 80 80 p 8080 8080 name nginx v PWD www www v PWD conf
Scorer函数：make_scorer/score_func和的区别

在 scikit 0 18 1 文档中我发现接下来的内容有点令人困惑似乎可以通过多种方式编写自己的评分函数但有什么区别呢网格搜索简历 http scikit learn org stable modules generated sk
设置 customElement: true 时，Svelte 绑定不起作用

我想使用 Svelte 构建自定义元素 Thus in rollup config js I set customElement true 然后我必须使用来引用我的子组件但我发现通过这种方式 bind不管用这是代码示例 HelloW
如何在pyqtgraph中绘制十字线并绘制鼠标位置？

我是 Python 和 pyqtgraph 的新手我正在开发针对不同类型信号的查看器目前当我想包含十字准线和带有鼠标位置的文本标签时我陷入了困境我正在使用 GridLayout 因为稍后图形会与其他几个元素组合在一起我尝试改编
什么会导致 jQuery 的 unbind 功能无法按预期工作？

看一下下面的代码此外您将需要jquery js http docs jquery com Downloading jQuery Current Release jquery viewport js https github com NV
.AspNetCore.相关性。未找到国家财产。未知地点

我正在使用 OIDC 的混合身份验证流程 options Events OnRedirectToIdentityProvider redirectContext gt if redirectContext Request Path Star
如何在AngularJS中正确使用HTTP.GET？具体来说，对于外部 API 调用？

我在controller js中有以下代码 var myApp angular module myApp myApp service dataService function http delete http defaults header
所有主流浏览器都支持 JSON.parse 吗？ [复制]

这个问题在这里已经有答案了可能的重复浏览器原生 JSON 支持 window JSON https stackoverflow com questions 891299 browser native json support windo
JMeter：如何访问 ForEach 控制器内的循环计数器？

我在 JMeter 中有一个 ForEach 控制器如何访问此控制器内循环的计数器通过变量然后使用它来创建新变量 Put 计数器配置元素 http jmeter apache org usermanual component refe
用于 ListView 的 Kotlin setOnClickListener

我有以下代码 class BookListActivity AppCompatActivity var array arrayOf Item 1 Item 2 Item 3 Item 4 Item 5 Item 6 Item 7 Item
nginx 不为 ssl 中的 Rails 资产提供服务

我正在我的 nginx nginx 版本 nginx 1 4 1 Ubuntu rails Rails 3 2 16 和 unicorn unicorn v4 7 0 vps 中安装自签名 ssl 证书没有 ssl 一切看起来都很好但自
GoogleTalk 应用程序是用什么编程语言开发的？

有谁知道 Google Talk 应用程序是用哪种编程语言开发的是的我询问的是 Windows 客户端应用程序 http www google ro talk http www google ro talk googletalk exe
使用elasticsearch按一天中的时间累积流量

我正在接收来自大量客户端应用程序的请求事件我想使用elasticsearch 来找出我的最高流量点是什么时候我尝试过的一件事是使用嵌套直方图进行过滤器聚合然后使用嵌套的术语聚合通过脚本字段获取一天中的不同时间以下是我的尝试

使用elasticsearch按一天中的时间累积流量

使用elasticsearch按一天中的时间累积流量 的相关文章

随机推荐

热门标签

使用elasticsearch按一天中的时间累积流量的相关文章