elasticsearch collapse折叠聚合

2023-10-27

目前经验：折叠只能用于筛选数据，不能进行聚合，需要聚合，自己在内存中聚合

from elasticsearch import Elasticsearch


def query_2coll(index_name):
    query = {'size': 10000,
             "query": {
                 "match_all": {}
             },
             "collapse": {
                 "field": "subject_id",
                 "inner_hits": {
                     "name": "group",
                     "size": 5,
                     "sort": [{"group": "asc"}]
                 },
                 "max_concurrent_group_searches": 4
             }
    }
    try:
        datas = []
        allDoc = es.search(index=index_name, doc_type='koala-index', body=query)

        for data in allDoc['hits']['hits']:
            print(data['_source']['id'], data['_source']['group'], data['_source']['subject_id'])
            # for val, buckets in enumerate(data['_source']):
            #     if val>1:
            #         print('data error')
            # print(buckets['_source'])
            datas.append(data['_source'])
        return datas
    except Exception as e:
        print('query1 error', e)
        return datas


def query(index_name):
    query ={'size':10000,
        "query": {
            "match_all": {}
        },
        "sort": [
            {
                "group": {
                    "order": "asc"
                }
            }
        ],
        "collapse": {
            "field": "group",
                "terms": {
                    "field": "subject_id", 'size': 10000
                }
            },
        "aggs": {
                "agg_sex": {
                    "terms": {
                        "field": "subject_id",'size':10000
                    }
                }
        }
    }
    try:
        datas=[]
        allDoc = es.search(index=index_name, doc_type='koala-index', body=query)

        for data in allDoc['hits']['hits']:
            print(data['_source']['id'],data['_source']['group'],data['_source']['subject_id'])
            # for val, buckets in enumerate(data['_source']):
            #     if val>1:
            #         print('data error')
            # print(buckets['_source'])
            datas.append(data['_source'])
        return datas
    except Exception as e:
        print('query1 error', e)
        return datas

def query_ju(index_name):
    query = {
        "from": 0,
        "size": 10000,
        "sort": [
            {
                "event_id": {
                    "order": "desc"
                }
            }
        ],
        "collapse": {
            "field": "subject_id",
            "inner_hits": {
                "name": "quality",
                "size": 1,
                "sort": [
                    {
                        "event_id": {
                            "order": "asc"
                        }
                    }
                ]
            }
        }
    }
    datas=[]
    try:
        allDoc = es.search(index=index_name, doc_type='koala-index', body=query)

        for data in allDoc['hits']['hits']:
            print(data['_source']['date'])
            # for val, buckets in enumerate(data['_source']):
            #     if val>1:
            #         print('data error')
            # print(buckets['_source'])
            # datas.append(buckets['_source'])
        return datas
    except Exception as e:
        print('query1 error', e)
        return datas

if __name__ == '__main__':
    es = Elasticsearch(['127.0.0.1:9200'])
    index_name = 'event_tk'
    query_2coll(index_name)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

elasticsearch

elasticsearch collapse折叠聚合的相关文章

在 Elastic 搜索中加载示例数据集时出错

您好我正在尝试加载示例数据集参考弹性搜索文档 https www elastic co guide en elasticsearch reference current exploring your data html但是当我尝试运行指示
ElasticSearch 嵌套查询 - 排除父文档

尝试排除其中子文档之一与查询不匹配的顶级文档对于下面的示例我尝试排除其嵌套作业之一具有的所有文档current true 并与company name Elastic 但由于嵌套作业文档之一与current false和公司name E
在 ElasticSearch API 应用程序中找不到 NodeBuilder

我正在尝试实现 Elasticsearch API 我的系统接受 nodeBuilder 时出现错误这是代码 import org elasticsearch action index IndexResponse import org e
ElasticCloud 的 ElasticSearch 身份验证错误？

我刚刚在 ElasticCloud 上设置了一个新的 ElasticSearch 集群我正在尝试遵循帮助文档 https cloud elastic co help 它说您可以按如下方式发布文档 curl https
弹性搜索文档计数

我正在运行 2 2 版本的 Elastic 搜索我已经创建了索引并加载了示例文档我发现其中有些问题当我给予 GET index type count 我得到了正确的答案 count 9998 shards total 5 succes
无法使用docker在Apple Mac芯片M1上启动elasticsearch

在发布这个问题之前我浏览了许多链接例如 Kibana 无法在 Mac M1 上使用 docker 连接到 ElasticSearch https stackoverflow com questions 73160632 kibana c
无法使用 java 8 在 Windows 10 上安装 elasticsearch 5.1.1

我正在尝试在安装了 java 8 111 的 Windows 10 笔记本电脑上安装 ElasticSearch 5 1 1 当我尝试安装 Elastic search 时触发错误 C Users 用户名 Downloads elastic
Elasticsearch 关于“空索引”的查询

在我的应用程序中我使用了几个elasticsearch索引它们在初始状态下不包含索引文档我认为这可以称为空该文档的映射是正确且有效的该应用程序还有一个包含实体的关系数据库这些实体可能具有在 elasticsearch 中关联的
Elasticsearch：根据类型对不同字段进行排序

我的索引中有两种类型 Event and City 我正在尝试按日期将它们全部排序但是每种类型的日期字段名称都不同为了Event该值是在updated at领域和City日期是在update at其嵌套对象之一中的字段city eve
设置 verify_certs=False 但 elasticsearch.Elasticsearch 因证书验证失败而引发 SSL 错误

self host KibanaProxy 自我端口 443 self user 测试 self password 测试我需要禁止证书验证使用选项时它与curl一起使用 k在命令行上但是在使用 Elasticsearch pytho
ElasticSearch - 尝试在 Windows 上启动服务时出错

昨天我在 Windows Server 2012 R2 上完成了 ElasticSearch 的安装并且能够正常启动 ElasticSearch 服务今天我安装了 Kibana 和 X Pack 但在尝试启动 ElasticSear
适用于elasticsearch 7.0.1 和 kibana 7.0.1 的 docker-compose.yml

我在 Windows 10 上将 Docker Desktop 与 Linux 容器结合使用并希望通过 docker compose 文件启动最新版本的 elasticsearch 和 kibana 容器使用 6 2 4 等旧版本时一切
聚合多个递归logstash

我正在使用带有输入 jdbc 的 Logstash 并且希望通过聚合将一个对象嵌入到另一个对象中如何使用添加递归即在另一个对象中添加一个对象这是一个例子 index my index type test id 1 version 1
在 ElasticSearch 中，我应该对单独但相关的实体使用多个索引吗？

添加索引的开销有详细记录但我无法找到有关何时针对要建立索引的各种文档类型使用多个索引的良好信息这是一个说明问题的通用示例假设我们有以下实体产品名称产品 ID 产品类别 ID 商店列表产品类别名称 ProductCategor
Elasticsearch 可搜索合成字段

假设源文档 JSON 中存在几个名为的字段 a and b 属于类型long 我想构建一个综合字段例如c 通过用下划线连接前面字段的值和将其索引为keyword 也就是说我正在研究一个可以通过如下虚构的部分映射来支持的功能 a typ
Elasticsearch 中的别名数量（全局和/或每个索引）是否有限制？

我开始为我的项目研究elasticsearch 具体来说是1 5版本我正在考虑使用别名将客户端应用程序从复杂的索引设置中抽象出来我最终可能会得到 20 到 50 个索引每个索引有 10 到 30 个别名这将达到 1500 个别名我
query_string 和 multi_match 有什么区别？

运行此查询时 query string query text fields field1 field2 multi match query text fields field1 field2 有什么不同何时使用其中之一何时使用另一个 q
无法连接到docker中的elasticsearch容器

我正在尝试使用 docker 的官方 elasticsearch 镜像我遵循了本指南 https www elastic co guide en elasticsearch reference current docker html但是当
Elasticsearch 5.1 完成建议中的输出字段有什么好的替代方案吗？

在 ES 5 1 中索引数据时遇到的第一个错误是包含输出字段的完成建议映射 message MapperParsingException failed to parse nested IllegalArgumentException unk
如何查询elasticsearch大于和小于？

我想获取 1000 到 2000 之间的值我尝试了以下查询 query bool filter range price gte 1000 price lte 2000 但这并没有给出令

随机推荐

蓝桥杯算法训练VIP-方格取数

题目题目链接题解动态规划本题和这个题几乎是完全一样那个博客写的巨清楚所以这里不写了代码 include
Redis的Jedis连接池

Jedis本身是线程不安全的并且频繁的创建和销毁连接会有性能损耗因此我们推荐大家使用Jedis连接池代替Jedis的直连方式 public class JedisConnectionFactory private static fina
BDD100K数据集下载和标签格式转换问题

BDD100K数据集下载和标签格式转换问题数据集介绍加州大学伯克利分校的Berkeley DeepDrive数据集由超过100K的视频序列组成包含各种各样的注释包括图像级标记对象边界框可行驶区域车道标记和全帧实例分割数据集具
python中解决import matplotlib.pyplot as plt 出现报错：OSError: [WinError 193] %1 不是有效的 Win32 应用程序

先上代码 import matplotlib pyplot as plt squares 1 4 9 16 25 fig ax plt subplots ax plot squares plt show 在pycharm运行出现报错而在s
时间序列预测——时序卷积网络（TCN）

本文展示了使用时序卷积网络 TCN 进行时间序列预测的全过程包含详细的注释整个过程主要包括数据导入数据清洗结构转化建立TCN模型训练模型包括动态调整学习率和earlystopping的设置预测结果展示误差评估等完整的时
终于支持 markdown 格式了

print Hello MD
Pytorch虚拟环境搭建、训练unet、vit、yolov3

一搭建虚拟环境手把手教你在win10下搭建pytorch GPU环境 Anaconda Pycharm 老潇的摸鱼日记博客园 cnblogs com https www cnblogs com victorxiao p 1351225
华为奇葩面试题登上热搜！「一头牛重800公斤一座桥承重700公斤，请问牛怎么过桥？」

今日知乎上有一道华为公司面试题一头牛重800公斤一座桥承重700公斤问牛怎么过桥目前这个话题已经登上了知乎热搜第三这个问题到底是互联网大厂奇葩亦或是常规操作这到底是道德的沦丧还是下面就一起来看看神通广大的知乎热心网友是怎么解答的
【基于python实现UI自动化】1.0 selenium工具介绍

基于python实现UI自动化 1 0 selenium工具介绍 Selenium介绍 Selenium的发展 Selenium 1 Selenium 2 Selenium 3 Selenium 4 Selenium介绍 Selenium是
【STM32WLE5之LoRa# 系列2、易智联LM401 评估板PingPong工程移植】

STM32WLE5之LoRa 系列2 易智联LM401 评估板PingPong工程移植前言一开发环境 1 STM32CubeMX与STM32CubeIDE软件安装 2 下载STM32WL固件库二硬件平台三 PingPong例程的
工厂模式（创建型）

工厂模式有简单工厂模式工厂方法模式抽象工厂模式简单工厂模式简单工厂模式的方法为通过一个工厂工厂里面有一个创建的函数通过输入type 通过switch的匹配匹配成功的话创建相应的产品没有的话返回nullptr 具体的结
Spring cache

文章目录 Spring cache 简单使用注解缓存 Cacheable 键生成器自定义的键生成器带条件的缓存 CachePut CacheEvict Caching CacheConfig 使用Spel表达式使用xml配置缓存以
win10如何添加开机自己启动软件

win10添加开机自启动软件的方法 Win10添加自动运行软件的方法打开C Users 用户 AppData Roaming Microsoft Windows Start Menu Programs Startup 注意此处的用户是具体
趣链科技解读区块链技术及其产业应用

陀螺公开课是定位于区块链行业的线上精品教育课程以视频的形式传递行业思考内容板块包括技术前沿产业案例领袖视野学术思想名人演讲等通过邀请行业领域专家线上讲课及开放高质量视频投稿为用户提供优质的区块链学习内容陀螺公开课第二期
linux-bash基础特性-通配符

globbing 通配符文件名通配整体文件名匹配而非部分匹配模式元字符匹配任意长度的任意字符 ab ab开头的单词 ab 包含ab的单词 ab ab结尾的单词 a b 包含a b的单词匹配任意单个字符 ab ab开头的三个字符
Ubuntu Linux操作系统

Ubuntu Linux操作系统 Ubuntu是一个Linux发行版的操作系统软件这意味着它运行在使用Linux的应用程序内核和库 Ubuntu的开发和由Canonical公司即成立由马克沙特尔沃思资助的南非公司赞助的Ubuntu
Android自定义权限permission

http www tuicool com articles BZZrimu ndroid是一种特权分隔的操作系统在Android上运行的每个应用程序都具有各自独立的系统标识 Linux用户ID和组ID 系统各部分有不同的身份标识因此 L
五眼网络安全机构联合发布事件响应指南

聚焦源代码安全网罗国内外最新资讯编译奇安信代码卫士团队位于澳大利亚加拿大新西兰英国和美国的网络安全机构联合发布关于检测恶意活动和事件响应的安全建议报告指出最佳实践事件响应程序始于对工件日志和数据的收集及其删除分析之后在
数据结构---求用二进制表示的数字最右侧的1的位置

public static void main String args int e 700 int rightvalue e e 1 int rightPosition 0 for int i rightvalue i gt 1 i i g
elasticsearch collapse折叠聚合

目前经验折叠只能用于筛选数据不能进行聚合需要聚合自己在内存中聚合 from elasticsearch import Elasticsearch def query 2coll index name query size 10000

elasticsearch collapse折叠聚合

elasticsearch collapse折叠聚合 的相关文章

随机推荐

热门标签

elasticsearch collapse折叠聚合的相关文章