search_after 在弹性搜索中如何工作？

2024-05-12

我一直在尝试在我们的应用程序中使用 Elasticsearch，但分页限制为 10k 对我们来说实际上是一个问题，并且由于必须超时问题，滚动 API 也不是推荐的选择。

我发现 Elasticsearch 有一个叫做 search_after 的东西，它是支持深度分页的理想解决方案。我一直试图从文档中理解它，但它有点令人困惑，并且无法清楚地理解它是如何工作的。

假设我的文档中有三列，id, first_name, last_name，这里的ID是唯一的主键。

{
    "size": 10,
    "query": {
        "match" : {
            "title" : "elasticsearch"
        }
    },
    "sort": [
        {"id": "asc"}      
    ]
}

我可以使用上面的查询来使用 search_after 功能吗？我在他们的文档中读到，我们必须在排序中使用多个唯一值，而不仅仅是一个（ID），但正如你所知，在我的数据集中我只有 ID 是唯一的。我可以做什么来将 search_after 用于我的数据集示例？

我无法理解所述问题，如果我使用一个独特的决胜局进行排序？有人可以帮忙用外行人的话解释一下吗？

https://www.elastic.co/guide/en/elasticsearch/reference/6.8/search-request-search-after.html

应使用每个文档具有唯一值的字段作为排序规范的决胜局。否则排序顺序为具有相同排序值的文档将是未定义的，并且可能导致结果缺失或重复。 _id 字段具有唯一值每个文档，但不建议将其用作决胜局直接地。请注意，search_after 会查找第一个文档完全或部分匹配决胜局提供的价值。因此如果一个文档的决胜局值为“654323”，您在 search_after 中搜索 “654”它仍然会匹配该文档并返回找到的结果在它之后。文档值在此字段上被禁用，因此对其进行排序需要在内存中加载大量数据。相反，建议复制（客户端或使用一组摄取处理器）的内容启用并使用 doc 值的另一个字段中的 _id 字段这个新字段作为排序的决胜局。

就你而言，如果你的id字段包含唯一值并且具有类型keyword（或数字）那么你绝对没问题，可以使用它来分页search_after.

因此，第一个电话将是您问题中的电话：

{
    "size": 10,
    "query": {
        "match" : {
            "title" : "elasticsearch"
        }
    },
    "sort": [
        {"id": "asc"},
        {"score": "desc"}      
    ]
}

在你的回复中，你需要查看最后一次点击并采取sort最后一次点击的值：

{
    "_index" : "myindex",
    "_type" : "_doc",
    "_id" : "100000012",
    "_score" : null,
    "_source": { ... },
    "sort" : [
      "100000012",                                <--- take this
      "98"                                        <--- take this
    ]
}

然后在下一次搜索调用中，您将在中指定该值search_after

{
    "size": 10,
    "query": {
        "match" : {
            "title" : "elasticsearch"
        }
    },
    "search_after": [ "100000012", "98" ],        <--- add this
    "sort": [
        {"id": "asc"}      
    ]
}

下一个结果集的第一个命中将是id: 100000013。就是这样。没有更多的事情了。

你所指出的问题与你无关如果你总是用 full 排序id values。它的工作原理是你总是使用最后一个id先前结果的值。如果你要添加"search_after": ["1000"]那么你就会遇到他们提到的问题，但你没有理由这样做。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

elasticsearch

ElasticStack

search_after 在弹性搜索中如何工作？的相关文章

Logstash删除类型并保留_type

我有一个logstash 客户端和服务器客户端将带有logstash的udp输出的日志文件发送到服务器服务器也运行logstash来获取这些日志在服务器上我有一个 json 过滤器它会在实际日志的字段中提取 json 格式的消息
如何在弹性搜索中生成多个布尔查询的查询

我想使用 spring 框架在 elasticsearch 中动态生成多个布尔运算的查询我在elasticsearch中的数据就像 masterID
局部敏感哈希 - Elasticsearch

有没有允许在 Elasticsearch 上使用 LSH 的插件如果是的话您能否指出该位置并告诉我如何使用它谢谢编辑我发现ES使用了MinHash插件我怎样才能用这个来比较文件呢查找重复项的最佳设置是什么有一个Elastic
从 App Engine 连接到 Kubernetes 引擎

我们希望使用应用程序引擎灵活的流程来更新位于 Google Kubernetes Engine 上的 ElasticSearch 索引我们需要通过 http s 地址连接到 ElasticSearch 推荐的方法是什么我们不想将集群暴露
如何编写Elasticsearch多个必须脚本查询？

我想使用查询来比较多个字段我有字段 1 到 4 我想搜索字段 1 大于字段 2 的数据并且下面的查询工作正常 size 0 source field1 field2 field3 field4 sort query bool filte
ElasticSearch - 仅获取与搜索响应中所有顶级字段匹配的嵌套对象

假设我有以下文档 id 1 name xyz users name abc surname def name xyz surname wef name defg surname pqr 我只想获取与搜索响应中的所有顶级字段匹配的嵌套对象我
弹性搜索文档计数

我正在运行 2 2 版本的 Elastic 搜索我已经创建了索引并加载了示例文档我发现其中有些问题当我给予 GET index type count 我得到了正确的答案 count 9998 shards total 5 succes
无法使用docker在Apple Mac芯片M1上启动elasticsearch

在发布这个问题之前我浏览了许多链接例如 Kibana 无法在 Mac M1 上使用 docker 连接到 ElasticSearch https stackoverflow com questions 73160632 kibana c
如何使用ElasticSearch来实现社交搜索？

我正在尝试使用 ElasticSearch 创建具有社交功能的商业搜索我有一个企业目录用户可以通过不同的方式与这些企业进行交互通过查看它们检查它们等当用户搜索商家时我希望能够在结果顶部向他们显示他们的朋友与之互动过的商家或根据
弹性搜索 - search_after 参数

我读了这个doc https www elastic co guide en elasticsearch reference 5 0 search request search after html要理解 search after 并有两个
在 Elasticsearch 中删除文件后回收磁盘空间

当我从 Elasticsearch 中删除文档时为什么我的总大小保持不变尽管由于没有以前存储的数据而明显小得多我读过有关索引优化的内容但我不确定这是什么或如何做到这一点 Thanks 我确信 SO 和 Google 上都有大量与
从 node.js 创建对 AWS ES 实例的有效签名请求

我试图找到一个示例说明如何连接到 Node js 中的 AWS ES 实例然后通过一个简单的请求访问 ES 集群我正在尝试使用elasticsearch节点包 https www npmjs com package elasticse
如何增加vm.max_map_count？

我正在尝试在 Ubuntu EC2 计算机 t2 medium 中运行弹性搜索但我收到消息最大虚拟内存区域 vm max map count 65530 太低至少增加到 262144 我怎样才能增加vm max map count v
即使禁用安全性，OAuth 令牌 API 也无法在 Elastic Search 中工作

我是 Elastic search 新手使用 Elastic search 版本 7 7 1 我想通过以下方式生成 OAuth 令牌弹性搜索文档 https www elastic co guide en elasticsearch re
Elasticsearch 在 Mac 上存储数据的位置

类似的问题this one https stackoverflow com questions 24694201 where are data files of elasticsearch on a standard debian inst
Elastic Search 索引经常被删除[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在 google cloud 上对个人项目运行弹性搜索并将其用作我的应用程序的搜索索引从最近三天开始索引就被神秘地删除了我不知
为 Logstash 中的新字段设置 Elasticsearch Analyzer

通过使用GROK filter 我们可以向Logstash添加新字段但是我想知道如何为该特定字段设置分析器例如我有一个新的 id 字段其中有一个字段例如a b 但是 Elasticsearch 附带的普通分析器会将其分解为a a
适用于elasticsearch 7.0.1 和 kibana 7.0.1 的 docker-compose.yml

我在 Windows 10 上将 Docker Desktop 与 Linux 容器结合使用并希望通过 docker compose 文件启动最新版本的 elasticsearch 和 kibana 容器使用 6 2 4 等旧版本时一切
在“spring-data-elasticsearch”4.0.4.RELEASE中，如何将SearchHits转换为Page？

In spring data elasticsearch4 0 4 发布 ElasticsearchRestTemplate s queryForPage 方法已弃用需要使用search 相反它返回SearchHits代替Page 那么
使用文件的 AWS Elasticsearch 同义词

我正在尝试使用文件将同义词添加到弹性搜索如本链接所示但它给了我以下错误https www elastic co guide en elasticsearch reference 5 2 analysis synonym tokenfil

随机推荐

在一条语句中对多个变量进行相同的赋值

有没有一种方法可以为不同的变量分配相同的值而无需在单个语句中构造数组例如如果我有变量a b c d and e 我可以分配类似的东西吗 a b c d e 10 0 我知道我可以用一行来做 a 10 0 b 10 0 c 10 0 d
可以禁用“应用程序错误”对话框吗？

我使用 Hudson 作为持续集成服务器来测试 C C 代码不幸的是我在某个地方有一个错误导致内存损坏因此在某些 Windows 计算机上我有时会收到一个应用程序错误对话框解释一条指令引用了无法读取的内存弹出此对话框并基本上挂
Java switch 语句：需要常量表达式，但它是常量

因此我正在研究这个具有一些静态常量的类 public abstract class Foo public static final int BAR public static final int BAZ public static fin
在 Swift async/await 中，我可以使用 Lock 还是 Semaphore

这不是问题这是一个想寻求帮助以及专业指导的问题根据文档 Sendable 类型可以在 Swift Concurrency 中安全地传递在旧项目中并非所有类型都是可发送的并且可能使用Cocoa类型但它们是线程安全的例如 class
Yocto“无法运行 qemu：无法初始化 SDL（x11 不 > 可用）”

所以我在本地构建服务器上安装了 Yocto 因为谁希望大规模构建占用他们的工作区 amirite 主机和服务器是Arch Linux 4 19 44 1 lts 无论如何我只是从找到的快速构建页面运行示例here https www yo
我们可以在没有 hibernate 的情况下使用 jpa 吗

我是 JPA 的新手根据我的理解 JPA 是规范 Hibernate 实现 JPA 并提供附加功能以及 JPA 方法但我正在浏览 JPA 教程其中使用EntityManager对象我们可以对数据执行 CRUD 而无需使用 Hibern
Drupal Views 如何过滤与日期范围重叠的项目

在 Drupal 中我使用 CCK 将日期时间字段添加到我的自定义数据类型中它插入开始日期和结束日期字段这就是我想要的现在我希望视图过滤并仅显示日期范围开始日期和结束日期与今天日期重叠的项目关于如何在视图上设置它有什么想法吗
我如何知道我的 iOS 应用程序的蜂窝网络访问是否被禁用？

我有一个 iOS 应用程序它在应用程序启动时发出一些小型网络请求资源更新等如果用户在 iOS 设置中关闭应用程序的蜂窝网络访问他们每次启动时都会收到 iOS 的有关网络使用情况的提示有没有办法以编程方式知道此应用程序的蜂窝数据已被
TypeScript：实现具有调用签名和索引签名的接口

我想创建一个满足此类型的对象 interface I string x string number 并通过 TypeScript 类型检查理想情况下我希望不需要诉诸技巧例如使用any作为中间步骤我知道可以将其他字段添加到具有调用签名
如何在MySQL选择查询中编写正则表达式？

我尝试过这个表达 b word w b i比较一个word对照其他单词列表来查找重复项我用了preg math all 效果很好我想做同样的事情但这次检查从 mysql 数据库检索到的单词这是我写的 SELECT FROM tabl
如何在 Nuxt 中设置 netlify 表单

当我通过添加带有 a 的链接来使用 vue router 导航到表单时
进程间并发文件写入

我需要将不同进程的日志数据写入单个文件我正在使用 Windows Mutex 它需要公共语言运行时支持 Mutex m gcnew Mutex false MyMutex m gt WaitOne File Open and Write
Inno Setup 在 Windows Vista/7 及更高版本上安装到 AppData\Roaming，但在 Windows XP 上安装到应用程序数据

我为 inDesign 制作了几个脚本现在我想将它们全部分发到一个安装文件中由于 inDesign 脚本驻留在 XP 和 Vista 或更高版本上的不同位置因此我遇到了一些问题我编译的设置在 Windows XP 下运行良好但不
数字解析怪异

这行代码 Console WriteLine Convert ToInt32 23 23 1 抛出异常这行代码 Console WriteLine Convert ToDouble 23 23 1 打印 2324 有谁知道为什么会这样我
Web应用程序结构和部署

我们的产品是一个 ASP Net Web 应用程序目前我们在 Visual Studio 中使用网站项目但研究使用 Web 应用程序项目已经有一段时间了我目前正在研究它们以便我们能够改进我们的部署过程我们有一个在不同客户之间共享
如何创建QWidget的屏幕截图？

我在 Qt Creator 中做作业在其中绘制 QWidget 并且需要保存此 QWdiget 的某些部分我试图解决这个问题 QPixmap pixmap pixmap copy rectangle rectangle is part
如何将 Devise 的“超时”模块添加到现有的 Devise 安装中？ - 轨道 3.1

这些是将模块添加到现有 Devise 安装的说明 https github com plataformatec devise wiki How To change an already existing table to add devis
如何将 create-react-app 与较旧的 React 版本一起使用？

使用时创建反应应用程序 https github com facebookincubator create react app with 自定义反应脚本 https github com kitze custom react scripts
Javascript 文件到 Blob

我正在使用 Cordova Media 将音频录制到空文件中要上传它我需要文件的内容类型我正在尝试将文件转换为 Blob 以便我可以设置内容类型但是我正在努力将文件转换为 Blob state cordova localDirect
search_after 在弹性搜索中如何工作？

我一直在尝试在我们的应用程序中使用 Elasticsearch 但分页限制为 10k 对我们来说实际上是一个问题并且由于必须超时问题滚动 API 也不是推荐的选择我发现 Elasticsearch 有一个叫做 search after

search_after 在弹性搜索中如何工作？

search_after 在弹性搜索中如何工作？ 的相关文章

随机推荐

热门标签

search_after 在弹性搜索中如何工作？的相关文章