elasticsearch有复合索引吗？

2024-02-12

我想知道elasticsearch是否需要预先定义复合索引。通过复合索引，我的意思是类似于 mongodb 的东西。

db.collection.ensureIndex( { 字段1: 1, 字段2: 1, 字段3: 1 } )

或者类似于 mysql db 的东西。

在 mytable(field1, field2, field3) 上创建索引 adhoc_index;

所以我处理的数据非常扁平（大部分只是csv格式）。它看起来像下面这样（为了完整性）。

字段 1、字段 2、...、字段 N

字段的数量是任意的。一个数据集可能有 10 个字段，另一个有 20 个字段，另一个有 1000 个字段。我基本上将每一行转换为如下所示的 JSON 文档。

{
 "field1" : "value1",
 "field2" : "value2",
 ...
 "fieldN" : "valueN"
}

将 A、B 和 C 表示为字段的三个互斥子集：{field1, field2, ..., fieldN}。在任何给定时间，我都必须构建一个动态查询来过滤 A=a、B=b 和 C=c 的记录。

例如，

A = {字段1}，B = {字段2，字段3}，C = {字段6}
A = {字段2}，B = {字段1}，C = {字段1000，字段50}

所以我的elasticsearch DSL查询可能看起来像下面这样（我自己不确定这是否正确，但只是为了说明）。

"bool" : {
 "must" : [
  {"term" : { "field1" : "val1" },
  {"term" : { "field2" : "val2" },
  {"term" : { "field3" : "val3" },
  {"term" : { "field4" : "val4" }
 ]
}

基本上，这个查询说，“给我所有包含 field1=val1、field2=val2、field3=val3、field4=val4 的文档”。

我之所以问这个关于elasticsearch的问题是因为我在互联网上搜索复合索引时找不到明确的答案。他们还需要吗？

我也在评估 mongodb 和 mysql，我认为它们不能很好地适应我的情况，因为这些复合/复合索引必须先验定义，并且直到运行时我才会获得该信息字段需要一起建立索引以优化查询速度。当然，使用mysql，一旦我找出哪组字段需要一起索引（以及按什么顺序），我可以返回创建索引，但如果数据集很大（数据集的数量），这可能需要很长时间行数 > 100 万）。

我是否可以通过弹性搜索直接获得这个复合索引功能？意思是，我什至不必接触索引映射文件/定义？

ElasticSearch 没有复合索引，但它在查询多个索引并将它们相交（相交位向量 FTW）方面非常高效。

大多数时候，不需要复合索引，即使对于您提到的查询 4 个不同字段的情况也是如此。 ElasticSearch 会愉快地查询 4 个不同的索引，然后以有效的方式对结果进行交叉。根据我的经验，在类似情况下，它的性能可以与 MongoDB 相媲美并超越。

如果绝对必须有复合索引，则可以考虑对辅助字段建立索引，该字段的值是要索引的值的复合。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Lucene

elasticsearch

elasticsearch有复合索引吗？的相关文章

将 Elasticsearch 结果导出到 CSV 文件

我正在尝试将使用以下查询找到的结果导出到桌面上的 CSV 中这是我第一次使用 Elasticsearch 和 cURL 所以我对如何做到这一点感到困惑 from elasticsearch import Elasticsearch es
在ElasticSearch中搜索没有时间的日期字段值

我的数据中有一个日期字段为 type date format dateOptionalTime 现在我的日期字段和值是 INITIAL EXTRACT DATE 2015 04 02T06 47 57 78 05 30 在搜索时我仅根据
Solr 中的多值字段排序

我有一个 Solr 索引将每个产品的价格存储在多值字段中我需要按价格对结果集进行排序其中价格从低到高从高到低我尝试对价格进行排序它显示错误您无法对 multivalued True 字段进行排序下面是我的 solr XML
Elasticsearch 崩溃后无法恢复

磁盘空间不足导致 Elasticsearch 分片崩溃三个节点现在为红色两个节点已恢复它们的状态为黄色 ES 的 CPU 利用率为 150 内存利用率很高正在尝试恢复它们但似乎存在一些版本匹配冲突我清理了磁盘空间并删除了分片的
在 ElasticSearch 7+ 中，如何搜索所有文本字段？

我想在 Elasticsearch 7 3 中存储的文档中搜索单词我希望在以前版本的 Elasticsearch 上运行的一个示例是 query bool must match all oliver must not should fro
如何在logstash.conf文件中创建多个索引？

我使用以下代码在logstash conf中创建索引 output stdout codec gt rubydebug elasticsearch host gt localhost protocol gt http index gt tr
在elasticsearch结果中显示不匹配的单词

我想显示返回文档的多单词查询不匹配哪些单词是否有查询类型或参数来实现此目的通常此类不匹配的单词会以删除线字体显示给用户我得到答案后的示例查询 POST posts search query bool should match nam
从中间部分匹配完成建议elasticsearch

我有一个名为搜索建议具有以下 search suggest type completion analyzer simple payloads true preserve separators false preserve position
需要在 java api 中的 Solr 搜索中搜索文本及其周围的几行

我正在使用 solr 7 7 2 并且我使用 solrj 在 Solr 中编写了一个 Java 程序该程序在一个巨大的文本文件中搜索单词我使用以下代码来显示代表整个文本的搜索结果 SolrQuery params new SolrQue
如何在不更改设置的情况下不区分大小写排序

我的索引名称是 data new 下面是插入索引的代码 test id 1 name A professor Bill Cage accounting id 2 name AB professor Gregg Payne engineeri
Solr 过滤查询 - 字符串与整数

假设我正在尝试查询一堆具有类别的文档并且我想将查询限制为指定的类别据我所知这只是使用 fq 参数过滤器查询我想知道将参数设置为整数而不是字符串或数据通常的情况是否会提高性能我只是会在右侧犯错但我想我应该仔细检查一下以防万一
在弹性搜索中使用 GET/POST 时的不同结果

我正在通过 Elastic Search Head 插件尝试弹性搜索当我通过 POST 提交查询时结果符合预期但是当我使用 GET 尝试相同的查询时我总是会返回索引中的所有值那么如何通过 GET 将查询传递到弹性搜索服务器以
在Windows Xampp上安装和使用elasticsearch php客户端

我下载的是elasticsearch 5 1 1 zip来自https www elastic co downloads elasticsearch https www elastic co downloads elasticsearch
如何修复从 React 对 Elasticsearch 进行 API 调用时的“混合内容：”错误

我正在使用 firebase 的 elasticsearch 的 bitnami 版本我发现它只能连接到http并不是https当我使用邮递员尝试时我的create react app已部署到 firebase 我得到Mixed Con
Elastic Beanstalk 添加多个 ssl 证书

我有一个 Docker Django api 应用程序可以从多个域 abc xyx com 或 def lmn com 调用我已从 Elastic beanstalk 中的配置控制台成功添加了 abc xyz com 的 ssl 证书
cursorMark是无状态的以及它如何解决深度分页

作为指定here https cwiki apache org confluence display solr Pagination of Results光标标记是无状态的但我不明白它是如何解决无状态的深度分页问题的 solr 是否按唯一
尝试在 ElasticSearch 中查询和聚合，但聚合不起作用 - elasticsearch.js 客户端

我尝试查询我的数据集有两个目的匹配一个术语可转售 true 按价格对结果进行排序最低到最高数据集文档是 data resellable true startingPrice 0 id 4emEe r x5DRCc5 buyNowP
如何增加vm.max_map_count？

我正在尝试在 Ubuntu EC2 计算机 t2 medium 中运行弹性搜索但我收到消息最大虚拟内存区域 vm max map count 65530 太低至少增加到 262144 我怎样才能增加vm max map count v
ElasticSearch 映射对分组文档进行折叠/执行操作的结果

有一个对话列表每个对话都有一个消息列表每条消息都有不同的字段和action场地我们需要考虑到在对话的第一条消息中使用了动作A 在几条消息之后有使用的动作A 1过了一会儿A 1 1等等有一个聊天机器人意图列表对对话的消息操作进行分组
NEST 1.0：请参阅 Fiddler 上的请求

我刚刚更新到 NEST 1 0 我在远程服务器不是本地主机上有 Elastic Search 通常我在使用 Fiddler 发送和接收请求时没有任何问题更新后 bammm 没有检测到任何请求但我的应用程序发出这些请求没有任何问题你

随机推荐

SQL：从两个表中选择相似的列

我有一个包含两个表的数据库 Table1 and Table2 他们都有一个共同的专栏 ColumnA 这是一个nvarchar 如何从两个表中选择此列并将其作为结果集中的单个列返回所以我正在寻找类似的东西 ColumnA in Tabl
不同时区的同一日期

我的问题是如何在不同时区获得相同的日月年小时分钟秒例如 var now moment valueOf var result1 moment now format DD MM YYYY HH mm SS Z 在我的时区我得到这样
在 Flutter 中实现双向列表视图

Flutter中如何实现双向滚动视图 ListView 有一个scrollDirection 字段但它只能采用Axis horizo ntal 或Axis vertical 有可能两者兼得吗这是使用外部的潜在解决方案SingleChil
如何将命令的输出重定向到环境变量中定义名称的文件？

我想将文件夹下存在的所有文件的绝对路径存储到文本文件中比方说temp txt 我正在使用此命令来执行此任务 dir s b a d gt D my work temp txt 当我重定向到硬编码到批处理文件中的文件名时上述命令工作正常
高效地将两个整数 x 和 y 转换为浮点数 x.y

给定两个整数 X 和 Y 在 C 中将它们转换为 X Y 浮点值的最有效方法是什么 E g X 3 Y 1415 gt 3 1415 X 2 Y 12 gt 2 12 以下是我的机器上的一些鸡尾酒餐巾基准测试结果适用于将两个ints to
AngularJS：单击时更改字体真棒图标颜色和背景

我是 angularJS 的新手我想要的是我有一些社交链接图标和文本框默认情况下linkedin图标被选中当我点击 facebook 图标时它的颜色应该更改为蓝色背景带有 facebook 链接的文本框也应该更改 linkedi
用于检测用户是否单击 XFBML 页面中的“喜欢”按钮的事件处理

我有一个 Facebook 连接应用程序画布 IFrame 应用程序其中有一个Like控制粉丝专页我想检测用户何时单击Like按钮能够显示附加信息折扣优惠券代码我用的是最新的JavaScript API http develope
PouchDb - 删除文档内的对象

我是一名意大利 PouchDb 和 AngularJS 开发人员我的 json 文档是 id 6 rev 3 f7283d7683cd6fb15753f494aad1d49f name Ivrea owners owner id 1 na
angular.forEach 和对象

问题我正在做我认为是但也许不是一个简单的angular forEach在数组上然后使用 resource根据返回的每个值进行调用正如我所期望的每次调用的结果都是一个对象但是我无法让这些对象以angular forEach 文档
JavaScript-如何在不使用 charAt 方法的情况下返回该索引处的字符

我有一个接受两个参数字符串和索引的函数如何编写一段代码在不使用 javascript 内置方法 charAt 的情况下返回该索引处的字符例如 getIndex great 1 应该返回 r 创建函数如下 function getInd
当 Markdown 包含水平线时，“生成 PDF 时出错”： --- 或 ***

当我的 Markdown 文件包含水平线或时我收到有关 Linethickness gt Protect 的错误我知道最近 MiKTeX 出现了问题但我不确定它们是否适用于此从昨天早上开始我就一直遇到这个问题当时我正在尝试让
Android 底部导航 Activity 在 onCreate 中出现空指针异常

我向我的项目添加了一个底部导航活动但是当我启动相关活动时它给出了空指针异常它说异常是在第 28 行触发的在 lk apiit eea mobile Activities CompanyProfile onCreate Company
PHP：获取关联数组的第n项

如果你有一个关联数组 Array uid gt Marvelous status gt 1 set later gt Array 0 gt 1 1 gt 0 op gt Submit submit gt Submit 如果您想访问第二项您
在特定桌面上启动进程

如何在特定的 Windows 桌面上启动 Windows 进程最好我们正在寻找一种在 Windows 8 1 上也支持的解决方案即不依赖于 Windows 10 的新任务视图功能我知道用户在 Windows 8 1 中不容易访问不
使用 Backbone Marionette 使用现有渲染的 HTML 显示视图

我有一个像所附的应用程序布局上面的面板已经到了页面即在服务器的 HTML 响应中当用户与该面板中的元素交互时下面的动态面板的内容会相应地发生变化我研究了 Backbone Marionette 的各种视图类型和区域管理器但我仍然
更改 OS X 菜单栏中 Tkinter 应用程序的标题

当您在 Python 中使用 Tkinter 创建带有 GUI 的应用程序时应用程序的名称在 OS X 的菜单栏中显示为 Python 如何才能让它显示为其他内容我的答案是基于埋在中间的一个一些论坛 http compgroups ne
statespace.SARIMAX模型：为什么模型使用所有数据来训练模式，并预测训练模型的范围

我按照教程研究了SARIMAX模型 https www digitalocean com community tutorials a guide to time series forecasting with arima in python
Dagger 2 活动注入不起作用

我正在尝试新的 dagger 2 这是我第一次实现它但我无法让它工作我想我已经明白了这个概念并且理解了这个例子here https github com LiveTyping u2020 mvp 我尝试复制相同的结构只是针对我的示例进
Java Process.waitFor() 和 Readline 挂起

首先这是我的代码 import java io import java util Date import com banctecmtl ca vlp shared exceptions public class PowershellTes
elasticsearch有复合索引吗？

我想知道elasticsearch是否需要预先定义复合索引通过复合索引我的意思是类似于 mongodb 的东西 db collection ensureIndex 字段1 1 字段2 1 字段3 1 或者类似于 mysql db 的东西

elasticsearch有复合索引吗？

elasticsearch有复合索引吗？ 的相关文章

随机推荐

热门标签

elasticsearch有复合索引吗？的相关文章