Elasticsearch 对具有部分边缘 ngram 补全的数组字段的搜索建议

2024-04-07

我正在尝试根据文档中的字符串数组构建一个建议器，它类似于this one https://stackoverflow.com/questions/20789224/elasticsearch-autocomplete-search-on-array-field但有几个区别：completion suggester来自 Elasticsearch 的功能并不完全符合我的要求（在过滤和前缀匹配方面），因为我需要一个边缘 ngram，它可以作用于句子中的任何单词，且不区分重音。让我用一个例子来澄清。

假设我有以下索引文档。我想根据查询建议“标签”q（我不关心文档本身，只关心tag与我的查询相匹配）

[
  { "tags": [ "société générale", "consulting" ] },
  { "tags": [ "big data", "big", "data"] },
  { "tags": [ "data" ] },
  { "tags": [ "data engineering" ] }
  { "tags": [ "consulting and management of IT" ] }
]

我想将前缀与重音容差相匹配，以下查询/响应突出显示了我需要的内容

(1) q = "societe" or q = "societe generale"应该返回[ "société générale" ]--> 不区分重音
(2) q = "big data"应该返回[ "big data" ]--> 前缀“big”和“data”必须在字符串中
(3) q = "data"应该返回[ "big data", "data", "data engineering" ],--> 句子中的任何位置（但作为前缀）
(4) q = "ata"不应返回任何内容（不是前缀）
(5) q = "IT consulting"应该返回[ "consulting and management of IT" ]--> 的两个前缀q无论顺序如何都应该匹配

如果我使用常规的completion映射器+建议器，

# assuming a mapping of "tags", of type 'completion' is configured in my ES
{
  suggest: {
    text: "big data",
    tags: {
      completion: {
        field: "tags",
      },
    },

除了 (2)、(4) 和 (3) 的 1/3 结果之外，这些情况几乎都不起作用

我可以构建一个自定义建议器或自定义搜索查询来满足我的要求和上面给出的示例吗？

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

elasticsearch

searchsuggestion

elasticsearch7

Elasticsearch 对具有部分边缘 ngram 补全的数组字段的搜索建议的相关文章

将 Spark Dataframe 保存到 Elasticsearch - 无法处理类型异常

我设计了一个简单的作业使用 Spark 从 MySQL 读取数据并将其保存在 Elasticsearch 中这是代码 JavaSparkContext sc new JavaSparkContext new SparkConf setA
将 CloudTrail 日志导入 Logstash

我正在尝试将日志从 CloudTrail 获取到 ElasticSearch 中以便我们可以更好地了解 AWS 账户中发生的情况我已经在我的机器 Ubuntu 14 04 上设置了 Logstash 和 ElasticSearch 并且
范围过滤器不适用于“gt”运算符，但适用于“lt”

我正在使用弹性搜索来索引我的文档并希望根据特定属性过滤文档这是我的代码 filter push range audience ethnicity asian gt 50 它不适用于 gt 运算符发回不一致的结果但适用于 lt 运算符
使用elasticsearch按一天中的时间累积流量

我正在接收来自大量客户端应用程序的请求事件我想使用elasticsearch 来找出我的最高流量点是什么时候我尝试过的一件事是使用嵌套直方图进行过滤器聚合然后使用嵌套的术语聚合通过脚本字段获取一天中的不同时间以下是我的尝试
如何在 Elasticsearch NEST 中序列化 JToken 或 JObject 类型的属性？

我正在将 Elasticsearch 引入 C API 项目我想利用现有的 API 模型作为搜索文档其中许多模型允许添加自定义数据点这些是使用JObject https www newtonsoft com json help htm
将带有脚本的管道聚合转换为 kibana

Can 管道聚合 https www elastic co guide en elasticsearch reference current search aggregations pipeline html在elasticsearch中转
如何连接Kafka和Elasticsearch？

我是Kafka的新手我使用kafka通过logstash收集netflow 可以并且我想将数据从kafka发送到elasticsearch 但是存在一些问题我的问题是如何将 Kafka 与 Elasticsearch 连接起来 net
如何用Python为ElasticSearch创建只读客户端？

我想从 ES 读取数据但不想意外向其中写入数据无索引操作这只是一种安全措施以便以后修改查询函数的其他人不允许插入数据当你说你想要只读客户端时客户端强调您系统中的同一集群可能有其他客户端然后阻止整个索引为只读将会阻止所有客户端的
使elasticsearch中的所有对象嵌套对象

是否可以让elasticsearch中的所有嵌套对象自动映射到默认嵌套的类型而不是对象是的您可以使用以下方法来做到这一点动态模板 https www elastic co guide en elasticsearch referenc
分面搜索的后过滤器和全局聚合之间有什么区别？

搜索界面中的一个常见问题是您想要返回结果的选择但可能想返回有关所有文档的信息例如我想查看所有红色衬衫但想知道什么其他颜色可供选择这有时被称为多面结果或者多面导航这Elasticsearch 参考中的示例 https ww
LogStash 无法从许可证中检索许可证信息。响应代码“401”通过 URL“http://elasticsearch:9200/_xpack”联系 Elasticsearch

我正在努力让 Docker LogStash 连接到 Docker ElasticSearch 并启用 xpack 安全性主要日志有 logstash 1 2020 05 20T22 41 03 950 WARN deprecation
了解elasticsearch如何在内部存储日期

我想了解 ES 如何在其索引内部存储日期值它会转换为 UTC 吗我有一个日期类型的字段 t 这是映射 t type date 现在当我向 ES 插入添加文档时它如何存储在索引中 t 1427700477165 从 Date now
match_none 有什么用？

我浏览了docs https www elastic co guide en elasticsearch reference current query dsl match all query html query dsl match no
ElasticSearch JavaAPI (SearchScroll)- search_context_missing_exception","reason":"找不到 id 的搜索上下文

我正在获取超过100k使用一个索引中的文档searchScroll并在所有字段中再添加一个字段100K文件然后再次将这些文档插入到另一个新索引中我正在使用SearchScrollapi 也在设置大小searchSourceBuilder
全文搜索 DynamoDB

以下情况我正在为我的客户将元素存储在 DyanmoDb 中 HashKey 是元素 ID Range Key 是客户 ID 除了这些字段之外我还存储一个字符串数组 gt 标签例如 Pets House 和多行文本我想在我的应用程序中
如何编写Elasticsearch多个必须脚本查询？

我想使用查询来比较多个字段我有字段 1 到 4 我想搜索字段 1 大于字段 2 的数据并且下面的查询工作正常 size 0 source field1 field2 field3 field4 sort query bool filte
ElasticSearch 嵌套查询 - 排除父文档

尝试排除其中子文档之一与查询不匹配的顶级文档对于下面的示例我尝试排除其嵌套作业之一具有的所有文档current true 并与company name Elastic 但由于嵌套作业文档之一与current false和公司name E
在弹性搜索中使用 GET/POST 时的不同结果

我正在通过 Elastic Search Head 插件尝试弹性搜索当我通过 POST 提交查询时结果符合预期但是当我使用 GET 尝试相同的查询时我总是会返回索引中的所有值那么如何通过 GET 将查询传递到弹性搜索服务器以
在 ElasticSearch API 应用程序中找不到 NodeBuilder

我正在尝试实现 Elasticsearch API 我的系统接受 nodeBuilder 时出现错误这是代码 import org elasticsearch action index IndexResponse import org e
Nest Elastic - 构建动态嵌套查询

我必须使用 Nest 查询嵌套对象但是查询是以动态方式构建的下面的代码演示了以静态方式对嵌套书籍进行查询 QueryContainer qry qry new QueryStringQuery DefaultField name D

随机推荐

我在Excel中有3个时间段 - 我需要知道最长连续时间段的持续时间

请帮忙理想情况下我真的很想仅使用公式来解决这个问题而不是 VBA 或任何我认为花哨的东西我所工作的项目为持续参与提供奖金我们有三个有时更多参与时间段这些时间段可能会重叠和或可能有没有参与的空间神奇的数字是 84 天的
如何在另一个线程中设置文本视图的文本

我试图在另一个线程即子线程中设置文本但对于以下代码它给出了错误只有创建视图层次结构的原始线程才能触摸其视图 public void onCreate Bundle savedInstanceState super onCreate
为什么 eclipse 无法正确部署我的动态 Web 项目？

问题是我在源代码控制下有一个 java 动态 Web 项目并在我的 Eclipse 工作区中检出之前我能够从 eclipse 中在本地 Tomcat 服务器上运行 servlet 但是我进行了一些更改删除了一些文件并添加了一些新
如何在 JavaScript 中旋转图像？

我想在单击打开按钮时旋转风扇图像单击关闭按钮旋转停止我的代码是 img src fan png width 200 br
Android 支持库 ActionBar NullPointerException 版本 2.2（级别 8） - 与preferences.xml冲突

我正在使用 v7 支持库在 Android 2 x 上显示 ActionBar 当我将应用程序部署到 IDE Intellij IDEA 中的设备时应用程序运行正常当我使用 maven 构建并打包要部署到 Play 商店的应用程序时我
在 IPython Notebook 之间共享数据

如果我有多个 IPython 笔记本在同一台服务器上运行有什么办法可以在它们之间共享数据吗例如从另一个笔记本导入变量谢谢这对我有用 store 命令允许您在两个不同的之间传递变量笔记本 data 这是我想要传递到不同笔记本的字符
DateTimePicker 控件不显示 AM/PM

我在使用自定义格式其中包括两个字母的 A M P M 的 DateTimePicker 控件时遇到问题缩写使用 en US CultureInfo DateTimeFormat ShortTimePattern 会导致时嗯tt 但
Python 运行守护进程子进程并读取标准输出

我需要运行一个程序并将其输出收集到标准输出该程序 socat 需要在 python 脚本运行期间在后台运行 Socat 一旦运行就会处于守护进程模式但首先它会将一些行输出到标准输出我的脚本的其余部分需要这些行命令 socat d d
如何访问证书扩展（信息）值？

我有一个由变量访问的 X509Certificate 当我尝试获取证书的详细信息时我设法通过提供的函数轻松获取 CriticalExtensions 值但是我想要达到的是存储在证书中并由对象 ID 2 5 29 32 表示的非关键扩展
在 Windows Server 2019 Core 中强制安装不兼容的 .inf 驱动程序 [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在尝试在我的第六代 NUC 上安装 Server 2019 Core 尽管安装进展顺利但当它在没有任何网络连接的情况下启动时我想起
用 C 处理 TCP 的部分返回

我一直在读Beej 的网络编程指南 http beej us guide bgnet 获取 TCP 连接的句柄在其中一个示例中简单 TCP 流客户端的客户端代码如下所示 if numbytes recv sockfd buf MAXDA
如何序列化和反序列化 JavaScript 对象？

我需要序列化和反序列化 JavaScript 对象以将它们存储在数据库中请注意这些对象包含函数因此我无法将它们存储为 JSON 因此无法使用 json2 js JavaScript 对象当然是 JavaScript 的反序列化的
在jmeter中设置整个请求url

我有一个请求它提供上传网址作为响应正文 uploadUrl https test com 9000 sample uploadurl I m able to extract the uploadUrl using JSON extract
Neo4j 中的自动增量

有没有办法像在 Neo4j 的 MySQL 中一样设置 auto increment 例如当我使用 GraphDatabaseService 对象创建节点时我希望节点以 1000000000 等数字开头非常感谢看看这个答案我可以在
从 XSD 生成 Ruby 类

有没有办法从 XSD 生成 Ruby 类甚至可能是 ActiveResource 类以便它们包含将类序列化为对初始 XSD 有效的 xml 的方法我知道soap4r有xsd2ruby 但似乎生成的ruby类无法轻松序列化为xml 无耻
Android：滚动后 RecyclerView 内容混乱[关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案我使用 RecyclerView 来显示标记列表并且值的每个标记都显示为 CardView 但是在RecyclerVi
Google 地图 v3 与 MeteorJS 加载同步问题

我的应用程序在 MeteorJS 框架上运行并使用谷歌地图 javascript api v3 谷歌地图加载方案类似于此中解释的方案post https stackoverflow com a 16797219 942899 和官方的很相似
如何创建 .chartForegroundStyleScale 的动态输入

在 Swift Charts 中签名为chartForegroundStyleScale为每个数据系列设置 ShapeStyle 的方法是 func chartForegroundStyleScale
如何在Jenkins中设置环境变量？

我希望能够做类似的事情 AOEU echo aoeu 并让詹金斯设置AOEU aoeu The 环境变量詹金斯的部分没有这样做相反它设置AOEU echo aoeu 如何让 Jenkins 评估 shell 命令并将输出分配给环境变量
Elasticsearch 对具有部分边缘 ngram 补全的数组字段的搜索建议

我正在尝试根据文档中的字符串数组构建一个建议器它类似于this one https stackoverflow com questions 20789224 elasticsearch autocomplete search on arr

Elasticsearch 对具有部分边缘 ngram 补全的数组字段的搜索建议

Elasticsearch 对具有部分边缘 ngram 补全的数组字段的搜索建议 的相关文章

随机推荐

热门标签

Elasticsearch 对具有部分边缘 ngram 补全的数组字段的搜索建议的相关文章