如何在elasticsearch中配置synonym_path

2024-04-19

我对 elasticsearch 很陌生，我想使用同义词，我在配置文件中添加了这些行：

index :
    analysis :
        analyzer : 
            synonym :
                type : custom
                tokenizer : whitespace
                filter : [synonym]
        filter :
            synonym :
                type : synonym
                synonyms_path: synonyms.txt

然后我创建了一个索引测试：

"mappings" : {
  "test" : {
     "properties" : {
        "text_1" : {
           "type" : "string",
           "analyzer" : "synonym"
        },
        "text_2" : {
           "search_analyzer" : "standard",
           "index_analyzer" : "synonym",
           "type" : "string"
        },
        "text_3" : {
           "type" : "string",
           "analyzer" : "synonym"
        }
     }
  }

}

并使用此数据插入类型测试：

{
"text_3" : "foo dog cat",
"text_2" : "foo dog cat",
"text_1" : "foo dog cat"
}

synonym.txt 包含“foo,bar,baz”，当我搜索 foo 时，它返回我所期望的内容，但是当我搜索 baz 或 bar 时，它返回零结果：

{
"query":{
"query_string":{
    "query" : "bar",
    "fields" : [ "text_1"],
    "use_dis_max" : true,
    "boost" : 1.0
}}}

result:

{
"took":1,
"timed_out":false,
"_shards":{
"total":5,
"successful":5,
"failed":0
},
"hits":{
"total":0,
"max_score":null,
"hits":[
]
}
}

我不知道你的问题是否是因为你定义了“bar”的同义词不好。正如您所说，您是个新手，我将举一个与您类似的有效示例。我想展示elasticsearch 如何在搜索时和索引时处理同义词。希望能帮助到你。

首先创建同义词文件：

foo => foo bar, baz

现在，我使用您尝试测试的特定设置创建索引：

curl -XPUT 'http://localhost:9200/test/' -d '{
  "settings": {
    "index": {
      "analysis": {
        "analyzer": {
          "synonym": {
            "tokenizer": "whitespace",
            "filter": ["synonym"]
          }
        },
        "filter" : {
          "synonym" : {
              "type" : "synonym",
              "synonyms_path" : "synonyms.txt"
          }
        }
      }
    }
  },
  "mappings": {

    "test" : {
      "properties" : {
        "text_1" : {
           "type" : "string",
           "analyzer" : "synonym"
        },
        "text_2" : {
           "search_analyzer" : "standard",
           "index_analyzer" : "standard",
           "type" : "string"
        },
        "text_3" : {
           "type" : "string",
           "search_analyzer" : "synonym",
           "index_analyzer" : "standard"
        }
      }
    }
  }
}'

请注意，synonyms.txt 必须与配置文件位于同一目录中，因为该路径是相对于配置目录的。

现在索引一个文档：

curl -XPUT 'http://localhost:9200/test/test/1' -d '{
  "text_3": "baz dog cat",
  "text_2": "foo dog cat",
  "text_1": "foo dog cat"
}'

现在的搜索

在字段 text_1 中搜索

curl -XGET 'http://localhost:9200/test/_search?q=text_1:baz'
{
  "took": 3,
  "timed_out": false,
  "_shards": {
    "total": 5,
    "successful": 5,
    "failed": 0
  },
  "hits": {
    "total": 1,
    "max_score": 0.15342641,
    "hits": [
      {
        "_index": "test",
        "_type": "test",
        "_id": "1",
        "_score": 0.15342641,
        "_source": {
          "text_3": "baz dog cat",
          "text_2": "foo dog cat",
          "text_1": "foo dog cat"
        }
      }
    ]
  }
}

您获得该文档是因为 baz 是 foo 的同义词，并且在索引时 foo 用其同义词进行了扩展

在字段 text_2 中搜索

curl -XGET 'http://localhost:9200/test/_search?q=text_2:baz'

result:

{
  "took": 2,
  "timed_out": false,
  "_shards": {
    "total": 5,
    "successful": 5,
    "failed": 0
  },
  "hits": {
    "total": 0,
    "max_score": null,
    "hits": []
  }
}

我没有得到点击，因为我在索引时没有扩展同义词（标准分析器）。而且，由于我正在搜索 baz 而 baz 不在文本中，所以我没有得到任何结果。

在字段 text_3 中搜索

curl -XGET 'http://localhost:9200/test/_search?q=text_3:foo'
{
  "took": 3,
  "timed_out": false,
  "_shards": {
    "total": 5,
    "successful": 5,
    "failed": 0
  },
  "hits": {
    "total": 1,
    "max_score": 0.15342641,
    "hits": [
      {
        "_index": "test",
        "_type": "test",
        "_id": "1",
        "_score": 0.15342641,
        "_source": {
          "text_3": "baz dog cat",
          "text_2": "foo dog cat",
          "text_1": "foo dog cat"
        }
      }
    ]
  }
}

注：text_3是“baz狗猫”

text_3 是没有扩展同义词的索引。当我搜索 foo 时，它的同义词之一是“baz”，我得到了结果。

如果你想调试你可以使用_analyze端点例如：

curl -XGET 'http://localhost:9200/test/_analyze?text=foo&analyzer=synonym&pretty=true'

result:

{
  "tokens": [
    {
      "token": "foo",
      "start_offset": 0,
      "end_offset": 3,
      "type": "SYNONYM",
      "position": 1
    },
    {
      "token": "baz",
      "start_offset": 0,
      "end_offset": 3,
      "type": "SYNONYM",
      "position": 1
    },
    {
      "token": "bar",
      "start_offset": 0,
      "end_offset": 3,
      "type": "SYNONYM",
      "position": 2
    }
  ]
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Search

elasticsearch

searchengine

如何在elasticsearch中配置synonym_path 的相关文章

elasticsearch中@timestamp和timestamp字段的区别

当我使用日志存储向弹性搜索记录一些请求时它将 timestamp 字段作为时间当我使用 NEST 记录这些请求并设置时间戳字段时它会放置时间戳字段当我使用 kibana 查看数据时这两个字段具有单独的名称他们之间有什么区别 ti
Titan 加载弹性搜索问题

我使用以下代码来加载泰坦 TitanFactory Builder config TitanFactory build config set storage backend berkeleyje config set storage dir
冷融合和分页

首先我对 ColdFusion 很陌生但学得很快因此我正在尝试构建一个大型数据库最初每页显示 25 行的所有结果并有一个下一个上一个链接来浏览页面这一切都工作正常但是当我执行搜索时当新结果显示大约几页时分页链接不起作用
使用elasticsearch按一天中的时间累积流量

我正在接收来自大量客户端应用程序的请求事件我想使用elasticsearch 来找出我的最高流量点是什么时候我尝试过的一件事是使用嵌套直方图进行过滤器聚合然后使用嵌套的术语聚合通过脚本字段获取一天中的不同时间以下是我的尝试
Jquery 搜索 - 不区分大小写

我在 Jquery 脚本上获得了一些帮助该脚本创建了可搜索可切换的常见问题解答代码可以在这里看到 http jsfiddle net pT6dB 62 http jsfiddle net pT6dB 62 问题是如果单词 How 带
未能向 master 发送加入请求

我使用的是elasticsearch版本1 3 0 重启数据节点后无法检测到主节点我收到错误failed to send join request to master 在错误日志中 app101 dGRBqTFTQfae76IFCjsM
Elasticsearch批量设置_id

当我使用 id 设置将文档添加到 elasticsearch 时我得到 Field id is a metadata field and cannot be added inside a document Use the index AP
Java 中搜索和排序算法的高效实现

有没有人有关于常见搜索和排序算法的一组 Java 代码实现的良好参考剥猫皮的方法有很多种很容易在网上找到各种算法的 Java 代码但是 Java 中是否有实现这些不同算法的最有效方法的列表例如有http www algorithmi
如何在elasticsearch中使用冒号搜索模式？

我在 Elasticsearch 中有一个字段其值为 ft 05 08 2015 13 01 27 358 cgn 4189 当我想使用查询字符串 cgn 4189 进行搜索时我没有结果我尝试像 cgn 4189 一样转义冒号但有语
Google 自定义搜索引擎未给出预期的搜索结果

我一直在尝试创建一个新的谷歌自定义搜索引擎但是当我尝试一些查询时搜索引擎没有给我预期的搜索结果在某些查询上它工作正常但在其他查询上它说没有结果我尝试添加我想要搜索的网站的 URL 但是当我尝试搜索该页面的关键字时某些页面和
在 mysql 中搜索带变音符号的阿拉伯语

所以我有一个巨大的带有变音符号的阿拉伯语书面文本数据库变音符号是阿拉伯语中附加到其他字符的小字符例如带变音符号不带变音符号我正在使用 mysql 和 laravel 在文本中搜索没有变音符号的特定单词如何忽略搜索中的变音符号看
match_none 有什么用？

我浏览了docs https www elastic co guide en elasticsearch reference current query dsl match all query html query dsl match no
Excel VLOOKUP 和 SEARCH 组合

我试图在文本列中搜索文本字符串的一部分并返回第二列希望这通过一个示例更有意义请注意这个示例是编造的我无法发布我正在使用的确切数据但这与它类似例如 A D E Really good dog Good dog text1 red
Python elasticsearch DSL 聚合/每个文档嵌套值的度量

我试图找到 2 级嵌套中的最小值每个文档单独的最小值到目前为止我能够进行聚合计算搜索结果中所有嵌套值的最小值但无需按文档进行分隔我的示例架构 class MyExample DocType myexample id Intege
SOLR - 过滤器查询中的正则表达式

我想在 fq 中实现 Regex 但以前从未实现过我的属性中有以下值字段类型为小写 Prop company1 city1 state1 country1 高级分析化学家芝加哥我想根据正则表达式过滤结果正则表达式应该与上面的内容
在应用程序中搜索对象的设计模式

需要一些有关设计模式的帮助我正在创建一个应用程序该应用程序在存储在单独表中的数据库中的对象上具有不同类型例如我有 5 种对象 A B C D E 我在数据库中有 5 个不同的表来存储每个对象现在我想在我的应用程序中实现搜索功能
复杂的 SOLR 查询，包括 NOT 和 OR

我对 SOLR 搜索有一些相当复杂的要求我需要针对标记内容的数据库执行这些搜索我需要首先过滤数据库以获取与我的过滤器标签匹配的结果任何具有黑名单中的标签的结果都应被删除除非它们也包含白名单中的标签假设我想检索所有标记为森林或
如何在 kibana 中自动配置索引模式

是否可以在 kibana 中自动配置索引模式要么通过一些设置文件要么通过rest api 安装后可以手动完成 Kibana 5 x 公开了这样的 API 来管理索引模式要创建索引模式可以发出以下命令来 kibana 访问 url 只
从 WordPress 搜索结果页面获取类别名称

在特定博客类别中进行搜索查询重定向到 WP BLOG 主页面后我的搜索 URL 如下所示 online shop s category new posts category post type post 不幸的是我无法在搜索结果页面
自定义 Tridion 搜索索引处理程序：页面 url 的自定义字段与标准字段？

我正在研究 SDL Tridion 2011 GA 的自定义搜索索引处理程序我得到了一些工作使用Arjen 提供的非常有用的信息 http 80000ft blogspot nl 2012 08 search indexing hand

随机推荐

为什么 JavaScript 中的数字是不可变的？

我在这里阅读了问题和答案 javascript 数字不可变 https stackoverflow com questions 8248568 javascript numbers immutable 但我还不清楚为什么数字原始类型是
如何处理重复事件中的 DST 和 TZ？

dateutil rrule 是否支持夏令时和夏令时需要类似于 iCalendar RRULE 的东西如果不是如何解决这个问题安排重复事件和 DST 偏移量更改 Imports gt gt gt from django utils
编组无法从 Go 访问的 C 对象

有一些 C 对象例如联合体包含位域的结构体以及其对齐方式与 Go 的 ABI 不同的结构体无法从 Go 访问其中一些结构无法更改为可从 Go 代码访问因为它们是现有库的 API 的一部分因此要将这些对象编组到 Go 结构中我
测试自定义 AuthorizationAttribute 时抛出 NullReferenceException

我看了一下如何进行单元测试来测试检查请求标头的方法 https stackoverflow com questions 9263457 how do i make a unit test to test a method that che
Docker 卷挂载不存在

我在 OS X 上运行 Docker 1 11 并试图找出本地卷的写入位置我通过运行创建了一个 Docker 卷docker volume create name mysql 然后我跑了docker volume inspect mysq
Facebook 政策：我的应用程序可以自动将故事发布到我的 Facebook 流吗？

根据Facebook 平台政策 http developers facebook com policy 您不得预先填写 user message 通过a发送的参数或内容扩展权限例如状态更新或注释除非用户之前生成的内容工作流程这
仅使用 VBA 宏将可见行的值从一个工作簿复制到新工作簿中

我有一些宏可以将工作表 2 从现有工作簿复制到新工作簿此代码按其应有的方式工作只是存在不应在新工作簿上显示的隐藏行这是我编写的代码用于复制工作表并仅粘贴其值 Dim Output As Workbook Dim FileName A
PostgreSQL regexp_replace 与匹配的表达式

我正在使用 PostgreSQLregexp replace函数来转义字符串中的方括号括号和反斜杠以便我可以将该字符串用作正则表达式模式本身在使用该字符串之前还对该字符串进行了其他操作但它们超出了本问题的范围想法是替换 with
如何强制消费者读取kafka中的特定分区

我有一个应用程序用于从 1 个 Kafka 生产者生成的 URL 流中下载特定的 Web 内容我创建了一个有 5 个分区的主题有 5 个 kafka 消费者但网页下载的超时时间为 60 秒当下载其中一个 URL 时服务器会假设消
插入图片到Excel VBA，方法图片失败

尝试制作一个在 Excel 中逐步插入 3 个图像的宏一张工作表图片包含 A 列第 1 3 行中图像的 URL 另一个工作表输出应该水平输出图像 Sub testinsertpix Dim i As Integer Dim lin
CSS 在标签字段中居中对齐

我正在尝试显示类似这样的内容 Please treat the blue line and black line as the border 其中图像描述文字应该是水平的位于剩余空间的中心但是我不知道应该应用什么CSS 这是我的小提琴 h
仅使用 RSA 和 AES 构建 openssl

我正在一个项目中使用 libcrypto a OpenSSL 默认情况下所有算法都在 libcrypto a 下可用对于该项目我只需要 RSA AES 和 SHA 如何仅使用这些算法构建 libcrypto a 如果您通过运行以下命令
OnTouch 和 OnClick 冲突：指定为非 null 的参数为 null：方法 kotlin.jvm.internal.Intrinsics.checkNotNullParameter，参数 e1

我有一个 Recyclerview 允许用户通过向上滑动来更改比例我为此使用gestureDetector 和 onFling 这工作正常但是用户应该能够单击 recyclerView 的项目我通过创建一个界面来做到这一点Recycl
为什么 Visual Studio 2019 16.9.5 中的 .NET Core 3.1 和 .NET 5 的脚手架标识失败？

我正在尝试在新项目中生成身份帐户登录和帐户注册页面我尝试过 NET Core 3 1 和 NET 5 在这两种情况下即使它是一个新项目我也会收到以下错误消息正如您所知这是一条非常有用的错误消息有谁知道 NET Core 3
nullptr 引用在 C++ 中是未定义的行为吗？ [复制]

这个问题在这里已经有答案了下面的代码愚弄了nullptr指针和参考 include
如何创建电子邮件发送服务？

我已经考虑这个想法有一段时间了想了解一下您的想法我想创建一个 NET 服务来发送和跟踪电子邮件我的粗略想法在各种应用程序中序列化 NET 电子邮件 System Net Mail MailMessage 对象的实例并将它们放入数据
从 Metro Style App c# 加载 C 库 (gsdll32.dll)

我想使用 Metro Style App c 中的 gsdll32 dll 我加载dll如下 DllImport gsdll32 dll EntryPoint gsapi delete instance private static ext
如何用序列图来展示一个类与另一个类之间的关系，以该类的实例的实例作为输入？

我将使用之前的相同示例question https stackoverflow com questions 66934927 how to represent the relationship between an instance of
如何使图像视图的选择器仅更改背景而不更改图像源？

我有一个 ImageView 同时设置了图像 src 和背景颜色该图像位于 gridview 项目布局的布局中我想创建一个 xml 选择器当选择该项目时图像背景会改变但图像 src 不会改变类似于带有文本图标的android主菜
如何在elasticsearch中配置synonym_path

我对 elasticsearch 很陌生我想使用同义词我在配置文件中添加了这些行 index analysis analyzer synonym type custom tokenizer whitespace filter synon

如何在elasticsearch中配置synonym_path

如何在elasticsearch中配置synonym_path 的相关文章

随机推荐

热门标签