Elasticsearch 中的分析器有什么用？

2024-04-21

我在理解弹性搜索分析器时遇到一些问题。它的用途是什么以及如何使用它？

From 本文 https://www.elastic.co/blog/found-text-analysis-part-1，有来自源文本的分词器和分词过滤器。我是否无法理解来自 URL 或索引内文本的源文本？从文章中，它说要执行“GET

这是来自 URL，但是这个分析器与搜索我的索引中的文本相关吗？

如果我的问题听起来很愚蠢，我很困惑并且很抱歉。

Analyzer https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-analyzers.html#analysis-analyzers是一个包装器，它包装了三个函数：

字符过滤器 https://www.elastic.co/guide/en/elasticsearch/reference/current/analyzer-anatomy.html#_character_filters:主要用于剥离一些未使用的字符或者改变一些字符。
分词器 https://www.elastic.co/guide/en/elasticsearch/reference/current/analyzer-anatomy.html#_tokenizer:将文本分解为单独的标记（或单词），并根据某些因素（空格、ngram 等）进行分解。
令牌过滤器 https://www.elastic.co/guide/en/elasticsearch/reference/current/analyzer-anatomy.html#_token_filters:它接收令牌，然后应用一些过滤器（例如将大写术语更改为小写）。

简而言之analyzer用于告诉elasticsearch 应如何对文本进行索引和搜索。

你正在寻找的是分析API https://www.elastic.co/guide/en/elasticsearch/reference/current/indices-analyze.html#indices-analyze，这是了解分析器如何工作的一个非常好的工具。文本提供给此 API，与索引无关。

在你的情况下获取请求:

GET http://localhost:9200/_analyze?text=I%20sing%20he%20sings%20they%20are%20singing&analyzer=snowball

相当于：

GET _analyze
{
  "analyzer" : "snowball",
  "text" : "I sing he sings they are singing"
}

其输出：

{
  "tokens": [
    {"token": "i", "position": 1, ...},
    {"token": "sing", "position": 2, ...},
    {"token": "he", "position": 3, ...},
    {"token": "sing", "position": 4, ...},
    {"token": "sing", "position": 7, ...},
  ]
}

如中提到的article https://www.elastic.co/blog/found-text-analysis-part-1.

还有一件事，假设您在索引中定义了一个自定义分析器，它以您自己的方式组合执行字符过滤、标记化和标记过滤，并且您想检查它将如何标记文本，那么您可以使用_analyze终点与您的索引名称，即使在这种情况下，您也必须提供文本。

GET my_index/_analyze
{
  "analyzer" : "custom",
  "text" : "I sing he sings they are singing" --> You have to provide the text. 
}

为什么需要分析仪？

当您想要对文本或短语进行索引时，通常会使用分析器，将文本分解为单词非常有用，以便您可以搜索术语来获取文档。

Example:假设您有一个索引 (my_index)，在该索引中您有一个文本字段（简介），并且您索引了一个文档，其中"intro":"你好，我是希德"如果您不使用分析器，那么这将存储为“嗨，我是 sid”。如果您想查询此文档，则必须编写完整的短语（查找 intro =“Hi There I am sid”的文档）。但是，如果这个短语被索引为标记，那么即使您查询标记（查找 intro="sid" 的文档），您也会获得该文档。

Note:默认情况下标准分析仪 https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-standard-analyzer.html#analysis-standard-analyzer用于所有文本字段。

希望能帮助到你！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

elasticsearch

Elasticsearch 中的分析器有什么用？的相关文章

Elasticsearch - 如何获取文档的流行词列表

我有一个临时索引其中包含我需要审核的文档我想按这些文档包含的单词对它们进行分组例如我有这些文件 1 aaa bbb ccc ddd eee fff 2 bbb mmm aaa fff xxx 3 hhhh aaa fff 所以我想
spring-data-elasticsearch 在多个索引上搜索

我的页面上有一个搜索字段该搜索字段应该搜索多个索引我可以毫无问题地搜索一个索引如 spring data elasticsearch 文档中所述但是如果我搜索例如 Foo 我希望得到以下列表作为按相关性排序的结果 title F
Elasticsearch 6.2 / Kibana查询：一字段必须存在，一字段不能存在

我的愿望是搜索 field 存在且 fields b 不存在的文档有没有办法使用 Kibana 中的 Lucene 查询语法 Kibana 的发现部分中的搜索字段来执行此操作我尝试过使用缺失字段 b没有成功 exists
在 Elasticsearch 中过滤折叠结果

我有一个弹性搜索索引其中包含表示给定时间点实体的文档当实体更改状态时会创建带有时间戳的新文档当我需要获取所有实体的当前状态时我可以执行以下操作 GET https 127 0 0 1 9200 myindex search col
PHP Elastic Search 过滤查询字符串搜索

所有人都希望使用过滤查询其中结果应包含来自 query string 以及应用的 term filter 的数据 GET blog search query filtered query query string fields descr
排除elasticsearch结果数据中的_id和_index字段

如果简单地点击 api 每个文档中有 5 个字段但我只想要这两个字段 user id 和 loc code 所以我在字段列表中提到但它仍然返回一些不必要的数据如 shards hits time out等使用下面的查询在 chrom
AWS ElasticSearch：如何将策略应用于索引

我们有一个 AWS ElasticSearch 域正在向其中写入记录文档我现在已经在 Kibana 中创建了索引状态生命周期管理 ISM ILM 策略并且可以将该策略应用于 Kibana 中的索引现在我想在从处理索引写入的 J
Titan 加载弹性搜索问题

我使用以下代码来加载泰坦 TitanFactory Builder config TitanFactory build config set storage backend berkeleyje config set storage dir
使用elasticsearch按一天中的时间累积流量

我正在接收来自大量客户端应用程序的请求事件我想使用elasticsearch 来找出我的最高流量点是什么时候我尝试过的一件事是使用嵌套直方图进行过滤器聚合然后使用嵌套的术语聚合通过脚本字段获取一天中的不同时间以下是我的尝试
未能向 master 发送加入请求

我使用的是elasticsearch版本1 3 0 重启数据节点后无法检测到主节点我收到错误failed to send join request to master 在错误日志中 app101 dGRBqTFTQfae76IFCjsM
向 ElasticSearch 术语聚合添加其他字段

索引文档如下 id 1 title Blah platform id 84 url http facebook com title Facebook 我想要的是按平台计数和输出统计数据为了计数我可以使用术语聚合platform id作为
将 Elasticsearch 结果导出到 CSV 文件

我正在尝试将使用以下查询找到的结果导出到桌面上的 CSV 中这是我第一次使用 Elasticsearch 和 cURL 所以我对如何做到这一点感到困惑 from elasticsearch import Elasticsearch es
Elastic Search 5.x 嵌套多个查询 C#

我将 C 与这些 nuget 包一起使用
Elasticsearch 崩溃后无法恢复

磁盘空间不足导致 Elasticsearch 分片崩溃三个节点现在为红色两个节点已恢复它们的状态为黄色 ES 的 CPU 利用率为 150 内存利用率很高正在尝试恢复它们但似乎存在一些版本匹配冲突我清理了磁盘空间并删除了分片的
在 ElasticSearch 7+ 中，如何搜索所有文本字段？

我想在 Elasticsearch 7 3 中存储的文档中搜索单词我希望在以前版本的 Elasticsearch 上运行的一个示例是 query bool must match all oliver must not should fro
Elasticsearch 中的嵌套与对象

有人可以解释 Elasticsearch 文档中对象和嵌套字段之间的区别吗我知道默认情况下字段被定义为对象我还知道我可以用这样的点访问对象字段 my field name my field title 等对象的文档 http
Logstash删除类型并保留_type

我有一个logstash 客户端和服务器客户端将带有logstash的udp输出的日志文件发送到服务器服务器也运行logstash来获取这些日志在服务器上我有一个 json 过滤器它会在实际日志的字段中提取 json 格式的消息
弹性搜索模糊匹配，精确匹配首先显示

我想在查询中使用模糊匹配但精确匹配显示在结果的顶部我已经尝试过以下方法 return this gt client gt search array index gt self INDEX type gt self TYPE body g
随着索引和文档数量恒定，elasticsearch 批量索引会随着时间的推移而变慢

我遇到了使用 NET NEST 客户端和 ElasticSearch 进行批量索引的性能随着时间的推移索引数量和文档数量恒定而降低的情况我们正在奔跑ElasticSearch Version 0 19 11 JVM 23 5 b02在具
如何使用 django-haystack 和 elasticsearch 后端进行模糊搜索？

看起来好像elasticsearch支持模糊查询 http www elasticsearch org guide reference query dsl fuzzy query http www elasticsearch org gui

随机推荐

Scala：为什么不能编译？

Given class Foo T def get T class Bar class FooBar extends Foo Bar def get new Bar object Baz def something T U lt Foo T
symfony2：如何从模板访问服务

如果我创建了一个服务有没有办法从 twig 访问它而不需要创建 twig extension 您可以将服务设置为一个树枝全局变量config yml e g app config config yml twig globals your
自定义 UINavigationBar 适用于模拟器，但不适用于发布版本

我希望能够深入了解过去几个小时以来我一直在努力解决的问题我有一个正在配置的自定义 UINavigationBarapplication DidFinishLaunchingWithOptions通过调用以下方法 UINavigationB
异步函数外部堆栈上下文

有时代码想知道特定函数或子函数是否正在运行例如 node js 有domains https nodejs org api domain html它也适用于异步内容不确定这是否包括异步函数一些简单的代码来解释我需要什么如下所示
IOS stackview addArrangedSubview 在特定索引处添加

如何在 UIStackView 的特定索引中添加排列的子视图就像是 stackView addArrangedSubview nibView atIndex index 你的意思是你想插入而不是添加 func insertArrange
在 C# 中创建大型二进制文件的增量差异补丁

我正在寻找一种创建大型二进制文件 VMWare 虚拟磁盘文件的 Delta Diff 补丁的方法是否有 C 中的实现或 NET Framework 中的任何有用的方法任何帮助表示赞赏谢谢 rAyt bsdiff http www d
最佳 Java OpenID 库 [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
使用javascript读取和写入json文件[重复]

这个问题在这里已经有答案了可能的重复如何使用 JavaScript 读取和写入文件 https stackoverflow com questions 585234 how to read and write into file usi
如何在 Powershell 中复制 Azure 资源管理器模板 uniquestring() 函数？

我有一个 Azure 托管服务该服务使用 ARM 模板自动部署在我们的构建过程中并在不同的资源组中提供该服务的多个实例有些资源需要全局唯一的名称为了支持这一点我使用uniquestring函数通常根据资源组 ID 生成这些资源
在流 #1 中找不到编解码器 pcm_alaw 的标签，使用 ffmpeg 连接 2 个文件时容器当前不支持编解码器 [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在尝试连接两个文件第一个文件包含音频和视频第二个文件仅包含视频我用以下ffmpeg命令 ffmpeg command ffmpe
android：如何检查应用程序是否在后台运行

我是安卓新手我有基于客户端服务器的应用程序服务器每分钟都会不断向客户端发送更新通知并且在客户端我的应用程序接收这些更新并使用 Toast 显示它但现在我的问题是每当我的客户端应用程序进入后台服务器时都会继续发送更新通知并且我的
iPhone iOS 2.0 到 iOS 4.0 SQLite 兼容性

我希望我的应用程序能够与 iOS 2 0 兼容就像 iOS 3 0 和 iOS 4 0 一样我将使用 SQLite 的原因有很多现在我应该用 SQLite 做什么我应该使用仅随 iOS 2 0 附带的 SQLite 提供的功能吗
将 Spring Data JPA 与 EJB/CDI 结合使用时，对存储库的初始请求出现奇怪的异常

我创建了一个小项目其中结合了 Spring Data JPA 存储库 EJB CDI 以及 Wildfly Swarm 或普通 Wildfly The 休息资源 https github com maxant swarm problems
如何使用线性模型函数的色标填充背景？

我正在分析Alberto Cairo的功能艺术中的datavis示例我推荐给你那本书里有这样的例子我在 R 中尝试在左下图散点图中我使用书中的数据并计算了人口函数中的军事效果lm efect pop 以及人口效应函数的
更改 Subversion 错误消息的语言

由于某种原因 subversion 返回了我认为是德语的错误消息 svn up svn Zielpfad existiert nicht 不幸的是我不懂那种语言在我诉诸使用在线翻译引擎来解决这个问题之前我想我会尝试修复它我想我只是做
为什么没有成员变量的C++类会占用空间？

我发现 MSVC 和 GCC 编译器都为每个类实例分配至少一个字节即使该类是没有成员变量或只有静态成员变量的谓词下面的代码说明了这一点 include
-webkit-flex 在 Android 上无法正常显示

认识到自己的奇妙能力后display flex 我制作了一个网页在 Windows 上的 Chrome 26 中查看时该网页看起来完全符合我的要求但是它在我的 Android 上的 Chrome 26 中不起作用在我的模拟器中的
如果 python 迭代器返回可迭代对象，我如何将这些对象链接到一个大迭代器中？

我将在这里给出一个简化的例子假设我在 python 中有一个迭代器并且该迭代器返回的每个对象本身都是可迭代的我想获取此迭代器返回的所有对象并将它们链接在一起形成一个长迭代器是否有一个标准实用程序可以实现这一点这是一个人为的例子 x
jquery datatables - 从 json 获取列

In jquery Datatables is it possible to define columns with a server side script I need something like this 必须从服务器加载带有日期的
Elasticsearch 中的分析器有什么用？

我在理解弹性搜索分析器时遇到一些问题它的用途是什么以及如何使用它 From 本文 https www elastic co blog found text analysis part 1 有来自源文本的分词器和分词过滤器我是否无法理解来

Elasticsearch 中的分析器有什么用？

Elasticsearch 中的分析器有什么用？ 的相关文章

随机推荐

热门标签

Elasticsearch 中的分析器有什么用？的相关文章