ReversedWildcardFilterFactory 如何加速通配符搜索？

2024-01-08

索尔docs http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#solr.ReversedWildcardFilterFactory say:

solr.ReversedWildcardFilterFactory

一个过滤器，可以反转令牌以提供更快的前导通配符和前缀查询。将此过滤器添加到索引分析器，但不添加到查询分析器。标准 Solr 查询解析器将使用它来反转通配符和前缀查询以改进表现...

但它是如何做到这一点的呢？

既然所有的token都经过ReversedWildcardFilterFactory，那么它是否会反向存储所有的token呢？（这对我来说似乎很愚蠢）

或者，它是否正常存储所有令牌and反转的标记，然后在查询时运行大约两倍长的索引列表？（大概这仍然比使用前导 * 进行搜索要快得多）

我感到困惑的部分原因是在这个例子中schema.xml从 Solr 中，他们执行以下操作：

<copyField source="*_en" dest="text_en_index"/>
<copyField source="*_en" dest="text_rev_index"/>

where text_rev_index uses a ReversedWildcardFilterFactory。如果ReversedWildcardFilterFactory存储正向和反向令牌，我不确定为什么他们会将这些字段复制到正向和反向dest fields.

From https://docs.lucidworks.com/display/lweug/Wildcard+Queries https://docs.lucidworks.com/display/lweug/Wildcard+Queries:

Lucid 查询解析器将检测何时使用前导通配符并调用反转过滤器（如果存在于索引分析器中）以反转通配符术语，以便生成正确的查询将与存储在索引中的反向术语相匹配的术语对于这个领域。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Solr

fulltextsearch

ReversedWildcardFilterFactory 如何加速通配符搜索？的相关文章

使用 Windows 加密文件系统 (EFS) 对 FILESTREAMS 进行 SQL Server 2012 全文搜索

这基本上是一个是否问题但如果答案包括支持参考资料以及答案如果答案是是我们将不胜感激奇怪的是我在 MSDN 或 TechNet 中找不到明确的答案我的直觉和实验让我得出了不的结论是否可以将 Windows EFS 与 S
如何使用 SolrJ 获取突出显示的片段？

我正在将我的应用程序从 Lucene 迁移到 Solr Solr 可以更好地处理突出显示但是如果我搜索关键字 city 我会期望得到如下响应 id fdc3833a 0e4f 4314 ba8c title Paris is a beau
如何提取 SQLite FTS 表中的所有标记？

出于调试目的我想查看 SQLite 中全文搜索虚拟表中存在的所有标记当我查看 FTS 表名为fts table 我看到以下内容但是浏览这些表中的数据不会显示标记列表无论如何我都找不到如何提取简单的令牌列表你可以这样做ftx4a
SolrCloud：无法创建集合、锁定问题

我一直在尝试实现 SolrCloud 一切正常直到我尝试创建包含 6 个分片的集合我的设置如下 5 个虚拟服务器全部运行 Ubuntu 14 04 由一家公司跨不同数据中心托管为整体运行 ZooKeeper 3 4 6 的 3 台服
使用多个字段对 solr 搜索结果进行排序 (solrj)

我需要根据两个因素对从 apache solr 返回的结果进行排序我们的系统中有三个实体由 solr 索引组项目和数据集在结果中我希望首先显示数据集然后是项目然后是组但我仍然希望它尊重每种类型的评分值因此例如结果将是得
Solr 高亮显示

我看到了这个帖子here https stackoverflow com questions 4058913 how to highlighting search results using apache solr with php cod
Solr 管理控制台中模式浏览器屏幕中的字段

上面是特定索引的架构浏览器屏幕的屏幕截图该字段是品牌字段类型定义如下
Plon 全文索引 Excel 文件

如何自定义 Plone 搜索引擎以激活 excel 文件的全文索引我已经安装了 pdftotext 和 wv 用于 pdf word 文件全文索引如果你添加产品 OpenXml https pypi python org pypi Pr
Solr距离过滤

我正在尝试使用 Solr 进行距离范围搜索我知道在5公里范围内进行搜索过滤很容易 q fq geofilt pt 45 15 93 85 sfield store d 5 我所追求的是如果我正在寻找一系列的说法如何做同样的事情5至10公
LUCENE：搜索与正则表达式匹配的术语

我需要搜索 lucene 索引中的任何术语匹配特定的正则表达式我知道我可以使用TermsComponent在solr中如果配置如下
更改 SOLR 默认连接

我正在使用嵌入 SOLR 的应用程序 SOLR 在 Tomcat 的 webapp 区域中像一场战争一样运行是否有 SOLR 配置允许我切换搜索的默认 SOLR 行为以假定 AND 而不是 OR 作为连接运算符在您的模式文件中添加或修
如何在 FORMSOF Inflectional 全文搜索中获取匹配项的位置？

我使用 CONTAINSTABLE 查询与 MS SQL Server 的全文索引引擎在文本列中进行搜索例如 SELECT FROM MyTable INNER MERGE JOIN CONTAINSTABLE MyTable sDesc
如何在不使用 SPLITSHARD 的情况下动态向 SolrCloud 添加节点？

我已经设置了Solr云有 4 个碎片我向 SolrCloud 添加了 8 个节点 4 个领导者和 4 个副本每个节点运行在不同的机器上但后来我发现我的数据越来越多每天400万文件这样我的 4 个分片就不够用了因此我想动态地向该
MIME 类型/内容类型，用于在 IE 和 Firefox 中使用 Excel 打开 CSV 文件

我在 Excel 中识别并打开 CSV 输出时遇到问题在我的 Web 应用程序中我有一个 java servlet 它将搜索结果返回给用户搜索结果由 Apache Solr 服务器提供 GUI 前端有一个选项允许用户请求 CSV 格
SQL Server 与 MySQL：CONTAINS(*,'FORMSOF(THESAURUS,word)')

我很震惊当我在 SQL Server 中看到查询非常简单时我花了 3 4 天弄清楚如何在 mysql 中实现词干提取和同义词搜索 Select from tab where CONTAINS FORMSOF THESAURUS wor
SLF4J 日志记录到文件 vs. DB vs. Solr

我需要一些关于 SLF4J 日志记录的建议目前我们正在为 Java Web 应用程序使用 SLF4J 日志记录 log4j 绑定该应用程序使用简单的 ConsoleAppender 我们的下一步是研究可以保存日志的地方我们的应用程序
Solr 您的意思是（拼写检查组件）

我在我的应用程序中使用 solr 并集成了拼写检查组件但我遇到了一些问题第一的当我输入一个用空格分隔的术语时他们会给我每个术语的更正 Eg 水 gt 什么术语但事实是watters 第二当我输入一些带有错误术语的短语时尽管其他
使用 gin 索引和 sqlalchemy 返回排名搜索结果

我为全文搜索设置了 GIN 索引我想获取与搜索查询匹配的记录列表按排名排序记录与搜索查询的匹配程度对于结果我只需要记录及其列不需要用于排序的实际排名值我有以下查询它运行良好并从我的 postgresql 数据库返回预期结果
Solr 动态价格范围和组

跟进问题如何获取 solr 结果中的方面范围 https stackoverflow com questions 33956 how to get facet ranges in solr results SolR 查询价格范围 htt
Solrcloud Zookeper 设置：等待 4000ms 后未找到注册的领导者，集合：c1 切片：shard2

我使用 solr 4 10 3 我通过 java 中的嵌入式 jetty 服务器启动 solr 我正在尝试使用 2 个分片领导者配置 solrcloud 我有一个外部动物园管理员设置我在启动 solr 时指向动物园管理员实例如下所示

随机推荐

“eval() uating”条件的替代方法

在我正在处理的遗留代码库中有一个条件评估器它接受用户输入来构建条件然后使用 php eval 在运行时评估此条件在不使用 eval 的情况下解决此问题的最佳方法是什么例如我有一个用户在 UI 中输入的条件 1 gt 0 必须对此进
使用 VBA 从 Excel 工作表更新 SQL

我正在尝试使用 VBA 从 Excel 工作表更新 SQL 中的一些记录我在 Excel 工作表中有很多记录所以这就是为什么我想自动化这一点以下是我要更新 rmn dr 的字段示例 t id 在两个表中都是唯一的我想使用 Excel
ADB 没有响应 - Android Studio

不要将其标记为重复项让我解释一下出了什么问题并告诉你我做了什么所以这是我的问题当我打开 Android Studio 时它给我一个错误如下所示然后我进入我的 Windows 防火墙设置这是我所拥有的如您所见防火墙已关闭然
工作节点组未加入 EKS 集群

我按照这个博客在 AWS 上设置了 open5GS https aws amazon com blogs opensource open source mobile core network implementation on amazon
为什么 simplexml_load_file 相对于主机文件不起作用？

I have simplexml load file指令放置在包含的 PHP 文件中但该指令的工作原理取决于我包含此文件的位置为什么是否可以相对于放置的文件指令解释相对文件路径您始终可以使用魔法访问当前文件的完整路径 FILE ht
partial_fit Sklearn 的 MLPClassifier

我一直在尝试使用Sklearn的神经网络MLPClassifier 我有一个大小为 1000 个实例的数据集具有二进制输出我想对其应用带有 1 个隐藏层的基本神经网络问题是我的数据实例并非同时可用在任何时间点我只能访问 1 个数据
Erlang 进程与 Java 线程

我在读Sa a Juri 所著的 Elixir in Action 一书第一章 https manning content s3 amazonaws com download b b915834 e80b 4520 939d ff1900
Delphi 中的嵌套属性

Delphi 有没有办法使用嵌套属性目前我正在使用Delphi XE 例如 TCompoundAttribute class TCustomAttribute public constructor Create A1 A2 TCustom
有没有办法在函数运行完成后运行其他函数？

def foo pass def bar print good bay 两个功能如打击现在我想在 foo run 完成后运行 bar 函数有没有类似类使用的方法 del 据我所知在课堂方法中我可以使用 del 就像下面这样 class
在表中存储/检索数组的最佳方法

我目前在 MySQL 中有一个表可以正常存储值但我想向该表添加一个字段来存储值数组例如城市我应该简单地将该数组存储为 CSV 吗每行都需要它自己的数组因此我对创建一个新表并为前一个表中插入的每行插入 2 5 行感到不安我觉得这种
如何在 JavaFX TableView 中的行悬停时发生某些事情？

现在当在表格视图中选择一行时我会在鼠标位置显示对话框我希望当我将鼠标悬停在每一行上时显示对话框似乎有一个 CSS hover 所以我认为它可以以某种方式在 java 代码中捕获您可以创建一个自定义表行工厂它将侦听器添加到行的悬停
为什么我不能在 std::vector 中使用抽象类？

我是从这些问题中得出的为什么我们不能声明 std vector https stackoverflow com questions 2160920 why cant we declare a stdvectorabstractclass
将 $mysqli 设置为 OOP 的全局变量

好的这是一个复杂的问题但任何帮助或建议将非常感激所以我正在与一个网站合作使用 htaccess 将所有流量重定向到load php 对于任何sql功能我有一个抽象类它有很多查询语句作为传递参数来定义每个查询的细节的函数例如 t
如何防止 Netlify 因为 process.env.CI = true 将警告视为错误？

在 Netlify 上部署新项目开始失败检查日志我看到以前成功部署的日志中没有的内容 Treating warnings as errors because process env CI true Most CI servers set
以编程方式安排 AWS Lambda 一次性执行

我有两个 AWS Lambda 函数我希望 Lambda A 确定某个时间点例如 2022 年 5 月 4 日 10 00 然后我希望 Lambda B 被安排在这个特定的时间点运行我可能可以通过使用 Lambda A 以编程方式创建
在 Shiny 应用程序中使用 Font Awesome 5.7 图标

Shiny s icon 功能仅支持 Font Awesome 4 7 图标可以在此处找到 Shiny 支持的图标的完整列表 https fontawesome com v4 7 0 icons 自那以后 Font Awesome 已多次
如何为 Windows 安装程序创建清单？

我们的应用程序有一个安装程序必须像许多其他安装程序一样以管理员权限下载和运行但是安装程序未命名为 setup exe 因此 Windows 不会自动检测到它需要提升才能运行坦率地说更改安装程序名称以使事情正确提升听起来相当混乱本
如何在 PHPStorm (WebStorm) 中调试 grunt

有人对在 PHP Storm 中调试 grunt 例如事件侦听器函数有个好主意 Storm 中有 Node js 支持但如果我想调试 grunt 任务例如当文件更改并且监视任务发出它时我不确定如何配置调试设置我使用Windows
带范围运算符的 Perl 上下文是什么？

我是 Perl 新手我想结合范围运算符来理解 Perl 上下文这是我的代码 use strict use warnings my asc 10 50 print asc n 我有两个疑问如果表达式 10 50 返回一个数组那么由于
ReversedWildcardFilterFactory 如何加速通配符搜索？

索尔docs http wiki apache org solr AnalyzersTokenizersTokenFilters solr ReversedWildcardFilterFactory say solr ReversedWil

ReversedWildcardFilterFactory 如何加速通配符搜索？

ReversedWildcardFilterFactory 如何加速通配符搜索？ 的相关文章

随机推荐

热门标签

ReversedWildcardFilterFactory 如何加速通配符搜索？的相关文章