优化 Solr 的排序

2024-03-01

我正在使用 Solr 进行实时搜索索引。我的数据集大约有 60M 大文档。我需要按时间排序，而不是按相关性排序。目前，我在查询中使用排序标志按时间排序。这对于特定搜索效果很好，但是当搜索返回大量结果时，Solr 必须获取所有结果文档并在返回之前按时间对它们进行排序。这很慢，必须有更好的方法。

更好的方法是什么？

我找到了答案。

如果您想按时间而不是相关性排序，请对所有过滤器使用 fq= 而不是 q=。这样，Solr 就不会浪费时间计算与 q= 匹配的文档的权重值。事实证明，Solr 花费了太多时间进行加权，而不是排序。

此外，您可以通过在 solrconfig.xml 中的 newSearcher 和 firstSearcher 事件侦听器中预热排序字段来加快排序速度。这将确保排序是通过缓存完成的。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Lucene

Solr

优化 Solr 的排序的相关文章

SolrCloud：无法创建集合、锁定问题

我一直在尝试实现 SolrCloud 一切正常直到我尝试创建包含 6 个分片的集合我的设置如下 5 个虚拟服务器全部运行 Ubuntu 14 04 由一家公司跨不同数据中心托管为整体运行 ZooKeeper 3 4 6 的 3 台服
solr 查询中的加号未正确处理

All 我是 Solr 的新手当我使用 solr 示例导入一些随机文档时我在 q 中使用搜索查询如下所示 fund report fund和之间没有空格我以为会在文档中搜索 fund report 这个词这种情况在文档中很少发生
仅根据lucene中term出现次数较多的文档来计算分数

我开始研究基于 lucene net 引擎的简历检索文档组件它工作得很好它会获取文档并根据 VSM 背后的理念是查询词出现在 a 中的次数文档相对于数量该术语出现在所有集合中的文档越多该文件的相关内容是询问 Lucene
使用 Lucene 进行精确短语搜索？

我正在使用 SpanTerm Query 在 lucene 中搜索确切的短语但这似乎不起作用这是我的代码 Indexing IndexWriter writer new IndexWriter dir new StandardAnaly
Solr 管理控制台中模式浏览器屏幕中的字段

上面是特定索引的架构浏览器屏幕的屏幕截图该字段是品牌字段类型定义如下
为什么无法使用 CentOS、plesk 9.2.1 和 tomcat 5.5 安装 solr 1.3.0？

好吧我只是通过他的托管提供商为我的客户设置了一个专用服务器他们在那里安装了 plesk 版本 9 2 1 并且该专用服务器的一个警告是如果我在控制面板之外即使用 SSH 执行任何任务他们不保证支持该软件组件这很好因为我宁愿使用
Lucene 的 StopFilter 中使用的默认停用词列表是什么？

Lucene 有一个默认的 stopfilter http lucene apache org core 4 0 0 analyzers common org apache lucene analysis core StopFilter h
Elasticsearch 中的嵌套与对象

有人可以解释 Elasticsearch 文档中对象和嵌套字段之间的区别吗我知道默认情况下字段被定义为对象我还知道我可以用这样的点访问对象字段 my field name my field title 等对象的文档 http
DataImportHandler 未在 solr admin 中索引 mysql 表

我正在尝试使用 DataImportHandler 在 solr 中索引 mysql 表但它似乎没有索引数据配置 xml
Solr 4.0 中的 BaseTokenFilterFactory 去哪儿了？

用于创建您自己的标记和字符过滤器的 Solr 文档说明如下 http wiki apache org solr AnalyzersTokenizersTokenFilters Specifying an Analyzer in the sc
复杂的 SOLR 查询，包括 NOT 和 OR

我对 SOLR 搜索有一些相当复杂的要求我需要针对标记内容的数据库执行这些搜索我需要首先过滤数据库以获取与我的过滤器标签匹配的结果任何具有黑名单中的标签的结果都应被删除除非它们也包含白名单中的标签假设我想检索所有标记为森林或
Solr MoreLikeThis 不适用于多个分片？

我在 SolrCloud 中有 5 个节点集群每个节点有 2 个分片 Solr版本 6 3 0 现在当我运行 mlt 查询时它仅返回每个节点的结果并且不会将它们分布在所有分片节点上即没有给出任何结果给出结果我什至尝试将其指
需要在 java api 中的 Solr 搜索中搜索文本及其周围的几行

我正在使用 solr 7 7 2 并且我使用 solrj 在 Solr 中编写了一个 Java 程序该程序在一个巨大的文本文件中搜索单词我使用以下代码来显示代表整个文本的搜索结果 SolrQuery params new SolrQue
Lucene 评分：在什么情况下使用 queryNorm？

我对 lucene 的评分策略有点困惑我知道Lucene的评分公式是这样的 score q d coord q d x queryNorm q X SUM
Solr 您的意思是（拼写检查组件）

我在我的应用程序中使用 solr 并集成了拼写检查组件但我遇到了一些问题第一的当我输入一个用空格分隔的术语时他们会给我每个术语的更正 Eg 水 gt 什么术语但事实是watters 第二当我输入一些带有错误术语的短语时尽管其他
Solr 中缺少强制 uniquekey 字段错误

我的项目中有这个问题我使用 Apache Poi 读取 xlsx excel 文件并且想在 Solr 核心中对它们进行索引我使用 SolrInputDocument 来索引读取文件这是我的java代码 package org sol
Solr PatternReplaceCharFilterFactory 未替换为指定模式

所以我对 Solr 很陌生但我尝试使用 PatternReplaceCharFilterFactory 对将存储的电话号码字符串进行一些预处理这是该字段的配置
如何使用 lucene 查询找到空的 Solr 文档字段

我有一些这样的文件
如何使用 solrnet 在 solr 中使字段搜索不区分大小写

在 solr 模式中我有如下字段
由于未定义符号，PECL solr 未加载：curl_easy_getinfo

我正在尝试加载 PECL solr 扩展我尝试使用 pecl install solr 并下载并使用 phpize configure make 来安装它在这两种情况下扩展安装时都没有错误但在 apache 重新启动后或在命令行上

随机推荐

标准库函数在 C 中如何工作？ [复制]

这个问题在这里已经有答案了在浏览 C 标准库函数时 glibc 我找到printf 实际上打电话puts 功能 IO puts 但我无法找出 put 函数实际上是如何写入的stdout 是否使用write 系统调用定义在unistd h或
带有虚线图案的渐变线

我需要创建一条具有线性渐变的虚线我设法使用创建了一条虚线 hr 以及以下样式 line border 0px border bottom 2px dashed 我也知道要实现渐变我需要这样做 background webkit grad
在 ec2 中启动 minikube 显示“X 抱歉，Kubernetes v1.18.0 需要将 conntrack 安装在 root 路径中”

我正在尝试启动 Minikube 所以我跑了 minikube start vm driver none 但它在控制台中显示以下行 Amazon 2 Xen amd64 上的 minikube v1 9 2 根据用户配置使用无驱动程序 X
使用 Google Apps 脚本 (GAS) V8 定义私有类字段

自从 Google 推出 V8 引擎以来我正在将一些代码迁移到新引擎 ES6 允许定义私有类但是在 Google App Script 上运行时我收到错误 Example class IncreasingCounter count 0
SharePlum 错误：“无法获取用户信息列表”

我正在尝试使用分享梅花 https pypi python org pypi SharePlum 0 1 1这是 SharePoint 的 Python 模块但是当我尝试连接到我的 SharePoint 时 SharePlum 会向我抛出
对象拥有 QObject 派生类集合的正确方法是什么？

我正在尝试创建一个类公开 QObject 派生类具有其自己的 qt 属性的集合或多个我可以在 qml 中使用 qt 属性根据http qt project org doc qt 5 0 qtcore qobject html n
如何从wpf中的代码隐藏更改控件的Grid.Row和Grid.Column

我已将控件放置在DataGrid像这样
python结构解包长度错误

我有一个长度为 41 的字节对象我尝试用以下方法解压它 struct unpack 2B2B32sBi data 但我收到一个错误 struct error 解包需要长度为 44 的字节对象我认为长度2B2B32sBi应该2 1 2 1
使c++程序在windows中的特定核心上运行

我想知道如何强制 Visual Studio 中的 C 程序在特定的核心上运行在拥有多个核心的计算机上 i found this https stackoverflow com questions 8326427 how to force
以编程方式设置Android动画列表

我正在尝试将 gif 动画添加到我的应用程序中 1 我可以从服务器下载 gif 动画 2 我能够解码动画 gif 使用我的自定义解码器并拥有与其帧相对应的单独位图现在我想使用逐帧动画来制作它的动画正如我所读到的要执行逐帧动画首先需
如何设置camel处理器或其他路由成分的id

Camel 自动生成处理器和其他内容的 ID processor1 processor25 有没有办法设置这个名字我们需要通过 jmx 识别某些处理器来获取遥测数据我想要设置的名称是通过属性给出的它们在开始时是已知的因此我需要在定
jQuery 交换图像未加载

我正在尝试使用 jQuery attr 将图像从 Images origImage 的原始图像源位置交换到 Images newImage 的新图像源位置当我单击 div 时如果右键单击图像并查看地址 URL 属性图像 Url 属性会
如何将不同类型的列插入到numpy数组中？

我想附加两个类型的 numpy 数组np datetime64 and int到另一个这会导致错误我需要做什么来纠正这个问题如果我将向量附加到自身上即 np append c c axis 1 or np append a a ax
如何设置gdb的默认选项？

我每次打开 GDB 时都会设置几个选项例如 set print thread events off 有没有办法默认设置这些选项也许类似于 gdb rc 文件初始化文件为gdb叫做 gdbinit 您可以将所需的选项放入此文件中它们将
当 div 滚动到视口时淡入

好的所以我一直在寻找simple当用户将其滚动到视图中时淡入 div 的方法但我找不到直接的解决方案 HTML div class container div class topdiv This is a 100 height div
C# - 无法在方法内声明委托

我这里真的是一片空白我在想why我无法在方法中声明委托类型但我必须在类级别声明委托类型 namespace delegate learning class Program Works fine public delegate void
静态内存实例中的字符串计数

据我所知编译时类似 C 的字符串仅作为一个实例保存在静态内存中例如我两者都有true在 gcc 4 6 上运行下面的示例但我想知道它是否总是如此并且可以便携 C 和 C 上的行为都很有趣 include
Spark如何执行join+filter？它具有可扩展性吗？

假设我有两个大型 RDD A 和 B 包含键值对我想使用密钥连接 A 和 B 但是在匹配的 a b 对中我只想要一小部分好的所以我进行连接并随后应用过滤器 A join B filter isGoodPair where isGo
Laravel 5.1 防止 CSRF 不匹配引发异常 [重复]

这个问题在这里已经有答案了我遇到向用户抛出 CSRF 异常的问题发生这种情况的原因完全是无辜的例如如果有人在最终提交表单时花了太长时间填写表单则会话已过期并且令牌不匹配现在显然这是一个错误但它不需要杀死所有内容并抛出异常有
优化 Solr 的排序

我正在使用 Solr 进行实时搜索索引我的数据集大约有 60M 大文档我需要按时间排序而不是按相关性排序目前我在查询中使用排序标志按时间排序这对于特定搜索效果很好但是当搜索返回大量结果时 Solr 必须获取所有结果文档并在返回

优化 Solr 的排序

优化 Solr 的排序 的相关文章

随机推荐

热门标签

优化 Solr 的排序的相关文章