是否可以“合理”地设置 Solr 分数阈值，而与返回的结果无关？（即 Solr 评分是否以任何方式标准化）

2024-06-20

我有一个包含许多条目的 Solr 索引，并且在查询时返回一些子集 - 每个条目都有一些分数（显而易见）。一旦结果与分数一起返回，我希望能够仅“保留”高于某个分数的结果（即仅具有特定质量的结果）。当返回的子集可以是任何东西时是否可以这样做？

我问这个问题是因为在某些查询中，0.008 的分数似乎会导致良好的匹配，而其他查询则较高的分数会导致较差的匹配。

理想情况下，我只是在寻找一种登上顶峰的方法x参赛作品只要它们至少具有一定的质量。

我认为你不应该这样做。使用 TF-IDF 评分模型，无法计算出高于该分数的所有结果都相关的分数，反之亦然。如果您设法做到这一点，那么在对索引进行几次更新后，该阈值很可能将不再有效（因为文档频率会发生变化）。

如果您仍然想这样做，我认为可以使用函数查询来实现：有一个if（在后备箱中）和一个querySolr 中可用的函数。只需过滤您的结果，以便仅保留分数高于给定阈值的条目。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Solr

是否可以“合理”地设置 Solr 分数阈值，而与返回的结果无关？（即 Solr 评分是否以任何方式标准化）的相关文章

本地/离线网站“站点”的全文搜索[重复]

这个问题在这里已经有答案了可能的重复通过 javascript 对 CD Rom 上的静态 HTML 文件进行全文搜索 https stackoverflow com questions 1357173 full text search
ckan本地安装，solr JSP支持未配置500错误

我正在尝试使用 Ubuntu 14 04 LTS 在本地计算机上安装 CKAN 我按照从找到的源安装的说明进行操作here http docs ckan org en latest maintaining installing instal
将solr 1.4索引升级到solr 3.3？

我有一个使用 apache solr 1 4 构建的现有索引我想在 3 3 版本中使用这个现有索引正如您所知索引格式在 3 x 之后发生了变化那么如何才能做到这一点呢我已经使用 Luke 将现有索引即 1 4 版本导出为 XM
Solr 过滤查询 - 字符串与整数

假设我正在尝试查询一堆具有类别的文档并且我想将查询限制为指定的类别据我所知这只是使用 fq 参数过滤器查询我想知道将参数设置为整数而不是字符串或数据通常的情况是否会提高性能我只是会在右侧犯错但我想我应该仔细检查一下以防万一
我们可以同时使用拼音标记和同义词吗？

我正在尝试同时启用语音分析器和同义词这似乎不起作用它们一起使用有错吗在下面的实现中我希望使用同义词转换搜索查询然后使用语音分析器来检索结果但我的同义词在这里完全被忽略了如果我在创建索引时删除语音分析器那么同义词就可以正常工作
solr + haystack + django 我在哪里放置 schema.xml？

我刚刚安装Solr and Haystack for a Django我正在做的项目下列的this http docs haystacksearch org dev tutorial html Haystack教程我创建了一个 sche
如何禁用 solr 管理页面

对于生产来说拥有一个甚至不要求登录凭据的 solr 管理员感觉不安全如何禁用默认的 solr 管理页面我只是希望我的 web 应用程序使用 Solr 进行搜索词索引我强烈建议保留管理页面用于调试目的它在很多情况下拯救了我有多种方
Solr 在 TrieDateField 上按年份过滤

我的 Solr 模式有一个字段类型tdate班级的solr TrieDateField
从 Solr Admin 删除 solr 文档

如何使用 SOLR Admin 删除 SOLR 索引中的所有文档我尝试使用该网址并且它有效但想知道是否可以使用管理员来完成相同的操作使用下面的查询之一DocumentSolr 管理 UI 选项卡 XML
用于标签搜索的数据存储解决方案

我已经按照预先计算的分数订购了数百万件商品每个项目都有许多布尔属性假设总共有大约一万个可能的属性每个项目有十几个我希望能够请求实时几毫秒给定任意属性组合的前 n 个项目您会推荐什么解决方案我正在寻找可扩展性极强的东西我们目
NoSQL（MongoDB）与 Lucene（或 Solr）作为数据库[关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案随着基于文档数据库的 NoSQL 运动的发展我最近关注了 MongoDB 我注意到如何将项目视为文档就像 Lucene 以及 Solr 用
SOLR - Boost 函数 (bf) 以增加日期最接近 NOW 的文档的分数

我有一个 solr 实例其中包含具有 startTime 字段的文档范围从上个月到一年后我想添加一个提升查询函数来提升 startTime 字段接近当前时间的文档的分数到目前为止我已经看到很多使用 rord 为较新的文档添加增强
加速 SOLR 搜索

使用 SOLR Apache Lucene 3 6 时 SOLR 搜索响应非常慢我正在尝试的一些性能增强技术是 SOLR 分页 mergeFactor 当前在 solrConfig xml 中设置为 10 SOLR 方面查询 solrco
如何减少solr内存使用？

我在我的应用程序中使用 solr 只有数百个文档内存占用80M左右如何减少 80M 并不多事实上它几乎是最低限度你不会比这个低很多影响内存使用的一些因素输入文档尺寸多线程文档更新缓存大小分面查询 Sorting 参考 ht
solr 不标记受保护的单词

我在 Solr Lucene 3 x 中有一个文档其中有一个特殊的复制字段facet headline 以便有一个用于分面的未词干字段有时两个或以上的单词属于在一起这应该被处理算作一个单词例如 kim jong il 因此标题星
在生产环境中使用 Rails 设置 sunspot solr

我尝试了各种链接但我似乎找不到关于创建与生产中的 Rails 一起运行的 solr 实例的好资源我知道您必须为生产设置 solr 服务器我已经尝试使用 tomcat 设置 solr 但我似乎无法将其链接到 Rails 应用程序有什么
org.apache.solr.common.SolrException 流主体已禁用

我已经设置了 apache solr 7 1 并使用 postman 工具来查询它但是当我尝试使用邮递员删除索引数据时出现以下错误 Request GET http localhost 8983 solr solr sample3 up
Solr：在哪里可以找到 Luke 请求处理程序

我正在尝试获取 Solr 索引中所有静态和动态字段的列表另一个SO答案 https stackoverflow com a 16296974 765287建议为此使用 Luke 请求处理程序它建议在此 url 中查找处理程序 http
特殊字符（-&+ 等）在 SOLR 查询中不起作用

我正在使用 text general fieldType 在 SOLR 中进行搜索在使用特殊字符进行搜索时我没有得到正确的结果并出现错误我想使用这样的特殊字符 Query solr q Healing Live solr q Heal
Solr 模式中字段的默认值可以是当前日期吗？

我正在使用 Solr 我想添加一个字段last update in the schema xml其中默认值是添加或更新文档的当前日期你知道我该怎么做吗 Thanks It is a 支持场景 https lucene apache org

随机推荐

Spring MVC 从 HttpServletResponse 相对重定向

鉴于这种相对重定向到另一个控制器的方法 Controller RequestMapping someController public class MyController RequestMapping redirme public Str
使用 jquery 在菜单中突出显示当前 url

我有一个菜单但我想突出显示当前与 jquery 的链接 var loc window location var lochref topNavigation li a attr href if lochref loc topNavigati
可排序不拖动 safari 中表格的所有列

我有一个vue引导表 https bootstrap vue org docs components table使用 v 槽为每个单元使用自定义模板所有这些单元格都是自定义组件我希望该表的行可以排序也就是说我希望用户能够拖放该表中的
是否有理由在 Perl 中使用 open(...) 的双参数形式？

是否有任何理由使用双参数形式open 在 Perl 中而不是三个或更多参数的版本我能想到的唯一原因是明显的观察结果即两个参数的形式更短但是假设冗长不是问题是否有任何其他原因会让您选择双参数形式open 一参数和二参数 open 应用
Bash 中的动态变量名称

我对 bash 脚本感到困惑我有以下代码 function grep search magic way to define magic variable 1 ls tail 1 echo magic variable 1 我希望能够创建一
字符串在换行符处拆分

我在 MS Access 表单上有一个文本框用户将从 Excel 电子表格中复制一列数字到其中我需要获取此输入并将其用作参数来构建查询我的代码看起来像这样 Dim data as variant Dim input as String
如何使用 mediawiki 的 api、curl 和 bash 登录？

我对流程的理解来自 mediawikis 登录手册https www mediawiki org wiki API 登录 https www mediawiki org wiki API Login 使用 MediaWiki 的 Web
在 symfony2 中加载应用程序的自定义配置文件

我正在开发一个symfony2应用程序我试图包含我的自定义 yaml 配置位于 src AppBundle Resources Config general yml 我已按照此处提供的示例进行操作http symfony com doc
如何在源代码管理中存储 Visual Studio 的调试配置

Visual Studio 的调试配置存储在 user文件是用户特定的并且传统上被源代码管理忽略我对工作目录参数感兴趣我需要它在程序员的机器上保持一致并且它具有以下价值 outDir而不是默认的 ProjectDir 我怎样才能解决这
iOS - 如何在 swift 中使用 `NSMutableString`

我已经看过这段 Objective C 代码但我很难在 swift 中做同样的事情 NSMutableAttributedString res self richTextEditor attributedText mutableCopy
如何在数据部分（RAM）中保留一定范围的内存并防止同一应用程序使用该内存的堆/堆栈？

我想在 RAM 中保留分配一定范围的内存并且同一应用程序不应覆盖或使用该范围的内存进行堆堆栈存储如何在内存中分配一定范围的内存以防止堆栈堆覆盖我考虑过向应用程序本身添加或分配一个数组并保留内存但它被编译器优化了因为它在应
如何使用Android获取Linux内核的版本？

如何在 Android 应用程序中获取 Linux 内核的版本不是 100 确定但我认为调用 uname r 需要 root 访问权限无论如何有一种不太肮脏的方法可以做到这一点那就是 System getProperty os v
为什么在此 boost SSL 服务器示例中使用shared_ptr

我正在检查这个SSL 服务器示例 https www boost org doc libs 1 72 0 doc html boost asio example cpp11 ssl server cpp并想知道为什么使用shared ptr
检查变量是否是函数类型

假设我有一个变量其定义如下 var a function Statements 我想要一个函数来检查变量的类型是否类似于函数 IE function foo v if v is function type do something foo
如何找到键盘未覆盖的视图部分（UIModalPresenationStyleFormSheet）？

我有一个视图控制器显示带有 UITextView 的视图并且我想在键盘出现时调整视图的大小以便 UITextView 不会被键盘覆盖我几乎在所有情况下都可以正常工作据我所知仅当视图控制器以 ModalPresentationSt
React 中的输入仅允许数字（antd 样式）

我知道 type number 有效但这不是我想要的 my HTML
删除PHP字符串中所有不匹配的字符？

我有一个文本我想从中删除所有不属于以下字符的字符所需字符 0123456789 abcdefghijklmnopqrstuvwxyz n 最后一个是我确实想保留的 n 换行符要匹配除列出的字符之外的所有字符请使用反转字符集 http
哈希桶数量

In the HashMap http docs oracle com javase 7 docs api java util HashMap html文档中提到 the 初始容量只是创建哈希表时的容量 the capacity是哈希表中的
检查数字是否在 JavaScript 中的范围内的最短代码

这是我检查一个数字是否在某个范围内在其他两个数字之间的方法 var a 10 b 30 x 15 y 35 x lt Math max a b x gt Math min a b gt true y lt Math max a b y
是否可以“合理”地设置 Solr 分数阈值，而与返回的结果无关？（即 Solr 评分是否以任何方式标准化）

我有一个包含许多条目的 Solr 索引并且在查询时返回一些子集每个条目都有一些分数显而易见一旦结果与分数一起返回我希望能够仅保留高于某个分数的结果即仅具有特定质量的结果当返回的子集可以是任何东西时是否可以这样做我问这个问

是否可以“合理”地设置 Solr 分数阈值，而与返回的结果无关？ （即 Solr 评分是否以任何方式标准化）

是否可以“合理”地设置 Solr 分数阈值，而与返回的结果无关？ （即 Solr 评分是否以任何方式标准化） 的相关文章

随机推荐

热门标签

是否可以“合理”地设置 Solr 分数阈值，而与返回的结果无关？（即 Solr 评分是否以任何方式标准化）

是否可以“合理”地设置 Solr 分数阈值，而与返回的结果无关？（即 Solr 评分是否以任何方式标准化）的相关文章