使用不同搜索空间大小的不同 lucene 搜索结果

2024-01-13

我有一个使用 lucene 进行搜索的应用程序。搜索空间有数千个。在这数千个搜索中，我只得到了一些结果，大约 20 个（这是正常的并且是预期的）。

然而，当我将搜索空间减少到只有那 20 个条目时（即我只对这 20 个条目建立索引并忽略其他所有内容......这样开发会更容易），我得到相同的 20 个结果，但顺序不同（和评分）。

我尝试通过 Field#setOmitNorms(true) 禁用范数因子，但仍然得到不同的结果？

是什么导致了评分的差异？

Thanks

请参阅 Lucene 的评分文档相似度API http://lucene.apache.org/java/2_9_1/api/all/org/apache/lucene/search/Similarity.html。我的赌注是两种情况之间 idf 的差异（numDocs 和 docFreq 都不同）。为了确定，请使用解释（） http://lucene.apache.org/java/2_9_1/api/all/org/apache/lucene/search/Searcher.html#explain%28org.apache.lucene.search.Query,%20int%29函数来调试分数。

编辑：用于获取解释的代码片段：

TopDocs hits = searcher.search(query, searchFilter, max);
ScoreDoc[] scoreDocs = hits.scoreDocs;
for (ScoreDoc scoreDoc : scoreDocs) {
  String explanation = searcher.explain(query, scoreDoc.doc).toString();
  Log.debug(explanation);
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

Search

Lucene

size

scoring

使用不同搜索空间大小的不同 lucene 搜索结果的相关文章

如何自定义BlockingQueue的阻塞行为

我想创建一个阻塞队列它根据自定义规则而不是队列中的项目数量来阻止生产者例如生产者生成一些文件并放入队列中消费者经过一番分析后将它们转移到特定位置对于上述场景如果队列中的总文件大小达到某个阈值我希望生产者等待生成新文件如果总大
JUnit Eclipse 显示 System.out.print() 的

我正在使用 JUnit 3 和 Eclipse 3 4 当我运行 JUnit 测试用例时一切正常并且测试完美完成唯一的事情是我想查看我正在运行的类的输出所有类都具有一些输出值的基本 System out print 因此当我运行测试
firestore快照监听器生命周期和定价之间有什么关系？

在我的活动中我有一个字符串列表这些字符串表示我想要附加快照侦听器的 Firestore 文档我使用 Acivity ModelView 存储库结构在活动的 onCreate 中我向 ViewModelProvider 询问适当的
如何在具有动态列的表中插入值 Jdbc/Mysql

我想在具有动态列的表中添加值我设法创建一个包含动态列的表但我不知道如何插入数据 Create Table sql CREATE TABLE MyDB myTable level INTEGER 255 int columnNumber
无法从后台服务通过 WiFi 访问互联网

我将直接介绍我发现的一些事实数据如果您遇到解决了类似的问题请帮助我我每 5 分钟向服务器发送一次数据除非用户在服务器的帮助下手动将其关闭 wakeful broadcast receiver通过一个intent service
如何模拟一个方面

我目前正在使用aspectj 开发一些监控工具因为这个工具应该是技术独立的尽可能所以我没有使用 Spring 进行注入但我希望我的方面能够经过单元测试方面示例 Aspect public class ClassLoadAspect
独占锁定ConcurrentHashMap

我知道不可能锁定 ConcurrentHashMap 进行独占访问但是我找不到原因是因为构成CHM的 Segment 没有被api公开吗据推测如果是的话客户端代码可以执行交接锁定 Cheers 我知道不可能锁定 Concur
在 Spring 中设置 WS https 调用超时 (HttpsUrlConnectionMessageSender)

我正在尝试为 WS 调用设置超时我延长了WebServiceGatewaySupport并尝试将发送者超时设置为如下 public Object marshalSendAndReceive Object requestPayload We
如何自定义JProgressBar？

我正在制作一个启动器我想要一个自定义的进度栏我已经做了一些研究并且可以使用 JavaFX 从未用它做过任何事情并且可以通过替换 UI 来实现我正在寻找一个具有圆形边缘和圆形填充的酒吧像这样的事情 package gui impo
Java G1 GC 处理引用对象运行缓慢

我已经在 J ava 上运行了计数器它24小时工作每秒点击通过100次左右白天 GC 处理时间从 20 60 毫秒缓慢上升到 10000 60000 毫秒然后下降到 20 60 毫秒这种模式不时地重复从 GC 日志中我发现 GC
如何在将数据发送到 Firebase 数据库之前对其进行加密？

我正在使用 Firebase 实时数据库制作聊天应用程序我知道 Firebase 非常安全只要您的规则正确但我自己可以阅读使用我的应用程序的人的所有聊天记录我想阻止这种情况为此我需要一种解密和加密方法我尝试使用凯撒解密但失败了
通用 JSF 实体转换器[重复]

这个问题在这里已经有答案了我正在编写我的第一个 Java EE 6 Web 应用程序作为学习练习我没有使用框架只是使用 JPA 2 0 EJB 3 1 和 JSF 2 0 我有一个自定义转换器用于将存储在 SelectOne 组件中
哪种 Java DOM 包装器是最好或最受欢迎的？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
@TestPropertySource 不适用于 Spring 1.2.6 中使用 AnnotationConfigContextLoader 的 JUnit 测试

似乎我在 Spring 4 1 17 中使用 Spring Boot 1 2 6 RELEASE 所做的任何事情都不起作用我只想访问应用程序属性并在必要时通过测试覆盖它们无需使用 hack 手动注入 PropertySource 这不行
java中的比较器链

正在阅读Oracle 关于接口的 Java 教程 https docs oracle com javase tutorial java IandI createinterface html其中给出了一个例子Card 打牌我试图理解接口中的
将字符串中的字符向左移动

我是 Stack Overflow 的新手有一道编程课的实验室问题一直困扰着我该问题要求我们将字符串 s 的元素向左移动 k 次例如如果输入是 Hello World 和3 它将输出 lo WorldHel 对于非常大的 k 值它
Java的hashCode可以为不同的字符串产生相同的值吗？

使用java的哈希码函数是否可以为不同的字符串提供相同的哈希码或者如果可能的话其可能性的是多少 Java 哈希码是 32 位它散列的可能字符串的数量是无限的所以是的会发生冲突百分比是没有意义的项目字符串的数量是无限的而
监控 Java 应用程序上的锁争用

我正在尝试创建一个小基准在 Groovy 中以显示几个同步方法上的高线程争用当监控自愿上下文切换时应该会出现高争用在 Linux 中这可以通过 pidstat 来实现程序如下 class Res private int n s
使用 Android 的 Mobile Vision API 扫描二维码

我跟着这个tutorial http code tutsplus com tutorials reading qr codes using the mobile vision api cms 24680关于如何构建可以扫描二维码的 Andr
如何使用 Spring AOP 建议静态方法？

在执行类的静态方法之前和之后需要完成一些日志记录我尝试使用 Spring AOP 来实现这一点但它不起作用而对于正常方法来说它起作用请帮助我理解如何实现这一点如果可以使用注释来完成那就太好了也许您应该在使用 Spring AO

随机推荐

连接到 Azure 存储帐户时出现 404 错误

我正在浏览此处找到的带有天蓝色存储帐户的 blob 教程Azure 存储教程 http www windowsazure com en us develop net how to guides blob storage upload blo
如何在运行时动态创建/修改 Angular 9 项目结构中的 sitemap.xml 文件？

如何在 Angular 9 项目结构中创建动态 sitemap xml 文件我可以使用来自节点 API 的 HTTP get 请求获取数据但是使用此数据如何在运行时从 Angular 项目更新本地 xml 文件就我而言角度项目和节点
单独使用 CSS，如何实现从右到左的 Border-bottom 渐变？

我想知道是否可以单独使用 CSS 来制作边框底部渐变从右到左而不是从中心向外在寻找答案的过程中我发现了一个JSFiddle http jsfiddle net necolas vqnk9 链接显示可以有一个从上到下透明的边框渐变方法
通过将 git 变更集传输为 tarball 来模拟“气隙”系统的“git pull”

我需要将 git 存储库同步到气隙系统在系统上创建镜像环境文件必须通过专门批准的渠道传输新代码在被允许进入系统之前还必须经过漫长的审查和批准过程代码开发得很快我想每周同步特定分支就像我只是执行 git pull 一样重新传
AS3 中的多维数组排序

在 AS3 中进行多重排序的最简单方法是什么类似于 PHP 中的 array multisort 如下所示使用 array multisort 对多维数组进行排序 https stackoverflow com questions 53
代码高尔夫：钻石图案

Locked 这个问题及其答案是locked help locked posts因为这个问题是题外话但却具有历史意义目前不接受新的答案或互动挑战根据输入输出菱形图案的字符数最短代码输入由 3 个正数组成分别代表菱形的大小和网格的
如何复制一行数据，并以偏移量粘贴它

我正在处理一个 Excel 2010 工作表其中包含一些医生的姓名及其地址但经常有 2 个姓名相同但地址不同在这种情况下我想将地址信息复制到与名字相同的行但偏移量为 4 列这是我想出的代码 Sub OraganizadorEnd
bash read -d '' 的作用是什么？

a 是什么意思 d 在 bash 读取命令中做什么该示例直接来自以前的SO https stackoverflow com questions 15429330 how to specify a multi line shell vari
在 Python 中如何使用函数（回调）作为另一个函数的参数？

假设我有一些代码例如 def myfunc anotherfunc extraArgs somehow call anotherfunc here passing it the extraArgs pass 我想传递另一个现有函数作为an
将 List 从 actionlink 传递到控制器方法

在我的控制器中我有这个 ViewBag lstIWantToSend lstApps Select x gt x ID ToList creates a List
SQL Server 中将signed int 转换为字符串ip 地址

我正在从 SQL Server 数据库检索一个带符号的 int 并且需要将其转换为正常外观的点字符串以向用户显示谷歌搜索我发现了这段代码 SELECT dbo IPADDRESS IPADDRESS CAST ROUND cast
为什么 NHibernate.Cache.HashtableCacheProvider 不适合生产使用？

The NHibernate 文档 http nhforge org doc nh en index html performance cache和书NHibernate 实际应用 https rads stackoverflow com
继承默认构造函数在 gcc 中失败，但在 clang 中有效，哪个有 bug？

举这个简单的例子 struct Base Base Base defined by the compiler struct Derived Base using Base Base Should inherit Base Base Deri
为什么 Windows Azure 诊断不能可靠地记录日志？

我们在使 Windows Azure 诊断可靠地记录日志时遇到问题这似乎是偶然的我们不明白为什么这是我们的代码有时有效有时无效 public class WorkerRole RoleEntryPoint public overr
android ViewPager可定制

我需要实现一个滚动视图如下所示也就是说在空闲状态下图像 1 以全尺寸可见而图像 2 部分可见从而向用户提供他可以滚动内容的线索滚动后滚动视图不得停留在中间状态并且滚动必须完成就像 iOS 的滚动视图在启用分页打开
Terraform 可选 jsonencode 属性

好的获取以下 terraform 片段 variable my var1 type string default null variable my var2 type string default null output my out v
HP Fortify 路径操作验证规则

我正在通过 Hp Fortify 运行代码并有一些路径操纵的发现我了解它的背景并试图解决我没有遍历从数据库查询某些路径值来存储输出文件日志导出数据等的所有位置而是尝试将其集中化因此我不想让 File WriteAllTex
在 Android 上强制正确的 CSS3 转换百分比解释

tl dr 获取下面链接中演示的机制以在 Android Chrome 和默认浏览器上使用 GPU 加速 UPDATE 2 2014 01 13 13 25 30Z 根据bref it https stackoverflow com us
引用 JSON 树结构的分支的最佳方法是什么？

所以我有一个 JSON 文件它被解析为 Javascript 中的对象我知道你在想什么幸运的家伙 JSON 本质上是一个大树形式的流程图这是我想要实现的目标的一个小样本 tree options options name targe
使用不同搜索空间大小的不同 lucene 搜索结果

我有一个使用 lucene 进行搜索的应用程序搜索空间有数千个在这数千个搜索中我只得到了一些结果大约 20 个这是正常的并且是预期的然而当我将搜索空间减少到只有那 20 个条目时即我只对这 20 个条目建立索引并忽略其他所有

使用不同搜索空间大小的不同 lucene 搜索结果

使用不同搜索空间大小的不同 lucene 搜索结果 的相关文章

随机推荐

热门标签

使用不同搜索空间大小的不同 lucene 搜索结果的相关文章