我有一个包含许多条目的 Solr 索引,并且在查询时返回一些子集 - 每个条目都有一些分数(显而易见)。一旦结果与分数一起返回,我希望能够仅“保留”高于某个分数的结果(即仅具有特定质量的结果)。当返回的子集可以是任何东西时是否可以这样做?
我问这个问题是因为在某些查询中,0.008 的分数似乎会导致良好的匹配,而其他查询则较高的分数会导致较差的匹配。
理想情况下,我只是在寻找一种登上顶峰的方法x
参赛作品只要它们至少具有一定的质量。
我认为你不应该这样做。使用 TF-IDF 评分模型,无法计算出高于该分数的所有结果都相关的分数,反之亦然。如果您设法做到这一点,那么在对索引进行几次更新后,该阈值很可能将不再有效(因为文档频率会发生变化)。
如果您仍然想这样做,我认为可以使用函数查询来实现:有一个if
(在后备箱中)和一个query
Solr 中可用的函数。只需过滤您的结果,以便仅保留分数高于给定阈值的条目。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)