我知道Lucene中有一个内置的DuplicateFilter,可以对Lucene的结果进行重复数据删除。对于用户在重复率非常高的文档数据库上进行搜索来说,这是一个非常重要的功能。
由于我正在使用 Hibernate Search 进行全文索引/搜索,并且想知道是否有办法将 Lucene 上的 DuplicateFilter 引入 Hibernate Search?
可以通过使用filters http://docs.jboss.org/hibernate/stable/search/reference/en-US/html_single/#query-filter。参见BestDriversFilter
- 它延伸org.apache.lucene.search.Filter http://lucene.apache.org/core/4_0_0-BETA/core/org/apache/lucene/search/Filter.html?is-external=true在相同的方式重复过滤器 http://lucene.apache.org/core/4_0_0-BETA/sandbox/org/apache/lucene/sandbox/queries/DuplicateFilter.html.
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)