Hibernate 搜索查找短语的部分匹配

2024-02-21

在我的项目中，我们使用带有 lucene 分析器和 Solar 的 Hibernate Search 4.5。我向我的客户提供一个文本字段。当他们输入一个短语时，我想找到所有User名称包含给定短语的实体。

例如，考虑数据库中具有以下标题的条目列表：

[ Alan Smith, John Cane, Juno Taylor, Tom Caner Junior ]

jun应该返回Juno Taylor and Tom Caner Junior

an应该返回Alan Smith, John Cane and Tom Caner Junior

    @AnalyzerDef(name = "customanalyzer", tokenizer = @TokenizerDef(factory = WhitespaceTokenizerFactory.class), filters = {
            @TokenFilterDef(factory = LowerCaseFilterFactory.class),
            @TokenFilterDef(factory = SnowballPorterFilterFactory.class, params = { @Parameter(name = "language", value = "English") })

    })
@Analyzer(definition = "customanalyzer")
    public class Student implements Serializable {

        @Column(name = "Fname")
        @Field(index = Index.YES, store = Store.YES, analyze = Analyze.YES)
        private String fname;

        @Column(name = "Lname")
        @Field(index = Index.YES, store = Store.YES, analyze = Analyze.YES)
        private String lname;

    }

我尝试过使用通配符搜索，但是

通配符查询不会对匹配项应用分析器。否则有 * 或 ? 的风险被毁掉太高了。 https://docs.jboss.org/hibernate/search/4.5/reference/en-US/html_single/#section-creating-faceting-request

Query luceneQuery = mythQB
    .keyword()
      .wildcard()
    .onFields("fname")
    .matching("ju*")
    .createQuery();

我怎样才能实现这个目标？

首先，您没有将分析器分配给您的字段，因此当前未使用它。您应该使用@Field.analyzer。

其次，为了回答你的问题，最好用以下方法来分析此类文本：EdgeNGramFilter。您应该将此过滤器添加到分析器定义中。

EDIT:此外，为了防止诸如“sathya”之类的查询与“sanchana”匹配，您应该在查询时使用不同的分析器。

下面是一个完整的例子。

@AnalyzerDef(name = "customanalyzer", tokenizer = @TokenizerDef(factory = WhitespaceTokenizerFactory.class), filters = {
        @TokenFilterDef(factory = LowerCaseFilterFactory.class),
        @TokenFilterDef(factory = SnowballPorterFilterFactory.class, params = { @Parameter(name = "language", value = "English") })
        @TokenFilterDef(factory = EdgeNGramFilterFactory.class, params = { @Parameter(name = "maxGramSize", value = "15") })

})
@AnalyzerDef(name = "customanalyzer_query", tokenizer = @TokenizerDef(factory = WhitespaceTokenizerFactory.class), filters = {
        @TokenFilterDef(factory = LowerCaseFilterFactory.class),
        @TokenFilterDef(factory = SnowballPorterFilterFactory.class, params = { @Parameter(name = "language", value = "English") })

})
public class Student implements Serializable {

    @Column(name = "Fname")
    @Field(index = Index.YES, store = Store.YES, analyze = Analyze.YES, analyzer = @Analyzer(definition = "customanalyzer"))
    private String fname;

    @Column(name = "Lname")
    @Field(index = Index.YES, store = Store.YES, analyze = Analyze.YES, analyzer = @Analyzer(definition = "customanalyzer")))
    private String lname;

}

然后特别提到您希望在构建查询时使用这个“查询”分析器：

QueryBuilder queryBuilder = fullTextEntityManager.getSearchFactory().buildQueryBuilder().forEntity(Student.class)
    // Here come the assignments of "query" analyzers
    .overridesForField( "fname", "customanalyzer_query" )
    .overridesForField( "lname", "customanalyzer_query" )
    .get();
// Then it's business as usual
Query luceneQuery = queryBuilder.keyword().onFields("fname", "lname").matching("sathya").createQuery();
FullTextQuery query = fullTextEntityManager.createFullTextQuery(luceneQuery, Student.class);

也可以看看：https://stackoverflow.com/a/43047342/6692043 https://stackoverflow.com/a/43047342/6692043

顺便说一句，如果您的数据仅包含名字和姓氏，则不应使用词干提取（SnowballPorterFilterFactory)：它只会无缘无故地降低搜索的准确性。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

Hibernate

Lucene

hibernatesearch

solar

Hibernate 搜索查找短语的部分匹配的相关文章

Java Runtime.getRuntime().freeMemory() 问题

我搜索并看到了一些线程但没有一个能够解决我遇到的具体问题我正在尝试使用以下方式监视我的内存使用情况Runtime getRuntime freeMemory Runtime getRuntime maxMemory and Runtim
Spring Security 自定义过滤器

我想自定义 Spring security 3 0 5 并将登录 URL 更改为 login 而不是 j spring security check 我需要做的是允许登录目录并保护 admin report html 页面首先我使用教
是否有任何简单（且最新）的 Java 框架可用于在 Swing 应用程序中嵌入电影？

我正在构建一个小型 Swing 应用程序我想在其中嵌入一部电影重要的是这个应用程序是一个 WebStart 应用程序并且该库应该能够打包在我启动的 jnlp 中即不依赖于本机库我知道并尝试过 JMF 但我认为与其他框架相比其
Java：在 eclipse 中导出到 .jar 文件

我正在尝试将 Eclipse 中的程序导出到 jar 文件在我的项目中我添加了一些图片和 PDF s 当我导出到 jar 文件时似乎只有main已编译并导出我的意愿是如果可能的话将所有内容导出到 jar 文件因为这样我想将其转换为
通往楼梯顶部的可能路径

这是一个非常经典的问题我听说谷歌在他们的面试中使用过这个问题问题制定一个递归方法打印从楼梯底部到楼梯顶部的所有可能的独特路径有 n 个楼梯您一次只能走 1 步或 2 步示例输出如果它是一个有 3 级楼梯的楼梯 1 1 1 2
在 Wildfly 中与 war 部署共享 util jar 文件

假设我有一个名为 util jar 的 jar 文件该 jar 文件主要包含 JPA 实体和一些 util 类无 EJB 如何使这个 jar 可用于 Wildfly 中部署的所有 war 无需将 jar 放置在 war 的 WEB IN
来自十六进制代码的 Apache POI XSSFColor

我想将单元格的前景色设置为十六进制代码中的给定颜色例如当我尝试将其设置为红色时 style setFillForegroundColor new XSSFColor Color decode FF0000 getIndexed 无论我在
Spring Security SAML2 使用 G Suite 作为 Idp

我正在尝试使用 Spring Security 5 3 3 RELEASE 来处理 Spring Boot 应用程序中的 SAML2 身份验证 Spring Boot 应用程序将成为 SP G Suite 将成为 IDP 在我的 Maven
Jackson XML ArrayList 输出具有两个包装器元素

我在 Jackson 生成的 XML 输出中得到了两个包装器元素我只想拥有一个我有一个 Java bean Entity Table name CITIES JacksonXmlRootElement localName City pu
从 GitHub 上托管的 Spring Cloud Config Server 访问存储库的身份验证问题

我在 GitHub 上的存储库中托管配置如果我将回购公开一切都好但如果我将其设为私有我将面临 org eclipse jgit errors TransportException https github com my user m
如何在 Spring 属性中进行算术运算？
Java实现累加器类，提供Collector

A Collector具有三种通用类型 public interface Collector
使用架构注册表对 avro 消息进行 Spring 云合约测试

我正在查看 spring 文档和 spring github 我可以看到一些非常基本的内容examples https github com spring cloud samples spring cloud contract sample
在 SWT/JFace RCP 应用程序中填充巨大的表

您将如何在 SWT 表中显示大量行巨大是指超过 20K 行 20 列的东西不要问我为什么需要展示那么多数据这不是重点关键是如何让它尽可能快地工作这样最终用户就不会厌倦等待每行显示某个对象的实例列是其属性一些我想使用 JFa
JMenu 中的文本居中

好吧我一直在网上寻找有关此问题的帮助但我尝试的任何方法似乎都不起作用我想让所有菜单文本都集中在菜单按钮上当我使用setHorizontalTextPosition JMenu CENTER 没有变化事实上无论我使用什么常量菜单
Java Swing：需要一个高质量的带有复选框的开发 JTree

我一直在寻找一个 Tree 实现其中包含复选框其中当您选择一个节点时树中的所有后继节点都会被自动选择当您取消选择一个节点时树中其所有后继节点都会自动取消选择当已经选择了父节点并且从其后继之一中删除了选择时节点颜色将发生变化
Resteasy 可以查看 JAX-RS 方法的参数类型吗？

我们使用 Resteasy 3 0 9 作为 JAX RS Web 服务最近切换到 3 0 19 我们开始看到很多RESTEASY002142 Multiple resource methods match request警告例如我们
如何重新启动死线程？ [复制]

这个问题在这里已经有答案了有哪些不同的可能性可以带来死线程回到可运行状态如果您查看线程生命周期图像就会发现一旦线程终止您就无法返回到新位置 So 没有办法将死线程恢复到可运行状态相反您应该创建一个新的 Thread 实例
org.apache.commons.net.io.CopyStreamException：复制时捕获 IOException

我正在尝试使用以下方法中的代码将在我的服务器中创建的一些文件复制到 FTP 但奇怪的是我随机地低于错误我无法弄清楚发生了什么 Exception org apache commons net io CopyStreamException
Spring表单ModelAttribute字段验证避免400 Bad Request错误

我有一个ArticleFormModel包含正常发送的数据html form由 Spring 使用注入 ModelAttribute注释即 RequestMapping value edit method RequestMethod PO

随机推荐

使用 PowerShell 搜索 AD，而不使用 AD 模块 (RSAT)

ActiveDirectory 模块附带远程服务器管理工具 RSAT 我想避免在 PC 客户端上安装 RSAT 有没有一种方法可以在不使用 Active Directory 模块的情况下检索 AD 组的成员你可以使用 ADSI 进行 L
调用 GetObject() 后，Graphics.TBitmap 成功从 JPEG 帧解码导致空 TDibSection

我正在使用 FastJpeg 库 jpegdec pas 将 JPEG 帧解码为 Graphics TBitmap 对象解码工作正常我使用 TBitmap SaveToFile 方法将位图打印到文件以进行目视检查它看起来很棒然后我
MySQL：为什么我的 INSERT 语句在自动递增 id 时会跳过 56 个数字？

在向我的 SQL 课程的学生演示 INSERT 语句时我们发现了 MySQL 8 0 中的一些奇怪行为请帮助我们了解发生了什么不需要解决方法因为我们知道一些解决方法这是为了学习而不是为了生产谢谢我们正在创建一个新数据库并从众
MVC4 脚手架添加控制器给出错误“无法检索元数据...”

我使用的是 RTM 版本的 Windows 8 和 VS 2012 Ultimate 我有一个 MVC4 项目使用具有代码优先实体框架模型的 SqlCe 4 0 模型非常简单 public class MyThing public int
Ubuntu 上的 java 和 libGDX / LWJGL 游戏全屏多显示器尺寸错误

我正在开发一个 libGDX LWJGL 之上的库游戏项目并从多个不同的工作站使用 Intellij IDEA IDE Windows 7 x64 笔记本电脑配备两个显示屏 1920x1080 和 1600x1200 nVidia G
WCF 多重绑定

当我尝试多个端点时出现以下错误 System ServiceModel AddressAlreadyInUseException The TransportManager failed to listen on the supplied U
XAudio2 - 更改频率时播放生成的正弦声音

我想开发一个应用程序来匹配您的耳鸣频率播放频率用户通过按加号或减号按钮来减少或增加频率参见部分代码基于 stackoverflow 的一些编码谢谢 public static short BufferSamples new sho
Scala Play Json 读取

我有一个示例代码如下 import play api libs json import play api libs functional syntax import play api data validation ValidationEr
我应该使用什么 shebang 来始终指向 python3？

我有一个使用 shebang 的脚本 usr bin env python 它在 Python 3 是唯一可用版本的计算机上运行良好但在同时具有 Python 2 和 Python 3 的计算机上它使用 Python 2 运行脚本如果
如何检测 TabBarView 刚刚被拖动？

TabBar 小部件有一个 onTap 回调可以检测用户何时刚刚按下了选项卡这很有用因此我们可以准备新的 tabView 来显示一些动态数据 TabBar 小部件还具有拖动功能允许更改显示的 tabView 与点击另一个选项卡的结果
当我将鼠标悬停在其上方大小发生变化的元素上时，如何防止 div 移动

http bit ly 1fVGrBT http bit ly 1fVGrBT 这是我的网站当您将鼠标悬停在 Problem 上并移开时其下方的 div 会被上下推动解决方案也会发生同样的情况有什么想法或建议如何防止它移动吗我认为
采购后清理全局环境：如何在 R 中删除某种类型的对象

我读到了一个公共数据集该数据集在构建最终数据帧的过程中创建了数十个临时向量由于该数据框将作为更大流程的一部分进行分析因此我计划source使用创建数据帧的 R 脚本但不想让自己或未来的用户面临混乱的全局环境我知道我可以使用ls列出
具有多个字段的对象的Java比较器[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我有一个对象Collection有 5 个字段 id entityType entityId brandId productId 要对一个
如何拦截 .NET 程序中对文件的访问

我需要在系统尝试访问文件时进行拦截并在其发生之前执行某些操作您可以使用FileSystemWatcher http msdn microsoft com en us library system io filesystemwatcher
使用 python-requests 上传文件 - UnicodeDecodeError

我正在尝试使用 python requests 上传文件 with open file zip rb as fff up requests post url files file fff 并得到 UnicodeDecodeError asc
TADOStoredProc 和 SQL Server 存储过程，参数作为默认值

我正在使用 Delphi 7 和 SQL Server 2008 我创建了一个虚拟表和虚拟存储过程如下所示 CREATE TABLE dbo Persons P ID int IDENTITY 1 1 NOT NULL LastName
为什么枚举会转换为函数？

考虑 enum Colors Red Green Blue 它转换成这样 var Colors function Colors Colors Colors Red 0 Red Colors Colors Green 1 Green Colo
@classmethod 的位置

装饰器类方法的源代码位于python源代码中的哪里具体来说我无法找到它在版本 2 7 2 中定义的确切文件我没有回答你的问题但下面的代码显示了装饰器可能相当于classmethod 用纯 Python 编写因为源代码中的那个是用
Xcode — 在外部编辑器中快速打开当前文件

是否可以设置键盘快捷键或者在某处添加一些菜单项以在外部编辑器中打开当前编辑的文件显然我可以这样做在文件树中右键单击在Finder中显示在窗口标题中右键单击选择包含目录右键单击文件打开方式应用程序但步骤太多了呵呵我已
Hibernate 搜索查找短语的部分匹配

在我的项目中我们使用带有 lucene 分析器和 Solar 的 Hibernate Search 4 5 我向我的客户提供一个文本字段当他们输入一个短语时我想找到所有User名称包含给定短语的实体例如考虑数据库中具有以下标题的条

Hibernate 搜索查找短语的部分匹配

Hibernate 搜索查找短语的部分匹配 的相关文章

随机推荐

热门标签

Hibernate 搜索查找短语的部分匹配的相关文章