如何使用Lucene实现拼音搜索？

2024-03-30

我想使用 Lucene 6.1.0.、Soundex 或任何适合葡萄牙语的算法来实现语音搜索。我在互联网上发现了许多不完整的示例，教如何实现自定义分词器、分析器，但似乎这些示例上使用的抽象类在 6.1.0 版本中并不相同。谁能指出我在哪里可以找到 Lucene 的好文档，而不仅仅是 java 文档，而没有任何进一步的文档来教导如何将这些东西组合在一起？

提前致谢。

The 分析仪文档 http://lucene.apache.org/core/6_1_0/core/org/apache/lucene/analysis/Analyzer.html展示如何创建分析器。

对于语音分析，您应该查看org.apache.lucene.analysis.phonetic https://lucene.apache.org/core/6_1_0/analyzers-phonetic/index.html包（您需要将“lucene-analyzers-phonetic-6.1.0.jar”添加到构建路径，以及 Apache 的“commons-codec-1.10.jar”，您可以get here http://commons.apache.org/proper/commons-codec/download_codec.cgi).

然后你可以设置你的分析器，例如：

Analyzer analyzer = new Analyzer() {
    @Override
    protected TokenStreamComponents createComponents(String fieldName) {
        Tokenizer tokenizer = new StandardTokenizer();
        TokenStream stream = new DoubleMetaphoneFilter(tokenizer, 6, false);
        return new TokenStreamComponents(tokenizer, stream);
    }
};

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

Lucene

如何使用Lucene实现拼音搜索？的相关文章

如何找出导致 poi 损坏 xlsx / xlsm 文件的原因

我遇到的问题是 Apache POI 仅通过读取和写入就损坏了 xlsm xlsx 文件例如使用以下代码 public class Snippet public static void main String args throws
如何在Android中将文件转换为base64（如.pdf、.text）？

如何将 SD 卡文档 pdf txt 转换为 Base 64 字符串并将字符串发送到服务器这个方法对我有用 String encodeFileToBase64Binary encodeFileToBase64Binary yourFile
Spring JSON序列化、Gson反序列化

我目前在某些内部对象的反序列化方面遇到问题在春天我在使用输出之前初始化所有对象 ResponseBody 例如这是一个响应 id 1 location id 1 extra location data id 2 location 1
无法解析 Java 中的方法

我有一个Question具有 4 个的对象Answer里面的物体在 Question java 我有一个方法是 public Answer getA return a 在另一种方法中我有 if questions get randomNu
连接到 Apache Kafka 多节点集群中的 Zookeeper

我按照以下说明设置了多节点 kafka 集群现在如何连接到zookeeper 是否可以从 JAVA 中的生产者消费者端仅连接到一个 ZooKeeper 或者是否有一种方法可以连接所有 ZooKeeper 节点设置多节点 Apache
Tomcat：Java 静态变量作用域、应用程序范围还是会话范围？

java 静态变量是否在使用相同 web 应用程序的所有会话之间共享或者每个会话都有自己的静态变量版本吗换句话说 Tomcat 是为每个会话创建一组新的类还是为整个 Web 应用程序创建一组新的类 Tomcat 创建一个ClassLo
JP QL - 一对多关系中的过滤结果

我在尝试构建 JPQL 查询时陷入困境并希望比我拥有更多 JPA 经验的人能够提供帮助考虑以下两个实体 class Author String name OneToMany mappedBy author Set
给定一个 IP 地址列表，如何找到最小值、最大值？

在Java中我有一个ip地址的数组列表我如何找到最小值和最大值我已经使用了 Collection min 但在以下情况下它不起作用 192 168 0 1 lt min 192 168 0 250 192 168 0 9 lt max
多个罐子、单个持久单元解决方案？

包括我在内的一些人一直在努力将不同模块 jar 中的实体合并到单个持久性单元中尤其是JavaSE 例如这里JPA 2 0 自动从不同的 jar 添加实体类到 PersistenceUnit https stackoverflow com
在java中查找OSX的版本

我需要测试 java 中 osx 的版本是否 Try System getProperty os name and or System getProperty os version 它返回字符串 HERE https docs oracle
如何将 java ArrayList 转换为等效的 double[] [重复]

这个问题在这里已经有答案了可能的重复如何在 Java 中从 List 转换为 double https stackoverflow com questions 6018267 how to cast from listdouble to
阻止 GWT 中的事件冒泡

我有以下代码片段 changeTextArea 是一个 TextArea 对象 changeTextArea addKeyboardListener new KeyboardListenerAdapter public void onKey
更改 WireMock __files 目录

来自docs http wiremock org docs stubbing 要从文件中读取正文内容请将文件放在 files 下目录默认情况下这应该位于 src test resources 下从 JUnit 规则运行时当独立运
调整 Java 类以提高 CPU 缓存友好性

在设计java类时对于实现CPU缓存友好性有哪些建议到目前为止我学到的是应该尽可能多地使用 POD 即 int 而不是整数这样在分配包含对象时数据将被连续分配例如 class Local private int data0 pr
Jersey/JAX-RS：如何自动使用@Valid递归级联bean验证？

我正在 Jersey 的 REST 资源端点中验证我的 POJO public class Resource POST public Response post NotNull Valid final POJO pojo public cl
无法实例化类对象的类型 (Java)

这是我收到错误的代码在 new 之后的第二个 Killer 处 String classes new String 5 kills 0 Brian Moser kills 1 James Doakes kills 2 Lila Tourn
从 Java/Spring 检索 RabbitMQ 队列中未确认消息的数量

有没有办法返回未确认的消息数我正在使用此代码来获取队列中的消息数 DeclareOk declareOk amqpAdmin getRabbitTemplate execute new ChannelCallback
部署到 Glassfish 4.1 时 URL 模式无效

如果用户已经通过身份验证我有一个网络过滤器可以从登录和索引页面重定向最初我有一个无效的 URL 模式我修复了无效模式并尝试重新部署以接收以下内容 java lang IllegalArgumentException Invalid U
startDrag 方法已弃用且无法编译程序

startDrag android content ClipData android view View DragShadowBuilder java lang Object int 已弃用如何解决这个问题而又不失去对旧版本的兼容性还有
与 System.in.read() 一起使用的文件结尾/流键盘组合是什么

如果这个小问题已经得到解答我深表歉意我无法在SO找到它使用以下 Java 简单代码从 IDE 控制台读取行 Windows 7 和 Eclipse Kepler int v try while v System in read 1 S

随机推荐

使用 perl 格式化字符串和日期

我想转换使用perl 05 26 2013 06 09 47 to 26 05 2013 06 09 47 另外我怎样才能将上面的日期和时间更改为 GMT 日期和时间 use DateTime Format Strptime qw my
用户查找加密数据库字段

本质上我有一个保存用户数据的表所有这些数据都是 AES 加密的在 BLOB 字段中这意味着这些字段都不能被索引这将减慢该表上的任何查询特别是因为在进行任何匹配之前整个表需要解密 WHERE AES DECRYPT user em
从树视图 tkinter 复制项目

我的一个 tkinter 应用程序中有一个树视图我想知道是否真的可以通过用户右键单击来复制选定的字段如果没有是否有任何其他小部件允许用户复制 GUI 窗口中显示的选定字段 Code log Toplevel root log titl
javascript向函数添加属性

假设我们有一个函数 function Rabbit console log shiv 现在无需创建该函数的对象我就可以分配该对象的属性 Rabbit bark function line console log name is line
使用 Iso_Fortran_Env 设置函数的 Kind 值

如何使用 ISO Fortran Env 的内在函数以 Fortran 2008 惯用的方式设置函数的返回 KIND 值通常在主程序中我可以使用 ISO Fortran 内在函数如下所示 program name here use i
jQuery 事件适用于 Firefox，不适用于 Chrome

我在代码中注册了一些点击事件它们在 Firefox Windows 和 Mac 中正常运行但在 Chrome 中无法执行尝试过 Windows 和 Mac beta JavaScript 的目的是根据 select 元素的值显示正确的
检查一个 Int 值是否大于或等于另一个 Int 值？价值？ [复制]

这个问题在这里已经有答案了如何比较两个 Int 值所以我有这个 let limit Int let current Int Int self stringValue 但是当我尝试比较它们大于或等于时 if current gt s
如何使 JAWS 等屏幕阅读器可以访问“正在加载”图标？

所以 HTML 代码是这样的 div style display none img src PT LOADING gif alt Processing please wait title div 即使提供了 ALT 文本在更改样式以显示图
函数 while 循环中的 return 是如何处理的？

我有一个函数该函数内部有一个 while 循环当我尝试使用 IF 语句在 while 循环内设置非局部变量然后退出整个函数时突然该变量不再设置 function EXAMPLE cat test txt while read LIN
insertRow 与appendChild

向表中添加行时首选哪种方法 var tr tbl insertRow 1 or var tr document createElement tr tbl appendChild tr insertRow会好得多这是支持的 http www
为什么此 GeoTool 片段不生成可查看的 shapefile？

我正在创建一个简单的程序它从 csv 文件读取值并根据这些值创建 shp 文件这是一个轻微的修改这个例子 http docs geotools org latest tutorials feature csv2shp html 形状文件
JUL 适配器不适用于 Jersey

我正在尝试使用七月适配器将 Java Util Logging 委托给 Log4j2 更准确地说任何使用 JUL 生成日志的第三方库都应该委托给 Log4j2 作为一个简单的练习我创建了一个使用库的独立应用程序我创建这个库是为了测试目
Steam API 所有游戏

我一直在阅读论坛并尝试 Steam API 我正在寻找提供所有 Steam 游戏的 API 我发现提供所有 SteamApp 的 API 以及提供应用程序信息的 Steam 商店 API 我正在寻找类型游戏但为此我需要为每个 Stea
如何在两个微服务之间共享 REST 服务实体？

我使用 java 创建了两个微服务我需要从服务 A 到服务 B 进行 REST api 调用发送的数据将采用 JSON 格式使用 jax rs 我需要在这两个服务中创建实体类由于两个项目中的实体类相同我可以吗创建一个通用 jar
ES 2017：异步函数 vs AsyncFunction(object) vs 异步函数表达式

我刚刚读到async functions并遇到了 ES2017 的一些类似功能它造成了很多混乱我只想问有什么区别async function AsyncFunction 用于创建异步函数和异步函数表达式我认为这只是另一个异步函数
Scrapy 遭遇 DEBUG：爬行（400）

我正在尝试使用 Scrapy 抓取页面 https zhuanlan zhihu com wangzhenotes 我运行这个命令 scrapy shell https zhuanlan zhihu com wangzhenotes and
python中的{}和[]有什么区别？

有什么区别columnNames and columnNames 在Python中我怎样才能迭代每一个使用 for value in columnNames OR for idx o val o in enumerate columnN
具有多个类约束的 Haskell 类型签名

我怎样才能有多个类约束所以如果A is an Eq and B is a Num 我可以说 f Eq a gt a gt b or f Num b gt a gt b 那么我怎样才能拥有Eq a gt and Num b gt 同时 f
如何自定义jquery滑块范围的颜色？

使用 jquery 滑块时我想将所选范围的默认颜色从灰色更改为蓝色 document ready function var slider slider slider range min min 0 max 100 change funct
如何使用Lucene实现拼音搜索？

我想使用 Lucene 6 1 0 Soundex 或任何适合葡萄牙语的算法来实现语音搜索我在互联网上发现了许多不完整的示例教如何实现自定义分词器分析器但似乎这些示例上使用的抽象类在 6 1 0 版本中并不相同谁能指出我在哪里可以

如何使用Lucene实现拼音搜索？

如何使用Lucene实现拼音搜索？ 的相关文章

随机推荐

热门标签

如何使用Lucene实现拼音搜索？的相关文章