使用 Lucene 进行精确短语搜索？

2024-04-19

我正在使用 SpanTerm Query 在 lucene 中搜索确切的短语。但这似乎不起作用。这是我的代码。

Indexing

IndexWriter writer = new IndexWriter(dir, new StandardAnalyzer(Version.LUCENE_30), false,IndexWriter.MaxFieldLength.UNLIMITED);  
doc.add(new Field("contents", sb.toString(), Field.Store.YES, Field.Index.ANALYZED,Field.TermVector.WITH_POSITIONS_OFFSETS));
doc.add(new Field("imageid", imageDocument.getImageId(), Field.Store.YES, Field.Index.NOT_ANALYZED));
doc.add(new Field("title", imageDocument.getTitle(), Field.Store.YES, Field.Index.ANALYZED));
doc.add(new Field("country", imageDocument.getCountry(), Field.Store.YES, Field.Index.NOT_ANALYZED));
write.addDocument(doc);

搜寻中

String sentence = searchParameters.get("searchExactWord");
String[] words = sentence.split(" ");
String queryNoWord = "";
int i = 0;
SpanTermQuery [] clause = new SpanTermQuery[words.length];
for (String word : words)
{
    clause[i] = new SpanTermQuery(new Term("contents",word));
    i++;
}
SpanNearQuery query = new SpanNearQuery(clause, 0, true);
booleanQuery.add(query, BooleanClause.Occur.MUST);

如果我做错了请指导我？？？

Prateek

Try a PhraseQuery http://lucene.apache.org/java/3_0_3/api/core/org/apache/lucene/search/PhraseQuery.html反而：

PhraseQuery query = new PhraseQuery();
String[] words = sentence.split(" ");
for (String word : words) {
    query.add(new Term("contents", word));
}
booleanQuery.add(query, BooleanClause.Occur.MUST);

Edit:我认为你有不同的问题。您还有哪些其他部分booleanQuery？这是搜索短语的完整工作示例：

public class LucenePhraseQuery {
    public static void main(String[] args) throws Exception {
        // setup Lucene to use an in-memory index
        Directory directory = new RAMDirectory();
        Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_30);
        MaxFieldLength mlf = MaxFieldLength.UNLIMITED;
        IndexWriter writer = new IndexWriter(directory, analyzer, true, mlf);

        // index a few documents
        writer.addDocument(createDocument("1", "foo bar baz"));
        writer.addDocument(createDocument("2", "red green blue"));
        writer.addDocument(createDocument("3", "test foo bar test"));
        writer.close();

        // search for documents that have "foo bar" in them
        String sentence = "foo bar";
        IndexSearcher searcher = new IndexSearcher(directory);
        PhraseQuery query = new PhraseQuery();
        String[] words = sentence.split(" ");
        for (String word : words) {
            query.add(new Term("contents", word));
        }

        // display search results
        TopDocs topDocs = searcher.search(query, 10);
        for (ScoreDoc scoreDoc : topDocs.scoreDocs) {
            Document doc = searcher.doc(scoreDoc.doc);
            System.out.println(doc);
        }
    }

    private static Document createDocument(String id, String content) {
        Document doc = new Document();
        doc.add(new Field("id", id, Store.YES, Index.NOT_ANALYZED));
        doc.add(new Field("contents", content, Store.YES, Index.ANALYZED,
                Field.TermVector.WITH_POSITIONS_OFFSETS));
        return doc;
    }
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

Lucene

使用 Lucene 进行精确短语搜索？的相关文章

Java 迭代器获取下一个而不递增

我正在用 Java 编写以下循环对于每个循环我想访问链表 r 的当前元素和下一个元素 List
使用比较器对对象进行排序给出空指针

我正在尝试对包含 3 张卡的 ArrayList 进行排序我正在用比较器来做这件事这是否太过分了 Card getRank 返回 2 到 14 之间的整数我完全不知道哪里出了问题我之前已经成功完成了这个并与我的其他代码进行了比较
Antlr 处理异常

我使用 Antlr 3 和 AST 树开发了一个复杂的语法 ANTLR 生成词法分析器和解析器问题是例如当用户输入无效的语法时该语法需要用户没有输入此内容然后在我的 Eclipse IDE 中出现以下异常 line 1 24 m
谁能解释一下 servlet 映射吗？

我正在尝试使用 SpringMVC 编写一个 Web 应用程序通常我只是将一些虚构的文件扩展名映射到 Spring 的前端控制器并快乐地生活但这次我要使用类似 REST 的 URL 没有文件扩展名将我的上下文路径下的所有内容映射到前端
如何在 Groovy 中的 JSON Converter 方法中保留字母大小写？

我正在尝试将 groovy 对象解析为 JSON 属性名称不遵循正确的驼峰式大小写形式 class Client String Name Date Birthdate 当我使用这个时 Client client new Client Nam
Jackson Json 将对象反序列化为列表

我正在使用 Spring 的 Web 服务RestTemplate并反序列化Jackson 在来自服务器的 JSON 响应中其中一个字段可以是对象或列表这意味着它可以是 result or result 有没有办法通过对我要反序列化的类
按对象值分组，统计后按最大对象属性设置组键

我设法使用 Java 8 Streams API 编写了一个解决方案该解决方案首先按对象 Route 的值对列表进行分组然后计算每组中的对象数量它返回一个映射 Route gt Long 这是代码 Map
从继承的受保护 Java 字段创建公共访问器

我怎样才能完成以下工作 class Foo extends javax swing undo UndoManager increase visibility works for method override def editToBeUnd
PrintStream是有缓冲的，但是flush不会降低性能，而BufferedOutputStream会加速性能

我预计由于 PrintStream 是缓冲的通过在每次 print 之后添加刷新操作速度性能应该会显着降低但事实并非如此如下面的代码片段所示此外将 PrintStream 包裹在 BufferedOutputStream 周围可
Java 中的本机方法

我花了一些时间学习什么是 Java Native 方法以及它们是在平台相关代码主要是 C 中实现的但是我在哪里可以找到这些 Java 的本机实现呢例如 Thread 类的 sleep long millis 方法是本机的但它的实现代
无法启动组件 [StandardEngine[Catalina].StandardHost[localhost].StandardContext[/LabWebServletHibernate]]

当使用 eclipse neon 1 在 tomcat 8 上运行应用程序时我收到此错误它使用 spring 4 3 3 hibernate 5 2 4 和 maven 嚴重 A child container failed durin
将 emoji 替换为适当的 java 代码

我正在开发一个简单的java程序它可以接受这样的字符串停止你违反了法律但是现在你并将每个表情符号替换为适当的 java 字符我不知道该怎么称呼他们这是一个例子汽车表情符号将替换为 uD83D uDE97 这允许我有一个
Java - 同步方法导致程序大幅减慢

我正在尝试了解线程和同步我做了这个测试程序 public class Test static List
Java 中意外的负数

import java util public class Prac9FibonacciNumbers public static void main String args int x new int 100 x 0 1 x 1 1 fo
kafka Avro 多个主题的消息反序列化器

我正在尝试以 avro 格式反序列化 kafka 消息我使用以下代码 https github com ivangfr springboot kafka debezium ksql blob master kafka research c
将传入字符串的 unicode 表示形式转换为 UTF-8？

我正在读取一些已经转换为 html 样式代码的数据我现在需要将其转换回 UTF 8 字符以供查看不幸的是我无法使用浏览器查看该字符串我读过有关 java 中的转换的内容似乎如果你有一个 uxxxx 字符串那么编译器会为你转换然
如何在 Spring Boot 中创建 Apache POI Excel 视图配置

当我想使用 Spring Boot Web 将数据导出到 Excel 时遇到问题我使用 Thymeleaf 作为模板引擎由 Spring Boot 自动配置但是当我在附加配置中添加 XmlViewResolver 时由 XmlVie
线程睡眠阻止我的 Swing 应用程序执行

我的应用程序发生的事情是有道理的但我不知道如何修复它以下是我的应用程序功能的简要描述计时器窗口应显示在屏幕右下角并显示实时时间一小时后它应该执行一些操作我还没有决定该操作我面临的问题是定时器 java当我刷新实时计时器的秒数时
Maven `help: effective-pom` 只为单个项目生成，而不是所有项目

我想为多模块构建中的所有子项目生成有效的 pom The help effective pom文档here http maven apache org plugins maven help plugin usage html The hel
RecyclerView 适配器的 Kotlin 泛型

我正在尝试编写一个通用的 recyclerview 适配器我找到了几个例子然而仍然无法弄清楚如何实现通用适配器我写的代码是 open abstract class BaseAdapter

随机推荐

使用嵌套 delegate_to 将文件从一台远程服务器复制到另一台远程服务器

作为用户我想将文件从节点1复制到节点2 是否可以使用复制模块 delegate to 以下是我试图做的事情 Playbook 从节点 3 运行 Playbook Sample name Gather Facts for all hosts
如何在不指定类型的情况下引用 Java 枚举

我有一个类定义了自己的枚举如下所示 public class Test enum MyEnum E1 E2 public static void aTestMethod Test2 E1 lt lt Gives E1 cannot be
如何在Codeigniter中插入动态数据？

I just want to insert dynamic generated input field data into database My db table having three fields id Auto Increment
在Python中有效地找到scipy/numpy中非零的区间？

假设我有一个 python 列表或一个 python 一维数组以 numpy 表示假设存在连续的元素延伸如何找到此列表或数组中非零延伸的开始和结束坐标即索引例如 a 0 0 0 0 1 2 3 4 nonzero coords a
文本和边框之间的富文本框填充

是否可以在文本和边框之间的富文本框控件中添加填充我尝试将一个富文本框停靠在面板内并将所有四个边的填充设置为 10 这实现了我想要的效果除非需要富文本框的垂直滚动条该滚动条也会被填充有EM GETRECT https learn m
如何在 blogdown 中使用 bibtex 进行引用？

我想在使用 R 包 blogdown 创建的静态网站页面上使用引用基于关于 blogdown 的书 https bookdown org yihui blogdown https bookdown org yihui blogdown 这
Django - DRF - 调度方法流程

我正在与 DRF 合作构建一个 API 并使用主类对基于类的视图进行一些验证 class MasterClass APIView def dispatch self request args response super FaveoAPIV
将回调地狱转换为延迟对象

背景所以我有一个相当大的项目有很多 API 函数我正在考虑完全转向协程但由于它们的实现方式是Callback并不是Deferred 我无法有效地使用它们例如我想做apiCallOne apiCallTwo and apiCal
SqlBulkCopy 的建议批量大小是多少？

建议的批量大小是多少SqlBulkCopy 我正在寻找一个可以用作性能调整起点的通用公式我有一个导入实用程序与我的 SQL Server 实例位于同一台物理服务器上使用自定义IDataReader 它解析平面文件并将它们插入数据库中SQ
Vim：如何将一组行重新格式化为一行（如果该行是一个句子）？

不是重复的在 Vim 中将文件中的所有行连接成一行的最简单方法是什么 https stackoverflow com questions 391710 in vim what is the simplest way to join all
线段-多边形相交

问候我想检测一个线段是否只接触多边形或穿过它人物解释了我的疑问如何知道情况A和B的区别请注意在这两种情况下红线在两个顶点处穿过多边形一个顶点与外部相接触另一个顶点与内部相交我有一个段段相交算法但我不知道如何正确使
使用 iText 段落之间的图像

我正在使用 iText 生成自定义 pdf 文档我尝试了很多但无法获得包含图像的文本的所需设计我需要如下所示的输出我尝试过 Chunk 类和 Paragraph 类但我无法获得所需的结果有任何想法吗你有至少两个选择 Use
MySQL select for update 返回空集，即使存在一行

我发现 MySQL 的选择更新有一个奇怪的问题我使用的是5 1 45版本我有两张桌子 mysql gt show create table tag Tabl
在 Mac 上打开 CSV 文件时出现错误 53

当我尝试打开 CSV 文件时我得到错误 53 找不到文件我在第四行收到错误 Open FilePath For Input As 1我究竟做错了什么这是我第一次打开 CSV 请宽容我的代码 Sub opentextfile Dim
“Android”中的所见即所得视图编辑器？

复制有适用于 Google Android 的表单设计器吗 https stackoverflow com questions 1755860 我想移动一个复选框以便它显示在与 main xml 内绝对布局下的左上角不同的位置对于 A
这个文件格式叫什么

我需要解析以下格式的文件 General Description Some Text Version 4 ProjType 1 Configurations Mice BuildOutputs BuildProject OutputFile
更改背景颜色

好吧我对 vim 还很陌生我不知道如何更改背景颜色我正在编辑 vimrc 文件来设置这些颜色但找不到任何背景颜色我正在使用一个配色方案我只需要知道如何覆盖它或者要查找什么以便我可以在我的 color theme vim 文件中
如何让 NSView 不裁剪其边界区域？

我在 Xcode 上为 OS X 创建了一个空的 Cocoa 应用程序并添加了 void applicationDidFinishLaunching NSNotification aNotification self view NSVie
Android Studio 布局编辑器无法渲染自定义视图

在 Android Studio 中布局编辑器无法预览 xml 中的自定义视图非常简单的例子 public class MyCustomView extends FrameLayout public MyCustomView Conte
使用 Lucene 进行精确短语搜索？

我正在使用 SpanTerm Query 在 lucene 中搜索确切的短语但这似乎不起作用这是我的代码 Indexing IndexWriter writer new IndexWriter dir new StandardAnaly

使用 Lucene 进行精确短语搜索？

使用 Lucene 进行精确短语搜索？ 的相关文章

随机推荐

热门标签

使用 Lucene 进行精确短语搜索？的相关文章