Java、Lucene：在Java中设置IndexWriter的锁定超时。

2024-04-13

我正在致力于将 Lucene 与我们基于 Spring-MVC 的应用程序集成。目前我们已经可以使用它了，但是我们很少得到cannot obtain lock错误。之后我必须手动删除锁定文件才能正常工作。

如何在 Java 中设置锁定索引的超时时间？我没有任何 Lucene 的 XML 配置。我通过POM.xml在maven中添加了项目库并实例化了所需的类。

Code :

public void saveIndexes(String text, String tagFileName, String filePath, long groupId, boolean type, int objectId) {
        try {
            // path is the indexing directory. 
            File testDir;
            Path suggestionsPath;
            Directory suggestionsDir;

            Path phraseSuggestPath;
            Directory phraseSuggestDir;

            Directory directory = org.apache.lucene.store.FSDirectory.open(path);
            IndexWriterConfig config = new IndexWriterConfig(new SimpleAnalyzer());
            IndexWriter indexWriter = new IndexWriter(directory, config);

            org.apache.lucene.document.Document doc = new org.apache.lucene.document.Document();
            if (filePath != null) {
                File file = new File(filePath); // current directory
                doc.add(new TextField("path", file.getPath(), Field.Store.YES));
            }
            doc.add(new StringField("id", String.valueOf(objectId), Field.Store.YES));
            //  doc.add(new TextField("id",String.valueOf(objectId),Field.Store.YES));
            if (text == null) {
                if (filePath != null) {
                    FileInputStream is = new FileInputStream(filePath);
                    BufferedReader reader = new BufferedReader(new InputStreamReader(is));
                    StringBuilder stringBuffer = new StringBuilder();
                    String line;
                    while ((line = reader.readLine()) != null) {
                        stringBuffer.append(line).append("\n");
                    }
                    stringBuffer.append("\n").append(tagFileName);
                    reader.close();
                    doc.add(new TextField("contents", stringBuffer.toString(), Field.Store.YES));
                }
            } else {

                FieldType fieldType = new FieldType(TextField.TYPE_STORED);
                fieldType.setTokenized(false);
                doc.add(new Field("contents", text+"\n"+tagFileName, fieldType));
            }
            indexWriter.addDocument(doc);
            indexWriter.commit();
            indexWriter.flush();
            indexWriter.close();
            directory.close();

            StandardAnalyzer analyzer = new StandardAnalyzer();
            AnalyzingInfixSuggester wordSuggester = new AnalyzingInfixSuggester(suggestionsDir, analyzer);

            ArrayList<String> words = new ArrayList<>();
            if (text != null) {
                text = html2text(text);
                Pattern pt = Pattern.compile("[^\\w\\s]");
                Matcher match = pt.matcher(text);
                while (match.find()) {
                    String s = match.group();
                    text = text.replaceAll("\\" + s, "");
                }

                if (text.contains(" ")) {
                    Collections.addAll(words, text.split(" "));

                } else {
                    words.add(text);
                }
                SuggestionIterator suggestionIterator = new SuggestionIterator(words.iterator());
                wordSuggester.build(suggestionIterator);
                wordSuggester.close();
                suggestionsDir.close();
            }

            AnalyzingInfixSuggester phraseSuggester = new AnalyzingInfixSuggester(phraseSuggestDir, analyzer);
            if (text != null) {
                text = html2text(text);
                ArrayList<String> phrases = new ArrayList<>();
                phrases.add(text);
                SuggestionIterator suggestionIterator = new SuggestionIterator(phrases.iterator());
                phraseSuggester.build(suggestionIterator);
                phraseSuggester.close();
                phraseSuggestDir.close();
            }

        } catch (Exception ignored) {
        }
    }

谢谢。

我引用两件事IndexWriter 文档 https://lucene.apache.org/core/6_5_0/core/org/apache/lucene/index/IndexWriter.html,

打开 IndexWriter 会为正在使用的目录创建一个锁定文件。尝试在同一目录上打开另一个 IndexWriter 将导致 LockObtainFailedException。

and

注意：IndexWriter 实例是完全线程安全的，这意味着多个线程可以同时调用其任何方法。如果你的应用程序需要外部同步，您不应该在 IndexWriter 实例上同步，因为这可能会导致死锁；请使用您自己的（非 Lucene）对象。

因此，如果 IndexWriter 已经在其他地方打开且未关闭，则无法再次打开它。就您而言，当两个用户位于同一代码块中时，碰巧会出现一些不幸的时机。

您可以通过两种方式解决这个问题，

1.指定关键部分：将具有编写器打开、使用和关闭操作的代码部分标记为关键部分，并在该关键部分上应用 Java 同步。使用一些应用程序 Singleton bean 进行同步。因此，当另一个用户遇到该块时，他将等待第一个用户完成并释放锁。

2.单写入器实例：在您的应用程序中开发一种机制，在应用程序的生命周期内仅打开和关闭编写器一次，并在服务代码中传递该单个实例，以便编写器方法可以被尽可能多的用户调用，因为编写器实例是线程安全的卢森人。我想，这可以通过 Singleton Spring bean 并将该 bean 注入到您的服务中来实现。

第二种方法的缺点是 - 单个全局索引目录的多服务器部署，以及是否有其他应用程序尝试在该全局索引上打开写入器。这个问题可以通过将索引编写器实例创建代码包装在某种全局服务中来解决，该服务不断将相同的实例返回给尝试使用它的应用程序。

这不是一个您试图通过删除锁定文件或引入超时来解决的简单问题。您必须根据 IndexWriter 文档对您的设计进行建模，而不是相反。

拥有单个编写器实例也会带来一些性能改进。

另外，练习在创建 writer 后立即进行空提交。这帮助我解决了过去的一些问题。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

Lucene

Java、Lucene：在Java中设置IndexWriter的锁定超时。的相关文章

将 CSV 文件读入 Java 作为数据库表

我发现了很多关于使用 Java 读取 CSV 的帖子并且他们所指向的 API 在读取 CSV 文件时都采用了面向行的方法就像当你得到一行时获取每一列的值我希望有一个更高级别的 API 比如在 Perl 中 DBI 允许您在 CSV
Java 弱哈希映射 - 需要根据值的弱点而不是键来删除条目

所以JavaWeakHashMap让我们创建一个映射如果其键变弱则删除该映射的条目但是我怎样才能创建一个Map 当它的条目被删除时values地图上变弱了我想使用映射的原因是作为全局哈希表它根据对象的 ID 跟踪对象 ID gt
无法从 TemporalAccessor 获取 OffsetDateTime

当我这样做时 String datum 20130419233512 DateTimeFormatter formatter DateTimeFormatter ofPattern yyyyMMddHHmmss withZone ZoneI
Selenium - 保存网站，包括所有图像、css、dom

我想使用 firefox 或 chrome 访问带有 selenium 的页面当页面加载时我想从页面下载所有图像 css dom 我想存储每张图像就像我在其中找到它们一样 chrome gt Tools gt Development
GSON：自定义对象反序列化

好吧我编辑了这个问题因为它不够清楚 Edit 2 更新了 JSON 文件我在 Android 应用程序中使用 GSON 我需要解析来自服务器的 JSON 文件而且有点太复杂了我不想让我的对象结构太重所以我想简化内容所以我的对象
如何在 Java 中安装附加包？

我对 Java 很陌生我想使用名为的包中的一些功能daj 教程代码有以下几行 import daj import java util import java lang Math import Msg 但第一行和第四行会产生红色下划线导致
@NotNull.List 的目的

当我查看标准时限制条件 http docs oracle com javaee 6 api javax validation constraints package summary html在 Bean Validation API JSR
(Java) 在 Mac OS X 上以编程方式访问“系统根目录”下的 SSL 证书

我正在编写一个 Java 应用程序它可以通过远程 Https 站点进行 REST Api 调用远程站点由受信任的证书签名它在 Windows 上运行良好但由于 SSL 证书问题在 OS X 上运行时遇到问题我做了一些挖掘发现原
将 emoji 替换为适当的 java 代码

我正在开发一个简单的java程序它可以接受这样的字符串停止你违反了法律但是现在你并将每个表情符号替换为适当的 java 字符我不知道该怎么称呼他们这是一个例子汽车表情符号将替换为 uD83D uDE97 这允许我有一个
可以混合使用 JVM 语言吗？即：Groovy 和 Clojure

我知道你可以轻松地混合groovy java clojure java 无论什么JvmLang java 这是否也意味着我也可以让 clojure 和 groovy 代码进行交互如果我使用 Grails 或 jRoR 我也可以在该环境中使
如何将 currentTimeMillis 转换为可读的日期格式？ [复制]

这个问题在这里已经有答案了我想用currentTimeMillis两次这样我就可以计算持续时间但我也想以用户可读的格式显示时间和日期我遇到了麻烦currentTimeMillis有利于计算但我看不到内置函数可以转换为合适的时间或时
Spring @Value 添加验证小于

我使用以下属性值注入我如何向此操作添加小于验证我的意思是我想设置一个验证user maxpassiveday可以说财产价值不得低于 100 Value user maxpassiveday int maxpassiveday 使用Sp
比较和删除列表和数组java中不存在的元素

我有一个String数组和一List
kafka Avro 多个主题的消息反序列化器

我正在尝试以 avro 格式反序列化 kafka 消息我使用以下代码 https github com ivangfr springboot kafka debezium ksql blob master kafka research c
在openjdk:7-jre-alpine docker上如何安装python 3.6

直到大约一周前我才在 java 图像上成功使用 python 3 6 脚本如下所示 FROM openjdk 7 jre alpine RUN apk update apk upgrade apk add no cache bash a
EclipseLink 2.7.0 和 JPA API 2.2.0 - 签名不匹配

当运行由maven构建的具有以下依赖项的项目时
为什么jdk中没有ConcurrentLinkedHashMap类？

这个问题直接接着问从我之前的问题来看 https stackoverflow com q 12299731 1527084 我想我的第二个问题的答案是否定的所以我想了解为什么 java util concurrent 包中没有 Concu
如何确保超类的子类方法的线程安全？

我参加了一次面试并被要求为以下要求设计一个课程假设我有一个 A 类它可以有任意数量的子类即子类类 A 有一个名为 doSomething 的方法该方法是同步的要求是 A 的所有子类都是强制性的重写 doSomething me
根据 Java 环境变量中的值创建使用 @JsonIgnore 的自定义注释

我需要创建一个新的注释用于在环境变量设置时忽略输出 JSON 文件中的字段var false 我尝试使用JsonAnnotationIntrospector 但无法获得预期的输出 public class Vehicle String v
对 Java 协议缓冲区对象进行一些小更改

我想在 Java 协议缓冲区对象树的深处进行一个小更改我可以使用 getBuilder 方法来创建一个新对象该新对象是旧对象的克隆并进行一些更改当深入完成此操作时代码会变得丑陋 Quux Builder quuxBuilder fo

随机推荐

运行 Jest 时 NextJS 中未定义环境变量

我设置了一个简单的 NextJS 项目但在让 Jest 识别我的环境变量时遇到问题我已按照以下说明进行操作https nextjs org docs basic features environment variables test e
微服务版本控制

就在运行时支持同一服务的多个版本化部署以及消费者如何使用不同版本而言适应基于微服务的架构中的版本控制的最佳实践是什么 1 如果我们使用基于路由的版本控制作为提到的方法之一here http niels nu blog 2016 micro
选择除第一个之外的所有“tr”

我怎样才能选择全部tr除第一个元素之外的元素tr在带有 CSS 的表格中我尝试使用this http www daniel lemire com blog archives 2008 08 22 how to select even or
如何将函数中的多个变量移至全局范围？

我是Python新手我正在努力创建一个类似游戏的垄断并且正在研究程序的设置方面我有一个函数询问用户他们想要为每个设置输入什么然后我使用另一个函数将这些设置导入到文本文件中以便可以存储它们以供以后使用也可以让程序将它们用作设置这
如何识别 RDP / MSTSC 登录失败的情况？

我正在使用 RDP MSTSC 的 C 实现MsRdpClient9NotSafeForScripting 类 https learn microsoft com en us windows win32 termserv imstscaxe
如何决定使用什么——双精度还是小数？ [复制]

这个问题在这里已经有答案了可能的重复十进制与双精度我应该使用哪一种以及何时使用 https stackoverflow com questions 1165761 decimal vs double which one should
如何将列表与 JPA Hibernate 中存在的所有值完全匹配？

我有一个User实体与skills属性作为类型列表我想查询的是User表格对照技能列表如果所有技能都出现在技能列中则仅找到匹配项除非没有我为此使用了 JPQL 但它使用以下命令逐一匹配列表中的每个元素IN clause 用户等级
生成一个sql server表中不存在的随机数

我正在寻找生成一个随机数该生成的数字不存在于另一个表上例如如果一个表名为randomNums具有价值观10 20 30 40 50 我喜欢生成一个除上述值之外的数字我尝试了以下查询 Query WITH CTE AS SELECT
按列表中的值对查询集进行排序

是否可以通过查询中提供的元素列表对 django 查询集进行排序例如如果我这样做 m objects filter id in 3 1 8 我不希望查询集的顺序是 id 3 的元素 id 1 的元素和 id 8 的元素 Thanks 既
React-router-dom 中的 Router 与 Route 有何不同

在 React Router 中文档 https reacttraining com react router web guides quick start我已经看到它同时导入Route and Router模块来自react router
Grails 3.0.0.M1 - 将脚手架模板安装到我的 Grails 项目中

我在 Grails 3 中可以获得的唯一模板install form fields templates are create gsp and edit gsp来自fields plugin 有没有机会再次安装和使用旧的 form gsp 字
我们可以在 Xamarin 表单的选项卡页面上方添加内容吗？

I want to add some label and image above tabbed page in xamarin forms so when i slide to another tabbed page the content
Visual Studio 2015：Ctrl+Shift+8 (View.PopBrowseContext) 导航回来不起作用？

A keyboard shortcut that I ve used frequently going back several Visual Studio versions is Ctrl Shift 8 to go back to wh
为什么我的 GAE 应用程序提供静态文件的延迟如此之高？

我在 GAE 上检查 Go 应用程序的性能我认为静态文件的响应时间相当长 183 毫秒是吗为什么我能做什么呢 64 103 25 105 07 Feb 2013 04 10 03 0800 GET css bootstrap res
使用 babel 缩小 webpack 中的 ES6 代码

我尝试过 Uglifyjs babelli babel minify 等选项似乎没有任何效果 Uglify 抛出一些如下错误预期名称 au680 bundle js 147541 22 babelli 也不压缩代码任何人都可以给出使用
Javascript 特殊字符匹配功能

我正在研究这段代码并使用匹配功能来检测密码的强度如何检测字符串中是否有特殊字符 if password match a z score if password match A Z score if password match 0 9
经典 ASP XLS 输出，单元格中带有回车符

我有一个经典的 ASP 脚本它将 HTML 表输出为 XLS 文件但没有运气让回车符换行符在单个单元格中工作为了进行测试我使用基于克里斯托夫响应的代码如何从经典 ASP 输出 Excel xls 文件 https stackove
如何将 Netezza 中的日期从时间戳格式转换为 yyyymmdd？

如何将 Netezza 中的日期从时间戳格式转换为 yyyymmdd 使用以下查询转换为日期格式 select TO CHAR DATE 2009 12 23 23 45 58 YYYY MM DD or select TO CHAR TO
如何获取子元素相对于父元素的位置？

如果有 Canvas 父级则很容易获得子级的位置 Canvas GetLeft Top child 但是对于其他类型的父母我怎样才能得到孩子的位置呢可以使用以下方法完成TranslatePoint的控制方法 UIElement cont
Java、Lucene：在Java中设置IndexWriter的锁定超时。

我正在致力于将 Lucene 与我们基于 Spring MVC 的应用程序集成目前我们已经可以使用它了但是我们很少得到cannot obtain lock错误之后我必须手动删除锁定文件才能正常工作如何在 Java 中设置锁定索引的超

Java、Lucene：在Java中设置IndexWriter的锁定超时。

Java、Lucene：在Java中设置IndexWriter的锁定超时。 的相关文章

随机推荐

热门标签

Java、Lucene：在Java中设置IndexWriter的锁定超时。的相关文章