Solr 可以加载原始 Lucene 索引吗？

2023-11-26

我的一些同事有一个大型 Java Web 应用程序，该应用程序使用使用 Lucene Java 构建的搜索系统。我想做的是拥有一个基于 HTTP 的 API 来访问那些现有的搜索索引。我以前使用过 Nutch，并且非常喜欢 OpenSearch 实现如何简单地以 RSS 形式获取结果。

我尝试在 solrconfig.xml 中设置 Solr 的 dataDir，希望它能愉快地拾取现有索引文件，但它似乎只是忽略它们。

我的主要问题是：

Solr 可以用来访问其他地方创建的 Lucene 索引吗？或者可能有更好的解决方案吗？

成功！根据 Pascal 对 schema.xml 更改的建议，我很快就让它工作了。谢谢！

以下是我的完整步骤，供感兴趣的人参考：

下载Solr并将dist/apache-solr-1.4.0.war复制到tomcat/webapps
将 example/solr/conf 复制到 /usr/local/solr/
将预先存在的 Lucene 索引文件复制到 /usr/local/solr/data/index
将 solr.home 设置为 /usr/local/solr
在solrconfig.xml中，将dataDir更改为/usr/local/solr/data（Solr在里面查找索引目录）
将我的 Lucene 索引加载到 Luke 中进行浏览（很棒的工具）
在示例 schema.xml 中，删除了除“string”之外的所有字段和字段类型
在示例 schema.xml 中，添加了与 Luke 中所示的 14 个字段相对应的 14 个字段定义。例子：<field name="docId" type="string" indexed="true" stored="true"/>
在示例 schema.xml 中，将 uniqueKey 更改为索引中似乎是文档 id 的字段
在示例 schema.xml 中，将 defaultSearchField 更改为索引中似乎包含术语的字段
启动tomcat，最终没有看到异常，并在localhost:8080/solr/admin中成功运行了一些查询

这对我来说只是证明它可以工作。显然还有很多配置需要完成。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

API

Search

Lucene

Solr

Solr 可以加载原始 Lucene 索引吗？的相关文章

Lucene 标准分析器与 Snowball

刚刚开始使用 Lucene Net 我使用标准分析器索引了 100 000 行运行了一些测试查询并注意到如果原始术语是单数则复数查询不会返回结果我知道雪球分析器增加了词干支持这听起来不错不过我想知道超过标准的雪球锣是否有任何
在多维数组 PHP 的所有键中搜索

我想在多维数组中的所有键中搜索特定字符串我只需要弄清楚它是否存在仅此而已我想知道访问者的 IP 是否存在于任何数组中有没有我可以用来执行此操作的 php 函数或方法我尝试过的每个函数或方法总是返回 false 数组中数组搜索数
在 .csv 文件中搜索 C 中的名称匹配项

我目前有一个 csv 文件其中包含三个字段用户密码类型例如我的文件如下所示 michael sun123 user joseph sierra7 user isaac apple2 sysop 我想从这样的文件中读取并检查用户
我可以使用 vim “star” 搜索来搜索 PHP 类成员和方法吗？

vim 星号星号搜索 help star 是一个很棒的功能它可以让您找到光标所在单词的下一个出现位置不幸的是它将美元前缀视为字符串的一部分因此如果我在类名中的 SearchTerm 上方按它会在注释中找到 SearchTerm
为 REST API 编写单元测试的最佳方法是什么？

在为 API 包装器编写单元测试时我应该对 REST API 端点进行真正的调用还是应该使用 mocl 响应来模拟成功和错误的调用单元测试意味着只测试你的unit API 包装器仅此而已因此不幸的是您应该模拟整个 API 另一
NoSQL（MongoDB）与 Lucene（或 Solr）作为数据库[关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案随着基于文档数据库的 NoSQL 运动的发展我最近关注了 MongoDB 我注意到如何将项目视为文档就像 Lucene 以及 Solr 用
simplexml_load_file 在 Solr 的 url 中带有 &（与号）

我正在使用 Solr 并有以下查询该查询在我的浏览器中运行良好 http www someipaddress com 8983 solr select q fq shopid 40 start 0 rows 18 fq manufactu
如何使用授权 API 设置部分身份验证

好的我正在通过 Authorize net API 设置部分付款以便能够使用多张卡支付单笔余额费用我假设他们的部分身份验证功能涵盖了我的用例但在测试中我可以在此处使用 API 实时控制台向您展示一个问题 https develo
检查 Bash 数组中是否存在元素[重复]

这个问题在这里已经有答案了我想知道是否有一种有效的方法来检查 Bash 数组中是否存在元素我正在寻找类似于我可以在Python中做的事情例如 arr a b c d if d in arr do your thing else do
请放心，如何在 POST 请求后从响应正文中提取生成的令牌并将其设置到标头

执行任何请求我需要执行身份验证POST请求正文 username somename password somepass 标头Content Type application json这给了我一个带有生成令牌的响应我需要将其粘贴为第二个标
Solr 中的拼写检查中阈值频率不起作用

我得到stuck在中间Solr 我只需要最流行的词 w r t query 我用过语音过滤器双方索引和查询但这里的problem是它正在给予术语太多我只需要几个术语这是非常具体的query 模式 xml
具有 .net core 后端和 .net 身份的 React SPA 应用程序

我基本上有与这里详细说明的相同的问题使用 asp Core 2 0 和 React 进行登录重定向 https stackoverflow com questions 48337368 但那个帖子从未得到答复我已经搜索了很多几乎我的问
如何使用 Airtable API 使用偏移量获取超过 100 行？

我对 Airtable API 非常陌生由于某种原因以这种方式连接 API 不起作用 at airtable Airtable Base Key Airtable Key 但我是这样工作的 get url https api airta
org.apache.catalina.core.JreMemoryLeakPreventionListener 中急切调用 URLConnection 的 setDefaultUseCaches(false) 是什么原因

这个问题可能有点难以找到答案这是一个系列中的问题考虑使用 Policy getPolicy 的原因是什么因为它将保留对上下文的静态引用并可能导致内存泄漏 https stackoverflow com questions 7057421
在 Java 中处理视频（DVD、.avi .mkv）

在寻找了一个像样的 Java 视频播放库之后我发现了问题周围的每个人都在尖叫不要使用 JMF 因为它已经过时过时并且需要用户安装它其他替代方案例如 VLCJ 如果可以工作的话似乎不错但仍然相对不稳定并且依赖大量本机代码并且至于
Solr 错误 - 流主体被禁用

我正在从浏览器 URL 中删除文档我正在使用 Solr 7 4 0 我正在使用此查询来删除文档 http localhost 8983 solr test update stream body
使用 Swagger 的 Spring REST API 文档 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个可以帮助我生成 RESTful API 文档的工具我的服务器是用Java编写的并使用S
Lucene.Net 下划线导致令牌分裂

我已将 MsSqlServer 数据库表视图和存储过程编写到目录结构中然后使用 Lucene net 对其进行索引我的大多数表视图和过程名称都包含下划线我使用标准分析器如果我查询名为 tIr 的表例如发票 tnWtn01 我收
获取所有ios应用程序的全局列表[重复]

这个问题在这里已经有答案了我想对苹果应用商店进行一些全球统计一个瓶颈是至少获取所有当前活动应用程序的 ID 这 9 位数字有谁知道如何获取 iOS 应用商店中当前活动应用程序的所有 id 的完整列表更好的是特定类别的所有 ID 例如
在 Android KitKat 中接收彩信

所以这个视频Android 4 4 短信 API http www youtube com watch v mdq0R2WQssQ DevBytes 解释了 KitKat 中 SMS API 的最新变化他们还提供了示例项目的链接 http

随机推荐

IntelliJ 社区版 JSP 语法高亮

我刚刚下载了 IntelliJ 15 0 1 Community Edition 因为我厌倦了 Eclipse 而且它在我的笔记本电脑 Ubuntu 14 04 LTS 上看起来很糟糕一切都进行得很顺利直到我发现 JSP 文件中的语法突
列表列表的所有组合[重复]

这个问题在这里已经有答案了我基本上是在寻找 python 版本的组合List
告诉 git 永远不要更新文件

我在 git 中有一些文件即配置文件我需要将它们放在 git 存储库中但我不希望它们更新出于某种原因运行它们然后更改配置文件那么有什么方法可以告诉 git 忽略对文件的任何更改但将原始文件保留在存储库中吗目前我发现执行此
如何识别 Google OAuth2 用户？

我使用 Facebook 登录来识别用户当新用户到来时我将他们的用户 ID 存储在我的数据库中下次他们来的时候我认出了他们的 Facebook ID 并且知道我的数据库中是哪个用户现在我尝试用 Google 的 OAuth2 做同
从 QChar 检索 Unicode 代码点 > U+FFFF

我有一个应用程序应该处理各种字符并在某些时候显示有关它们的信息我在 QChar QString 等中使用 Qt 及其固有的 Unicode 支持现在我需要 QChar 的代码点来查找一些数据http unicode org Public
使用 django 并扭曲在一起

1 我想开发一个有论坛和聊天的网站聊天和论坛以某种方式链接对于每个线程来说用户可以在该线程的聊天室中聊天或者可以在论坛上发表回复我正在考虑使用 django 进行论坛并使用twisted 进行聊天我可以将两者结合起来吗使用t
我应该使用哪种 X-UA 兼容模式？

我一直在阅读有关在网页上使用文档兼容性元标记的主题我有点困惑哪个内容值适合用于 xhtml 过渡文档类型的共识然后逐步使用 HTML5 文档类型我们仍然支持 IE6 IE7 所以 IE EmulateIE8 是最合适的有人可以帮忙
手机锁定时 Android 服务停止工作

我有一个启动服务的应用程序该服务有一个计时器每 30 秒弹出一次通知我注意到以下行为如果屏幕在屏幕上则通知显示正常即使应用程序在后台如果屏幕关闭通过电源按钮或本身关闭则不会显示通知如果屏幕关闭但我正在运行调试则会出现通
Android：如何在启动屏幕上对齐 2 个图像

我想使用包含 2 个图像的启动屏幕主图像必须完全居中次要图像必须位于底部和主图像之间的中心 The expected render is something like this But I don t see how to get th
Python结构模式匹配

我无法运行此代码 match shape case Point x y case Rectangle x y print x y 我找不到matchPython 中的关键字我在这里找到了它 https www python org dev
Angular 2：不改变 URL 的路由

如何在 Angular 2 应用程序中进行路由而不更改 URL 这是因为该应用程序位于 Django 应用程序页面上的几个选项卡之一下适合将 URL 保持不变目前我里面有这样的东西app component ts RouteConfig
有没有办法直接在 Jupyter 单元中调用 wait ？

我见过此类代码在某些环境中工作的示例例如https github com ipython ipykernel pull 323 但对我来说这只会提高SyntaxError so far Update 我知道在纯 Python 中它不起作
如何在java中检查（未经检查的）强制转换？

我有以下问题我想编写一个使用java反射的框架我从某处获得一个类的名称我想加载该类并创建一个实例作为侧面约束所有有效的类都属于一个公共超类为了保持简单和容易我不会发布我所有的课程相反我编写了某种 MWE 见下文我该怎
从 TFS 签出时的 .partial 文件

当我从 TFS 查看解决方案时我在整个项目中得到了很多 partial 文件它们不在 TFS 服务器上而在我的 PC 上遗憾的是其中一些阻止我的解决方案运行我总是必须手动删除它们我能以某种方式阻止这种情况吗他们来自哪里这些
如何通过 slack API 删除/禁用用户？

我对此尝试了多种方法首先尝试获取没有任何用户 ID 的用户这仅返回我的用户然后尝试获取具有其他 id 的用户它也可以正确检索数据但是我似乎无法将用户属性设置为已删除我正在使用这种Python方法 slack client a
本地存储库需要 Git LFS 吗？

我创建了一个专门存储在本地的 Git 存储库我问自己我是否真的需要 Git LFS 来存储二进制文件据我所知 gitattributes已正确配置如下所示 psd binary 是的文件落在 git objects 但它们被压缩并
创建CSS全局变量：样式表主题管理[重复]

这个问题在这里已经有答案了有没有办法在 css 中设置全局变量例如 Color1 fff Color2 b00 h1 color Color1 background Color2 最新更新 16 01 2020 CSS 自定义属性变量
CSV 到关联数组

我见过很多关于如何获取 CSV 文件然后创建一个以标题为键的关联数组的示例例如 Brand Model Part Test Honda Civic 123 244 Honda Civic 135 434 Toyota Supra 511
将范围扩展为：“1-3,6,8-10”到 [1,2,3, 6, 8,9,10]

我试图在我的程序中添加一个选项允许用户选择他想要执行的程序步骤我希望能够解析像这样的字符串 1 3 6 8 10 并得到 1 2 3 6 8 9 10 你知道 Python 中是否已经存在正在执行此操作的东西吗该函数执行您所要求的操作
Solr 可以加载原始 Lucene 索引吗？

我的一些同事有一个大型 Java Web 应用程序该应用程序使用使用 Lucene Java 构建的搜索系统我想做的是拥有一个基于 HTTP 的 API 来访问那些现有的搜索索引我以前使用过 Nutch 并且非常喜欢 OpenSear

Solr 可以加载原始 Lucene 索引吗？

Solr 可以加载原始 Lucene 索引吗？ 的相关文章

随机推荐

热门标签

Solr 可以加载原始 Lucene 索引吗？的相关文章