Solr 可以加载原始 Lucene 索引吗?

2023-11-26

我的一些同事有一个大型 Java Web 应用程序,该应用程序使用使用 Lucene Java 构建的搜索系统。我想做的是拥有一个基于 HTTP 的 API 来访问那些现有的搜索索引。我以前使用过 Nutch,并且非常喜欢 OpenSearch 实现如何简单地以 RSS 形式获取结果。

我尝试在 solrconfig.xml 中设置 Solr 的 dataDir,希望它能愉快地拾取现有索引文件,但它似乎只是忽略它们。

我的主要问题是:

Solr 可以用来访问其他地方创建的 Lucene 索引吗?或者可能有更好的解决方案吗?


成功!根据 Pascal 对 schema.xml 更改的建议,我很快就让它工作了。谢谢!

以下是我的完整步骤,供感兴趣的人参考:

  1. 下载Solr并将dist/apache-solr-1.4.0.war复制到tomcat/webapps
  2. 将 example/solr/conf 复制到 /usr/local/solr/
  3. 将预先存在的 Lucene 索引文件复制到 /usr/local/solr/data/index
  4. 将 solr.home 设置为 /usr/local/solr
  5. 在solrconfig.xml中,将dataDir更改为/usr/local/solr/data(Solr在里面查找索引目录)
  6. 将我的 Lucene 索引加载到 Luke 中进行浏览(很棒的工具)
  7. 在示例 schema.xml 中,删除了除“string”之外的所有字段和字段类型
  8. 在示例 schema.xml 中,添加了与 Luke 中所示的 14 个字段相对应的 14 个字段定义。例子:<field name="docId" type="string" indexed="true" stored="true"/>
  9. 在示例 schema.xml 中,将 uniqueKey 更改为索引中似乎是文档 id 的字段
  10. 在示例 schema.xml 中,将 defaultSearchField 更改为索引中似乎包含术语的字段
  11. 启动tomcat,最终没有看到异常,并在localhost:8080/solr/admin中成功运行了一些查询

这对我来说只是证明它可以工作。显然还有很多配置需要完成。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Solr 可以加载原始 Lucene 索引吗? 的相关文章

  • Lucene 标准分析器与 Snowball

    刚刚开始使用 Lucene Net 我使用标准分析器索引了 100 000 行 运行了一些测试查询 并注意到如果原始术语是单数 则复数查询不会返回结果 我知道雪球分析器增加了词干支持 这听起来不错 不过 我想知道 超过标准的雪球锣是否有任何
  • 在多维数组 PHP 的所有键中搜索

    我想在多维数组中的所有键中搜索特定字符串 我只需要弄清楚它是否存在 仅此而已 我想知道访问者的 IP 是否存在于任何数组中 有没有我可以用来执行此操作的 php 函数或方法 我尝试过的每个函数或方法总是返回 false 数组中 数组搜索 数
  • 在 .csv 文件中搜索 C 中的名称匹配项

    我目前有一个 csv 文件 其中包含三个字段 用户 密码 类型 例如 我的文件如下所示 michael sun123 user joseph sierra7 user isaac apple2 sysop 我想从这样的文件中读取并检查用户
  • 我可以使用 vim “star” 搜索来搜索 PHP 类成员和方法吗?

    vim 星号 星号搜索 help star 是一个很棒的功能 它可以让您找到光标所在单词的下一个出现位置 不幸的是 它将美元前缀视为字符串的一部分 因此如果我在类名中的 SearchTerm 上方按 它会在注释中找到 SearchTerm
  • 为 REST API 编写单元测试的最佳方法是什么?

    在为 API 包装器编写单元测试时 我应该对 REST API 端点进行真正的调用 还是应该使用 mocl 响应来模拟成功和错误的调用 单元测试意味着只测试你的unit API 包装器 仅此而已 因此 不幸的是 您应该模拟整个 API 另一
  • NoSQL(MongoDB)与 Lucene(或 Solr)作为数据库[关闭]

    Closed 这个问题是基于意见的 help closed questions 目前不接受答案 随着基于文档数据库的 NoSQL 运动的发展 我最近关注了 MongoDB 我注意到如何将项目视为 文档 就像 Lucene 以及 Solr 用
  • simplexml_load_file 在 Solr 的 url 中带有 &(与号)

    我正在使用 Solr 并有以下查询 该查询在我的浏览器中运行良好 http www someipaddress com 8983 solr select q fq shopid 40 start 0 rows 18 fq manufactu
  • 如何使用授权 API 设置部分身份验证

    好的 我正在通过 Authorize net API 设置部分付款 以便能够使用多张卡支付单笔余额 费用 我假设他们的部分身份验证功能涵盖了我的用例 但在测试中 我可以在此处使用 API 实时控制台向您展示一个问题 https develo
  • 检查 Bash 数组中是否存在元素[重复]

    这个问题在这里已经有答案了 我想知道是否有一种有效的方法来检查 Bash 数组中是否存在元素 我正在寻找类似于我可以在Python中做的事情 例如 arr a b c d if d in arr do your thing else do
  • 请放心,如何在 POST 请求后从响应正文中提取生成的令牌并将其设置到标头

    执行任何请求 我需要执行身份验证POST请求正文 username somename password somepass 标头Content Type application json这给了我一个带有生成令牌的响应 我需要将其粘贴为第二个标
  • Solr 中的拼写检查中阈值频率不起作用

    我得到stuck在中间Solr 我只需要最流行的词 w r t query 我用过语音过滤器双方索引和查询但这里的problem是它正在给予术语太多 我只需要几个术语这是非常具体的query 模式 xml
  • 具有 .net core 后端和 .net 身份的 React SPA 应用程序

    我基本上有与这里详细说明的相同的问题 使用 asp Core 2 0 和 React 进行登录重定向 https stackoverflow com questions 48337368 但那个帖子从未得到答复 我已经搜索了很多 几乎我的问
  • 如何使用 Airtable API 使用偏移量获取超过 100 行?

    我对 Airtable API 非常陌生 由于某种原因 以这种方式连接 API 不起作用 at airtable Airtable Base Key Airtable Key 但我是这样工作的 get url https api airta
  • org.apache.catalina.core.JreMemoryLeakPreventionListener 中急切调用 URLConnection 的 setDefaultUseCaches(false) 是什么原因

    这个问题可能有点难以找到答案 这是一个系列中的问题考虑使用 Policy getPolicy 的原因是什么 因为它将保留对上下文的静态引用并可能导致内存泄漏 https stackoverflow com questions 7057421
  • 在 Java 中处理视频(DVD、.avi .mkv)

    在寻找了一个像样的 Java 视频播放库之后 我发现了问题 周围的每个人都在尖叫不要使用 JMF 因为它已经过时 过时并且需要用户安装它 其他替代方案 例如 VLCJ 如果可以工作的话似乎不错 但仍然相对不稳定并且依赖大量本机代码 并且至于
  • Solr 错误 - 流主体被禁用

    我正在从浏览器 URL 中删除文档 我正在使用 Solr 7 4 0 我正在使用此查询来删除文档 http localhost 8983 solr test update stream body
  • 使用 Swagger 的 Spring REST API 文档 [关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我正在寻找一个可以帮助我生成 RESTful API 文档的工具 我的服务器是用Java编写的并使用S
  • Lucene.Net 下划线导致令牌分裂

    我已将 MsSqlServer 数据库表 视图和存储过程编写到目录结构中 然后使用 Lucene net 对其进行索引 我的大多数表 视图和过程名称都包含下划线 我使用标准分析器 如果我查询名为 tIr 的表例如 发票 tnWtn01 我收
  • 获取所有ios应用程序的全局列表[重复]

    这个问题在这里已经有答案了 我想对苹果应用商店进行一些全球统计 一个瓶颈是至少获取所有当前活动应用程序的 ID 这 9 位数字 有谁知道如何获取 iOS 应用商店中当前活动应用程序的所有 id 的完整列表 更好的是特定类别的所有 ID 例如
  • 在 Android KitKat 中接收彩信

    所以这个视频Android 4 4 短信 API http www youtube com watch v mdq0R2WQssQ DevBytes 解释了 KitKat 中 SMS API 的最新变化 他们还提供了示例项目的链接 http

随机推荐

  • IntelliJ 社区版 JSP 语法高亮

    我刚刚下载了 IntelliJ 15 0 1 Community Edition 因为我厌倦了 Eclipse 而且它在我的笔记本电脑 Ubuntu 14 04 LTS 上看起来很糟糕 一切都进行得很顺利 直到我发现 JSP 文件中的语法突
  • 列表列表的所有组合[重复]

    这个问题在这里已经有答案了 我基本上是在寻找 python 版本的组合List
  • 告诉 git 永远不要更新文件

    我在 git 中有一些文件 即配置文件 我需要将它们放在 git 存储库中 但我不希望它们更新 出于某种原因 运行它们 然后更改配置文件 那么有什么方法可以告诉 git 忽略对文件的任何更改 但将原始文件保留在存储库中吗 目前 我发现执行此
  • 如何识别 Google OAuth2 用户?

    我使用 Facebook 登录来识别用户 当新用户到来时 我将他们的用户 ID 存储在我的数据库中 下次他们来的时候 我认出了他们的 Facebook ID 并且知道我的数据库中是哪个用户 现在我尝试用 Google 的 OAuth2 做同
  • 从 QChar 检索 Unicode 代码点 > U+FFFF

    我有一个应用程序应该处理各种字符并在某些时候显示有关它们的信息 我在 QChar QString 等中使用 Qt 及其固有的 Unicode 支持 现在我需要 QChar 的代码点来查找一些数据http unicode org Public
  • 使用 django 并扭曲在一起

    1 我想开发一个有论坛和聊天的网站 聊天和论坛以某种方式链接 对于每个线程来说 用户可以在该线程的聊天室中聊天 或者可以在论坛上发表回复 我正在考虑使用 django 进行论坛 并使用twisted 进行聊天 我可以将两者结合起来吗 使用t
  • 我应该使用哪种 X-UA 兼容模式?

    我一直在阅读有关在网页上使用文档兼容性元标记的主题 我有点困惑哪个内容值适合 用于 xhtml 过渡文档类型的共识 然后逐步使用 HTML5 文档类型 我们仍然支持 IE6 IE7 所以 IE EmulateIE8 是最合适的 有人可以帮忙
  • 手机锁定时 Android 服务停止工作

    我有一个启动服务的应用程序 该服务有一个计时器 每 30 秒弹出一次通知 我注意到以下行为 如果屏幕在屏幕上 则通知显示正常 即使应用程序在后台 如果屏幕关闭 通过电源按钮或本身关闭 则不会显示通知 如果屏幕关闭但我正在运行调试 则会出现通
  • Android:如何在启动屏幕上对齐 2 个图像

    我想使用包含 2 个图像的启动屏幕 主图像必须完全居中 次要图像必须位于底部和主图像之间的中心 The expected render is something like this But I don t see how to get th
  • Python结构模式匹配

    我无法运行此代码 match shape case Point x y case Rectangle x y print x y 我找不到matchPython 中的关键字 我在这里找到了它 https www python org dev
  • Angular 2:不改变 URL 的路由

    如何在 Angular 2 应用程序中进行路由而不更改 URL 这是因为该应用程序位于 Django 应用程序页面上的几个选项卡之一下 适合将 URL 保持不变 目前我里面有这样的东西app component ts RouteConfig
  • 有没有办法直接在 Jupyter 单元中调用 wait ?

    我见过此类代码在某些环境中工作的示例 例如https github com ipython ipykernel pull 323 但对我来说这只会提高SyntaxError so far Update 我知道在 纯 Python 中它不起作
  • 如何在java中检查(未经检查的)强制转换?

    我有以下问题 我想编写一个使用java反射的框架 我 从某处 获得一个类的名称 我想加载该类并创建一个实例 作为侧面约束 所有有效的类都属于一个公共超类 为了保持简单和容易 我不会发布我所有的课程 相反 我编写了某种 MWE 见下文 我该怎
  • 从 TFS 签出时的 .partial 文件

    当我从 TFS 查看解决方案时 我在整个项目中得到了很多 partial 文件 它们不在 TFS 服务器上 而在我的 PC 上 遗憾的是 其中一些阻止我的解决方案运行 我总是必须手动删除它们 我能以某种方式阻止这种情况吗 他们来自哪里 这些
  • 如何通过 slack API 删除/禁用用户?

    我对此尝试了多种方法 首先尝试获取没有任何用户 ID 的用户 这仅返回我的用户 然后尝试获取具有其他 id 的用户 它也可以正确检索数据 但是 我似乎无法将用户属性设置为 已删除 我正在使用这种Python方法 slack client a
  • 本地存储库需要 Git LFS 吗?

    我创建了一个专门存储在本地的 Git 存储库 我问自己 我是否真的需要 Git LFS 来存储二进制文件 据我所知 gitattributes已正确配置 如下所示 psd binary 是的 文件落在 git objects 但它们被压缩并
  • 创建CSS全局变量:样式表主题管理[重复]

    这个问题在这里已经有答案了 有没有办法在 css 中设置全局变量 例如 Color1 fff Color2 b00 h1 color Color1 background Color2 最新更新 16 01 2020 CSS 自定义属性 变量
  • CSV 到关联数组

    我见过很多关于如何获取 CSV 文件 然后创建一个以标题为键的关联数组的示例 例如 Brand Model Part Test Honda Civic 123 244 Honda Civic 135 434 Toyota Supra 511
  • 将范围扩展为:“1-3,6,8-10”到 [1,2,3, 6, 8,9,10]

    我试图在我的程序中添加一个选项 允许用户选择他想要执行的程序步骤 我希望能够解析像这样的字符串 1 3 6 8 10 并得到 1 2 3 6 8 9 10 你知道 Python 中是否已经存在正在执行此操作的东西吗 该函数执行您所要求的操作
  • Solr 可以加载原始 Lucene 索引吗?

    我的一些同事有一个大型 Java Web 应用程序 该应用程序使用使用 Lucene Java 构建的搜索系统 我想做的是拥有一个基于 HTTP 的 API 来访问那些现有的搜索索引 我以前使用过 Nutch 并且非常喜欢 OpenSear