如何使用现有的 solr 核心数据创建 solr 核心?

2024-03-25

Solr 1.4 企业搜索服务器建议对核心副本进行大量更新,然后将其交换为主核心。我正在执行以下步骤:

  1. 创建准备核心:
  2. 执行索引更新,然后在准备核心上提交/优化。
  3. 交换主核心和预备核心:
  4. 卸载准备核心:

我遇到的问题是,步骤 1 中创建的核心中没有任何数据。如果我要对所有东西和厨房水槽进行完整索引,那就没问题,但如果我只想更新文档的(大)子集 - 这显然是行不通的。

(我可以合并核心,但我想做的一部分是删除所有已删除的文档,而不尝试列出它们。)

我缺少一些 CREATE 操作标志吗?这CoreAdmin 的 Solr Wiki 页面 http://wiki.apache.org/solr/CoreAdmin细节上有点稀疏。

可能的解决方案:复制

solr-user 上的有人建议使用复制。要在这种情况下使用它(据我理解)需要以下步骤:

  1. 根据 MA​​IN 核心的配置创建一个新的 PREP 核心
  2. 将 MAIN 核心的配置更改为 master
  3. 将 PREP 核心的配置更改为从属
  4. 原因/等待同步?
  5. 更改 PREP 核心的配置,使其不再是从属核心
  6. 执行索引更新,然后在 PREP 核心上提交/优化。
  7. 交换 PREP 和 MAIN 核心

一个更简单的基于复制的设置是配置一个始终是主节点的永久 PREP 核心。然后,MAIN 核心(根据需要位于任意数量的服务器上)可以成为 PREP 核心的从属核心。索引可以根据需要在 PREP 核心上快速或缓慢地进行。

可能的解决方案:永久PREP核心和双重更新

我想到的另一个想法是(也涉及永久的 PREP 核心):

  1. 执行索引更新,然后在 PREP 核心上提交/优化。
  2. 交换 PREP 和 MAIN 核心。
  3. 重新执行索引更新,然后提交/优化现在的 PREP 核心。它现在拥有与 MAIN 核心相同的数据(理论上),并将存在,为下一次索引操作做好准备。

我创建了克隆操作的想法,该操作对索引和配置数据进行文件系统复制,然后创建一个新的。存在一些锁定问题,并且您必须具有对索引的文件系统访问权限,但它确实有效。这确实给了你一个很好的副本,你可以用它来处理配置文件。

我想得越多,你可以创建一个新的核心,然后执行以下操作:

从主命令强制在从设备上获取索引:http://slave_host:port/solr/replication?command=fetchindex http://slave_host:port/solr/replication?command=fetchindex可以传递额外的属性“masterUrl”或其他属性,例如“压缩”(或标记中指定的任何其他参数)以从主服务器进行一次性复制。这消除了在从机中对主机进行硬编码的需要。

并从生产版本中填充新版本,然后应用更新,然后交换回来!

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用现有的 solr 核心数据创建 solr 核心? 的相关文章

  • 如何在 SOLR 中索引 .html 文件

    我想要索引的文件存储在服务器上 我不需要抓取 路径 到 文件 示例 HTML 文件是
  • Solr 自动提交和自动优化?

    我很快就会将我的网站上传到 VPS 这是一个分类网站 使用Solr与 MySql 集成 每当放置或删除新的分类时 Solr 就会更新 我需要一种方法来使commit and optimize 自动化 例如每 3 小时左右一次 我怎样才能做到
  • Solr 精确单词搜索

    我想配置我的 Solr 搜索引擎 以便获得与我输入的搜索词完全匹配的结果 例如 taxes 应该返回带有 taxes 的文档 而不是 tax taxation 等 任何帮助或提示将不胜感激 我假设您的字段是 TextField 默认情况下
  • Solr 4 - 缺少必填字段:uuid

    我在使用 Solr4 中的 dataImportHandler 生成 UUID 时遇到问题 我正在尝试从现有的 MySQL 数据库导入 我的 schema xml 包含
  • 将 json 请求 POST 到 Solr,请求中带有cursorMark

    是否可以包括cursorMarkPOST 请求正文中的值而不是将其作为查询字符串参数发送 以下查询 query val abc limit 10 cursorMark sort id asc 返回一条错误消息 JSON 请求中未知的顶级键
  • SolrCloud:无法创建集合、锁定问题

    我一直在尝试实现 SolrCloud 一切正常 直到我尝试创建包含 6 个分片的集合 我的设置如下 5 个虚拟服务器 全部运行 Ubuntu 14 04 由一家公司跨不同数据中心托管 为整体运行 ZooKeeper 3 4 6 的 3 台服
  • solr 查询中的加号未正确处理

    All 我是 Solr 的新手 当我使用 solr 示例导入一些随机文档时 我在 q 中使用搜索查询 如下所示 fund report fund和 之间没有空格 我以为会在文档中搜索 fund report 这个词 这种情况在文档中很少发生
  • 加速 solr 索引

    Solr 索引花费的时间太长 我使用的mysql有超过3000万条记录 我正在使用两级子查询 请向我建议索引数据的最佳实践 以便我可以加快该过程 查看Solr性能因素 http wiki apache org solr SolrPerfor
  • 为什么无法使用 CentOS、plesk 9.2.1 和 tomcat 5.5 安装 solr 1.3.0?

    好吧 我只是通过他的托管提供商为我的客户设置了一个专用服务器 他们在那里安装了 plesk 版本 9 2 1 并且该专用服务器的一个警告是 如果我在控制面板之外 即使用 SSH 执行任何任务 他们不保证支持该软件组件 这很好 因为我宁愿使用
  • 更改 SOLR 默认连接

    我正在使用嵌入 SOLR 的应用程序 SOLR 在 Tomcat 的 webapp 区域中像一场战争一样运行 是否有 SOLR 配置允许我切换搜索的默认 SOLR 行为以假定 AND 而不是 OR 作为连接运算符 在您的模式文件中添加 或修
  • 如何在不使用 SPLITSHARD 的情况下动态向 SolrCloud 添加节点?

    我已经设置了Solr云有 4 个碎片 我向 SolrCloud 添加了 8 个节点 4 个领导者和 4 个副本 每个节点运行在不同的机器上 但后来我发现我的数据越来越多 每天400万文件 这样我的 4 个分片就不够用了 因此 我想动态地向该
  • 本地/离线网站“站点”的全文搜索[重复]

    这个问题在这里已经有答案了 可能的重复 通过 javascript 对 CD Rom 上的静态 HTML 文件进行全文搜索 https stackoverflow com questions 1357173 full text search
  • 对 solr 搜索结果进行排序。给出错误无法对多值字段进行排序:名称

    我对 Apache Solr 搜索比较陌生 我正在尝试对 Solr 查询中的结果集进行排序 查询 名称 abc AND 隐藏 false sort name desc 它显示错误 无法对多值字段进行排序 名称 Solr版本是 7 2 1 如
  • DataImportHandler 未在 solr admin 中索引 mysql 表

    我正在尝试使用 DataImportHandler 在 solr 中索引 mysql 表 但它似乎没有索引 数据配置 xml
  • 将solr 1.4索引升级到solr 3.3?

    我有一个使用 apache solr 1 4 构建的现有索引 我想在 3 3 版本中使用这个现有索引 正如您所知 索引格式在 3 x 之后发生了变化 那么如何才能做到这一点呢 我已经使用 Luke 将现有索引 即 1 4 版本 导出为 XM
  • 使用 sunspot/solr 搜索多个模型

    我已经能够成功地实现基本的全文搜索 但是当我尝试使用范围 with statements 时 任何涉及多对多关系模型的查询似乎都不适合我 我知道相关行位于数据库中 因为我的 sql 语句确实返回了数据 然而 太阳黑子查询不会返回任何结果 我
  • Solr 您的意思是(拼写检查组件)

    我在我的应用程序中使用 solr 并集成了拼写检查组件 但我遇到了一些问题 第一的 当我输入一个用空格分隔的术语时 他们会给我每个术语的更正 Eg 水 gt 什么术语 但事实是watters 第二 当我输入一些带有错误术语的短语时 尽管其他
  • Solr 中缺少强制 uniquekey 字段错误

    我的项目中有这个问题 我使用 Apache Poi 读取 xlsx excel 文件 并且想在 Solr 核心中对它们进行索引 我使用 SolrInputDocument 来索引读取文件 这是我的java代码 package org sol
  • 在 solr 8 中的 fl 中使用父过滤器时获取“当架构嵌套时不应发送父过滤器”

    我正在尝试使用子文档获取父文档 但得到 当模式嵌套时不应发送父过滤器 error 附上下面我尝试过但无法得到解决方案的查询 q parent which content type person fl child parentFilter c
  • 如何根据特定字段对 solr 查询的前 100 个结果进行排序?

    我想使用特定字段对 solr 的前 100 个文档进行排序 但它对整个结果集进行排序 然后显示结果 以下是我的代码 query1 setQuery Natural Language query1 setStart 0 query1 setR

随机推荐