模式更改是否需要重新索引所有 Solr 文档或仅包含已更改模式字段的文档？

2023-12-28

我的 Solr 索引中有数百万个文档。其中只有一千个文档具有字段 A，我想更改其架构。架构更改包括更改多值从真到假，stored从假到真，并且type从文本到字符串，需要重新索引的东西。重新索引数千个文档将花费我几分钟的时间，而重新索引所有内容则需要几天的时间。

Solr wiki 上的重新索引页面 (http://wiki.apache.org/solr/HowToReindex http://wiki.apache.org/solr/HowToReindex）说“您可能需要在开始索引过程之前删除所有文档”，但没有说明何时不需要。

我可以只删除包含字段 A 的一千个文档并重新索引这千个文档，还是需要先删除整个索引（所有文档），然后再对它们全部重新建立索引？

我已经在一个小型样本索引中测试了“删除少数”场景；更新和查询在更改的字段上按预期工作。然而，我不知道我是否只是运气好，由于没有删除所有内容而潜伏着一些问题。

如果您使用相同的 id（在 schema.xml 中定义的唯一键）对文档建立索引，则不必在建立索引之前删除它们。对具有相同 ID 的文档建立索引将覆盖现有文档。

请记住，当您为具有相同 ID 的文档建立索引时，旧文档会自动标记为“已删除”，但不会从索引中物理删除。并且词向量分析适用于所有文档（包括已删除的文档）

如果您需要物理清理已删除的文档，则需要执行索引“优化”，您可以从 solr 管理界面执行此操作。

如果您对架构进行更改，则不必对所有内容建立索引。仅重新索引受影响的文档就足够了。

所以如果我处在你的位置，我什至不会删除任何内容。我只会重新索引数千个受影响的文档。然后稍后进行优化以清理索引。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

模式更改是否需要重新索引所有 Solr 文档或仅包含已更改模式字段的文档？的相关文章

Node.getTextContent() 在 Node 中未定义

在我的项目中我面临一个问题 getTextContent 方法是节点类型未定义我目前使用的是jdk 1 5 谁能告诉我这是什么意思如果您遇到这个问题Eclipse 我测试的解决方案是 Java Build Path Order and
Solr Custom RequestHandler - 注入查询参数

简短的问题我正在寻找一种方法 java 来拦截对 Solr 的查询并注入我的业务逻辑提供的一些额外的过滤参数我应该使用什么结构语境首先我要坦白一点对于 Solr 我是个菜鸟对我来说设置一个服务器定义一个模式编写一个功能性
您将如何设计数据库以允许用户定义模式[关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案如果您必须创建一个应用程序例如博客应用程序那么创建数据库模式相对简单你必须创建一些表 tblPosts tblAttachments tb
solr 查询中的加号未正确处理

All 我是 Solr 的新手当我使用 solr 示例导入一些随机文档时我在 q 中使用搜索查询如下所示 fund report fund和之间没有空格我以为会在文档中搜索 fund report 这个词这种情况在文档中很少发生
使用多个字段对 solr 搜索结果进行排序 (solrj)

我需要根据两个因素对从 apache solr 返回的结果进行排序我们的系统中有三个实体由 solr 索引组项目和数据集在结果中我希望首先显示数据集然后是项目然后是组但我仍然希望它尊重每种类型的评分值因此例如结果将是得
在java中以编程方式生成XSD

是否有任何API可以在java中以编程方式生成XSD 我需要从 Json Schema 生成 XSD 我将阅读 Json Schema 并根据我在解析过程中遇到的元素需要创建适当的 XSD 元素因此如果有任何可以支持 XSD 元素的 A
为什么 Jing 不允许在 id 属性中使用冒号（“:”）？

我一直在努力反对 xsd ID 不允许在 id 属性中使用冒号我第一次注意到这一点是在 Emacs 中使用 James Clark 的 nxml mode 时因为它验证了我正在使用的 XHTML 文件然后我使用 Jing 针对 RN
Solr 中的多值字段排序

我有一个 Solr 索引将每个产品的价格存储在多值字段中我需要按价格对结果集进行排序其中价格从低到高从高到低我尝试对价格进行排序它显示错误您无法对 multivalued True 字段进行排序下面是我的 solr XML
本地/离线网站“站点”的全文搜索[重复]

这个问题在这里已经有答案了可能的重复通过 javascript 对 CD Rom 上的静态 HTML 文件进行全文搜索 https stackoverflow com questions 1357173 full text search
SOLR - 过滤器查询中的正则表达式

我想在 fq 中实现 Regex 但以前从未实现过我的属性中有以下值字段类型为小写 Prop company1 city1 state1 country1 高级分析化学家芝加哥我想根据正则表达式过滤结果正则表达式应该与上面的内容
使用java进行JSON模式验证[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在为返回 JSON 对象的 java webapp 编写一些验收测试我想验证返回的 JSON 是否针对架构进行验证任何人都可以建议
在solr中获取pdf搜索结果的页码

我正在构建一个 Web 应用程序用户可以在其中搜索 pdf 文档并使用 pdf js 查看它们我想显示搜索结果其中包含找到搜索词的段落的简短片段以及用于在右侧页面打开文档的链接所以我需要的是每个搜索结果的页码和简短的文本片段我正在
用户模式中默认创建的表

在 Sql Server 2008 中当我创建没有架构前缀的表时 create table mytable id int identify 它通常最终出现在模式 dbo 中名称为 dbo mytable 然而在我们的一台服务器上该表
使用 sunspot/solr 搜索多个模型

我已经能够成功地实现基本的全文搜索但是当我尝试使用范围 with statements 时任何涉及多对多关系模型的查询似乎都不适合我我知道相关行位于数据库中因为我的 sql 语句确实返回了数据然而太阳黑子查询不会返回任何结果我
Solr 中缺少强制 uniquekey 字段错误

我的项目中有这个问题我使用 Apache Poi 读取 xlsx excel 文件并且想在 Solr 核心中对它们进行索引我使用 SolrInputDocument 来索引读取文件这是我的java代码 package org sol
schema.ini 文件不适用于 MS Access

我有一堆 csv 文件我通过 VBA 将它们导入到 Access 中的表中我在与导入的 csv 文件相同的目录中还有一个 schema ini 文件尽管在 ini 文件中字段被指定为双精度类型但它们在 Access 中会转换为文本类
cursorMark是无状态的以及它如何解决深度分页

作为指定here https cwiki apache org confluence display solr Pagination of Results光标标记是无状态的但我不明白它是如何解决无状态的深度分页问题的 solr 是否按唯一
如何在 SQL 中存储目标（例如 RPG Quest）

今天有人问我他们应该如何将任务目标存储在 SQL 数据库中在这种情况下请考虑角色扮演游戏目标可能包括以下一些内容发现地点杀死 n MOB 类型获取对象的 n 个实现技能组中的技能你在角色扮演游戏中获得的所有其他东
Laravel Schema Builder 改变存储引擎

我正在尝试更改表并将其存储引擎更改为InnoDb 当我跑步时php artisan migrate它完成且没有错误然而当我检查 Sequel Pro 中的存储引擎时没有任何变化 public function up Schema ta
Solr 索引时间提升 VS 查询时间提升？

问题 1 我们可以只进行查询时间提升使用 dismax 而不在索引时间提及提升值吗问题 2 与查询时间提升相比索引时间提升有何优点缺点反之亦然查询时间和索引时间提升在索引时您可以选择提升特定文档整个文档或仅一个字段它作为

随机推荐

如何编写一个 O(n^2) 方法来查找两点之间的最大距离

我有一个数组int nums 5 1 6 10 4 7 3 9 2 我想在 O n 2 时间内找到该数组中最小和最大数字之间的距离根据作业的要求它需要 O n 2 时间为此我正在编写一个名为的方法quadratic 到目前为止我已
C++ 中的反射

我已经使用 Java 工作多年了在那些年里我广泛或者可能只是频繁使用反射并发现它有用且令人愉快但8个月前我换了工作现在Java只是一个记忆我开始接触C 所以现在我想知道C 中是否有反射机制我读过有关 RTTI 的内容但我
当您执行“git fetch上游master：master”与“git pull上游master：master”时，确切的区别是什么

我知道之间的区别git fetch and git pull git pull基本上是一个git fetch git merge在一个命令中但是我正在研究如何使用上游更新我的分支主分支无需检查主分支我遇到了这个答案合并更新和拉
如何为 Tomcat 设置 Spring 日志

使用 Spring MVC 且没有 Spring 日志使得调试变得困难我读过一些关于这个问题的其他文章但似乎没有一篇对我有帮助 log4j properties is in src文件夹 slf4j api 1 5 11 slf4j l
Azure WebJob 不会在调试器中本地运行

我的Azure WebJob曾经在VS2015调试器中运行但我发现它逐渐变得非常断断续续现在根本无法运行如果我将其部署到 Azure 它工作得很好该作业被标记为 RunOnStartUp public class Program s
如果 javascript 解释器执行“JIT 编译”，它是否会缓存其结果，以便下次加载网站时在同一脚本上使用？

更具体地说我最关心的是 Firefox 中的 SpiderMonkey 解释器因此假设我想加快浏览器中特定网站的加载速度或者加快具有某些流行脚本的所有网站的加载速度例如jQuery 据推测所涉及的脚本在页面重新加载之间不会改变
意外的模块路径“github.com/sirupsen/logrus”

我用过 github com sirupsen logrus 我无法删除它我试过了 go mod tidy go clean modcache 这是日志 go github com Sirupsen email protected cdn
Python 中的函数作为对象：内存中到底存储了什么？

我已经使用 Python 来解决实际问题有一段时间了但我仍然对幕后发生的事情没有正确的理论理解例如我正在努力理解 Python 如何将函数视为对象我知道函数是函数类的对象具有调用方法并且我知道我可以通过为自定义类编写调
将 Pickle 文件记录为 Mlflow 运行的一部分

我正在运行 MLflow 实验作为其中的一部分我想将一些工件记录为 python pickle 例如尝试不同的分类编码器因此想将编码器对象记录为 pickle 文件有办法实现这一点吗那里有两个功能日志工件 https mlflo
具有多语言支持的 Durandal（淘汰赛）应用程序

我正在为我正在开发的应用程序建立多语言支持经过一些研究并阅读SO 国际化最佳实践 https stackoverflow com questions 228835 best practice javascript and multilan
MySql - 存储“0000-00-00 00:00:00”代替默认日期值

我在 mysql 数据库中有一个带有日期时间列的表此列的默认值设置为 1900 01 01 00 00 00 但是我注意到在插入的 4000 行中有 1 行将此值设置为 0000 00 00 00 00 00 尽管设置了默认值但我对
我的seaborn 和Matplotlib 图看起来一样吗？

最近人们告诉我seaborn是Python中最好的数据可视化包所以我决定尝试一下然而我的图看起来与我的 matplotlib 图完全相同我正在使用 PyCharm Python 3 6 这是我用来测试两者的超级简单代码 x 1 2
安装 R 包时出现问题

我正在设置一台运行 Gentoo 的新笔记本电脑并希望安装 R 就像我在所有计算机上所做的那样然而在安装软件包时我遇到了一些问题我首先尝试 gt install packages c ggplot2 plyr reshape2 它正
是否可以在 Android Studio 中使用已发布签名的 APK 构建 App Bundle？我想将 apk 迁移到 Play 商店的应用程序包

我正在使用 Unity Engine 来构建 apk 然后我在Enhance 上使用该APK 来集成SDK AAB 格式不被接受因此我需要直接从 Unity 构建 APK 而不是 AAB 然后我希望将该集成 APK 迁移到 App Bun
卸载 python.org 版本的 python2.7 以支持默认的 OS X python2.7

我正在运行 OS X 10 8 2 并且我相信默认情况下它附带 Python 2 7 3 我之前从 python org 安装了 Python 2 7 2 并且想废弃它以将系统的默认 python 重置为预安装的原因是每当我启动任何 py
在seaborn中合并两个热图

我有 2 个数据表其中包含尺寸4x25 每个表都来自不同的时间点但具有完全相同的元数据本质上是相同的列标题和行标题鉴于列数较多我认为最好使用heatmap使用seaborn图书馆Python 但是我需要将两个表包含在同一个图中
使用 C# 以编程方式删除服务 [重复]

这个问题在这里已经有答案了可能的重复如何在 C 中以编程方式安装 Windows 服务 https stackoverflow com questions 358700 how to install a windows service
适应不断变化的业务需求？

关于如何开发能够适应不断变化的业务需求的软件的想法任何模式架构等可能一些轶事例子会很棒这更像是一项调查而不是具体问题谢谢您将想了解更多关于整个敏捷开发 http en wikipedia org wiki Agile deve
chmod - 保护正在访问的用户文件，以便只有所有者才能访问？

如何设置 chmod 以便只有文件的所有者才能读取写入和执行其他用户无法读写执行 chmod 600 filename会做的或者chmod 700如果它是可执行文件另一种不太神秘的方法是 chmod go rwx filenam
模式更改是否需要重新索引所有 Solr 文档或仅包含已更改模式字段的文档？

我的 Solr 索引中有数百万个文档其中只有一千个文档具有字段 A 我想更改其架构架构更改包括更改多值从真到假 stored从假到真并且type从文本到字符串需要重新索引的东西重新索引数千个文档将花费我几分钟的时间而重新索引所有

模式更改是否需要重新索引所有 Solr 文档或仅包含已更改模式字段的文档？

模式更改是否需要重新索引所有 Solr 文档或仅包含已更改模式字段的文档？ 的相关文章

随机推荐

热门标签

模式更改是否需要重新索引所有 Solr 文档或仅包含已更改模式字段的文档？的相关文章