删除文档后 SOLr 索引大小是否会减小?

2023-12-11

我有一个 SOLr 实例,在其中索引来自客户端的大量文档,以便用户可以在 Web 应用程序中搜索它们。

因为我们有大量文件,并且只需要搜索最近的文件(90 天左右),所以我们有一项计划工作,从索引中删除旧文档。

问题是,即使进行了删除,磁盘空间每天仍会增加约 2Gb。

这是正常行为还是我们应该采取更多措施来保持索引大小稳定?

我们正在使用 Java 应用程序向索引添加和删除文件。


删除只会将文档标记为已删除 - 它们仍然存在于索引中。由于删除它们需要重写索引文件,因此不会执行实际删除在发出优化命令之前.

还有一个选项expungeDeletes当您发出提交时,但据我所知,最好在正常运行时间之外发出优化。如果您每晚删除文档,则可以在删除后发出优化,甚至频率更低,例如每隔两天或三天一次。

优化需要与索引占用相同数量的可用磁盘空间(因为最坏的情况是整个索引被再次写入)。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

删除文档后 SOLr 索引大小是否会减小? 的相关文章

  • 有没有适合新手的 Solr 教程? [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • 在哪里可以找到 Apache Lucene/Solr 的性能基准

    是否有任何针对大型数据集上 Lucene Solr 性能基准的链接 资源 500GB 5TB以上范围的数据集 Thanks Lucene 提交者 Mike McCandless 运行基准 http people apache org mik
  • Solr 精确单词搜索

    我想配置我的 Solr 搜索引擎 以便获得与我输入的搜索词完全匹配的结果 例如 taxes 应该返回带有 taxes 的文档 而不是 tax taxation 等 任何帮助或提示将不胜感激 我假设您的字段是 TextField 默认情况下
  • Solr - 从数据库导入日期时间字段 -> 2 小时差异

    我正在 Solr 中导入日期时间列 SQLServer 并且 solr 中的值始终比数据库中早 2 小时 并且具有完整导入和增量导入 我已经用正确的时间配置了jvm 在日志中它显示了正确的时间 我想我必须在 data config xml
  • 在 Solr DataImportHandler 中从 Oracle 日期获取正确时间

    我正在尝试使用 Solr 的 DataImportHandler 从 Oracle DB 中索引一些文档 除了将 Oracle Date 列正确读取到我的文档中之外 一切工作正常 我的 Solr 架构中的字段定义为
  • 如何使用 SolrJ 获取突出显示的片段?

    我正在将我的应用程序从 Lucene 迁移到 Solr Solr 可以更好地处理突出显示 但是如果我搜索关键字 city 我会期望得到如下响应 id fdc3833a 0e4f 4314 ba8c title Paris is a beau
  • 如何使用 Solr Provider 控制 Sitecore ContentSearch 中嵌套查询的优先级?

    版本详情 我正在使用 Sitecore 7 5 build 141003 使用 Solr v4 7 作为搜索引擎 索引服务器 我还使用标准 Sitecore Solr 提供程序 没有自定义索引器 目标目标 我使用 Sitecore Cont
  • 将 json 请求 POST 到 Solr,请求中带有cursorMark

    是否可以包括cursorMarkPOST 请求正文中的值而不是将其作为查询字符串参数发送 以下查询 query val abc limit 10 cursorMark sort id asc 返回一条错误消息 JSON 请求中未知的顶级键
  • Solr 索引与存储

    我对太阳能场的索引和存储属性的行为有点困惑 例如 如果我在 Schema xml 中有以下内容
  • 为什么无法使用 CentOS、plesk 9.2.1 和 tomcat 5.5 安装 solr 1.3.0?

    好吧 我只是通过他的托管提供商为我的客户设置了一个专用服务器 他们在那里安装了 plesk 版本 9 2 1 并且该专用服务器的一个警告是 如果我在控制面板之外 即使用 SSH 执行任何任务 他们不保证支持该软件组件 这很好 因为我宁愿使用
  • Solr距离过滤

    我正在尝试使用 Solr 进行距离范围搜索 我知道在5公里范围内进行搜索过滤很容易 q fq geofilt pt 45 15 93 85 sfield store d 5 我所追求的是如果我正在寻找一系列的说法 如何做同样的事情5至10公
  • 更改 SOLR 默认连接

    我正在使用嵌入 SOLR 的应用程序 SOLR 在 Tomcat 的 webapp 区域中像一场战争一样运行 是否有 SOLR 配置允许我切换搜索的默认 SOLR 行为以假定 AND 而不是 OR 作为连接运算符 在您的模式文件中添加 或修
  • 如何在不使用 SPLITSHARD 的情况下动态向 SolrCloud 添加节点?

    我已经设置了Solr云有 4 个碎片 我向 SolrCloud 添加了 8 个节点 4 个领导者和 4 个副本 每个节点运行在不同的机器上 但后来我发现我的数据越来越多 每天400万文件 这样我的 4 个分片就不够用了 因此 我想动态地向该
  • 将solr 1.4索引升级到solr 3.3?

    我有一个使用 apache solr 1 4 构建的现有索引 我想在 3 3 版本中使用这个现有索引 正如您所知 索引格式在 3 x 之后发生了变化 那么如何才能做到这一点呢 我已经使用 Luke 将现有索引 即 1 4 版本 导出为 XM
  • Solr MoreLikeThis 不适用于多个分片?

    我在 SolrCloud 中有 5 个节点集群 每个节点有 2 个分片 Solr版本 6 3 0 现在 当我运行 mlt 查询时 它仅返回每个节点的结果 并且不会将它们分布在所有分片 节点上 即 没有给出任何结果 给出结果 我什至尝试将其指
  • Solr 过滤查询 - 字符串与整数

    假设我正在尝试查询一堆具有类别的文档 并且我想将查询限制为指定的类别 据我所知 这只是使用 fq 参数 过滤器查询 我想知道将参数设置为整 数而不是字符串或数据通常的情况是否会提高性能 我只是会在右侧犯错 但我想我应该仔细检查一下 以防万一
  • 我们可以同时使用拼音标记和同义词吗?

    我正在尝试同时启用语音分析器和同义词 这似乎不起作用 它们一起使用有错吗 在下面的实现中 我希望使用同义词转换搜索查询 然后使用语音分析器来检索结果 但我的同义词在这里完全被忽略了 如果我在创建索引时删除语音分析器 那么同义词就可以正常工作
  • Solr 动态价格范围和组

    跟进问题 如何获取 solr 结果中的方面范围 https stackoverflow com questions 33956 how to get facet ranges in solr results SolR 查询 价格范围 htt
  • Solr:在带有空格的字符串上使用通配符

    我的问题与这里讨论的问题基本相同 带空格的 Solr 通配符查询 https stackoverflow com questions 10023133 solr wildcard query with whitespace 但这个问题没有得
  • 如何根据特定字段对 solr 查询的前 100 个结果进行排序?

    我想使用特定字段对 solr 的前 100 个文档进行排序 但它对整个结果集进行排序 然后显示结果 以下是我的代码 query1 setQuery Natural Language query1 setStart 0 query1 setR

随机推荐

  • 快速从 findObjectsInBackgroundWithBlock 获取数据

    我正在使用 Parse 从数据库中获取数据 当块 findObjectsInBackgroundWithBlock 被调用时 会传递一个数组 由于我只接收一行数据 因此它全部出现在数组的一个 0 部分中 那么我如何从该数组中获取所有位 这是
  • 正确的表格标题

    语义问题 如果我有一个基本上是一张大表的 HTML 页面 我应该使用什么元素作为标题 通常 您会使用h1用于页面标题 以及caption作为表格的标题 但是 如果表格是页面上唯一的内容怎么办 包括两者看起来有点傻 那我用一个h1并忘记cap
  • 未找到配置或 get/set 在 Angular 6 中已被弃用

    ng config global defaults styleExt scss 错误 找不到配置 ng set global defaults styleExt scss 错误 get set 已被弃用 取而代之的是 config 命令 已
  • PyQT5错误:无法找到或加载Qt平台插件xcb

    直到 为止Anaconda3 其中包含Python 3 4 已重新安装在我的RedHat 6 5工作站 我已经能够开发使用的Python应用程序PyQT5 重新安装后Anaconda我收到一条错误消息 无法找到或加载 Qt 平台插件 xcb
  • React 虚拟化下拉菜单被溢出剪切:隐藏

    我正在为我的表使用react virtualized 我想在单击单元格中的按钮时显示一个下拉菜单 问题是我的下拉菜单被表格的行高抑制 行高 40 行高度 200 我玩过css定位 但到目前为止没有任何效果 下拉菜单代码 div div
  • 具有线程的多上下文 CoreData

    UPDATE 我想问题是保存子上下文时父上下文没有更新 仍然需要帮助 我尝试过很多多上下文 父子 核心数据的例子 以前我的应用程序使用传统的数据存储方式 即我使用了一个OperationQueue 我从服务器获取数据并使用MOC保存到数据库
  • SQL Server 查找不同行之间的 datediff、总和

    我正在尝试构建一个查询来分析我们的时间跟踪系统中的数据 每次用户滑入或滑出时 它都会生成一行记录滑入时间以及 在场 或 场外 进入或退出 在用户 Joe Bloggs 的情况下 有 4 行 我想将其配对并计算 Joe Bloggs 在网站上
  • 出现异常“并非所有代码路径都返回值”

    您好 我有一个使用查询更新 MySQL 表的方法 我使用 MS Visual Studio 和 phpmyadmin 作为 SQL 客户端 Method public static Member updateMember string un
  • Maven无法连接到docker内的网络

    我正在尝试克隆一个 git 项目并执行以下操作mvn package在码头工人里面 但是maven无法连接网络下载依赖项 这是Dockerfile FROM java 8 FROM maven ADD id rsa root ssh id
  • 使用 Solrj / Spring Data Solr 实现标记和排除过滤器

    我正在尝试在字段上实现多选的 Solr Facet 搜索 举这个例子 http docs lucidworks com display solr Faceting Faceting LocalParametersforFaceting 我想
  • 删除sql中的重复项并相应修改关系表

    我有三张桌子 menu tab 有列 menu id menu description item tab 有列 item id item name item description item price menu has item有列 me
  • 从 MS Access 解析 VBA 中的 JSON (US BLS)

    预先感谢您的帮助 我正在使用 JSON VB6 解析器 可以在以下位置找到它 VB JSON 解析器 我有以下 JSON 响应 来自 BLS 网站 特别是此链接Here 状态 REQUEST SUCCEEDED 响应时间 71 消息 结果
  • Java 解析 Json 与具有不同对象类型的数组(Gson 或 Jackson 等)

    response data 333 id 69238 code 545 id 69239 code 545 marked 123 544 id 69906 code 544 marked 123
  • 如何让物体忽略重力(AndEngine)?

    我有一个精灵 有身体 在场景中弹跳 它需要不受重力影响 但也能够与场景中的其他物体发生碰撞 这意味着我无法使用运动体 我试过 body PhysicsFactory createCircleBody mPhysicsWorld this B
  • 在android中使用sqlite插入包含单引号和双引号的字符串

    我在 Android 应用程序中使用 sqlite 插入字符串时遇到问题 我试过 query INSERT OR REPLACE into table id text VALUES data get i id data get i text
  • android中如何获取自己设备的手机号码?

    我想以编程方式检索设备的手机号码 我的代码是 TelephonyManager telephonyManager TelephonyManager this getSystemService Context TELEPHONY SERVIC
  • 如何扩展 jQuery 的 ReplaceWith 函数以接受回调函数?

    这应该很容易 对吧 但我似乎无法在任何地方找到此类功能的任何示例 问题是 在我执行replaceWith 之后 我想对那些写入DOM的元素做一些事情 但是如果我尝试在replaceWith 调用之后对它们做一些事情 那么它们还不存在 所以我
  • Android 中的媒体播放器播放暂停

    如何使 播放 和 暂停 图像按钮看起来像单个图像按钮 我特此在下面附上我的代码 这些是使用的图像 我将播放重命名为开始 import android app Activity import android media MediaPlayer
  • 当我使用 DropDownListFor 时,所选项目不显示

    我使用以下命令生成下拉列表 for var index 0 index lt Model AdminSummaries Count index div class rep tr0 div class rep td0 Html DropDow
  • 删除文档后 SOLr 索引大小是否会减小?

    我有一个 SOLr 实例 在其中索引来自客户端的大量文档 以便用户可以在 Web 应用程序中搜索它们 因为我们有大量文件 并且只需要搜索最近的文件 90 天左右 所以我们有一项计划工作 从索引中删除旧文档 问题是 即使进行了删除 磁盘空间每