创建索引需要很长时间

2024-03-30

我在 MongoDB 中创建了一个集合，其中包含11446615文件。

每个文档具有以下形式：

{ 
 "_id" : ObjectId("4e03dec7c3c365f574820835"), 
 "httpReferer" : "http://www.somewebsite.pl/art.php?id=13321&b=1", 
 "words" : ["SEX", "DRUGS", "ROCKNROLL", "WHATEVER"],     
 "howMany" : 3 
}

httpReferer: 只是一个网址

words: 从上面的 url 解析出的单词。列表的大小在 15 到 90 之间。

我计划使用这个数据库来获取具有相似内容的网页列表。

我将通过查询这个集合使用words字段，因此我在此字段上创建（或者更确切地说开始创建）索引：

db.my_coll.ensureIndex({words: 1})

我大约 3 小时前开始创建索引，看起来不可能在另外 3 小时内完成。

如何提高索引速度？或者也许我应该使用完全另一种方法来解决这个问题？欢迎任何想法:)

不，对于大型集合来说，索引速度很慢。您也可以在后台创建索引：

db.my_coll.ensureIndex({words:1}, {background:true});

在后台创建索引会比较慢并且会导致索引变大。但是，在索引完成之前它不会被使用，因此在此期间您将能够正常使用数据库并且索引不会阻塞。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

MongoDB

创建索引需要很长时间的相关文章

Mongoose查询结果是只读的吗？

如何修改 Mongoose 查询返回的对象假设我们有以下模式 var S new mongoose Schema name String field String 我对结果进行了以下查询和修改 var retrieve function
ElasticSearch 和 PHP 中的多个字段搜索

我正在使用最新版本弹性搜索 PHP https github com elasticsearch elasticsearch php以及最新版本的 MongoDB 和 ElasticSearch 我需要对可以包含一个或多个值的多个字段进行搜
致命错误 - 未找到“Mongo”类

我正在尝试执行此操作但我收到以下错误致命错误在 C wamp www 中找不到类 Mongo Info PHP 5 38 MongoDB mongodb win32 i386 2 0 2 MongoDB PHP 驱动程序 mongo
多文档事务在使用 mongodb 4.08 社区服务器的 C# 中不起作用

我需要使用 mongodb 事务更新多个文档 mongodb 社区服务器版本是 4 08 net 的 mongodb 驱动程序是 2 9 beta 也尝试过 2 8 从调试中我可以看到它执行了 session AbortTransacti
Mongo $group 和 $project

我正在尝试获取关键字计数parentId categioryId and llcId 我的数据库是 id ObjectId 5673f5b1e4b0822f6f0a5b89 keyword electronic content manage
清理 MongoDB 的输入

我正在为 MongoDB 数据库程序编写 REST 接口并尝试实现搜索功能我想公开整个 MongoDB 接口我确实有两个问题但它们是相关的所以我将它们放在一篇文章中使用 Python json 模块解码不受信任的 JSON 是否
MongoDB 存储过程等效项

我有一个包含商店列表的大型 CSV 文件其中一个字段是邮政编码我有一个名为 ZipCodes 的独立 MongoDB 数据库它存储任何给定邮政编码的纬度和经度在 SQL Server 中我将执行一个名为 InsertStore 的
Spring Data mongodb：添加 MongoDb 访问凭据

我的 Spring 应用程序中有以下工作配置
阻止 Mongoose 为子文档数组项创建 _id 属性

如果您有子文档数组 Mongoose 会自动为每个子文档创建 id 例子 id mainId subDocArray id unwantedId field value id unwantedId field value 有没有办法告诉 M
Java 驱动程序相当于 JavaScript shell 的 Object.bsonsize( doc )？

我想知道 Java 驱动程序相当于 Mongo JavaScript shell 的 Object bsonsize doc 方法例如执行以下操作的 Java 代码是什么 bobk mbp bobk mongo MongoDB shel
mongodb在单个操作中进行多个聚合

我有一个包含以下文档的项目集合 item i1 category c1 brand b1 item i2 category c2 brand b1 item i3 category c1 brand b2 item i4 category
Loopback ValidationError：“Role”实例无效。详细信息：`name`已经存在（值：“admin”）

我是环回新手但是我按照以下步骤安装和搭建我的文件夹环回服务器在 server boot 内创建了一个文件 script js 并包含以下代码 module exports function app var MongoDB app da
访问 Amazon EC2 上的 Mongodb 时出现问题

我还有一个问题要问你我有安装了 mondodb 的 Amazon EC2 实例它工作得很好除了一件事我无法从外部我的电脑访问连接到它我认为安全组的问题这是某种默认防火墙有谁知道如何配置EC2实例来访问mongodb 提
PyMongo 中的 MapReduce

我的蒙戈收藏 Impressions具有以下格式的文档 uid 10 impressions pos 6 id 123 service furniture pos 0 id 128 service electronics pos
CORS 问题。 Flask <-> AngularJS

使用 angularjs 客户端应用程序和提供 api 的 Flask 应用程序启动一个新项目我使用 mongodb 作为数据库我必须立即排除 jsonp 因为我需要能够跨不同端口进行 POST 因此我们为 Angular 应用程序设
Mongoose：保存时根据父字段值设置子文档字段值

这几乎肯定在其他地方有所涉及但是如果我有一个带有嵌入子文档的单一架构如下所示 var ChildSchema new Schema name type String trim true user type String trim tr
Model.find() 在猫鼬中返回空[重复]

这个问题在这里已经有答案了我正在使用 mongoose 来列出 mongodb 数据库中集合中的所有数据从请求中 http localhost 3000 listdoc model Organization 我正在执行以下代码 expo
MongoDB/PyMongo：如何在 Map 函数中使用点表示法？

我正在尝试计算每个邮政编码中找到的记录数在我的 MongoDB 中嵌入了邮政编码使用点表示法它位于 a res z a 代表地址 res 代表住宅 z 代表邮政编码例如这工作得很好 db NY count a res z 141
匹配条件和数组中的最新日期

db chat find pretty limit 3 id ObjectId 593921425ccc8150f35e7662 user1 1 user2 2 messages sender 1 datetime ISODate 2017
猫鼬递归填充

我已经搜索了一段时间但没有找到任何好的答案我有n deep我存储在数据库中并且想要填充的树所有的父母所以最后我得到了完整的树 node parent parent parent 到目前为止我已达到 2 级正如我提到的我需要达到 2

随机推荐

__del__ 在程序结束时

假设有一个程序在运行时其中有几个对象程序结束时是否调用每个对象的 del 方法如果是的话我可以做这样的事情 class Client del self disconnect from server 有许多潜在的困难 http doc
从非托管 C++ 创建 DLL

我目前有一个用非托管 C 编写的控制台应用程序源代码由一个入口点组成main以及其他一些功能我需要从此代码创建一个 DLL 以便我可以从其他项目特别是托管 C 使用它另一个问题我是否必须为此目的编写一个包装类由于我对托管非托管
如何使用 FastAPI 返回 HTMLResponse

是否可以在端点显示 HTML 文件例如用户正在访问的主页是的 FastAPI 可能有HTMLResponse 您可以返回一个HTMLResponse from fastapi import FastAPI from fastapi re
无法修改函数以独立工作而不是依赖于返回的结果

我用 python 编写了一个脚本在向某些链接发送请求时使用代理以便从那里解析产品名称我目前的尝试完美地完成了这项工作这个功能parse product 完全依赖于返回的结果代理以便以正确的方式重用相同的代理我正在尝试修改pa
当网格项与末端/底部对齐时，滚动不起作用

我想使用创建聊天CSS grid并遇到了我无法合并的问题align self end and overflow y auto The ul包含所有消息并且应该与底部对齐这样即使只有一条消息它也会出现在底部聊天的页眉和页脚是固定的您只
ApplicationListener 的注解版本及类似接口

您可以使用如下代码根据 Web 服务关闭或刷新启动的时间执行一些事件 public class APIService implements ApplicationListener
使用 jquery 移动元素

我如何使用 jQuery 来移动元素 position absolute left 169px top 182px to position absolute left 169px top 230px 清晰的移动不仅是CSS 它也必须是移动的
在 C# 中使用 ActiveX

我有这样的 JavaScript 代码 o new ActiveXObject ASDFsome Application utilites WScript CreateObject ASDF Utilites UTF Converter u
在记事本++中选择并删除整个列

有没有办法在记事本中选择并删除整个列假设notepad 中有这样一条日志 Dec 14 14 49 34 Dec 14 14 49 35 Dec 14 14 49 36 Dec 14 14 49 37 我想选择并删除 JustDec在上
重用 Runnable 的最佳方式

我有一个实现的类Runnable目前我正在使用 Executor 作为线程池来运行任务将文档索引到 Lucene executor execute new LuceneDocIndexer doc writer 我的问题是我的 Runna
fancyBox 3 中的转换

是否可以指定在 fancyBox 3 中使用哪个转换我对 3 个转变感兴趣打开幻灯片画廊在幻灯片之间导航关闭幻灯片图库默认情况下 fancyBox 3 对不同类型的内容使用不同的过渡 a href img jpg img sr
Android 意图数据库

是否有一个意图数据库可以搜索发布公共服务的应用程序例如我可能有一个关于可以应用于照片应用程序中的照片的过滤器的想法但是我应该出于什么目的发布我的过滤器以便其他应用程序可以找到它并使用它所以问题是是否有一个或多或少标准的意图数据库以及
如何在容器化世界中独特地解决“流程”？

这是一个普遍问题但出于争论的目的您可以假设我们有一组通过 AMQP 和 HTTP 组合进行通信的进程有两种具体情况需要考虑最简单的一个 Q 如果 A 向 B 发送消息 B 如何识别 A 发送回复的位置 A A 必须以某种方式告诉 B
如何在悬停时更改父
的样式

我有一个 WordPress 网站在我的本地主机上它使用 ul 用于自定义菜单我怎样才能改变CSS li 悬停时only如果它有一个 ul 子菜单所有主菜单项都有一个边框半径我想在当前项目下面的服务上删除它例如 div cl
我可以使用 Jython 运行 numpy 和 pandas

我们有一些 Java 代码想要与计划用 Python 编写的新代码一起使用因此我们对使用 Jython 感兴趣然而我们还想使用 numpy 和 pandas 库在此 Python 代码中进行复杂的统计分析是否可以从 Jython 调
提高 Android 位图上 getpixel() 和 setpixel() 的速度

All 当我注意到有多慢之后getPixel and setPixel是不确定是哪一个猜想两者都不是涡轮增压的我快速编码了一个容器Bitmap使用int 数组来处理位图操作已经它明显更快但这还不够请问您能建议如何进一步加快速度
使用 Scala 中的可变参数

我正在抓狂地试图弄清楚如何执行以下操作 def foo msf String o Any os Any println String format msf o List os 我必须用一个来声明该方法是有原因的o and an os Seq
如何在 RXJS 中启动和停止可观察的间隔？

我有一个非常简单的 timeInterval 可观察对象我想在不断开订阅者连接的情况下启动停止传输无论可观察状态如何都应该坐下来等待有可能吗如果可以的话怎么办 var source Rx Observable interval
在 MS-Access 中插入带有日期时间的 SQL 命令

我正在 MS Access 2007 中尝试以下查询但在时间字段上失败 INSERT INTO LOG EMPLOYEECODE STATUSID LOCATIONID TIME DURATION SHIFTID LATECOMING E
创建索引需要很长时间

我在 MongoDB 中创建了一个集合其中包含11446615文件每个文档具有以下形式 id ObjectId 4e03dec7c3c365f574820835 httpReferer http www somewebsite pl a

创建索引需要很长时间

创建索引需要很长时间 的相关文章

随机推荐

热门标签

创建索引需要很长时间的相关文章