CouchDB 视图：MapReduce 中可以接受多少处理？

2024-03-02

我一直在尝试使用 CouchDB 进行 MapReduce。一些示例显示了映射归约函数中可能存在的一些繁重逻辑。在一种特殊情况下，他们在映射内执行 for 循环。

在发出您选择的文档之前，MapReduce 是否会在每个可能的文档上运行？

如果是这样，我认为这意味着运行任何类型的迭代处理withinMapReduce 函数至少会增加一个数量级的处理负担。

基本上可以归结为以下问题：在进行不合理的昂贵查询之前，可以在 MapReduce 中执行多少逻辑?

在 CouchDB Map-Reduce 中，大量昂贵的处理是可以接受的。

CouchDB 视图（map-reduce）更像是CREATE INDEX比他们SELECT FROM.

具体来说，CouchDB 保证映射函数运行only每个文档一次，永远。（嗯，实际上每个文档一次change曾经。）这就是“迭代映射缩减”。

因此，假设您有 10,000 个文档，并且它们占用 1second每个都要处理（这比我见过的要高得多）。完全构建视图需要 10,000 秒或 2.8 小时。但是，一旦视图完成，查询任何行（?key=...) 或行切片 (?startkey=...&endkey=...）与直接查询文档花费的时间相同。文档计数的查找时间为 O(log n)。

换句话说，即使每个文档执行映射需要 1 秒，但获取结果也需要几毫秒。（当然，必须首先构建视图，因为它实际上是一个索引。）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

database

NoSQL

couchdb

MapReduce

CouchDB 视图：MapReduce 中可以接受多少处理？的相关文章

PDO获取最后插入的ID

我有一个查询我想获取插入的最后一个 ID 字段ID是主键并且自动递增我知道我必须使用这个声明 LAST INSERT ID 该语句适用于如下查询 query INSERT INTO cell place ID VALUES LAST I
从 Presto 中的 JSON 列获取特定值

我有一个带有 JSON 列的表points其中一行为 0 0 2 1 1 2 2 0 5 15 1 2 20 0 7 我想获取键的值 1 and 20 并将它们存储为别名例如first and second在查询中到目前为止我所做的是
在 Python 中，如果我有 unix 时间戳，如何将其插入 MySQL 日期时间字段？

我正在使用 Python MySQLDB 我想将其插入 Mysql 中的 DATETIME 字段我该如何使用cursor execute 来做到这一点要将 UNIX 时间戳转换为 Python 日期时间对象请使用datetime fr
Hadoop 推测任务执行

在Google的MapReduce论文中他们有一个备份任务我认为这与Hadoop中的推测任务是一样的推测任务是如何实现的当我启动一项推测任务时该任务是从一开始就作为较旧且缓慢的任务开始还是从较旧的任务到达的位置开始如果是这样
where 子句中的双 %% ？

我有一个 where 子句如下例所示 WHERE subject LIKE chef AND dep LIKE psy 使用 1 或 2 符号有什么区别我知道其中一个的含义通配符但不知道第二个添加的功能是什么该查询可能是一个拼写错
Guid.NewGuid().GetHashCode() 用于数据库

这对于用作数据存储 SQL Server 的 ID 可靠吗我会使用 guid 但我更喜欢数字值 A guid更有可能代表一个记录uniquely than a numeric value 随着 GUID 确保全球唯一性 GUID 可以跨数
SQLite：从命令行仅将模式转储到 .sql 文件中

我正在尝试转储架构test db仅即没有数据到名为的文件中schema sql从 OS X 中的命令行无需启动 sqlite3 我知道我能做到 sqlite3 open test db output schema sql schema
通过updateTable创建多个GSI

我在用着更新表 http docs aws amazon com AWSJavaScriptSDK latest AWS DynamoDB html updateTable property根据 DynmaoDB 的规定根据文档如果我们
如何同步nosql db（ravendb）中的更改

我已经开始在 RavenDB 的示例上学习 NoSQL 我从一个最简单的模型开始假设我们有由用户创建的主题 public class Topic public string Id get protected set public stri
使用 unnest() 返回行？

我尝试在完成后返回一组行UPDATE 像这样的东西 UPDATE Notis new noti SET notis noti record type FROM SELECT FROM Notis WHERE user id 2 FOR UP
2 同一个表的同一列上的 PostgreSQL 索引 - 冗余吗？

我有一个带有 2 个索引的 PostgreSQL 表其中一项指数涵盖website id and tweet idcolumns 是唯一的 B 树索引第二个索引仅涵盖website id列并且是非唯一索引如果第一个索引存在第二个索
为什么Aries在数据库管理恢复中要先执行redo before undo？

如果 Aries 算法已经知道在分析阶段之后要撤消哪些事务为什么它会在撤消之前应用重做我知道认为这与 Lsn 数字和维护一致性有关因为在磁盘上刷新的数据撤消事务可能与崩溃时撤消事务不同由于脏数据页但我找不到这个问题的任何正
如何在 MongoDB 中获取连接的客户端

我正在编写一个使用 mongo 作为数据库的应用程序我想打印连接到数据库的客户端例如打印他们的ip 我怎样才能得到这些信息我尝试使用 db serverStatus connections 但它给了我可以访问我的数据库的计算机数量您
单笔交易与多笔交易[关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
在 Hadoop MapReduce 中为二进制文件创建自定义 InputFormat 和 RecordReader

我正在编写一个 M R 作业该作业处理以二进制格式编写的大型时间序列数据文件如下所示此处换行以提高可读性显然实际数据是连续的 TIMESTAMP 1 TIMESTAMP 1 TIMESTAMP 2 TIMESTAMP 2 TIME
每次都在django查询数据库中过滤查询集吗？

想象一下我有以下代码 qs Users objects all list for i in range 10 list append qs filter age i 这里过滤器被调用 10 次它是连接到数据库 10 次还是第一次使用过滤器
jQuery PUT ajax 请求不起作用

我正在尝试在 couchdb 中保存 Backbone 模型因此我已经覆盖了save向 couchdb 发出 ajax 请求的方法 ajax type PUT url http 127 0 0 1 5984 movies this get
Google BigQuery 底层架构

所以我大约 10 分钟前才开始摆弄 Google BigQuery 我想知道是否有人知道他们用来存储数据的底层架构例如这只是他们自己的下一代 BigTable 基础设施吗另外他们在索引索引重建等方面使用什么样的策略是否清楚我只是
如何在图数据库（如 Neo4j）中对现实世界的关系进行建模？

我有一个关于在图形数据库中建模的一般性问题但我似乎无法解决这个问题您如何建模这种类型的关系牛顿发明了微积分 In a 简单图 http docs neo4j org chunked snapshot graphdb neo4j rel
mysql 中 INSERT 语句的计算列

假设我想要一个表来记录其他表中的日期和列数或者任何类型的数学字符串连接等 CREATE TABLE log id INTEGER NOT NULL AUTO INCREMENT date DATETIME NOT NULL count

随机推荐

IOAuth.IO 与 Ionic/Angular 混合应用程序集成

我很难获得 OAuth io 编写的 cordova 插件 https github com oauth io oauth phonegap https github com oauth io oauth phonegap 在 ionic
数据绑定到实现 IEnumerable 的对象的属性

我正在尝试对对象的实例进行简单的数据绑定像这样的东西 public class Foo INotifyPropertyChanged private int bar public int Bar snip code to get set
如何自动启动所需的服务和应用程序？

我正在编写我的第一个 erlang 应用程序我想按照在 erlang 生态系统中应该完成的方式做事我的应用程序依赖于已启动的 ssl inets 服务和 log4erl 应用程序目前我在 erlang shell 中手动启动它们之后
WPF MVVM prism 中的 ASP.net 类似基于表单的身份验证 [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案在开发 WPF MVVM prism 应用程序后我想实现身份验证因为它是基于 ASP NET 表单的身份验证我想限制用户进入需要授权
支持不可变类的 ORM

哪个 ORM 支持以下领域模型不可变的 types 我想编写如下所示的类或 Scala 等效项 class A private final C c not mutable A B b init c A doSomething B b bu
更新由另一个减速器管理的状态

在我的 React 应用程序中我的appReducer管理全局内容例如通知用户信息等应用程序中的模块之一是库存模块它有自己的减速器即inventoryReducer 在 redux 商店中我组合了所有减速器当用户输入库存时
FactoryGirl 创建用户，但保存点在测试开始前被释放

我正在为spec requests user pages specs运行rspec测试 require spec helper describe User pages do subject page describe home page d
我可以从 Chrome 扩展程序访问站点的 localStorage 吗？

我的 chrome 扩展有两种状态 1 某些站点在localStorage 另一个域中有身份验证数据所以我必须显示主窗口 2 没有身份验证数据因此我必须显示带有登录名和密码表单的窗口为了定义是否提供身份验证数据我想检查他的 loc
如何使用pdfkit ios 11打开pdf文件？

我正在尝试使用新的 iOS 11 框架 pdfkit 打开 PDF 文件但我无法做到这一点所以帮助我使用 pdfkit 框架打开文件先感谢您这是基于 Objective C 的示例 Ensure PDFKit framework i
推送通知警报文本的最大长度是多少？

iOS 推送通知的警报文本的最大长度是多少 The 文档 https developer apple com go id push notifications指出通知有效负载总共必须低于 256 字节 https developer app
PWA 的推送通知或 Web 推送通知

首先我想说我一直在研究推送通知和网络通知但我有点困惑我从这里读到 PWA 的推送通知不适用于 Safari 上的 iOS iPhone 从 PWA 向 iOS 发送推送通知 https stackoverflow com questi
如何拥有一个写入服务总线队列的异步函数？

使用 Azure WebJobs SDK 我想创建一个异步函数该函数将接收 ServiceBus 队列输入并写入 ServiceBus 队列输出异步方法不能有 out 参数例如在 BlobStorage 上似乎可以通过使用 Stre
解析 nmap 结果

我正在 Linux 上使用 Python 2 6 开发一个项目我在终端使用 nmap 来获取这些扫描结果我在一个字符串中得到了这个结果 Starting Nmap 6 47 http nmap org at 2015 06 28 23
创建 AMI 需要很长时间

我正在为具有 100G 文件的服务器创建 AMI 已经过去一个多小时了事情还没有结束 AMI 仍然显示待处理有什么问题吗我应该怎么办只是为了让其他人知道这个过程可能需要非常非常长的时间我的 100 GB AMI 大约需要 2 5
Excel 2010：查找两个日期时间之间的秒数

我有一个专栏Cal Date time 其中包含通话的日期和时间如下所示 A B C D Number Call Date Time Duration in Sec 123 2010 01 10 01 07 24 465000 123 2
Android 中应用程序“资产”文件夹的路径是什么？

我正在开发一个 Android 应用程序希望在 apk 中捆绑一个视频文件 mp4 以便在启动应用程序时我可以播放简短的介绍视频不幸的是我无法弄清楚应该将该视频文件放置在项目文件夹中的哪个位置以及如何访问它文件的路径我在用vid
Pandas：iterrow 循环的替代方案

我有一个在 pandas 中运行的小函数当我运行时会抛出 ValueErrorif x in y陈述我看到了类似的问题建议使用布尔索引 isin and where 但我无法将任何示例适应我的情况任何建议将非常感激附加说明 gro
jQuery ：包含 html

我有一个表其中包含逗号分隔的数字列表如下所示 td 72 76 81 td 我正在尝试选择表格单元格don t包含特定的数字该选择器有效 td not contains 76 table 问题是可能存在包含 576 或 761 等的行
如何编写无分支 std::vector 扫描？

我想对数组编写一个简单的扫描我有一个std vector
CouchDB 视图：MapReduce 中可以接受多少处理？

我一直在尝试使用 CouchDB 进行 MapReduce 一些示例显示了映射归约函数中可能存在的一些繁重逻辑在一种特殊情况下他们在映射内执行 for 循环在发出您选择的文档之前 MapReduce 是否会在每个可能的文档上运行如果

CouchDB 视图：MapReduce 中可以接受多少处理？

CouchDB 视图：MapReduce 中可以接受多少处理？ 的相关文章

随机推荐

热门标签

CouchDB 视图：MapReduce 中可以接受多少处理？的相关文章