为什么我们应该使用 n 路合并？与2路合并相比，它有什么优势？

2024-04-03

我尝试阅读一些有关 n-way merge 的文章，但不理解这个概念。我很困惑为什么你会使用 n 路合并而不是 2 路合并？就像为什么要将数组分成 3 部分，对它们进行排序，然后对 2 部分进行 2 路合并，然后将第 3 部分与此合并的 2 部分进行 2 路合并:)

Thanks

当您进行外部排序时，您通常最终会合并多个流。例如，假设您需要对 1 TB 的数据进行排序，并且只有（比如说）64 GB 的 RAM。

通常，您会读取 64 GB 的数据，对其进行排序，然后将其写出。对整个 TB 数据重复此操作，为您可以一次性保存在内存中的每个“块”生成一个中间文件。有多种方法可以改进这一点，但您通常可以期望的最好结果是生成每个大约 128 GB 的排序中间文件。

这就留下了许多需要合并在一起的中间文件——而且这个数字几乎肯定会大于 2。

如果您定期执行此操作，则可能有一些相当高端的硬件可以使用。如果您将每个中间文件放在单独的磁盘驱动器上（并且至少还有一个用于输出），您几乎肯定可以通过一次将所有数据合并在一起（而不是一次只合并两个数据）来提高速度。该过程通常受 I/O 限制，因此一次从（比如说）8 个磁盘读取的速度通常是一次仅从 2 个磁盘读取的速度的 4 倍左右（尽管这取决于您的输出磁盘具有那么多带宽），这可能不是真的）。通过避免创建更多中间文件（这将需要进一步合并），您的整体速度可能会提高更大的系数。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Algorithm

Sorting

为什么我们应该使用 n 路合并？与2路合并相比，它有什么优势？的相关文章

关于在字典中查找所有有效单词的算法问题

给定一个字典只是一个字符串列表您收到来自外部来源的未知数量的信件给定字母串您将如何列出您可以通过这些字母的任意组合组成的所有有效单词来自字典因此如果您收到 applead 你应该找到apple bad pad lead等我知
如何仅使用单个数组在 JavaScript 中模拟调用堆栈

我正在看维基百科页面 https en wikipedia org wiki Call stack在调用堆栈上并尝试理解这个图像据我所知哈哈 const memory memory 0 3 top of stack pointer m
自动过滤/排序列表框项目 (Windows Phone)

我想确保添加到列表框中的项目根据每个项目的序列号按升序排序例如 1 项目 2 项目 4 项目 3 项目应根据其编号自动排序 1 2 3 10 这是 C 源代码 namespace XeroQuiz public partial class
快速约会算法

我在一家咨询公司工作大部分时间都在客户所在地正因为如此我很少见到同事为了更好地了解彼此我们将安排一个晚宴会有很多小桌子方便人们聊天为了在聚会期间与尽可能多的不同的人交谈每个人都必须每隔一段时间比如每小时换一张桌子如何
C# 中的 strstr() 等效项

我有两个byte 我想找到第二个的第一次出现byte 在第一个byte 或其中的一个范围我不想使用字符串来提高效率翻译第一个byte to a string会效率低下基本上我相信就是这样strstr 在 C 中做最好的方法是什么这
数学组合的完美最小哈希

首先定义两个整数N and K where N gt K 两者都在编译时已知例如 N 8 and K 3 接下来定义一组整数 0 N or 1 N 如果这使答案更简单并调用它S 例如 0 1 2 3 4 5 6 7 的子集数量S wi
如何使用 PHP 查找目录中的前 5 个文件？

如何使用 PHP 列出按字母顺序排序的目录中的前 5 个文件或目录 Using scandir array slice array filter scandir path to dir is file 0 5 The array filte
具有多个谓词的 C++11 算法

功能如std find if来自algorithmheader 确实很有用但对我来说一个严重的限制是我只能为每次调用使用 1 个谓词count if 例如给定一个像这样的容器std vector我想同时应用相同的迭代find if 多个
如何对STL向量进行排序？

我想排序一个vector vector
如何从迭代器推导连续内存

不知何故本土stl copy VC Dinkumware 上的算法表明它可以使用memcpy 可以轻松复制的数据一个凡人能做到这一点吗假设每个元素都是普通可复制的 random access iterator 是否意味着连续内存标准
归并排序中递归树的高度log(n)+1是怎么来的

我按照 stackoveflow 的建议阅读了一些问题和答案我正在遵循 cormen 的算法简介一书进行自学那本书里已经解释得很清楚了但唯一没有解释的是如何在合并排序分析中计算树的高度如果在后面的章节中对此进行解释的话我仍然在
负整数的基数排序

我正在尝试对整数包括负整数实现基数排序对于非负整数我计划为数字0 9创建一个10个队列的队列并实现LSD算法但我对负整数有点困惑我现在的想法是继续为它们创建另一个包含 10 个队列的队列并分别对它们进行排序然后在最后我将
根据 Pandas 中的列表对多列进行排序

感谢有关如何根据 pandas 中的倍数列表对给定多列进行排序的任何提示如下所示 import pandas as pd sort a a d e sort b s1 s3 s6 sort c t1 t2 t3 df pd DataFra
在 O(n) 时间内排序？

我被这个问题困扰了 2周知道如何处理它吗令 L 为 n 个不同整数的列表假设 L 的 x 的元素在 1 750 范围内设计线性排序算法对 L 的元素进行排序我已经尝试过插入排序但我不确定我的方法是否正确 Construct an
使用布尔值进行冒泡排序以确定数组是否已排序

我有以下用于冒泡排序的代码但它根本不排序如果我删除布尔值那么它工作正常我知道由于我的 a 0 小于所有其他元素因此没有执行交换任何人都可以帮助我解决这个问题 package com sample public class Bub
重新排列数组键 php [重复]

这个问题在这里已经有答案了我有这个数组 Array 15 gt 13 1 16 gt Mark one answer 19 gt You see a car on the hard shoulder of a motorway with
C++：向 std::sort 提供模板化比较函数

假设我想让 std sort 根据指针指向的 int 值对指向 int 的指针向量进行排序忽略那里明显的性能问题很简单吧做一个函数 bool sort helper const int a const int b return a l
jQuery 表格排序

我有一个非常简单的 HTML 表格有 4 列 Facility Name Phone City Specialty 我希望用户能够排序设备名称 and City only 我如何使用 jQuery 进行编码我发现了这个我想我应该投入
每个术语出现的次数

我得到了一个数组a n 2 where n can be 10 5最大时有n个科目和n个学生全部编号为 1 2 n a i 0 and a i 1 1 lt i lt n 表示在第 i 个科目中所有来自a i 0 to a i 1 通过
O(1) 算法确定节点是否是多路树中另一个节点的后代？

想象一下下面的树 A B C D E F 我正在寻找一种方法来查询 F 是否是 A 的后代注意 F 不需要是directA 的后代在这种特殊情况下这是正确的只需要针对更大的潜在后代节点池测试有限数量的潜在父节点当测试一个节点是否是潜

随机推荐

找到 2 个 java.sql.Timestamps 之间的小时或分钟差异？

我存储一个java sql Timestamp in a PostgreSQL数据库为时间戳数据类型我想找出数据库中存储的数据类型与当前数据类型之间的差异以分钟或小时为单位时间戳这样做的最佳方法是什么是否有内置方法或者我必须将其
文本背景颜色溢出

我将背景颜色应用于国家地区列表中的链接总体来说效果很好然而对于名称较长的国家来说它的效果不太好我试图让黄色溢出一切并清楚地显示国家的全名 HTML div class flagList div class flagColumn
Jade 模板布局无法与 Node.js 结合使用

我正在尝试在 Node js 中创建一个使用 Jade 模板和布局的简单服务器由于某种原因它只会加载模板而不加载布局这是我所得到的 main js var express require express var app express
如何正确使用Feature2D（如SimpleBlobDetector）？（Python + OpenCV）

我正在尝试使用一些简单的代码运行斑点检测 img cv2 imread args image height width channels img shape params cv2 SimpleBlobDetector Params para
如何绘制样本的 PMF？

是否有任何函数或库可以帮助我绘制样本的概率质量函数就像绘制样本的概率密度函数一样例如使用 pandas 绘制 PDF 就像调用以下命令一样简单 sample plot kind density 如果没有简单的方法我如何计算 PMF
有人知道 10 位原始 RGB 吗？关于全视

我正在使用 Omnivision ov5620 http electronics123 net amazon datasheet OV5620 CLCC DS 20 1 3 pdf http electronics123 net amazo
NLog 在发布模式下不工作

我正在使用 NLog 记录我的 asp net mvc C 应用程序中的异常 NLog 在发布模式下不工作在调试模式下运行时也是如此可能是什么问题有什么解决办法吗我和你遇到了同样的问题 ASP NET MVC 3 NET 4 IIS
OrientDB 中带有子选择的根空间查询

我正在尝试组合一个查询来查找图中节点 2 公里以内的节点假设我有一个数据集标记了纳斯卡线中的一些地理符号 Name Latitude Longitude Hummingbird 14 692131 75 148892 Monkey 14
如何选择哪个 iPhone 型号模拟器来运行我的 React Native 应用程序？

我正在开发 React Native 应用程序并在 iOS 模拟器上进行测试但是它始终在 iPhone 6 上运行我不知道如何切换到其他 iPhone 型号例如 iPhone 6 Plus 或 5 我可以通过转到模拟器 gt 硬件
警告：活动未启动，其当前任务已被带到前面[重复]

这个问题在这里已经有答案了我觉得这个问题很常见 Stackoverflow 上的许多结果都谈到了这一点一般的答案是因为一个旧的应用程序正在运行并且我尝试从 Eclipse 运行一个新的应用程序但编译没有改变所以 Android
模板类类型别名在成员声明中无法替换

假设你有一个模板class像这样 template
如何清除“运行”->“参数”菜单中的“参数”字段？

我正在使用 CodeGear RAD Studio IDE 为了使用命令行参数测试我的应用程序我多次使用运行 gt 参数菜单中的参数字段但每次我为它提供一个新值时它都无法从下拉框中删除我需要清理这个字段删除所有值因为
在现实世界中扩展 Docker 容器

我有一些关于扩展 Docker 容器的基本问题我有 5 个不同的应用程序它们彼此没有连接在拥有容器之前我会在每个虚拟机上运行 1 个应用程序并在云中单独扩展和缩小它们现在有了容器我就可以在虚拟机之上实现隔离因此现在我可以运
如果父级未被任何其他子级引用，则删除父级

我有一个示例情况 parent表有一列名为id 引用于child表作为外键删除子行时如果父行未被任何其他子行引用如何同时删除父行在 PostgreSQL 中9 1 或更高版本您可以使用单个语句来完成此操作数据修改CTE https
C# WPF 评级控件类似于 Wifi 信号指示器

我已经搜索了很多类似于下图中的 wifi 信号强度指示器的 WPF 评级控件但我找不到一个我尝试自己做这就是结果
iPhone 信号强度

我知道这个问题已经被提出但没有任何答案在 Objective C 中有没有办法返回信号强度苹果不允许开发者直接访问低级无线API函数可以在您的应用程序中包含其中一些功能请参阅iPhone无线项目 http code google
将 QHBoxLayout 的每个小部件对齐到顶部

我试图将 QHBoxlayout 中的每个小部件对齐到顶部但我得到的是每个小部件似乎都居中我认为这是由于尺寸不同造成的例如 from PyQt5 QtGui import from PyQt5 QtCore import from P
自定义 Ajax 绑定无法正常工作

我有以下自定义 Ajax 绑定代码即使它显示第一页的数据也会存在以下问题 The request Sorts在 Orders Read 方法中作为 NULL 出现 The request PageSizeOrders Read 方法中的
Altair 通过绑定范围滑块对日期时间值进行选择和转换过滤器似乎不适用于相等条件或选择器本身

我想将范围滑块与日期时间值绑定以仅过滤图表中特定日期的数据使用stocks数据我想要做的是让 x 轴显示公司 y 轴显示用户通过范围滑块选择的特定日期的股票价格根据来自的输入这个答案 https stackoverflow com
为什么我们应该使用 n 路合并？与2路合并相比，它有什么优势？

我尝试阅读一些有关 n way merge 的文章但不理解这个概念我很困惑为什么你会使用 n 路合并而不是 2 路合并就像为什么要将数组分成 3 部分对它们进行排序然后对 2 部分进行 2 路合并然后将第 3 部分与此合并的 2

为什么我们应该使用 n 路合并？与2路合并相比，它有什么优势？

为什么我们应该使用 n 路合并？与2路合并相比，它有什么优势？ 的相关文章

随机推荐

热门标签

为什么我们应该使用 n 路合并？与2路合并相比，它有什么优势？的相关文章