为什么归并排序中阈值交叉后要使用插入排序

2023-11-22

我到处都读到了分而治之的排序算法，例如Merge-Sort and Quicksort，与其递归直到只剩下一个元素，不如转移到Insertion-Sort当达到某个阈值（例如 30 个元素）时。这很好，但为什么只是Insertion-Sort？为什么不Bubble-Sort or Selection-Sort，两者都有类似的O(N^2)表现？Insertion-Sort仅当许多元素被预先排序时才应该派上用场（尽管这种优势也应该伴随Bubble-Sort），但除此之外，为什么它比其他两个更有效呢？

其次，在这个链接，在第二个答案及其附带的评论中，它说O(N log N)与相比表现不佳O(N^2)达到一定的N。怎么会？N^2应该总是表现得比N log N, since N > log N对于所有 N >= 2，对吗？

如果您在分而治之的快速排序达到阈值时退出每个分支，您的数据将如下所示：

[the least 30-ish elements, not in order] [the next 30-ish ] ... [last 30-ish]

插入排序有一个相当令人愉快的属性，您可以在整个数组上调用它一次，并且它的执行效果与您为每个 30 的块调用一次它的执行效果基本相同。因此，您不必在循环中调用它，而是可以最后调用它的选项。这可能不是faster，特别是因为它会额外通过缓存提取整个数据，但根据代码的结构，它可能会很方便。

冒泡排序和选择排序都没有这个属性，所以我认为答案可能很简单：“方便”。如果有人怀疑选择排序可能更好，那么他们就有责任“证明”选择排序更快。

请注意，插入排序的这种使用也有一个缺点 - 如果您这样做并且分区代码中存在错误，那么只要它不丢失任何元素，只是错误地对它们进行分区，您就会从来没有注意到.

编辑：显然这个修改是由 Sedgewick 完成的，他于 1975 年撰写了有关 QuickSort 的博士学位。Musser（Introsort 的发明者）最近对其进行了分析。参考https://en.wikipedia.org/wiki/Introsort

Musser 还考虑了 Sedgewick 延迟对缓存的影响小排序，其中小范围在单个末尾排序插入排序的传递。他报告说，这可以使数量增加一倍。缓存未命中，但其双端队列的性能是明显更好，应该保留模板库，在部分原因是在其他情况下立即进行排序会带来好处不太好。

无论如何，我不认为一般建议是“无论你做什么，都不要使用选择排序”。建议是，“插入排序优于快速排序，因为输入的大小非常小”，并且当您实现快速排序时，很容易向自己证明这一点。如果您想出另一种在相同的小数组上明显优于插入排序的排序，那么这些学术来源都不会告诉您不要使用它。我想令人惊讶的是，建议始终是针对插入排序，而不是每个来源选择自己最喜欢的（入门老师坦率地说惊人对冒泡排序的喜爱——如果我再也没有听说过它，我不会介意）。插入排序通常被认为是小数据的“正确答案”。问题不在于它是否“应该”快，而在于它是否真的快，而且我从来没有特别注意到任何基准消除了这个想法。

寻找此类数据的一个地方是 Timsort 的开发和采用。我很确定蒂姆·彼得斯选择了插入因为某种原因：他没有提供一般性建议，他正在优化一个库以供实际使用。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么归并排序中阈值交叉后要使用插入排序的相关文章

异或交换可以扩展到两个以上的变量吗？

我一直在尝试将异或交换扩展到两个以上的变量例如n变量但我没有得到比这更好的地方3 n 1 对于两个整型变量x1 and x2你可以像这样交换它们 swap x1 x2 x1 x1 x2 x2 x1 x2 x1 x1 x2 所以假设你有
如何有效地找到距给定点最远的点（从一组点中）？

我正在寻找一种算法或数据结构来解决以下问题给你一组点 S 然后你会得到另一个点形式的 Q 查询对于每个查询找到集合中距离给定点最远的点集合中最多有 10 5 个点和 10 5 个查询所有点的坐标都在 0 到 10 5 范围内我想
在应用程序创建完成时设置 Spark DataGrid 列的默认排序（Flex 4.5）

我有一个包含多个列的 Spark DataGrid 组件我希望我的应用程序默认按 DataGrid 中第一列的降序排列我想使用单击顶部标题一次时发生的内置默认排序我不需要对我正在使用的 ArrayCollection 进行排序或更改比
Backbone Marionette CompositeView 排序列表 - 在添加时呈现额外的模型

这是小提琴 http jsfiddle net QhQ8D 10 http jsfiddle net QhQ8D 10 代码在下面制作一个聊天应用程序需要一个排序的连接的用户列表名称上带有比较器的图形集合连接到 CompositeV
以下 PLINQ 代码没有改进

我没有看到使用以下代码的处理速度有任何改进 IEnumerable
如何对 Data::Dumper 的输出进行排序？

我想转储对象和散列的值但它总是乱序打印键如何按递归排序顺序转储键 use Data Dumper print Dumper obj Set Data Dumper Sortkeys 1获取 Perl 的默认排序顺序如果要自定义顺序
绘制多边形

我正在使用 Google Maps API V3 根据路径绘制多边形该路径是随机未排序坐标点 LatLng 的数组这会产生以下形状 Polylines intersect Problem 由于多边形的形状取决于路径中点的顺序因此如何对
找到一条穿过任意节点序列的最短路径？

In 这个先前的问题 https stackoverflow com questions 7314333 find shortest path from vertex u to v passing through a vertex wOP询
迭代任意大小的子集

我可以迭代大小为 1 的子集 for int a 0 a lt size a 或大小为 2 的子集 for int a1 0 a1 lt size a1 for int a2 a1 1 a2 lt size a2 or 3 for int
归并排序中递归树的高度log(n)+1是怎么来的

我按照 stackoveflow 的建议阅读了一些问题和答案我正在遵循 cormen 的算法简介一书进行自学那本书里已经解释得很清楚了但唯一没有解释的是如何在合并排序分析中计算树的高度如果在后面的章节中对此进行解释的话我仍然在
jQuery 表格排序

我有一个非常简单的 HTML 表格有 4 列 Facility Name Phone City Specialty 我希望用户能够排序设备名称 and City only 我如何使用 jQuery 进行编码我发现了这个我想我应该投入
按键对 JavaScript 对象进行排序

我需要按键对 JavaScript 对象进行排序因此以下内容 b asdsad c masdas a dsfdsfsdf 会成为 a dsfdsfsdf b asdsad c masdas 这个问题的其他答案已经过时与实施现实不符并
动态规划 (DP) 中的重叠子问题是什么？

为了使动态规划适用问题必须具有两个关键属性最优子结构 and 重叠子问题 1 https en wikipedia org wiki Dynamic programming 对于这个问题我们只关注后一个属性有各种不同的定义重叠子问题
Swift 使用哪种通用排序算法？它在排序数据上表现不佳

我一直在挑选和探索 Swift 标准库sort 其函数为Array类型令我惊讶的是我注意到它在已经排序的数据上表现不佳对数组进行排序Int打乱顺序似乎比对已经排序的同一个数组进行排序快 5 倍对已打乱顺序的对象数组进行排序比对已按排
归并排序中的递归：两次递归调用

private void mergesort int low int high line 1 if low lt high line 2 int middle low high 2 line 3 mergesort low middle l
对 std::vector 进行排序但忽略某个数字

我有一个std vector
如何计算排列？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有一个关于 Java 排列的问题 Suppose I have five different elements in an arra
从 1 到 20 亿，像 (23,29) 这样相差 6 的连续素数对的数量

如何在考虑时间复杂度的情况下从 1 到 20 亿使用任何编程语言且不使用任何外部库找到像 23 29 这样相差 6 的连续素数对的数量尝试过埃拉托色尼筛但获得连续素数是一个挑战使用了生成器但时间复杂度非常高代码是 def ge
使用从两列计算出的键对 CSV 进行排序，获取前 n 个最大值

这里是 Python 业余爱好者假设这里我有一个示例 csv 文件的片段 Country Year GDP Population Country1 2002 44545 24352 Country2 2004 14325 75677 Co
将数组排序为第一个最小值、第一个最大值、第二个最小值、第二个最大值等

编写一个JS程序返回一个数组其中第一个元素是第一个最小值第二个元素是第一个最大值依此类推该程序包含一个函数该函数接受一个参数一个数组该函数根据要求返回数组输入示例 array 2 4 7 1 3 8 9 预期输出 1 9

随机推荐

WPF：如何从 Fonts.SystemFontFamilies 中过滤掉非罗马字体？

我知道如何使用几行 XAML 创建一个 WPF 字体选择器绑定到Fonts SystemFontFamilies 感谢 Norris Cheng 的精彩博客文章但我不知道如何过滤掉所有国际和其他非罗马字母字体系列我的用户不太可能需要
Roxygen 真的可以像 Doxygen 对 C++ 那样记录 R 脚本（而不是包）吗？

Roxygen 的灵感来自 C C 程序员使用的 Doxygen 文档系统我使用过 Doxygen 我发现只要有 doxygen 注释记录任何程序都非常容易它还生成函数和类的调用图我认为 roxygen 会以同样的方式工作但是当我
Grails sql 查询

想象一下我有这样的东西 def example def temp ConferenceUser findAllByUser User get session user temp temp 解释我的问题虽然动态查找器非常易于使用且学习速度很
如何在Python中获取文本字符串的视觉长度

如同这个问题我不是问如何查找字符串中的字符数我想确定渲染时字符串的视觉长度或将其与另一个字符串进行比较例如 iiii 和 WWWW 都有四个字符然而 iiii 在视觉上更短我知道这是由字体决定的并且我不使用等宽字体因此为了解
如何修改运行时加载的 DLL 的导入地址表

我想挂钩在运行时从加载的 DLL 调用的函数我使用了 Windows Via C C 一书中的 CAPIHook 类 DLL 注入由 Install System Wide hook 完成 The hooking 由修改 IAT 完成但
如何填充 UIView 的背景图片

我有一个UIView我这样设置背景图片 self view backgroundColor UIColor colorWithPatternImage UIImage imageNamed sfond appz png 我的问题是背面图像不
从技术上讲，是否可以通过编程方式截取网站的屏幕截图？

您认为以编程方式截取网站的屏幕截图在技术上可行吗我想制作一个计划的 Python 任务来抓取网站列表并截取它们的主页屏幕截图您认为技术上可行吗或者您是否知道提供此类服务的第三方网站 Input url gt Output screen
“借用的数据不能存储在其封闭之外”是什么意思？

编译以下代码时 fn main let mut fields Vec new let pusher mut a str fields push a 编译器给我以下错误 error borrowed data cannot be stored
python-docx：将表解析为 Pandas Dataframe

我正在使用python docx用于提取 MS Word 文档的库我可以使用同一个库从Word文档中获取所有表格但是我想将表解析为 panda 数据框架是否有任何内置功能可以用来将表解析为数据框架或者我必须手动执行此操作另外是
如何处理同构呈现形式的早期输入

我有一个 React 应用程序其中包含一个表单该表单在服务器端呈现并预先填充了用户正在进行的工作问题是如果用户在应用程序加载之前编辑表单中的值则应用程序不会意识到更改当用户保存时服务器呈现的未更改的数据将被重新保存并且用户
EventSource：总是出现错误

首先EventSourceAPI 我写了最学术的例子问题是我总是遇到错误而且找不到任何有用的信息当我加载时home html JS脚本停止于source onerror 我将其打印到控制台但分析对象时我找不到任何错误类型或消息所以
Laravel：vue 组件未渲染

尽管遵循了以下教程但我的 vue 组件并未在页面上呈现我有以下布局 master blade php
如何导航到父活动

好吧当我在做某事并且我需要在我的应用程序中配置操作栏时我从http developer android com我找到了我要找的东西 public boolean onOptionsItemSelected MenuItem item s
geom_bar 的 gganimate 问题？

自从 David Robinson 发布了他的 gganimate 包以来我一直怀着羡慕和钦佩的心情看着 Twitter 上出现的各种 ggplot 动画并认为我自己也可以玩一玩我在使用 geom bar 时遇到 gganimate
firefox @font-face 因 fontawesome 失败

我在运行的 OSS 应用程序上使用 FontAwesome 字体但我似乎无法通过 Firefox 的字体清理程序这些文件都在同一个域中提供路径是正确的我使用的是 FontAwesome 的官方 css 当通过其网站和本地文档提供时
判断对象的类型？ [复制]

这个问题在这里已经有答案了有没有一种简单的方法来确定变量是列表字典还是其他变量有两个内置函数可以帮助您识别对象的类型您可以使用type 如果您需要对象的确切类型并且isinstance to check对象的类型针对某物通常您
C# 中的 IRC 库 [关闭]

Closed 这个问题不符合堆栈溢出指南目前不接受答案我想在我的程序中嵌入一个小聊天窗口用作基本的 IRC 客户端这需要有限的功能例如连接断开连接列出用户和发送私人消息在撰写本文时我已经尝试了几个臃肿的库这些库使得创建一
字典方法 Remove 和 Clear (.NET Core) 在枚举期间修改集合。没有抛出异常

我正在尝试实现一个缓存机制安全地枚举集合并且我正在检查内置集合的所有修改是否都会触发InvalidOperationException由各自的枚举器抛出我注意到在 NET Core 平台中Dictionary Remove and Di
如何使用 vaadin 使 VerticalLayout 可滚动？

我有一个组件它作为我所有页面的通用布局而存在该组件的布局如下使用油漆制作所以请抱歉 p 向右箭头表示该布局是 Horizo ntalLayout 向下箭头表示 VerticalLayout 我真的很感兴趣使 bodyContent
为什么归并排序中阈值交叉后要使用插入排序

我到处都读到了分而治之的排序算法例如Merge Sort and Quicksort 与其递归直到只剩下一个元素不如转移到Insertion Sort当达到某个阈值例如 30 个元素时这很好但为什么只是Insertion Sor

为什么归并排序中阈值交叉后要使用插入排序

为什么归并排序中阈值交叉后要使用插入排序 的相关文章

随机推荐

热门标签

为什么归并排序中阈值交叉后要使用插入排序的相关文章