为什么归并排序中阈值交叉后要使用插入排序

2023-11-22

我到处都读到了分而治之的排序算法,例如Merge-Sort and Quicksort,与其递归直到只剩下一个元素,不如转移到Insertion-Sort当达到某个阈值(例如 30 个元素)时。这很好,但为什么只是Insertion-Sort?为什么不Bubble-Sort or Selection-Sort,两者都有类似的O(N^2)表现?Insertion-Sort仅当许多元素被预先排序时才应该派上用场(尽管这种优势也应该伴随Bubble-Sort),但除此之外,为什么它比其他两个更有效呢?

其次,在这个链接,在第二个答案及其附带的评论中,它说O(N log N)与相比表现不佳O(N^2)达到一定的N。怎么会?N^2应该总是表现得比N log N, since N > log N对于所有 N >= 2,对吗?


如果您在分而治之的快速排序达到阈值时退出每个分支,您的数据将如下所示:

[the least 30-ish elements, not in order] [the next 30-ish ] ... [last 30-ish]

插入排序有一个相当令人愉快的属性,您可以在整个数组上调用它一次,并且它的执行效果与您为每个 30 的块调用一次它的执行效果基本相同。因此,您不必在循环中调用它,而是可以最后调用它的选项。这可能不是faster,特别是因为它会额外通过缓存提取整个数据,但根据代码的结构,它可能会很方便。

冒泡排序和选择排序都没有这个属性,所以我认为答案可能很简单:“方便”。如果有人怀疑选择排序可能更好,那么他们就有责任“证明”选择排序更快。

请注意,插入排序的这种使用也有一个缺点 - 如果您这样做并且分区代码中存在错误,那么只要它不丢失任何元素,只是错误地对它们进行分区,您就会从来没有注意到.

编辑:显然这个修改是由 Sedgewick 完成的,他于 1975 年撰写了有关 QuickSort 的博士学位。Musser(Introsort 的发明者)最近对其进行了分析。参考https://en.wikipedia.org/wiki/Introsort

Musser 还考虑了 Sedgewick 延迟对缓存的影响 小排序,其中小范围在单个末尾排序 插入排序的传递。他报告说,这可以使数量增加一倍。 缓存未命中,但其双端队列的性能是 明显更好,应该保留模板库,在 部分原因是在其他情况下立即进行排序会带来好处 不太好。

无论如何,我不认为一般建议是“无论你做什么,都不要使用选择排序”。建议是,“插入排序优于快速排序,因为输入的大小非常小”,并且当您实现快速排序时,很容易向自己证明这一点。如果您想出另一种在相同的小数组上明显优于插入排序的排序,那么这些学术来源都不会告诉您不要使用它。我想令人惊讶的是,建议始终是针对插入排序,而不是每个来源选择自己最喜欢的(入门老师坦率地说惊人对冒泡排序的喜爱——如果我再也没有听说过它,我不会介意)。插入排序通常被认为是小数据的“正确答案”。问题不在于它是否“应该”快,而在于它是否真的快,而且我从来没有特别注意到任何基准消除了这个想法。

寻找此类数据的一个地方是 Timsort 的开发和采用。我很确定蒂姆·彼得斯选择了插入因为某种原因:他没有提供一般性建议,他正在优化一个库以供实际使用。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

为什么归并排序中阈值交叉后要使用插入排序 的相关文章

随机推荐

  • WPF:如何从 Fonts.SystemFontFamilies 中过滤掉非罗马字体?

    我知道如何使用几行 XAML 创建一个 WPF 字体选择器 绑定到Fonts SystemFontFamilies 感谢 Norris Cheng 的精彩博客文章 但我不知道如何过滤掉所有国际和其他非罗马字母字体系列 我的用户不太可能需要
  • Roxygen 真的可以像 Doxygen 对 C++ 那样记录 R 脚本(而不是包)吗?

    Roxygen 的灵感来自 C C 程序员使用的 Doxygen 文档系统 我使用过 Doxygen 我发现只要有 doxygen 注释 记录任何程序都非常容易 它还生成函数和类的调用图 我认为 roxygen 会以同样的方式工作 但是当我
  • Grails sql 查询

    想象一下我有这样的东西 def example def temp ConferenceUser findAllByUser User get session user temp temp 解释我的问题 虽然动态查找器非常易于使用且学习速度很
  • 如何在Python中获取文本字符串的视觉长度

    如同这个问题 我不是问如何查找字符串中的字符数 我想确定渲染时字符串的视觉长度或将其与另一个字符串进行比较 例如 iiii 和 WWWW 都有四个字符 然而 iiii 在视觉上更短 我知道这是由字体决定的 并且我不使用等宽字体 因此 为了解
  • 如何修改运行时加载的 DLL 的导入地址表

    我想挂钩在运行时从加载的 DLL 调用的函数 我使用了 Windows Via C C 一书中的 CAPIHook 类 DLL 注入由 Install System Wide hook 完成 The hooking 由修改 IAT 完成 但
  • 如何填充 UIView 的背景图片

    我有一个UIView我这样设置背景图片 self view backgroundColor UIColor colorWithPatternImage UIImage imageNamed sfond appz png 我的问题是背面图像不
  • 从技术上讲,是否可以通过编程方式截取网站的屏幕截图?

    您认为以编程方式截取网站的屏幕截图在技术上可行吗 我想制作一个计划的 Python 任务来抓取网站列表并截取它们的主页屏幕截图 您认为技术上可行吗 或者您是否知道提供此类服务的第三方网站 Input url gt Output screen
  • “借用的数据不能存储在其封闭之外”是什么意思?

    编译以下代码时 fn main let mut fields Vec new let pusher mut a str fields push a 编译器给我以下错误 error borrowed data cannot be stored
  • python-docx:将表解析为 Pandas Dataframe

    我正在使用python docx用于提取 MS Word 文档的库 我可以使用同一个库从Word文档中获取所有表格 但是 我想将表解析为 panda 数据框架 是否有任何内置功能可以用来将表解析为数据框架 或者我必须手动执行此操作 另外 是
  • 如何处理同构呈现形式的早期输入

    我有一个 React 应用程序 其中包含一个表单 该表单在服务器端呈现 并预先填充了用户正在进行的工作 问题是 如果用户在应用程序加载之前编辑表单中的值 则应用程序不会意识到更改 当用户保存时 服务器呈现的未更改的数据将被重新保存 并且用户
  • EventSource:总是出现错误

    首先EventSourceAPI 我写了最学术的例子 问题是我总是遇到错误 而且找不到任何有用的信息 当我加载时home html JS脚本停止于source onerror 我将其打印到控制台 但分析对象时我找不到任何错误类型或消息 所以
  • Laravel:vue 组件未渲染

    尽管遵循了以下教程 但我的 vue 组件并未在页面上呈现 我有以下布局 master blade php
  • 如何导航到父活动

    好吧 当我在做某事并且我需要在我的应用程序中配置操作栏时 我从http developer android com我找到了我要找的东西 public boolean onOptionsItemSelected MenuItem item s
  • geom_bar 的 gganimate 问题?

    自从 David Robinson 发布了他的 gganimate 包以来 我一直怀着羡慕和钦佩的心情看着 Twitter 上出现的各种 ggplot 动画 并认为我自己也可以玩一玩 我在使用 geom bar 时遇到 gganimate
  • firefox @font-face 因 fontawesome 失败

    我在运行的 OSS 应用程序上使用 FontAwesome 字体 但我似乎无法通过 Firefox 的字体清理程序 这些文件都在同一个域中提供 路径是正确的 我使用的是 FontAwesome 的官方 css 当通过其网站和本地文档提供时
  • 判断对象的类型? [复制]

    这个问题在这里已经有答案了 有没有一种简单的方法来确定变量是列表 字典还是其他变量 有两个内置函数可以帮助您识别对象的类型 您可以使用type 如果您需要对象的确切类型 并且isinstance to check对象的类型针对某物 通常 您
  • C# 中的 IRC 库 [关闭]

    Closed 这个问题不符合堆栈溢出指南 目前不接受答案 我想在我的程序中嵌入一个小聊天窗口 用作基本的 IRC 客户端 这需要有限的功能 例如连接 断开连接 列出用户和发送私人消息 在撰写本文时 我已经尝试了几个臃肿的库 这些库使得创建一
  • 字典方法 Remove 和 Clear (.NET Core) 在枚举期间修改集合。没有抛出异常

    我正在尝试实现一个缓存机制安全地枚举集合 并且我正在检查内置集合的所有修改是否都会触发InvalidOperationException由各自的枚举器抛出 我注意到在 NET Core 平台中Dictionary Remove and Di
  • 如何使用 vaadin 使 VerticalLayout 可滚动?

    我有一个组件 它作为我所有页面的通用布局而存在 该组件的布局如下 使用油漆制作 所以请抱歉 p 向右箭头表示该布局是 Horizo ntalLayout 向下箭头表示 VerticalLayout 我真的很感兴趣使 bodyContent
  • 为什么归并排序中阈值交叉后要使用插入排序

    我到处都读到了分而治之的排序算法 例如Merge Sort and Quicksort 与其递归直到只剩下一个元素 不如转移到Insertion Sort当达到某个阈值 例如 30 个元素 时 这很好 但为什么只是Insertion Sor