Ruby 的 max 函数如何对重复项进行排序？

2023-11-25

我一直在看最大法在鲁比的Enumerablemixin (v2.4.1)。

这是一个相当简单的方法，但是当存在重复项时它如何排序有点令人困惑。

例如：

x = [1,2,3,4,5,6,7,8,9]
x.max {|a, b| a%2 <=> b%2}
=> 1
10.times{|y| p x.max(y) {|a, b| a%2 <=> b%2}}
[]
[1]
[1, 7] # why is 7 the next element after 1?
[3, 1, 5] # why no more 7?
[7, 3, 1, 5] # 7 is now first
[9, 7, 3, 1, 5]
[9, 7, 3, 1, 5, 6]
[9, 7, 3, 1, 5, 4, 6]
[9, 7, 3, 1, 5, 2, 4, 6]
[9, 7, 5, 3, 1, 8, 6, 4, 2] # order has changed again (now seems more "natural")

How is 7选择作为第二项？为什么当取三个值时根本不选择它？

如果你取更多的数字，顺序就会不一致（尽管集合中的项目are).

我看了一眼源代码，但似乎是在进行正常的比较；从该代码来看，此处看到的顺序并不明显。

谁能解释一下这个排序是如何实现的？我知道上面的顺序都是“有效”的，但是它们是如何生成的呢？

您的示例可以通过使用 max_by 来简化，以产生类似的结果：

10.times{|y| p x.max_by(y) {|t| t%2}}

我花了一些时间研究源代码，但找不到任何漏洞。

当我记得看到一份名为Switch: A Deep Embedding of Queries into Ruby（曼努埃尔·迈尔的论文）我找到了答案。

在第 104 页您可以找到以下问题的答案max_by:

...这里，输入列表中的值假设最大值返回由函数计算的值。如果产生多个值最大值，在这些值中选择结果是任意的。 ...

同样对于：
sort & sort_by来自评论@emu.c

不保证结果稳定。当两个键相等时，相应元素的顺序是不可预测的。

第一、第二次编辑- “我们需要更深入” => 我希望你会喜欢这个“旅程”。

简短的回答：
排序看起来像这样的原因是 max_by 块的组合（导致开始排序max值来自%2这是1然后继续0）和 qsort_r （BSD 快速排序）实现了 @ruby。

长答案：全部基于 ruby 2.4.2 或当前 2.5.0（正在开发）的源代码。

快速排序算法可能因您使用的编译器而异。您可以使用 qsort_r：GNU 版本、BSD 版本（您可以查看配置文件）了解更多。 Visual Studio 使用 2012 年或更高版本的 BSD 版本。

+Tue Sep 15 12:44:32 2015  Nobuyoshi Nakada  <[email protected]>
+
+   * util.c (ruby_qsort): use BSD-style qsort_r if available.

Thu May 12 00:18:19 2016  NAKAMURA Usaku  <[email protected]>

    * win32/Makefile.sub (HAVE_QSORT_S): use qsort_s only for Visual Studio
      2012 or later, because VS2010 seems to causes a SEGV in
test/ruby/test_enum.rb.

如果您有 GNU qsort_r 但没有 BSD：仅使用内部 ruby_qsort 实现。查看util.c用于快速排序的内部实现（ruby_qsort(void* base, const size_t nel, const size_t size, cmpfunc_t *cmp, void *d)）由 Tomoyuki Kawamura 函数。@util.h

如果 HAVE_GNU_QSORT_R=1 那么#define ruby_qsort qsort_r:
```
#ifdef HAVE_GNU_QSORT_R
#define ruby_qsort qsort_r
#else    void ruby_qsort(void *, const size_t, const size_t,
    int (*)(const void *, const void *, void *), void *);
#endif
```
如果检测到 BSD 风格：然后使用下面的代码（可以在util.c）。请注意如何cmp_bsd_qsort之前被调用ruby_qsort。原因？可能是标准化、堆栈空间，也可能是速度（我自己没有测试过——必须创建基准测试，这非常耗时）。

BSD qsort.c 源代码中指出了节省堆栈空间：

    /*
    * To save stack space we sort the smaller side of the partition first
    * using recursion and eliminate tail recursion for the larger side.
    */

ruby 源代码中的 BSD 分支：

     #if defined HAVE_BSD_QSORT_R
    typedef int (cmpfunc_t)(const void*, const void*, void*);

    struct bsd_qsort_r_args {
        cmpfunc_t *cmp;
        void *arg;
    };

    static int
    cmp_bsd_qsort(void *d, const void *a, const void *b)
    {
        const struct bsd_qsort_r_args *args = d;
        return (*args->cmp)(a, b, args->arg);
    }

    void
    ruby_qsort(void* base, const size_t nel, const size_t size, cmpfunc_t *cmp, void *d)
    {
        struct bsd_qsort_r_args args;
        args.cmp = cmp;
        args.arg = d;
        qsort_r(base, nel, size, &args, cmp_bsd_qsort);
    }

如果您使用 MSYS2 在 Windows 上编译 ruby（不再是 DevKit，而是用于 Windows 安装程序的 MSYS2，我大部分时间都在使用它）NetBSD 版本的 qsort_r（从 02-07-2012 开始）。最新的NetBSDqsort.c（修订版：1.23）.

现在来看现实生活中的例子- “我们需要更深入”

测试将在两个（Windows）红宝石上进行：

第一个 ruby：将基于DevKit版本2.2.2p95（于 2015 年 4 月 13 日发布）并且不包含 BSD qsort 实现。
第二个红宝石：将基于MSYS2 tool-chain红宝石版本2.4.2-p198（于 2017 年 9 月 15 日发布）并且包含 BSD qsort 实现的补丁（见上文）。

代码：

x=[1,2,3,4,5,6,7,8,9]
10.times{|y| p x.max_by(y) {|t| t%2}}

Ruby 2.2.2p95:

The result:
[]
[5]
[7, 1]
[3, 1, 5]
[7, 3, 1, 5]
[9, 7, 3, 1, 5]
[5, 9, 1, 3, 7, 6]
[5, 1, 9, 3, 7, 6, 4]
[5, 1, 3, 7, 9, 6, 4, 2]
[9, 1, 7, 3, 5, 4, 6, 8, 2]

Ruby 2.4.2-p198:

The result:
[]
[1]
[7, 1]
[5, 3, 1]
[5, 7, 3, 1]
[5, 9, 7, 3, 1]
[5, 1, 9, 7, 3, 6]
[5, 1, 3, 9, 7, 4, 6]
[5, 1, 3, 7, 9, 2, 6, 4]
[9, 1, 3, 7, 5, 8, 4, 6, 2]

现在对于不同的x: x=[7,9,3,4,2,6,1,8,5]

Ruby 2.2.2p95:

The result:
[]
[1]
[9, 7]
[1, 7, 3]
[5, 1, 7, 3]
[5, 1, 3, 9, 7]
[7, 5, 9, 3, 1, 2]
[7, 9, 5, 3, 1, 2, 4]
[7, 9, 3, 1, 5, 2, 4, 8]
[5, 9, 1, 3, 7, 4, 6, 8, 2]

Ruby 2.4.2-p198:

The result:
[]
[9]
[9, 7]
[3, 1, 7]
[3, 5, 1, 7]
[7, 5, 1, 3, 9]
[7, 9, 5, 1, 3, 2]
[7, 9, 3, 5, 1, 4, 2]
[7, 9, 3, 1, 5, 8, 2, 4]
[5, 9, 3, 1, 7, 2, 4, 6, 8]

现在对于源数组中的相同项目（qsort 不稳定，请参见下文）：x=[1, 1, 1, 2, 3, 4, 5, 6, 7, 8, 9]

使用以下代码对其进行处理：12.times{|y| p x.max_by(y) {|t| t%2}}

Ruby 2.2.2p95:

The result:
[]
[3]
[1, 1]
[9, 1, 7]
[3, 9, 1, 7]
[5, 3, 9, 1, 7]
[1, 5, 3, 9, 1, 7]
[5, 9, 3, 7, 1, 1, 1]
[1, 5, 9, 1, 7, 1, 3, 4]
[1, 1, 5, 9, 1, 7, 3, 4, 2]
[1, 1, 1, 5, 7, 3, 9, 4, 2, 8]
[9, 1, 7, 1, 5, 3, 1, 2, 6, 8, 4]

Ruby 2.4.2-p198:

The Result:
[]
[1]
[1, 1]
[7, 9, 1]
[7, 3, 9, 1]
[7, 5, 3, 9, 1]
[7, 1, 5, 3, 9, 1]
[1, 5, 9, 3, 7, 1, 1]
[1, 1, 5, 9, 3, 7, 1, 4]
[1, 1, 1, 5, 9, 3, 7, 2, 4]
[1, 7, 3, 1, 5, 9, 1, 2, 4, 8]
[9, 3, 1, 7, 1, 5, 1, 2, 8, 6, 4]

现在问一个大问题--> 为什么结果不同呢？

第一个明显的答案是，当使用 GNU 或 BSD 实现时，结果会有所不同吗？正确的？好吧，实现是不同的，但产生（检查链接的实现以了解详细信息）相同的结果。问题的核心在别处。

这里真正的问题是算法本身。当使用快速排序时，您得到的是不稳定的排序（当您比较两个相等的值时，它们的顺序不会保持不变）。当你有了 [1,2,3,4,5,6,7,8,9] 后，你可以在块中将其转换为 [1,0,1,0,1,0,1,0,1]使用 max(_by) 将数组排序为 [1,1,1,1,1,0,0,0,0]。你从 1 开始，但是哪一个呢？那么你会得到不可预测的结果。（max(_by) 是先获取奇数然后获取偶数的原因）。

See GNU qsort评论：

警告：如果两个对象比较相等，则排序后它们的顺序是不可预料的。也就是说排序并不稳定。这个可以当比较仅考虑部分时会产生差异元素。具有相同排序键的两个元素可能在其他方面有所不同尊重。

现在像引擎一样对其进行排序：

[1,2,3,4,5,6,7,8,9]-> 首先考虑的是奇数[1,3,5,7,9]那些被认为等于max_by{|t| t%2}产生[1,1,1,1,1].

结论：

现在该选择哪一个呢？好吧，就你的情况而言，这是不可预测的，那就是你得到的。即使对于与底层相同的 ruby 版本，我也会得到不同的版本快速排序算法本质上是不稳定的。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Ruby 的 max 函数如何对重复项进行排序？的相关文章

向 ExpandoObject 添加方法时，“关键字 'this' 在静态属性、静态方法或静态字段初始值设定项中无效”

我尝试向 ExpandoObject 添加一个动态方法该方法将返回属性动态添加给它但它总是给我错误我在这里做错了什么吗 using System using System Collections Generic using Sys
C# 中的接口继承

我试图解决我在编写应用程序时遇到的相当大的对我来说问题请看这个为了简单起见我将尝试缩短代码我有一个名为的根接口IRepository
构造函数中显式关键字的使用

我试图了解 C 中显式关键字的用法并查看了这个问题C 中的explicit关键字是什么意思 https stackoverflow com questions 121162 但是那里列出的示例实际上是前两个答案对于用法并不是很清楚
POCO HTTPSClientSession 发送请求时遇到问题 - 证书验证失败

我正在尝试使用 POCO 库编写一个向服务器发出 HTTPS 请求的程序出于测试目的我正在连接到具有自签名证书的服务器并且我希望允许客户端进行连接为了允许这种情况发生我尝试安装InvalidCertificateHandler这是
当前的 c++ 工作草案与当前标准有何不同

通过搜索该标准的 PDF 版本我最终找到了这个链接C 标准措辞草案 http www open std org jtc1 sc22 wg21 docs papers 2012 n3376 pdf从 2011 年开始我意识到我可以购买最终
如何将“外部模板”与由同一类中的模板化成员使用的嵌套类一起使用？

首先一些背景信息我尝试以 Herb Sutter 在他的解决方案中介绍的方式使用 Pimpl 习语得到了 101 http herbsutter com gotw 101 这在头文件中看起来像这样 include pimpl h h
在 2D 中将一个点旋转另一个点

我想知道当一个点相对于另一个点旋转一定角度时如何计算出新的坐标我有一个块箭头想要将其相对于箭头底部中间的点旋转角度 theta 这是允许我在两个屏幕控件之间绘制多边形所必需的我无法使用和旋转图像从我到目前为止所考虑的情况来看使问题
将数据打印到文件

我已经超载了 lt lt 运算符使其写入文件并写入控制台我已经为同一个函数创建了 8 个线程并且我想输出 hello hi 如果我在无限循环中运行这个线程例程文件中的o p是 hello hi hello hi hello hi e
基于xsd模式生成xml（使用.NET）

我想根据我的 xsd 架构 cap xsd 生成 xml 文件我找到了这篇文章并按照说明进行操作使用 XSD 文件生成 XML 文件 https stackoverflow com questions 6530424 generatin
当模板类不包含可用的成员函数时，如何在编译时验证模板参数？

我有以下模板struct template
当我“绘制”线条时，如何将点平均分配到 LineRenderer 的宽度曲线？

我正在使用线条渲染器创建一个绘图应用程序现在我尝试使用线条渲染器上的宽度曲线启用笔压问题在于 AnimationCurve 的时间值水平轴从 0 标准化为 1 因此我不能在每次添加位置时都在其末尾添加一个值除非有一个我不知
如何一步步遍历目录树？

我发现了很多关于遍历目录树的示例但我需要一些不同的东西我需要一个带有某种方法的类每次调用都会从目录返回一个文件并逐渐遍历目录树请问我该怎么做我正在使用函数 FindFirstFile FindNextFile 和 FindClo
System.Runtime.InteropServices.COMException（0x80040154）：[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我在 C 项目中遇到异常 System Runtime InteropServices COMException 0x80040154 检
有没有一种简单的方法可以让 Visual Studio 2015 使用特定的 ToolsVersion？

使用特定版本构建项目或解决方案时msbuild我可以使用以下命令选择早期的 net 工具链 toolsversion or tv switch C Program Files x86 MSBuild 14 0 bin msbuild tv
是否可以有一个 out ParameterExpression？

我想定义一个 Lambda 表达式out范围有可能做到吗下面是我尝试过的 C Net 4 0 控制台应用程序的代码片段正如您在 procedure25 中看到的我可以使用 lambda 表达式来定义具有输出参数的委托但是当我想使
为什么拆箱枚举会产生奇怪的结果？

考虑以下 Object box 5 int int int box int 5 int nullableInt box as int nullableInt 5 StringComparison enum StringComparison
结构体指针的动态数组

我必须使用以下代码块来完成学校作业严格不进行任何修改 typedef struct char firstName char lastName int id float mark pStudentRecord pStudentRecord
转到定义：“无法导航到插入符号下的符号。”

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动我今天突然开始在我的项目中遇到一个问题单击转到定义会出现一个奇怪的错误无法导航到
实例化 Microsoft.Office.Interop.Excel.Application 对象时出现错误：800700c1

实例化 Microsoft Office Interop Excel Application 以从 winforms 应用程序生成 Excel 时出现以下错误这之前是有效的但突然间它停止工作了尽管代码和 Excel 版本没有变化我
匿名结构体作为返回类型

下面的代码编译得很好VC 19 00 23506 http rextester com GMUP11493 标志 Wall WX Za 与VC 19 10 25109 0 标志 Wall WX Za permissive 这可以在以下位置检

随机推荐

如何使用 Node.js 在 Heroku 中托管 AngularJS 应用程序而不使用 yeoman？

我正在尝试使用 Node js 将使用 AngularJS 的 Hello World 构建推送到 Heroku 中但具有多个视图部分我首先在不使用 ngRoute 的情况下部署了一个 Hello World 意思是没有部分那是美
如何创建一个浮动的可触摸活动，仍然允许触摸其边界之外的本机控件？

我用 mspaint 制定的方案最好地解释了我想要实现的目标我尝试过设置FLAG NOT TOUCH MODAL根据描述这应该正是我想要的但它根本不起作用我的活动消耗ALL触摸事件甚至在其边界之外如果我设置FLAG NOT FO
CMake：如何在参数中使用双引号调用execute_process？又名：使用 CMake 中的 find 来计算与字符串匹配的行数

我想调用命令find从一个内execute process 的格式find命令是 find v c n i off line
在网络上录制音频，预设：16000Hz 16bit

function floatTo16BitPCM output offset input for var i 0 i lt input length i offset 2 var s Math max 1 Math min 1 input
闭包表相当于 SQL 中的图结构

这个问题sql中如何存储树形结构导致一个想法封闭表用于存储在许多方面都是最佳的树木问题是 SQL 中的图结构是否有类似的东西我看见这张纸这似乎概述了图形索引结构但它有点超出我的理解范围想知道是否有一种方法可以创建一些辅助表来处理
TypeError：无法创建一致的方法解析顺序（MRO）[重复]

这个问题在这里已经有答案了这是我计划在我的游戏中使用的代码但它抱怨 MRO 错误 class Player pass class Enemy Player pass class GameObject Player Enemy pass
gremlin python - 向顶点添加多个但数量未知的属性

我想向一个顶点添加多个属性但从一开始就没有明确知道这些属性可能是什么例如假设将一个人作为顶点添加到图中我们有以下属性字典 Person 1 id 1 first name bob age 25 height 177 也许要添加另一个
java derby 数据库从 CSV 批量加载

Derby 是否具有从 CSV 批量插入数据的功能我能想到的最好办法是逐行读入文件并创建一个批处理 SQL 更新语句并运行它对于 100 万行需要 30 40 分钟而使用 mySQL 的 LOAD 语句从 CSV 文件加载相同数据需
如何通过 Dockerfile 使用 apt-get 安装多个包

所以我试图制作一个基本的 Dockerfile 但是当我运行它时它说 The command bin sh c sudo apt get install git python yaml python jinja2 returned a no
Onclick验证表单，如果有效则仅提交表单

我有一个 html 表单我首先希望使用 jQuery 验证库 jquery validate min js 进行验证并且如果表格有效将表格提交到某个位置我已尝试以下操作
使用协议相关 URL 时会加载什么协议？ [关闭]

很难说出这里问的是什么这个问题模棱两可含糊不清不完整过于宽泛或言辞激烈无法以目前的形式合理回答如需帮助澄清此问题以便重新打开访问帮助中心我刚刚开始测试无协议 URL 背后的想法我要解决的问题是在 https 页面上我
在 R 中每小时对数据帧进行分组

我有一个数据框其中日期列中有日期时间值三列包含每个日期时间的计数我正在尝试将每小时的数据与三列的计数进行分组聚合函数适用于单列但我试图对整个数据框执行此操作有小费吗 aggregate DateFreq ColA by list
为 Qt 注册自定义类型时何时、何地以及为何使用命名空间

类似的问题已多次提出但我主要关注名称空间和指针问题 MyClass h namespace foo class MyClass MyClass QDataStream operator lt lt QDataStream out cons
boost线程互斥数组

我的问题是我有多个线程更新的块矩阵多个线程可能一次更新不相交的块但通常可能存在竞争条件现在矩阵使用单锁锁定问题是是否可能如果可能如何实现实现高效的锁数组以便一次只能锁定矩阵的一部分所讨论的矩阵可能会变得相当大约为 5
MemoryStream.Close() 或 MemoryStream.Dispose()

我该打电话给哪一个有必要两个都打电话吗如果我已经调用了其中一个另一个会抛出异常吗 Close and Dispose 当调用MemoryStream 仅用于做两件事将对象标记为已释放以便将来意外使用该对象时会引发异常 Possib
电子邮件网络钓鱼中的同形攻击检测

主要问题我正在 Java 中开发一个 API 需要检测网络钓鱼电子邮件中品牌例如 PayPal Mastercard 等的使用情况显然攻击者使用不同的策略来针对这些品牌以便更难以检测到它们例如大师卡看起来非常相似万事达
合并 Pandas Dataframe 中的日期范围

我在 Python 中有一组记录其中包含一个 id 至少一个属性和一组日期范围我想要使用每个 id 的代码并组合属性匹配且日期范围内没有间隙的所有记录日期范围无间隙是指一条记录的结束日期大于或等于该 ID 的下一条记录例如 ID
Flash 文档查看器

有基于 Flash 的文档查看器吗我正在寻找类似于 Scribd com 使用的 iPaper 的东西有一个很棒的 PDF2SWF 开源查看器 http www devaldi com page id 260
javafx 表中的自动行编号

我有一个示例代码我们用它来动态行号Java Swing表即JTable 我是新来的JavaFX并希望同样JavaFX 有没有办法设置自动行号JavaFX Table class LineNumberTable extends JTable
Ruby 的 max 函数如何对重复项进行排序？

我一直在看最大法在鲁比的Enumerablemixin v2 4 1 这是一个相当简单的方法但是当存在重复项时它如何排序有点令人困惑例如 x 1 2 3 4 5 6 7 8 9 x max a b a 2 lt gt b 2 gt 1

Ruby 的 max 函数如何对重复项进行排序？

Ruby 的 max 函数如何对重复项进行排序？ 的相关文章

随机推荐

热门标签

Ruby 的 max 函数如何对重复项进行排序？的相关文章