C# 中是否有一个好的浮点数基数排序实现

2024-04-17

我有一个带有浮点类型字段的数据结构。这些结构的集合需要按浮点值排序。是否有一个基数排序实现。

如果没有，是否有一种快速的方法来访问指数、符号和尾数。因为如果你首先对尾数、指数和最后一次的指数对浮点数进行排序。您对浮点数进行排序的时间复杂度为 O(n)。

Update:

我对这个主题很感兴趣，所以我坐下来实现了它（使用这种非常快速且节省内存的实现 https://en.wikibooks.org/wiki/Algorithm_implementation/Sorting/Radix_sort）。我也读过this one https://www.codercorner.com/RadixSortRevisited.htm（谢谢celion https://stackoverflow.com/users/224264/celion）并发现您甚至不必将浮点数拆分为尾数和指数来对其进行排序。您只需一对一地获取这些位并执行 int 排序。您只需要关心负值，这些负值必须在算法结束时相反地放在正值前面（我在算法的最后一次迭代中一步完成了这一点，以节省一些 CPU 时间）。

这是我的浮点基数排序：

public static float[] RadixSort(this float[] array)
{
    // temporary array and the array of converted floats to ints
    int[] t = new int[array.Length];
    int[] a = new int[array.Length];
    for (int i = 0; i < array.Length; i++)
        a[i] = BitConverter.ToInt32(BitConverter.GetBytes(array[i]), 0);

    // set the group length to 1, 2, 4, 8 or 16
    // and see which one is quicker
    int groupLength = 4;
    int bitLength = 32;

    // counting and prefix arrays
    // (dimension is 2^r, the number of possible values of a r-bit number) 
    int[] count = new int[1 << groupLength];
    int[] pref = new int[1 << groupLength];
    int groups = bitLength / groupLength;
    int mask = (1 << groupLength) - 1;
    int negatives = 0, positives = 0;

    for (int c = 0, shift = 0; c < groups; c++, shift += groupLength)
    {
        // reset count array 
        for (int j = 0; j < count.Length; j++)
            count[j] = 0;

        // counting elements of the c-th group 
        for (int i = 0; i < a.Length; i++)
        {
            count[(a[i] >> shift) & mask]++;

            // additionally count all negative 
            // values in first round
            if (c == 0 && a[i] < 0)
                negatives++;
        }
        if (c == 0) positives = a.Length - negatives;

        // calculating prefixes
        pref[0] = 0;
        for (int i = 1; i < count.Length; i++)
            pref[i] = pref[i - 1] + count[i - 1];

        // from a[] to t[] elements ordered by c-th group 
        for (int i = 0; i < a.Length; i++){
            // Get the right index to sort the number in
            int index = pref[(a[i] >> shift) & mask]++;

            if (c == groups - 1)
            {
                // We're in the last (most significant) group, if the
                // number is negative, order them inversely in front
                // of the array, pushing positive ones back.
                if (a[i] < 0)
                    index = positives - (index - negatives) - 1;
                else
                    index += negatives;
            }
            t[index] = a[i];
        }

        // a[]=t[] and start again until the last group 
        t.CopyTo(a, 0);
    }

    // Convert back the ints to the float array
    float[] ret = new float[a.Length];
    for (int i = 0; i < a.Length; i++)
        ret[i] = BitConverter.ToSingle(BitConverter.GetBytes(a[i]), 0);

    return ret;
}

它比 int 基数排序稍慢，因为在函数的开头和结尾进行数组复制，其中浮点数按位复制到 int 并返回。尽管如此，整个函数仍然是 O(n)。无论如何，比像你建议的那样连续排序 3 次要快得多。我看不到太多优化空间，但如果有人这样做：请随时告诉我。

要降序排序，请在最后更改此行：

ret[i] = BitConverter.ToSingle(BitConverter.GetBytes(a[i]), 0);

to this:

ret[a.Length - i - 1] = BitConverter.ToSingle(BitConverter.GetBytes(a[i]), 0);

测量：

我设置了一些简短的测试，包含浮点数的所有特殊情况（NaN、+/-Inf、最小/最大值、0）和随机数。它的排序顺序与 Linq 或Array.Sort对浮点数进行排序：

NaN -> -Inf -> Min -> Negative Nums -> 0 -> Positive Nums -> Max -> +Inf

所以我用大量 10M 数字进行了测试：

float[] test = new float[10000000];
Random rnd = new Random();
for (int i = 0; i < test.Length; i++)
{
    byte[] buffer = new byte[4];
    rnd.NextBytes(buffer);
    float rndfloat = BitConverter.ToSingle(buffer, 0);
    switch(i){
        case 0: { test[i] = float.MaxValue; break; }
        case 1: { test[i] = float.MinValue; break; }
        case 2: { test[i] = float.NaN; break; }
        case 3: { test[i] = float.NegativeInfinity; break; }
        case 4: { test[i] = float.PositiveInfinity; break; }
        case 5: { test[i] = 0f; break; }
        default: { test[i] = test[i] = rndfloat; break; }
    }
}

并停止了不同排序算法的时间：

Stopwatch sw = new Stopwatch();
sw.Start();

float[] sorted1 = test.RadixSort();

sw.Stop();
Console.WriteLine(string.Format("RadixSort: {0}", sw.Elapsed));
sw.Reset();
sw.Start();

float[] sorted2 = test.OrderBy(x => x).ToArray();

sw.Stop();
Console.WriteLine(string.Format("Linq OrderBy: {0}", sw.Elapsed));
sw.Reset();
sw.Start();

Array.Sort(test);
float[] sorted3 = test;

sw.Stop();
Console.WriteLine(string.Format("Array.Sort: {0}", sw.Elapsed));

输出是（更新：现在使用发布版本运行，而不是调试):

RadixSort: 00:00:03.9902332
Linq OrderBy: 00:00:17.4983272
Array.Sort: 00:00:03.1536785

大约比 Linq 快四倍多。那还不错。但还没有那么快Array.Sort，但也没有那么糟糕。但我对此感到非常惊讶：我预计它在非常小的数组上会比 Linq 稍微慢一些。但后来我只用 20 个元素进行了测试：

RadixSort: 00:00:00.0012944
Linq OrderBy: 00:00:00.0072271
Array.Sort: 00:00:00.0002979

即使这次我的 Radixsort 也比 Linq 更快，但是way比数组排序慢。 :)

更新2：

我做了一些更多的测量，发现了一些有趣的事情：更长的组长度常数意味着更少的迭代和更多的内存使用。如果使用 16 位的组长度（仅 2 次迭代），则在对小数组进行排序时会产生巨大的内存开销，但可以击败Array.Sort如果数组的元素数量超过 100k，即使数量不是很多。图表轴均已对数化：

_{(source: daubmeier.de http://daubmeier.de/philip/stackoverflow/radixsort_vs_arraysort.png)}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

C# 中是否有一个好的浮点数基数排序实现的相关文章

使用 C# 登录《我的世界》

我正在尝试为自己和一些朋友创建一个简单的自定义 Minecraft 启动器我不需要启动 Minecraft 的代码只需要登录的实际代码行例如据我所知您过去可以使用 string netResponse httpGET https
Swift 使用哪种通用排序算法？它在排序数据上表现不佳

我一直在挑选和探索 Swift 标准库sort 其函数为Array类型令我惊讶的是我注意到它在已经排序的数据上表现不佳对数组进行排序Int打乱顺序似乎比对已经排序的同一个数组进行排序快 5 倍对已打乱顺序的对象数组进行排序比对已按排
GetType() 在 Type 实例上返回什么？

我在一些调试过程中遇到了这段代码 private bool HasBaseType Type type out Type baseType Type originalType type GetType baseType GetBaseTyp
C++ 是否可以在 MacOS 上与 OpenMP 和 boost 兼容？

我现在已经尝试了很多事情并得出了一些结论也许我监督了一些事情但似乎我无法完成我想要的事情问题是是否有可能使用 OpenMP 和 boost 在 MacOS High Sierra 上编译 C 一些发现如果我错了请纠正我 Open
查找进程的完整路径

我已经编写了 C 控制台应用程序当我启动应用程序时不使用cmd 我可以看到它列在任务管理器的进程列表中现在我需要编写另一个应用程序在其中我需要查找以前的应用程序是否正在运行我知道应用程序名称和路径所以我已将管理对象搜索器查询写入
为什么在 WebApi 上下文中在 using 块中使用 HttpClient 是错误的？

那么问题是为什么在 using 块中使用 HttpClient 是错误的但在 WebApi 上下文中呢我一直在读这篇文章不要阻止异步代码 https blog stephencleary com 2012 07 dont block
当一组凭据下的计划任务启动的进程在另一组凭据下运行另一个程序时，Windows 是否有限制

所以我有一个简单的例子其中我有应用程序 A 它对用户 X 本地管理员有一些硬编码的凭据然后它使用硬编码的绝对路径启动带有这些凭据的应用程序 B A 和 B 以及 dotnet 控制台应用程序但是它们不与控制台交互只是将信息写入文件
使用可变参数包类型扩展的 C++ 函数调用者包装器

我绑定了一些 API 并且绑定了一些函数签名如下所示 static bool WrapperFunction JSContext cx unsigned argc JS Value vp 我尝试将对象和函数包装在 SpiderMonkey
归并排序中的递归：两次递归调用

private void mergesort int low int high line 1 if low lt high line 2 int middle low high 2 line 3 mergesort low middle l
使用 GCP 的数据存储区时如何区分代码是在模拟器中运行还是在 GKE 中运行

按照中给出的说明进行操作后我不确定是否遗漏了任何内容https cloud google com datastore docs tools datastore emulator https cloud google com datasto
启动时的 Excel 加载项

我正在使用 Visual C 创建 Microsoft Excel 的加载项当我第一次创建解决方案时它包含一个名为 ThisAddIn Startup 的函数我在这个函数中添加了以下代码 private void ThisAddIn
识别 Visual Studio 中的重载运算符 (c++)

有没有办法使用 Visual Studio 快速直观地识别 C 中的重载运算符在我看来 C 中的一大问题是不知道您正在使用的运算符是否已重载 Visual Studio 或某些第三方工具中是否有某些功能可以自动突出显示重载运算符或对重载运
在 NaN 情况下 to_string() 可以返回什么

我使用 VS 2012 遇到了非常令人恼火的行为有时我的浮点数是 NaN auto dbgHelp std to string myFloat dbgHelp最终包含5008角色你不能发明这个东西其中大部分为0 最终结果是 0 INF
高效列出目录中的所有子目录

请参阅迄今为止所采取的建议的编辑我正在尝试使用 WinAPI 和 C 列出给定目录中的所有目录文件夹现在我的算法又慢又低效使用 FindFirstFileEx 打开我正在搜索的文件夹然后我查看目录中的每个文件使用 FindNex
数量重新分配逻辑 - 具有外部数据集的 MapGroups

我正在研究一种复杂的逻辑需要将数量从一个数据集重新分配到另一个数据集在例子中我们有Owner and Invoice 我们需要从数量中减去Invoice准确地Owner匹配在给定汽车的给定邮政编码处减去的数量需要重新分配回同一辆车出
Unity：通过拦截将两个接口注册为一个单例

我有一个实现两个接口的类我想对该类的方法应用拦截我正在遵循中的建议Unity 将两个接口注册为一个单例 https stackoverflow com questions 1394650 unity register two inter
实体框架中的“it”是什么

如果以前有人问过这个问题请原谅我但我的任何搜索中都没有出现它我有两个数据库表 Person 和 Employee 对每个类型的表进行建模例如 Employee is a Person 在我的 edmx 设计器中我定义了一个实体
可访问性不一致：参数类型的可访问性低于方法

我试图在两个表单之间传递一个对象基本上是对当前登录用户的引用目前我在登录表单中有一些类似的内容 private ACTInterface oActInterface public void button1 Click object s
是否可以在不连接数据库的情况下检索 MetadataWorkspace？

我正在编写一个需要遍历实体框架的测试库MetadataWorkspace对于给定的DbContext类型但是由于这是一个测试库我宁愿不连接到数据库它引入了测试环境中可能无法使用的依赖项当我尝试获取参考时MetadataWorksp
OpenCV SIFT 描述符关键点半径

我正在深入研究OpenCV的SIFT描述符提取的实现 https github com Itseez opencv blob master modules nonfree src sift cpp 我发现了一些令人费解的代码来获取兴趣点邻域

随机推荐

在 Fabric.js 中真正旋转等边三角形的中心

使用 Fabric js 我无法真正围绕其中心点旋转三角形或者至少我认为应该是中心点我创建了一个jsFiddle http jsfiddle net UW8Be 这表明三角形很简单我用了originX center 原点Y 也是如此
将 Typeahead 与 Google 自定义搜索引擎结合使用

我正在尝试让 Twitter Typeahead Bloodhound 与 Google 的 CSE 配合使用到目前为止我已经成功返回结果但无法计算出 datumTokenizer var results new Bloodhound
SSIS 错误 - 无法执行事务操作，因为有正在处理此事务的待处理请求

在执行 ssis 包时出现以下错误 The transaction operation cannot be performed because there are pending requests working on this tran
Excel - 从单元格范围创建图表，同时排除空值？

我有这张 Excel 工作表其中基本上包含大量数据现在此 Excel 工作表通过导入数据的宏动态更新因此数据可能会发生变化这意味着某些单元格可能会被填充而其他单元格则不会所以我在工作表 2 中从 A2 A60 到 M2 M60
如何更改TTLauncherItem中标题的颜色？

我在尝试更改 TTLauncherItem 中的颜色时遇到很多麻烦因为默认的灰色不适合我的背景有任何想法吗这是我用来更改文本颜色的TTLauncherItem从默认的灰色变为黑色在白色背景上看起来更好 1 创建一个继承自的样式表TT
如何更改诺基亚全触摸 lwuit 表单标题颜色

我想更改基于诺基亚 lwuit 的全触摸表单的标题颜色我尝试过 setTitleComponent 方法但它不起作用另请检查以下链接http projects developer nokia com LWUIT for Series
有没有像 Haskell 的 Threadscope 这样的 C/C++ 线程跟踪器？

有没有像这样的免费开源工具线程范围 http research microsoft com en us projects threadscope 并且比NPTL 追踪工具 http nptltracetool sourceforge net
从 SQL Server 查询 Python 中的二进制值

我正在执行这个查询 SELECT CMDB ID FROM DB1 dbo CDMID 当我在 SSMS 18 上执行此操作时我得到以下信息我知道这些是十六进制值尽管我不是该主题的专家我需要在 python 上执行这个精确的查询以
在python中逐层打印二叉树

我想按以下方式打印二叉树 10 6 12 5 7 11 13 我已经编写了用于插入节点的代码但无法编写用于打印树的代码所以请帮忙解决这个问题我的代码是 class Node def init self data self data d
让 Graphstream 只渲染发生变化的部分

我使用以下方法创建了一个表示特定区域路线图的图表Graphstream 现在我想让蓝色节点看起来像在图表上移动为此我在另一个线程上显示图表并且每秒将不同的节点着色为蓝色如下所示 public void drawGraph List
Git lfs（大文件存储）表示 lfs 管理的文件在 git lfs pull 后被修改

我有一个存储库的工作副本它使用 git lfs 来存储一些大文件我安装了 git lfs 二进制文件但可能没有在工作副本中运行 git lfs install 当我想在添加 lfs 文件后更新本地工作副本时我执行以下命令 git p
C：scanf循环

char buf 1024 0 send a message if status 0 while 1 printf Enter message scanf 1023 n buf fflush stdin if strcmp buf quit
SQL Server 图形数据库 - 使用多种边类型的最短路径

我已经对 SQL Server GraphDB 进行了研究但到目前为止我发现的所有人为示例仅使用单个边缘表总是如此Person friend of gt Person 例如就我而言我创建了数据中心中已部署软件组件的图表并且存在不同
Android - 如何在启动后启动 /sdcard 上的应用程序

有没有一种方法可以在启动后自动启动Android应用程序如果它位于Android应用程序上 sdcard 好吧大概是通过BroadcastReceiver 但哪种行动是正确的呢 ACTION BOOT COMPLETED does no
Html.ActionLink 无法动态调度

我的 MVC3 有问题我正在尝试使用 Html ActionLink 为我的博客项目中的标题生成链接在中使用常量字符串ActionLink效果很好但如果我使用Posts Title 当前帖子模型的标题被循环我得到这个异常 CS197
如何减少flutter web应用程序的加载时间

截至目前我们可以将 flutter web 应用程序作为单个文件启动该文件将立即加载因此需要花费大量时间和带宽来加载这并不理想有没有办法一次只加载一个页面而不是整个网络应用程序我的意思是一次加载一个小部件任何建议将不胜感激
卡夫卡高级消费者 error_code=15

当尝试使用高级消费者使用全新的消费者组从 Kafka 进行消费时消费者永远不会开始运行当我将日志记录级别切换为调试时我可以看到以下两行一遍又一遍地重复 DEBUG AbstractCoordinator 09 43 51 192
了解跟踪*

再会当试图理解数学使用标准的评估顺序Trace and TraceScan最近开发的命令及其漂亮的视觉表示thread https stackoverflow com questions 5459735 the clearest way
foreach(... in ...) 或 .ForEach();这就是问题[重复]

这个问题在这里已经有答案了可能的重复 C foreach 与函数式each https stackoverflow com questions 2024305 c sharp foreach vs functional each 这是一个
C# 中是否有一个好的浮点数基数排序实现

我有一个带有浮点类型字段的数据结构这些结构的集合需要按浮点值排序是否有一个基数排序实现如果没有是否有一种快速的方法来访问指数符号和尾数因为如果你首先对尾数指数和最后一次的指数对浮点数进行排序您对浮点数进行排序的时间复杂度为

C# 中是否有一个好的浮点数基数排序实现

C# 中是否有一个好的浮点数基数排序实现 的相关文章

随机推荐

热门标签

C# 中是否有一个好的浮点数基数排序实现的相关文章