从列表中删除重复项的最有效方法

2023-12-21

假设我有一个包含重复值的列表，并且我想删除重复项。

List<int> myList = new List<int>(Enumerable.Range(0, 10000));

// adding a few duplicates here
myList.Add(1); 
myList.Add(2);
myList.Add(3);

我找到了 3 种方法来解决这个问题：

List<int> result1 = new HashSet<int>(myList).ToList(); //3700 ticks
List<int> result2 = myList.Distinct().ToList(); //4700 ticks
List<int> result3 = myList.GroupBy(x => x).Select(grp => grp.First()).ToList(); //18800 ticks
//referring to pinturic's comment:
List<int> result4 = new SortedSet<int>(myList).ToList(); //18000 ticks

在关于 SO 的大多数答案中，Distinct方法被显示为“正确的方法”，但 HashSet 总是更快！

我的问题：使用时有什么需要注意的吗？HashSet方法还有其他更有效的方法吗？

这两种方法有很大的区别：

List<int> Result1 = new HashSet<int>(myList).ToList(); //3700 ticks
List<int> Result2 = myList.Distinct().ToList(); //4700 ticks

第一个可以（可能会）改变返回的元素的顺序List<>: Result1元素的顺序不会相同myList的。第二个保持原来的顺序。

可能没有比第一种更快的方法了。

可能没有比第二个“更正确”的了（对于基于排序的“正确”的某个定义）。

（第三个和第二个类似，只是慢一些）

只是出于好奇，Distinct() is:

// Reference source http://referencesource.microsoft.com/#System.Core/System/Linq/Enumerable.cs,712
public static IEnumerable<TSource> Distinct<TSource>(this IEnumerable<TSource> source) {
    if (source == null) throw Error.ArgumentNull("source");
    return DistinctIterator<TSource>(source, null);
}

// Reference source http://referencesource.microsoft.com/#System.Core/System/Linq/Enumerable.cs,722
static IEnumerable<TSource> DistinctIterator<TSource>(IEnumerable<TSource> source, IEqualityComparer<TSource> comparer) {
    Set<TSource> set = new Set<TSource>(comparer);
    foreach (TSource element in source)
        if (set.Add(element)) yield return element;
}

所以最后Distinct()只需使用一个内部实现HashSet<>（称为Set<>) 检查项目的唯一性。

为了完整起见，我将添加问题的链接C# Distinct() 方法是否保持序列的原始顺序不变？ https://stackoverflow.com/q/4734852/613130

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

list

Distinct

从列表中删除重复项的最有效方法的相关文章

与 for_each 或 std::transform 一起使用时，如何调用 C++ 函子构造函数

我以前从未使用过 C 函子所以我只是想了解它们是如何工作的例如假设我们有这个函子类 class MultiplyBy private int factor public MultiplyBy int x factor x int ope
C# SmtpClient编程中如何设置带有中文的附件文件名？

我的代码如下 ContentType ct new ContentType ct MediaType MediaTypeNames Application Octet ct Name 这是一个很长的中文文件名希望能用它在附件名中 Doc A
是否需要销毁运算符删除的形式才能真正销毁对象？

C 20 添加了破坏形式operator delete区别于std destroying delete t范围它导致delete表达式在调用之前不再销毁对象operator delete 目的是在显式调用对象的析构函数和释放内存之前允许
关于逻辑/算法的想法以及如何防止线程写入 Sql Server 中的竞争

我有以下逻辑 public void InQueueTable DataTable Table int incomingRows Table Rows Count if incomingRows gt RowsThreshold async
在 C 语言中，为什么数组的地址等于它的值？

在下面的代码中指针值和指针地址与预期不同但数组值和地址则不然怎么会这样 Output my array 0022FF00 my array 0022FF00 pointer to array 0022FF00 pointer to a
Selenium - C# - Webdriver - 无法找到元素

在 C 中使用 selenium 我试图打开浏览器导航到 Google 并找到文本搜索字段我尝试下面的 IWebDriver driver new InternetExplorerDriver C driver Navigate GoT
防止控制台应用程序中的内存工作集最小化？

我想防止控制台应用程序中的内存工作集最小化在Windows应用程序中我可以这样做覆盖 SC MINIMIZE 消息 http support microsoft com kb 293215 en us fr 1 但是如何在控制台应用程
混合模型优先和代码优先

我们使用模型优先方法创建了一个 Web 应用程序一名新开发人员进入该项目并使用代码优先方法使用数据库文件创建了一个新的自定义模型这这是代码第一个数据库上下文 namespace WVITDB DAL public class D
if constexpr 中的 not-constexpr 变量 – clang 与 GCC

struct A constexpr operator bool const return true int main auto f auto v if constexpr v A a f a clang 6 接受该代码 GCC 8 拒绝它
Unity手游触摸动作不扎实

我的代码中有一种错误我只是找不到它发生的原因以及如何修复它我是统一的初学者甚至是统一的手机游戏的初学者我使用触摸让玩家从一侧移动到另一侧但问题是我希望玩家在手指从一侧滑动到另一侧时能够平滑移动但我的代码还会将玩家移动到您点击的
Linux 上的 RTLD_LOCAL 和dynamic_cast

我们有一个由应用程序中的一些共享库构成的插件我们需要在应用程序运行时更新它出于性能原因我们在卸载旧插件之前加载并开始使用新插件并且只有当所有线程都使用旧插件完成后我们才卸载它由于新插件和旧插件的库具有相同的符号我们dlopen
如何在 Javascript 中连接 C# ActiveX 事件处理程序

我尝试使用几个代码片段将 ActiveX 对象与 Javascript 事件处理程序挂钩我无法确定为什么事件处理程序没有被调用带有项目的 Github 存储库 https github com JesseKPhillips Csharp
如何编写一个接受 int 或 float 的 C 函数？

我想用 C 语言创建一个扩展 Python 的函数该函数可以接受 float 或 int 类型的输入所以基本上我想要f 5 and f 5 5 成为可接受的输入我认为我不能使用if PyArg ParseTuple args i v
如何从 Windows Phone 7 模拟器获取数据

我有一个 WP7 的单元测试框架它在手机上运行结果相当难以阅读因此我将它们写入 XDocument 我的问题是如何才能将这个 XML 文件从手机上移到我的桌面上以便我可以实际分析结果到目前为止我所做的是将 Debugger B
任何人都可以清楚地告诉如何在不使用像这样的预定义函数的情况下找到带有小数值或小数值的指数吗？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案例如 2 0 5 1 414 所以想要我是 c 的新手所以请解释简单的逻辑如果不是复杂的逻辑也足够了在数学中从整数取幂到实数
如果将变量设置为等于新对象，旧对象会发生什么？

假设我们有一个 X 类not有一个超载的operator 功能 class X int n X n 0 X int n n n int main X a 1 an object gets constructed here more code
.Net Reactive Extensions Framework (Rx) 是否考虑拓扑顺序？

Net 反应式扩展框架是否按拓扑顺序传播通知以最大限度地减少更新量就像 Scala Rx 所做的那样 Net 反应式扩展 Rx 是否可以 https github com lihaoyi scala rx wiki How it Work
从后面的代码添加外部 css 文件

我有一个 CSS 文件例如 SomeStyle css 我是否可以将此样式表文档从其代码隐藏应用到 aspx 页面您可以将文字控件添加到标头控件中 Page Header Controls Add new System Web UI L
声明一个负长度的数组

当创建负长度数组时 C 中会发生什么例如 int n 35 int testArray n for int i 0 i lt 10 i testArray i i 1 这段代码将编译并且启用 Wall 时不会出现警告并且似乎您可以分配
如果找不到指定的图像文件，显示默认图像的最佳方式？

我有一个普通的电子商务应用程序我将 ITEM IMAGE NAME 存储在数据库中有时经理会拼错图像名称为了避免丢失图像 IE 中的红色 X 每次显示产品列表时我都会检查服务器中是否有与该产品相关的图像如果该文件不存在我会将其

随机推荐

如何删除列表中的复选框

我懂了堆栈闪电战 https stackblitz com edit list examples file app 2Fselection list 2Fselection list component html具有选择的列表的示例如下图
URLLoader 轮询时卡住

更新不知怎的这在浏览器中运行 flash 时有效但如果从 IDE 运行则不起作用如果您遇到同样的问题您可能想尝试在浏览器中运行我正在制作一个聊天应用程序它使用 Flash 和 Actionscript 3 0 从我的服务器重复
List.permute 的性能

我实现了一个费舍尔耶茨洗牌 http en wikipedia org wiki Fisher E2 80 93Yates shuffle The modern algorithm最近它使用List permute对列表进行洗牌并注意
如何使用类似 SQL 的接口 INSERT 到 influxDB 中？

是否有可能INSERT使用 InfluxDB 上类似 SQL 的接口将数据转换为系列测量值是的您可以简单地INSERT线路协议字符串 https docs influxdata com influxdb v1 6 tools shel
在 JavaScript 对象中将键值分配给另一个键值[关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案例如我知道可以在 Javascript 中设置带有前面键值的键值 var obj one yes two obj one obj two
在 Joomla 中加载另一个模块中的模块

我绝对是 Joomla 的初学者我正在尝试在另一个模块中加载一个模块但我找不到如何执行此操作我一直在尝试添加 loadposition position 用 position 替换了我想要加载的模块的位置但它似乎只在文章中起作用我
StatelessSession 在 AbstractEntityPersister (Hibernate) 中被转换为 Session

我正在尝试对 StatelessSession 进行简单的保存有人能发现我做错了什么导致 Hibernate 方法尝试将 StatelessSession 无效转换为 Session 如果有任何反馈我将不胜感激我的示例代码 Stat
python-click：格式化帮助文本

这个问题是关于click https click palletsprojects com en 7 x 包裹帮助的长文本未按预期显示我尝试使用 b也一样但似乎影响不大 cmd and powershell相同的代码有不同的结果为什么
在图像opencv上绘制矩形？

我已经使用 python 中的 opencv 库加载了一个图像现在我想使用鼠标绘制一个矩形但是在绘制矩形时矩形应该是可见的以便绘制它的人可以以某种方式放置它使感兴趣的对象完全可见在矩形中但我的代码没有产生所需的输出我的代码是
JQuery $('iframe').ready 为什么不起作用？

我的父页面中有一个很长的 iframe 当您重新加载或单击 i 框架页面内的链接时它会加载到其中但纯窗口必须向上滚动我尝试过各种代码示例 jquery哪个事件比这个更好 https stackoverflow com question
Node.js 是 Perl 和 Python 等传统脚本语言的可行替代品吗？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
是否有开源电子邮件消息（标头、附件等）解析器？

是否有免费的开源解决方案将原始电子邮件消息作为一段文本并返回每个标头字段每个附件和消息正文作为单独的字段是的对于你指出的每一种语言我自己都在Python 中使用过尝试仔细阅读您选择的库的库文档注意您可能期望有一个不错的
mono：使用 monodevelop 可以进行远程调试吗？

mono 使用 monodevelop 可以进行远程调试吗我想远程调试在 CentOS 开发计算机上安装了 monodevelop 的远程 RHEL 服务器上运行的控制台应用程序这对于 monodevelop 可能吗这实际上可以通过软
如何限制 haar 级联检测到的人脸数量

我在情绪检测系统中使用 Haar 级联我提供给模型的每个视频输入中只有一张脸这是一项要求当我运行 Haar 级联模型来检测人脸时它有一些误报由于视频中只有一张脸因此我想选取检测到的最积极的区域并忽略所有其他检测有没有办法做到这
使用 htaccess 阻止所有人，除了来自特定引荐来源网址的访问者

在 htaccess 中如何阻止除来自特定域的访问者之外的所有访问者我尝试了这个但没有成功 serve everyone from specific domain or specific user agent RewriteCond H
在 Sitecore 中自定义子布局缓存

在 Sitecore 中使用 WebControls 时有一种方法可以自定义缓存行为 override获取缓存ID方法有没有办法通过子布局用户控件实现类似的效果我想添加自定义 VaryBy 选项示例 Vary By Moon P
仅保留数组中每个对象中选定的键[重复]

这个问题在这里已经有答案了下面函数redux1删除与未列出的键相对应的条目keys to keep from data object 鉴于我有一个要保留的对象键列表我该如何重写redux1以更清洁的方式最好利用map filter
C++ 输出字符串没有 '\n' 或 endl 将在字符串末尾输出 '#'

在ubuntu16 04上我使用g 编译这样的代码 include
大使回应“上游不健康”

我有一个简单的 k3s 集群并按照以下方式安装了大使入口控制器docs https www getambassador io yaml ambassador ambassador rbac yaml 当我尝试通过浏览器访问该服务时我只是
从列表中删除重复项的最有效方法

假设我有一个包含重复值的列表并且我想删除重复项 List

从列表中删除重复项的最有效方法

从列表中删除重复项的最有效方法 的相关文章

随机推荐

热门标签

从列表中删除重复项的最有效方法的相关文章