为什么以下两个重复查找算法的时间复杂度不同？

2024-03-27

我正在读这个question https://stackoverflow.com/questions/3951547/java-array-finding-duplicates。所选答案包含以下两种算法。我不明白为什么第一个的时间复杂度是O(ln(n))。在最坏的情况下，如果数组不包含任何重复项，它将循环 n 次，第二个也是如此。我错了还是我错过了什么？谢谢

1）更快（极限）的方式

这是一种基于哈希的方法。你必须为自动装箱付费，但它是 O(ln(n)) 而不是 O(n2)。一个有进取心的人会去寻找一个基于 int 的原始哈希集（我认为 Apache 或 Google Collections 有这样的东西。）

boolean duplicates(final int[] zipcodelist)
{
  Set<Integer> lump = new HashSet<Integer>();
  for (int i : zipcodelist)
  {
    if (lump.contains(i)) return true;
    lump.add(i);
  }
  return false;
}

2）向海勒鞠躬

请参阅 HuyLe 的答案，了解或多或少的 O(n) 解决方案，我认为这需要几个附加步骤：

static boolean duplicates(final int[] zipcodelist) {    
    final int MAXZIP = 99999;    
    boolean[] bitmap = new boolean[MAXZIP+1];    
    java.util.Arrays.fill(bitmap, false);    

    for (int item : zipcodeList)
        if (!bitmap[item]) bitmap[item] = true;
        else return true;    
    }

    return false; 
}

第一个解决方案的预期复杂度应该为 O(n)，因为必须遍历整个邮政编码列表，并且处理每个邮政编码的预期时间复杂度为 O(1)。

即使考虑到插入 HashMap 可能会触发重新哈希，复杂度仍然是O(1) http://www.cs.cornell.edu/courses/cs312/2008sp/lectures/lec20.html。这有点不合逻辑，因为 Java HashMap 和链接中的假设之间可能没有关系，但它表明这是可能的。

From HashSet http://docs.oracle.com/javase/1.4.2/docs/api/java/util/HashSet.html文档：

本课程提供恒定时间基本操作的性能（add，消除，contains和大小），假设哈希函数将元素正确地分散在桶中。

第二个解也是一样，分析正确：O(n)。

（只是一个题外话，BitSet 比数组更快，如原始帖子中所示，因为 8booleans 被打包成 1byte，使用更少的内存）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么以下两个重复查找算法的时间复杂度不同？的相关文章

独立于符号的字符串的模式匹配

我需要一种算法可以在数据中找到预定义的模式以字符串的形式存在独立于数据和模式的实际符号字符我只关心符号之间的关系而不关心符号本身数据中的同一符号具有不同的模式符号也是合法的模式匹配算法必须强制执行的唯一一件事是保留模式中同一
获取当前时间（以小时和分钟为单位）

我正在尝试从系统收集信息并且需要获取当前时间以小时和分钟为单位目前我有 date awk print 4 输出如下 16 18 54 怎样才能把秒数去掉呢提供格式字符串 date H M Running man date将给出所有格
创建横幅交换算法来轮播广告

我正在构建广告横幅轮播脚本基于印象整个月均匀地显示广告每次请求显示广告时都会进行计算所以这将是即时完成的广告应显示为一个接一个轮流播放而不是仅显示一个广告 1000 次展示然后显示另一个广告 1000 次展示大多数情况下它应该
如何通过使用内置的 Date 类来节省时间？

这个问题的目的是使用内置的 Date 类收集日期时间计算的解决方案而不是编写冗长的复杂函数我会自己写一些答案如果有人想出一些非常聪明的东西我会接受答案但这主要是作为解决方案的集合因为我经常看到处理日期的代码过于复杂请记住这是
算法的最佳、最差和平均情况运行时间是多少？

算法的最佳最差和平均情况运行时间是多少用最简单的术语来说对于输入大小为n 最好的情况最快完成时间选择最佳输入例如排序算法的最佳情况是已经排序的数据最坏的情况下完成最慢的时间选择了消极的输入例如排序算法的最坏情况可能是
我怎样才能找到圆的所有点？ [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 给定半径和圆心坐标如何找到圆的所有
如何在SAS中删除重复的记录\观察而不进行排序？

我想知道是否有办法取消重复记录WITHOUT排序有时候我想保留原来的顺序只想删除重复的记录是否可以顺便说一句以下是我对不重复记录的了解它最终会进行排序 1 proc sql create table yourdata nodu
硬币兑换的空间优化解决方案

给定一个值 N 如果我们想要找 N 分钱并且我们有无限供应每种 S S1 S2 Sm 价值的硬币我们可以有多少种找零方式硬币的顺序并不重要例如对于 N 4 且 S 1 2 3 有四种解 1 1 1 1 1 1 2 2 2 1 3
比较周期性数据的快速方法

假设我有任意类型的数据集 A B C D 并且我想将其与另一个数据集进行比较我希望 A B C D B C D A C D A B 和 D A B C 的比较成立但是不适用于 A C B D 或任何其他未类似排序的集合有什么快速方法可
如何在代码生成过程中简化包含变量的 C 风格算术表达式？

我正在尝试优化编译器中的表达式求值算术表达式都是C风格的并且它们可以包含变量我希望尽可能简化表达例如 3 100 A B 100 3 100可以简化为409 300 A B 主要取决于分配律结合律和交换律我遇到的主要困难是如何将
Java TreeMap时间复杂度-lowerKey

时间复杂度是多少lowerKey Java实现中的操作TreeMap 我认为它是 log n 但我在文档中找不到它更基本操作的复杂性已有详细记录此实现提供了有保证的 log n 时间成本 containsKey 获取放置和删除操作顺
在 Python 中删除表达式树及其每个子表达式树中第一个元素周围的括号

目标是实现简化操作删除表达式树及其每个子表达式树中第一个元素周围的括号其中表达式作为括在各个括号中的字符串输入给出这必须适用于任意数量的括号例如 12 3 45 6 gt 123 45 6 删除 12 周围的括号然后删除 45 周
找到两个移动物体的更好交点

我想极大地优化我的算法之一我将尽力以最好的方式解释它主题我们当时处于二维欧几里德系统中t 0 在这个系统中有两个对象 O1 and O2 O1 and O2分别位于点PA and PC O1移动于常数和已知点方向的速度PB 当物体到达
从纪元到相对日期的秒数

我正在处理自纪元以来的日期并且已经得到了例如 date 6928727 56235 我想将其转换为另一种相对格式以便我能够将其转换为与纪元相关的格式使用 time gmtime date 它返回 year 1970 mon 3 da
为无向无权图实现推重标签算法 s-t 最小割边

我正在寻找一个好的解决方案来在无向和未加权图中找到 s t 最小切割边我想使用推送重新标记算法但我不确定如何实现它以在无向和未加权图上找到最小割在每对顶点之间有两条反向边并在所有边上赋予相同的权重并应用推送重新标记算法我可以用这
4 x 3 锁图案

我遇到了这个它要求计算在 4x3 网格中可以制作特定长度的锁定图案的方式数并遵循规则可能有些点不能包含在路径中有效的模式具有以下属性图案可以使用第一次接触的点序列来表示与绘制图案的顺序相同从 1 1 到 2 2 的图案与图案不
使用 System.currentTimeMillis() 每秒运行一次代码

我试图使用 System currentTimeMillis 每秒运行一行代码代码 while true long var System currentTimeMillis 1000 double var2 var 2 if var2 1
如何使用KDTrees实现最近邻搜索？

所以我正在实施一个KD Tree http en wikipedia org wiki Kd tree进行最近邻搜索我已经构建了树部分但我认为我没有完全理解搜索部分关于遍历树来搜索邻居维基百科文章如下 Starting with
用于插入/删除/排名/选择查询的最佳数据结构/算法

到目前为止我知道像AVL树和红黑树这样的自平衡BST可以在O log n 次内完成这些操作然而要使用这些结构我们必须自己实现AVL树或RB树我听说有一个算法实现这四个操作而不使用自平衡 BST 有了我们自己定义的结构我们就需要
稀疏矩阵中的最大和子矩形

求一个子矩形中的最大和NxN矩阵可以完成O n 3 正如其他帖子中指出的使用 2 d kadane 算法的时间然而如果矩阵是稀疏的具体来说O n 非零条目可以O n 3 时间被打败了吗如果有帮助的话对于我感兴趣的当前应用程序

随机推荐

java.lang.ClassNotFoundException：com.sun.faces.config.ConfigureListener

我们是三个人开发一个 JSF 项目但我们以前从未接触过 JSF 奇怪的是使用从 SVN 检查的相同数据其中一位团队成员每次使用 Tomcat 7 0 27 都会收到 404 错误当Tomcat 在Eclipse中使用启动时会写出
默认情况下使用 unifdef 省略未定义的预处理器分支的方法？

我正在使用复杂的 C 代码其中包含许多编译选项这使得代码很难阅读我想生成一份反映代码的副本它实际编译的方式我使用 unifdef 得到了很好的结果实用程序直到最近我才知道但我很困惑为什么这么难调用我想知道我是否遗漏了一
Cordova 5.0.0：我应该将哪些文件提交到 git？

我使用 Cordova 5 0 0 并且我有以下项目结构 MyProject hooks platforms plugins resources www config xml 我现在的问题是我可以省略哪些文件夹我问这个问题是因为我在三个
展平元组列表[重复]

这个问题在这里已经有答案了如何将元组列表中的所有元素循环到空列表中例如 tup Before 69592 69582 69582 69518 69518 69532 69532 69525 tup After 69592 69582 6
使用 ggplot 和 pandas 在 Python 中绘制事件密度

我正在尝试可视化这种形式的数据 timestamp senderId 0 735217 106758968942084595234 1 735217 114647222927547413607 2 735217 10675896894208
JavaScript 语法：字符串赋值语句中的内联 If

我最近遇到了这个问题我认为这会是一个很好的问题假设您将一个字符串分配给一个局部变量并且您想通过一个简单的条件来改变它因此您将内联 if 语句插入到字符串中 var someCondition true var url beginn
在 Contiki 程序中使用 malloc

考虑以下 Contiki 程序 include
Node JS，传统数据结构？（如 Set 等），类似于 Node 的 Java.util 之类的东西？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我喜欢 Node JS 并且有 Java 背景甚至有兴趣在某些 Node 看起来有点牵强的项目中尝试
nasm：在运行时从 rip（指令指针）获取重定位二进制文件的偏移量

我有一个适用于 x86 64 的 multiboot2 兼容 ELF 文件其中启动符号定义在start asm NASM 汇编文件 multiboot2 标头包含relocatable tag 因为 GRUB 不支持 multiboot2
Flask URL路由编码问题

我偶然发现了一个奇怪的 Unicode Flask 中的 URL 编码问题 app route it2
为什么此 C++ 代码可以使用某些编译器编译，而不能使用其他编译器编译？

我在做作业时注意到我笔记本电脑上的编译器比我们用于提交的机器上的编译器要宽容得多我笔记本电脑上的 C 编译器是AppleClang 7 0 2 7000181 提交框上的编译器是g 4 9 2 回想起来不应该编译的代码是 includ
付款错误：PayPal 错误：请求无效。查看具体信息。 (VALIDATION_ERROR) 贝宝

我在我的项目中使用 PayPal 定期付款我想在一段时间内提供一次免费试用并且初始订单总额应该为零一旦免费试用完成实际订单金额将从帐户中扣除例如用户购买一个产品 100 美元并申请免费试用折扣代码则第一个订单应以 0 美元下
将 Bundle 传递给 startActivityForResult 以实现场景转换

我正在玩棒棒糖sceneTransitionAnimations 为了让它发挥作用你需要实施getWindow setExitTransition getWindow setReenterTransition 在调用活动的onCreate
Spring Security 3.2.0.RC1 - 元素和已弃用的方法

升级到 Spring Security 3 2 0 RC1 后我收到警告 Method setFilterProcessesUrl is tagged deprecated
带有客户端证书的嵌入式 Jetty

我想创建嵌入式 https 服务器要求客户端提供证书我正在使用它 http www smartjava org content embedded jetty client certificates http www smartjava
拉取请求的 Bitbucket 构建状态显示失败的构建，而不是最新的构建状态

我将 Bitbucket 与 Cloudbees 集成具有以下工作流程每次用户创建 Pull 请求时都将其作为目标develop分支 cloudbees 中的多分支管道将聚集拉取请求例如 PR 34 并将触发第一个构建 1 如果通过
颜色条上的日志标签

我有一个对数 imshow 图当创建颜色条时它的轴标签和刻度是对数的但由于值的范围较短 0 50 颜色条看起来像这样我希望它显示为沿轴间隔的 0 5 10 20 50 对数间距 Use the LogFormatter https
在 Bash 中打开默认文本编辑器？

我在编写 shell 脚本时遇到了一个问题有没有办法使用用户指定的文本编辑器打开文件用户选择的编辑器应该位于 EDITOR 但您仍必须选择合理的默认值 EDITOR vi file txt
向该对象的每一面添加不同的颜色

我为我的应用程序重新创建了一个包模型并将其作为 obj 导出到 ThreeJs 中我为模型几何中发现的每个面分配了不同的颜色如下所示 var geometry new THREE Geometry fromBufferGeometry
为什么以下两个重复查找算法的时间复杂度不同？

我正在读这个question https stackoverflow com questions 3951547 java array finding duplicates 所选答案包含以下两种算法我不明白为什么第一个的时间复杂度是O l

为什么以下两个重复查找算法的时间复杂度不同？

为什么以下两个重复查找算法的时间复杂度不同？ 的相关文章

随机推荐

热门标签

为什么以下两个重复查找算法的时间复杂度不同？的相关文章