删除字符串数组中重复项的最佳算法

2023-11-25

今天在学校老师要求我们实现一个重复删除算法。没那么难，大家想出了下面的解决方案（伪代码）：

for i from 1 to n - 1
    for j from i + 1 to n
        if v[i] == v[j] then remove(v, v[j])    // remove(from, what)
    next j
next i

该算法的计算复杂度为n(n-1)/2。（我们在高中，我们还没有谈论过大O，但似乎是O(n^2)）。这个解决方案看起来很丑陋，当然也很慢，所以我尝试编写更快的代码：

procedure binarySearch(vector, element, *position)
    // this procedure searches for element in vector, returning
    // true if found, false otherwise. *position will contain the
    // element's place (where it is or where it should be)
end procedure

----

// same type as v
vS = new array[n]

for i from 1 to n - 1
    if binarySearch(vS, v[i], &p) = true then
        remove(v, v[i])
    else
        add(vS, v[i], p)      // adds v[i] in position p of array vS
    end if
next i

这边走vS将包含我们已经传递的所有元素。如果元素v[i]位于此数组中，则它是重复项并被删除。二分查找的计算复杂度为log(n)对于主循环（第二个片段）是n。因此整个CC是n*log(n)如果我没错的话。

然后我又想到了使用二叉树，但又爱不释手。
基本上我的问题是：

我的CC计算正确吗？（如果不是，为什么？）
有没有更快的方法？

Thanks

最简单的解决方案是简单地对数组进行排序（如果您可以使用标准实现，则需要 O(n log n) 。否则请考虑进行简单的随机快速排序（代码甚至在维基百科上））。

然后再扫描一次。在该扫描过程中，简单地消除连续的相同元素。

如果你想在 O(n) 内完成，你也可以使用包含你已经见过的元素的 HashSet。只需在数组上迭代一次，对于每个元素检查它是否在您的 HashSet 中。

如果其中没有，请添加它。如果它在那里，请将其从数组中删除。

请注意，这将需要一些额外的内存，并且散列将有一个恒定的因素影响您的运行时间。虽然时间复杂度更好，但一旦超过一定的数组大小，实际运行时间只会更快

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

string

Algorithm

duplicates

bigo

complexitytheory

删除字符串数组中重复项的最佳算法的相关文章

使用 Scala 在 Apache Spark 中拆分字符串

我有一个数据集其中包含以下格式的行制表符分隔 Title lt t gt Text 现在对于每个单词Text 我想创建一个 Word Title 一对例如 ABC Hello World gives me Hello ABC Worl
如何在R中用采样字符替换通配符

我有以下顺序 s0 lt KDRH THLA RT HLAK 那里的通配符字符由我想要做的是用该向量中的采样字符替换该字符 AADict lt c A R N D C E Q G H I L K M F P S T W Y V Since
从日期中添加或减去天数的算法？

我正在尝试编写一个 Date 类以尝试学习 C 我正在尝试找到一种算法来添加或减去日期的天数其中日从 1 开始月从 1 开始事实证明它非常复杂谷歌也没有出现太多有谁知道有一个算法可以做到这一点最简单的方法是实际编写两个函数一个
证明链表是循环的最快方法？在Python中[重复]

这个问题在这里已经有答案了有人可以让我知道证明链表包含循环的最佳方法吗我正在使用一种带有两个指针的算法一个指针缓慢移动一步一个指针移动两步较快 class Node object def init self value next N
如何创建其中包含代理对的字符串？

I saw 这个帖子 http blogs msmvps com jonskeet 2009 11 02 omg ponies aka humanity epic fail 在 Jon Skeet 的博客上他谈论了字符串反转我想尝试他向
将字节数组写入txt文件并将其读回

我有一个字节数组我需要将其写入 txt 文件之后我需要从那里读取该字节数组这里出现了一个问题我读了这个将Java字符串转换为字节数组 https stackoverflow com questions 5499924 convert
Java 中的原始字符串 - 特别是对于正则表达式。多行字符串

有没有办法在Java中使用原始字符串没有转义序列我正在编写大量的正则表达式代码原始字符串将使我的代码更具可读性我知道该语言不会直接提供此功能但是有没有办法以任何方式模拟它们如果您使用 eclipse 这是一个解决方法当您将
如何获取字母数组的每种可能模式[重复]

这个问题在这里已经有答案了可能的重复有没有更好的方法来进行字符串排列 https stackoverflow com questions 1995328 are there any better methods to do permut
为什么“字符数组的初始化字符串太长”在 C 中编译得很好，而在 C++ 中却不行？

以下程序在 C 中编译良好但出现警告但在 C 中编译失败为什么是什么原因 include
将列表列表替换为“压缩”列表列表，同时保持顺序

我有一个列表列表如我所附的代码所示如果有任何共同值我想链接每个子列表然后我想用列表的精简列表替换列表的列表例子如果我有一个清单 1 2 3 3 4 I want 1 2 3 4 如果我有 4 3 1 2 3 I want 4 3
从数组中删除空字符串，同时保持记录而不循环？

这个问题在这里被问到从数组中删除空字符串同时保留非空字符串的索引记录 https stackoverflow com questions 18113243 remove empty strings from array while ke
为什么变量 1 += 变量 2 比变量 1 = 变量 1 + 变量 2 快得多？

我继承了一些 Python 代码用于创建巨大的表最多 19 列宽 5000 行花了九秒用于在屏幕上绘制表格我注意到每一行都是使用以下代码添加的 sTable sTable n GetRow where sTable是一个字符串我将
使用线段树求矩形并集的面积

我试图了解可用于计算一组轴对齐矩形的并集面积的算法我遵循的解决方案在这里 http tryalgo org en geometry 2016 06 25 union of rectangles http tryalgo org en ge
从两个列表中查找总和等于 x 的 2 个数字的最快方法

我的代码 n 3 a1 0 b1 10 a2 2 b2 2 if b1 gt n b1 n if b2 gt n b2 n diap1 x for x in range a1 b1 1 diap2 x for x in range a2 b
计算哪些字符串将具有相同的哈希值

使用 SHA 1 是否可以计算出哪些有限字符串将呈现相等的哈希值您正在寻找的是该问题的解决方案碰撞问题 http en wikipedia org wiki Collision 28computer science 29 也可以看看碰撞攻
用零向左填充字符串[重复]

这个问题在这里已经有答案了我见过类似的问题here https stackoverflow com questions 388461 padding strings in java and here https stackoverflow
替换大字符串中的多个字符串的最快方法

我正在寻找替换大 1mb 字符串的多个 500 子字符串的最快方法无论我尝试过什么 String Replace 似乎都是最快的方法我只关心最快的方式不是代码的可读性可维护性等我不在乎是否需要使用不安全的代码或预处理原始字符串每
在 C 中使用相等运算符 == 比较两个字符串是否相等 [重复]

这个问题在这里已经有答案了 int main int argc argv if argv 1 hello printf True n else printf False n myProg hello False 为什么我意识到strcmp
PySpark：根据与另一列中的字符串匹配的字典值创建新列

我有一个数据框 A 如下所示 ID SOME CODE TITLE 1 024df3 Large garden in New York New York 2 0ffw34 Small house in dark Detroit Michig
我不明白这个霍夫曼算法的实现

template

随机推荐

为什么 Java 8 中的 Cloneable 没有默认的 clone()

CloneableJava 本质上是破碎的具体来说我对接口的最大问题是它需要一种不定义方法本身的方法行为所以如果遍历一个Cloneable列表中您必须使用反射来访问其定义的行为然而在 Java 8 中我们现在有了默认方法现在我
使用 docker-entrypoint-initdb.d 脚本初始化 PostgreSQL 容器

我正在尝试创建一个 PostgreSQL 11 5 docker 容器在此过程中我想运行一个 SQL 脚本来创建必要的用户表等但是每当容器启动时我都会看到以下错误 The files belonging to this data
Web api 路由和 http post [重复]

这个问题在这里已经有答案了我正在使用 WEB API 2 构建一个 API 我有以下 API 控制器 RoutePrefix api account public class AccountController ApiController
如何在 AddModelError 消息中包含链接？

我想添加一个 ModelState 错误如下所示 ModelState AddModelError Some message a href controller action click here a 但是该链接不会进行编码因此会像文
emacs 完成或 IntelliSense 与 Visual Studio 上相同

Linux 上的 emacs 22 2 1 我正在使用 emacs 进行一些 C C 编程我想知道 emacs 是否支持补全 Visual Studio 中的 IntelliSense 例如在填充结构时我希望在键入点运算符或箭头运算符
如何在netbeans中运行node.js文件？

在net beans中我安装了node js插件但是我的简单节点程序无法工作我收到错误这是我的示例代码 var http require http http createServer function req res res wri
C/C++中Lua函数的引用

我有一个函数嵌套在一组表中相对较深 C C 中有没有一种方法可以获取对该函数的引用并在需要使用它时将其和参数推送到堆栈上这就是参考系统是为了函数调用r luaL ref L LUA REGISTRYINDEX 将值存储在注册表中
$q.all 和嵌套的 Promise

有一个关于在 Angular 中使用 q 时同步嵌套 Promise 的问题下面的代码能否确保等待整个 Promise 链这意味着对返回承诺的服务的嵌套调用是否会在 q all 块中等待 var call1 service1 get s
使用 QTextStream 以非阻塞方式读取 stdin

使用 Qt 我尝试以非阻塞方式读取标准输入流的内容当套接字收到一些新数据时我使用 QSocketNotifier 来提醒我通知程序的设置如下所示 QSocketNotifier pNot new QSocketNotifier STD
如何在 Scala 中使用库的多个版本？

我正在 Scala 中使用一个库例如 A 它依赖于另一个库例如 Z 的 x 11 版本现在我还使用一个库 B 它依赖于 Z 的 x 31 版本这会导致编译错误因为我们将有两个版本的库 Z 我如何在 scala 的 sbt 中同时
捕获标准输出并仍然将其显示在控制台窗口中

我正在生成一个在可见控制台窗口中运行的子进程它是运行 MSBuild 的批处理文件并且我希望将进程生成的输出显示在可见控制台窗口中并捕获该输出所以我可以用代码处理它我已经阅读了其他几个问题和处理 ProcessStartInfo R
在这种情况下，为什么调用父类方法而不是子类方法？

我有一个父类 A 和它的子类 B 两者都有doSomething具有不同类型参数的方法 Class A package Inheritance public class A public void doSomething Object st
添加类后 jQuery 单击事件不起作用

在我的 JSP 页面中我添加了一些链接 a class applicationdata href Organization Data a a class applicationdata href Business Units a a cla
为什么“cat”不会附加到“file”连接？

我运行了这两个代码块期望得到相同的输出 cattest lt file cattest txt cat First thing file cattest cat Second thing file cattest append TRUE
Laravel 如果 id 相同则验证唯一

我有一个表模型其中每个用户包含多个相册有没有办法说这个专栏title应该是唯一的但仅限于具有相同的行user id 例子 http pastebin com 8dvM4a1T 正如您在示例中看到的 id 为 2 的用户创建了 2 个
使用 ssh 密钥进行 cron git 推送

我为github帐户设置了ssh密钥因此不必每次都输入密码效果很好这是我使用的脚本 bin bash git push origin master 但是当我使用 cron 运行它时它不会使用我的 ssh 密钥这是输出 Permis
状态栏和导航栏上的 Google Now 渐变/阴影

我正在尝试制作与 Google Now 类似的状态栏和导航栏渐变图片参考如下所示的矩形区域在 Android Marshmallow 上尝试以下选项后
删除 Javascript blob？

我很难摆脱这些愚蠢的事情我有几个处理大量媒体文件的 Chrome 应用程序其中一个我能够使用一堆删除和一个window URL revokeObjectURL这最终阻止了他们在chrome blob internals 但这另一个似
使用 python urllib2 在http标头中传递会话cookie？

我正在尝试编写一个简单的脚本来登录维基百科并使用 Mediawiki api 在我的用户页面上执行一些操作但是我似乎从未通过第一个登录请求从此页面 https en wikipedia org wiki Wikipedia Creat
删除字符串数组中重复项的最佳算法

今天在学校老师要求我们实现一个重复删除算法没那么难大家想出了下面的解决方案伪代码 for i from 1 to n 1 for j from i 1 to n if v i v j then remove v v j remove

删除字符串数组中重复项的最佳算法

删除字符串数组中重复项的最佳算法 的相关文章

随机推荐

热门标签

删除字符串数组中重复项的最佳算法的相关文章