删除列表中复杂度优于 O(n^2) 的子字符串

2024-04-12

我有一个包含许多单词（100.000+）的列表，我想做的是删除列表中每个单词的所有子字符串。

因此，为了简单起见，我们假设我有以下列表：

words = ['Hello', 'Hell', 'Apple', 'Banana', 'Ban', 'Peter', 'P', 'e']

以下输出是所需的：

['Hello', 'Apple', 'Banana', 'Peter']

'Hell'被删除，因为它是一个子串'Hello'
'Ban'被删除，因为它是一个子串'Banana'
'P'被删除，因为它是一个子串'Peter'
'e'被删除，因为它是一个子串'Hello', 'Hell', 'Apple'，等等。

我做了什么

这是我的代码，但我想知道是否有比这些嵌套理解更有效的方法。

to_remove = [x for x in words for y in words if x != y and x in y]
output = [x for x in words if x not in to_remove]

我怎样才能提高性能？我应该使用regex反而？

@wim 是正确的。

给定固定长度的字母表，以下算法与文本的总长度呈线性关系。如果字母表的大小是无限的，那么它将是O(n log(n))反而。无论哪种方式都比O(n^2).

Create an empty suffix tree T.
Create an empty list filtered_words
For word in words:
    if word not in T:
        Build suffix tree S for word (using Ukkonen's algorithm)
        Merge S into T
        append word to filtered_words

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

string

Algorithm

list

删除列表中复杂度优于 O(n^2) 的子字符串的相关文章

从 Python 下载/安装 Windows 更新

我正在编写一个脚本来自动安装 Windows 更新我可以将其部署在多台计算机上这样我就不必担心手动更新它们我想用 Python 编写这个但找不到任何关于如何完成此操作的信息我需要知道如何搜索更新下载更新并从 python 脚本安
如何在 R 中将字符串解析为层次结构或树

有没有办法将表示组的字符串解析为 R 中的层次结构假设我的小组结构如下 1 1 1 1 1 1 1 1 1 1 1 1 2 1 1 3 1 1 3 1 1 1 3 2 1 1 3 3 1 2 1 2 1 1 2 1 1 1 2 1 2 1
Florian 的 Grisu2 算法如何工作？

我遇到了一个关于将 double 转换为 ascii 的问题经过搜索我得到了 Florian 的论文使用整数快速准确地打印浮点数 http www cs tufts edu nr cs257 archive florian loits
ImportError：运行 jupyter Notebook 时没有名为 IPython.paths 的模块？

我通过以下方式安装了 jupyter usr local opt python bin python2 7 m pip install jupyter 这将安装 ipython 版本 4 1 2 但是当我运行 jupyter Notebo
将二维数组放入 Pandas 系列中

我有一个 2D Numpy 数组我想将其放入 pandas 系列而不是 DataFrame 中 gt gt gt import pandas as pd gt gt gt import numpy as np gt gt gt a np
Python tkinter.filedialog Askfolder 干扰 clr

我主要在 Spyder 中工作构建需要弹出文件夹或文件浏览窗口的脚本下面的代码在spyder中完美运行在 Pycharm 中 askopenfilename工作良好同时askdirectory什么都不做卡住了但是如果在调试模式
在 O(n) 时间内排序？

我被这个问题困扰了 2周知道如何处理它吗令 L 为 n 个不同整数的列表假设 L 的 x 的元素在 1 750 范围内设计线性排序算法对 L 的元素进行排序我已经尝试过插入排序但我不确定我的方法是否正确 Construct an
获取两个字符串之间的公共部分c# [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我需要的是获取两个单词之间的共同部分并获取差异例子场景1 word1 感言 word2 Test 将返回公共部分Test 不同之
如何检测 Java 字符串中的 unicode 字符？

假设我有一个包含的字符串我如何找到所有这些 un icode 字符我应该测试他们的代码吗我该怎么做呢例如给定字符串 A X 我想将其转换为 AYXY 我想对其他 unicode 字符做同样的事情并且我不想将它们存储在某种翻译映
在相同任务上，Keras 比 TensorFlow 慢

我正在使用 Python 运行斩首 DCNN 本例中为 Inception V3 来获取图像特征我使用的是 Anaconda Py3 6 和 Windows7 使用 TensorFlow 时我将会话保存在变量中感谢 jdehesa 并
Alembic：如何迁移模型中的自定义类型？

My User模型是 class User UserMixin db Model tablename users noinspection PyShadowingBuiltins uuid Column uuid GUID default
对使用 importlib.util 导入的对象进行酸洗

我在使用Python的pickle时遇到了一个问题我需要通过将文件路径提供给 importlib util 来加载一些 Python 模块如下所示 import importlib util spec importlib util sp
如何在 Azure 数据工厂 - Databricks 中使用 continuation_token 获取 ADF Pipeline 运行详细信息的下一页？

我在用 adf client pipeline runs query by factory resourceGroupName 工厂名称过滤器参数的方法azure mgmt datafactory DataFactoryManageme
Pandas 堆积条形图中元素的排序

我正在尝试绘制有关某个地区 5 个地区的家庭在特定行业赚取的收入比例的信息我使用 groupby 按地区对数据框中的信息进行排序 df df orig groupby District Portion of income value co
Werkzeug 中的线程和本地代理。用法

首先我想确保我正确理解了功能的分配分配本地代理功能以通过线程内的模块包共享变量对象我对吗其次用法对我来说仍然不清楚也许是因为我误解了作业我用烧瓶如果我有两个或更多模块 A B 我想将对象C从模块A导入到模块B 但我
Flask 应用程序的测试覆盖率不起作用

您好想在终端的 Flask 应用程序中测试删除路由我可以看到测试已经过去它说 test user delete test app LayoutTestCase ok 但是当我打开封面时它仍然是红色的这意味着没有覆盖它请有人向我
falcon，AttributeError：“API”对象没有属性“create”

我正在尝试测试我的猎鹰路线但测试总是失败而且看起来我把所有事情都做对了 my app py import falcon from resources static import StaticResource api falcon API
PIL - 需要抖动，但限制调色板会导致问题

我是 Python 新手正在尝试使用 PIL 来执行 Arduino 项目所需的解析任务这个问题涉及到Image convert 方法以及调色板抖动等选项我有一些硬件能够一次仅显示 16 种颜色的图像但它们可以指定为 RGB 三元
操作错误：(sqlite3.OperationalError) SQL 变量太多，同时将 SQL 与数据帧一起使用

我有一个熊猫数据框如下所示 activity User Id 0 VIEWED MOVIE 158d292ec18a49 1 VIEWED MOVIE 158d292ec18a49 2 VIEWED MOVIE 158d292ec18a4
通过 Web 界面执行 python 单元测试

是否可以通过 Web 界面执行单元测试如果可以如何执行 EDIT 现在我想要结果对于测试我希望它们是自动化的可能每次我对代码进行更改时抱歉我忘了说得更清楚 EDIT 这个答案此时已经过时了 Use Jenkins https j

随机推荐

以 JSON/XML 格式呈现非活动记录对象 [RoR]

我正在使用 ruby gem whois 测试一个小型 whois API 由于 whois 响应的格式非常有趣有时我被要求不要使用 ActiveRecord 来保存响应简而言之它的工作原理如下用户从视图中以表单形式输入域名操作
暂停和继续秒表

我正在尝试创建秒表我已经做到了但我想随时暂停并继续时间我尝试过一些事情但我不知道该怎么做有谁能解释一下我该怎么做吗 import time tkinter canvas tkinter Canvas width 1900 heig
将一种类型的委托动态转换为另一种类型

我正在使用反射来获取恰好是委托的字段我需要用我自己的委托替换这个委托但是委托的类型是私有的所以我无法从我的方法创建它并分配它我有一个具有完全匹配签名的委托类型那么有什么方法可以动态地将我的委托转换为其他类型吗我有一个代表未知类型
为什么 String.addingPercentEncoding() 的返回值是可选的？

的签名String百分比转义的方法是 func addingPercentEncoding withAllowedCharacters CharacterSet gt String 这是stringByAddingPercentEncodi
无法点击 api 来验证 otp（使用 Volley）

我给出了我在 AndroidHive 的 github 存储库上提出的查询的链接请看一下我的问题 https github com rajatbeck LoginWithOTP issues 1 https github com raj
如何禁止任何应用程序的所有线程在特定 CPU 核心上运行，除非我指定的线程？

如何禁止任何应用程序的所有线程在特定 CPU 核心上运行除非我指定的线程在 Win nix 中要将线程或进程绑定到特定的 CPU 内核我们可以使用 OS API 函数 POSIX 中的 sched setaffinity 和 WIN
NSURLSessions 后台会话的正确用例是什么？

在评论中this https stackoverflow com a 12074879 5175709我正在讨论后台任务最终导致将backgroundTasks 用于与下载上传无关的任何内容对于上传下载请使用 NSURLSess
有没有好的方法将外部资源数据包含到 Rust 源代码中？

想象一下下面的例子 let SHADER static str version 140 attribute vec2 v coord uniform sampler2D fbo texture varying vec2 f texcoord
自定义二进制数据的 cURL POST（不是表单内容）

以下代码片段成功发送 POST 请求但未发送 sendStream 中的数据该流有效且包含数据这已被验证的问题 curl setopt request CURLOPT HTTPHEADER array Content type app
获取 JSON 中未知值后面的字符串

我使用维基百科的 API 来获取有关页面的信息 API 给了我这样的 JSON query pages 188791 pageid 188791 ns 0 title Vanit u00e9 langlinks lang bg Vanita
React Native expo 图像选择器将图像上传到 firebase 存储（v9）崩溃

我正在尝试将从 expo 图像选择器中选择的图像上传到 firebase 存储因为我正在使用 expo 我检查了 expo 图像选择器 git 并找到了 firebase 的 uploadImageAsync 所以我复制了它并只做了一点更
Jquery 对话框仅打开一次

全部我知道有人问过这个问题但以前的解决方案似乎不适用于我的情况我有一个简单的表每行都有许多记录最后一列是删除超链接我正在尝试使用对话框弹出并确认删除如果我使用对话框所在的 div 的显式名称我将其恰好放置在表格所在的 div
Google 通讯录广播/推送/通知/Hook API

我正在寻找一种在编辑删除或创建谷歌方面的联系人时接收来自谷歌的通知广播的方法我查看了 Google Contacts API 文档但找不到任何内容我认为一定有办法例如Android 肯定不会轮询更改 Google Contact
文本底部的几个像素被切断

我实在搞不懂这个案子到底是怎么回事在多行文本上底部的几个像素被切除 Setting line height normal 为我工作
JavaScript - 如何等待/SetTimeOut/睡眠/延迟

这又是我的剪刀石头布游戏目前用户无法看到发生了什么因为在提示输入石头布或剪刀后他们会立即重新提示问题是我怎样才能使程序延迟以便他们至少可以读取正在发生的事情我读到 JavaScript 中不存在 sleep 我正在尝试使
Laravel bigInteger 在关系中四舍五入为 int

好吧这是我的迁移 public function up Schema create instagrams function Blueprint table table gt bigInteger id gt unsigned gt pri
sql server 中 System.Version 的数据类型

最好的储存方式是什么系统版本 http msdn microsoft com en us library system version aspx在 SQL Server 中当我使用varchar类型时按asc排序的结果是 1 0 0 0
找不到方法 getAndroidDeviceInfo 的实现

我正在尝试运行这个example https github com flutter plugins tree master packages device info example在插件页面中我收到这个错误 I flutter 3273
如何在重定向到我的应用程序后关闭 Android 浏览器？

重定向到我的应用程序后如何关闭浏览器有什么办法可以做到这一点吗据我所知不可能影响其他活动例如关闭等
删除列表中复杂度优于 O(n^2) 的子字符串

我有一个包含许多单词 100 000 的列表我想做的是删除列表中每个单词的所有子字符串因此为了简单起见我们假设我有以下列表 words Hello Hell Apple Banana Ban Peter P e 以下输出是所需的 H

删除列表中复杂度优于 O(n^2) 的子字符串

删除列表中复杂度优于 O(n^2) 的子字符串 的相关文章

随机推荐

热门标签

删除列表中复杂度优于 O(n^2) 的子字符串的相关文章