找到所有潜在最长序列的Pythonic方法

2024-04-20

所以，我有一个如下所示的列表

potential_labels = ['foo', 'foo::bar', 'foo::bar::baz', "abc", "abc::cde::def", "bleh"]

The desired_output = ['foo::bar::baz', "abc::cde::def", "bleh"]

这是因为..对于根“foo”，“foo::bar::baz”是最长的序列对于“abc”、“abc::cde::def”，对于“bleh”，它是“bleh”

有没有任何Python内置函数可以做到这一点..我觉得itertools中几乎有一些东西可以做到这一点，但似乎无法弄清楚这一点。

Option 1
max + groupby应该这样做。

r = [max(g, key=len) for _, g in \
          itertools.groupby(data, key=lambda x: x.split('::')[0])]

r
['foo::bar::baz', 'abc::cde::def', 'bleh']

Option 2
一个更简单的解决方案将涉及collections.OrderedDict:

from collections import OrderedDict

o = OrderedDict()    
for x in data:
    o.setdefault(x.split('::')[0], []).append(x)

r = [sorted(o[k], key=len)[-1] for k in o]

r
['foo::bar::baz', 'abc::cde::def', 'bleh']

不完全是单行，但是什么是Pythonic毕竟是主观的。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

找到所有潜在最长序列的Pythonic方法的相关文章

Cython 函数中的字符串

我想这样做将字符串传递给 Cython 代码 test py s Bonjour myfunc s test pyx def myfunc char mystr cdef int i for i in range len mystr err
Python 异常 - args 属性如何自动设置？

假设我定义了以下异常 gt gt gt class MyError Exception def init self arg1 pass 然后我实例化该类以创建异常对象 gt gt gt e MyError abc gt gt gt e ar
xlrd 读取 xls XLRDError：不支持的格式或损坏的文件：预期的 BOF 记录；找到“\r\n”

这是代码 xls open workbook data xls 作为回报 File home woles P2 fin fin apps data container importer py line 16 in import data x
如何在 kubernetes 上使多个 pod 相互通信

我是 Kubernetes 新手我正在尝试通过 microk8s 将应用程序部署到 Kubernetes 该应用程序包含Python Flask后端 Angular前端 Redis和MySQL数据库我将映像部署在多个 Pod 中状态显
如何在不破坏默认行为的情况下覆盖 __getattr__ ？

我如何覆盖 getattr https docs python org 3 reference datamodel html object getattr 类的方法而不破坏默认行为压倒一切 getattr 应该没事 getattr 仅作为
如何使用 boto3 从 AWS Cognito 获取经过身份验证的身份响应

我想使用 boto3 获取访问 AWS 服务的临时凭证用例是这样的我的 Cognito 用户池中的用户登录到我的服务器我希望服务器代码为该用户提供访问其他 AWS 服务的临时凭证我有一个存储我的用户的 Cognito 用户池我有一
Python pandas：删除字符串中分隔符之后的所有内容

我有数据框其中包含例如 vendor a ProductA vendor b ProductA vendor a Productb 我需要删除所有内容包括两个以便我最终得到 vendor a vendor b vendor a 我尝
__getitem__、__setitem__ 如何处理切片？

我正在运行 Python 2 7 10 我需要拦截列表中的更改我所说的更改是指在浅层意义上修改列表的任何内容如果列表由相同顺序的相同对象组成则列表不会更改无论这些对象的状态如何否则它会更改我不需要找出来how列表已经改变
为什么我不能“string”.print()？

我的理解print 在 Python 和 Ruby 以及其他语言中它是字符串或其他类型上的方法因为它的语法非常常用打印嗨 works 那么为什么不呢 hi print 在 Python 中或 hi print在红宝石工作当你
比较两个文本文件并计算差异

我一直在尝试在Python中比较两个文本文件本质上我想打开它们并一次比较一个字符如果字符不同则向计数器添加1 然后显示该值这是我到目前为止所拥有的 usr bin env python diff 0 import random im
直接打开Spyder还是通过Pythonxy打开？

之前我一直在运行PythonSpyder 我总是开始Spyder直接双击其图标今天突然发现我还有一个东西叫Python x y 我注意到我也可以开始Spyder通过它这两种方法有什么区别吗如果不是的话有什么意义Python x y
获取 HTML 代码的结构

我正在使用 BeautifulSoup4 我很好奇是否有一个函数可以返回 HTML 代码的结构有序标签这是一个例子 h1 Simple example h1 p This is a simple example of html page
将查询参数添加到 URL

我正在尝试自动从网站下载数据我需要将动态参数传递到每天更改的站点 html 的结构是表格而不是表单如何传递参数并从 url 获取结果这是我尝试过的它需要在 python 2 7 中 import urllib url https d
如何将字符串方法应用于数据帧的多列

我有一个包含多个字符串列的数据框我想使用对数据帧的多列上的系列有效的字符串方法我希望这样的事情 df pd DataFrame A 123f 456f B 789f 901f df Out 15 A B 0 123f 789f 1 45
如何将列表中的每个项目转换为字符串，以便连接它们？ [复制]

这个问题在这里已经有答案了我需要加入一个项目列表列表中的许多项目都是从函数返回的整数值 IE myList append munfunc 我应该如何将返回的结果转换为字符串以便将其加入列表我是否需要对每个整数值执行以下操作 myLis
Learning_rate 不是合法参数

我正在尝试通过实现 GridSearchCV 来测试我的模型但我似乎无法在 GridSearch 中添加学习率和动量作为参数每当我尝试通过添加这些代码来执行代码时我都会收到错误这是我创建的模型 def define model op
Python：使用for循环更改变量后缀

我知道这个问题被问了很多但到目前为止我无法使用理解答案我想改变for循环中变量的后缀我尝试了 stackoverflow 搜索提供的所有答案但很难理解提问者经常提出的具体代码因此为了清楚起见我使用一个简单的示例这并不意味着
如何让 Python 找到 ffprobe？

I have ffmpeg and ffprobe安装在我的 mac macOS Sierra 上并且我已将它们的路径添加到 PATH 中我可以从终端运行它们我正在尝试使用ffprobe使用以下代码获取视频文件的宽度和高度 impor
Python 可以替代 Java 小程序吗？

除了制作用于物理模拟如抛射运动重力等的教育性 Java 小程序之外还有其他选择吗如果你想让它在浏览器中运行你可以使用PyJamas http pyjs org 这是一个 Python 到 Javascript 的编译器和工具集
Chrome + 另一个进程：进程间通信比 HTTP/XHR 请求更快？

我有一个进程 1 对视频流进行实时图像处理我需要在 Chrome 中的 HTML 页面中渲染该视频同一台计算机上的进程 2 在canvas or img or videoHTML5 元素由于我有 1000x1000 像素 x 3 字节

随机推荐

在 vs 代码编辑器中隐藏代码块行

我的所有代码上都有这些奇怪的行它们似乎突出显示了代码块我该如何关闭它们我的是1 30版本 Link https ibb co z5Tt6t4 https ibb co z5Tt6t4 所以左边的白线它们叫什么以及如何将它们关闭您可
识别不在另一个数据框中的记录

我有一个像这样的数据框 data1 pd DataFrame a z 0 a y 20 b z 1 columns id1 id2 number data2 pd DataFrame a y 1 a y 1 b z 0 columns id
NLog 的线程安全性如何？

Well 我等了好几天才决定发布这个问题因为我不知道如何陈述这一点结果写了一篇很长的详细帖子不过我认为此时向社区寻求帮助是有意义的基本上我尝试使用 NLog 为数百个线程配置记录器我认为这会非常简单但几十秒后我得到了这个异常
埃拉托斯特尼筛法速度比较：Python 与 Julia

所以我有一个用 Python 和 Julia 编写的 Eratosthenes 函数的小筛子并且我正在比较运行时间这是Python代码 import time def get primes n numbers set range n 1
将缺失值 (NA) 替换为空白（空字符串）

我有一个带有 NA 行的数据框 df data frame c classA NA classB t data frame rep A 5 rep NA 5 rep B 5 rownames df lt c 1 2 3 colnames d
使用 Swift 3 在 Xcode 8 中构建适用于 WatchOS 和 iOS 的嵌入式框架

我正在将最初用 Swift 1 编写的全 iOS WatchOS 1 应用程序移植到最新的 Xcode 8 WatchOS 3 Swift 3 我的应用程序有一个嵌入式框架具有一些常用功能用于编译和运行 watchkit 扩展目标和 i
如何避免每次创建新的 javafx 项目时添加 vm 参数？

我正在使用 e fx clipse 插件和 scenebuilder 在 STS 4 6 1 中创建 javafx 项目每次创建新项目时我都必须在运行配置中添加虚拟机参数 module path home path to javafx
Excel 数据透视表“显示为”值列中的差异

当值显示为父列总数的百分比时有没有办法让数据透视表自动计算两列之间的差异现在我需要手动但表格是动态的竞争对手的数量可能会有所不同功能看起来很简单但在谷歌搜索后找不到它 See example picture below of w
在 iOS 6 中，检查一个人是否登录了社交网络？

有没有办法检查用户是否确实在操作系统中登录了 facebook 或 twitter 我想这样做的原因是依靠应用程序中的共享例如使用 facebooks SDK 来共享而不要求用户再次登录我实际上认为代码 SLComposeViewCo
Apache Spark 警告“在 RowBasedKeyValueBatch 上调用溢出()”的含义

我正在使用 Apache Spark 本地模式运行 pyspark 2 2 0 作业并看到以下警告 WARN RowBasedKeyValueBatch Calling spill on RowBasedKeyValueBatch Wil
SSIS 包损坏，错误为 0xC00CE504

我有一个损坏的 SSIS 包并显示错误消息由于错误 0xC00CE504 名称以无效字符开头第 13 行第 2 列无法加载 XML 当加载包并且文件无法打开或无法正确加载到 XML 文档时会发生这种情况这可能是由于向 LoadPa
部分彩色文本并使其在 Jetpack Compose 中可点击 [重复]

这个问题在这里已经有答案了对于 XML 中声明的视图我们可以使用SpannableStringBuilder正如这里提到的https stackoverflow com a 4897412 9715339 https stackover
已经运行的应用程序现在出现套接字错误 10013

我在 VB NET 中完成了一个应用程序该应用程序侦听特定的 UDP 端口并通过同一端口应答发送数据包的 IP 从几年到上个月它都运行良好现在当尝试回答由于套接字错误 10013 导致的崩溃时我什至尝试了一个我知道它也可以工作的旧版
JavaScript 中的 FFMPEG 命令

是否可以使用如下命令 ffmpeg i video 1920 mp4 vf 比例 640 360 video 640 mp4 hide banner在纯 JavaScript 中降低视频的分辨率例如我有一个下拉菜单其中有标签所以我想
JTextArea 组件中的 Unicode 支持 [重复]

这个问题在这里已经有答案了我制作了这个简单的程序我想在 JTextArea 中显示 unicode 符文字符 u16e6 该符号显示在 JFrame 的顶部但不在 JTextArea 中我已将 JTextArea 的字体设置为与 J
如何远程在BitBucket上创建存储库？

我想在 Bitbucket 上使用 hg 命令从本地计算机创建存储库而不是在 Bitbucket 上手动创建存储库是否可以我通过curl 命令使用REST API 执行了以下操作 gt curl k X POST user user
如何正确确定Intel处理器的-march和-mtune？

我目前正在从源代码构建一个对我来说性能至关重要的软件因此我想对其进行优化以便在我的特定 Intel CPU 上运行构建过程要求我设置 march 和 mtune 标志如果在我的处理器节点上我使用 gcc march native
使用QThread定期更新一个QTableWidget pyqt

在我的应用程序中我使用 API 调用获取记录然后将数据动态添加到 QTableWidget 这是到目前为止我的代码片段 class TriageUI QtGui QMainWindow def init self QtGui QMain
使用并发.futures 中的 ThreadPoolExecutor 时的 max_workers 数量？

在决定从并发 futures 中将 ThreadPoolExecutor 中的 max workers 设置为什么时需要考虑哪些因素只要您期望 Python 3 5 可用是否有任何理由不将 max workers 设置为 None 然后
找到所有潜在最长序列的Pythonic方法

所以我有一个如下所示的列表 potential labels foo foo bar foo bar baz abc abc cde def bleh The desired output foo bar baz abc cde def

找到所有潜在最长序列的Pythonic方法

找到所有潜在最长序列的Pythonic方法 的相关文章

随机推荐

热门标签

找到所有潜在最长序列的Pythonic方法的相关文章