这段Python代码能更高效吗？

2023-12-02

我编写了一些代码来查找字符串中有多少个子串是字谜对。要查找的函数anagram(anagramSolution)复杂度为 O(N)。 substring函数的复杂度小于N平方。但是，这里的代码是有问题的。能不能再优化一点？

for i in range(T):
    x = raw_input()
    alist = get_all_substrings(x)

    for k, j in itertools.combinations(alist,2):
        if(len(k) == len(j)):
            if(anagramSolution(k,j)):
                counter +=1

    counterlist.append(counter)
    counter = 0

The alist可以有数千个项目（子集）。主要问题是循环。迭代所有项目需要花费大量时间。有没有更快或更有效的方法来做到这一点？

定义字谜类字符串中每个字母在字符串中出现次数的计数集。例如，'banana'有字谜类a: 3, b: 1, n: 2。如果两个字符串具有相同的字谜类，则它们是彼此的字谜词。我们可以计算每个字谜类中有多少个字符串的子串，然后通过计算来计算对的数量(n choose 2)对于每个具有 n 个子串的字谜类：

from collections import Counter

anagram_class_counts = Counter()

for substring in get_all_substrings(x):
    anagram_class_counts[frozenset(Counter(substring).viewitems())] += 1

anagram_pair_count = sum(x*(x-1)/2 for x in anagram_class_counts.viewvalues())

frozenset(Counter(substring).viewitems())构建字符串的 anagram 类的可哈希表示。

Counter接受一个可迭代对象并构建一个映射来表示每个项目出现的次数，所以
Counter(substring)构建一个表示字符串的字谜类的映射。
viewitems()给出类似集合的字母：计数对，并且
frozenset将其转换为可用作字典键的不可变集。

这些步骤所花费的时间与子串的大小成正比；平均而言，子字符串大约是整个字符串大小的三分之一，因此平均而言，处理每个子字符串需要花费O(len(x))时间。有O(len(x)**2)子字符串，因此处理所有子字符串需要O(len(x)**3) time.

如果有x具有相同字谜类的子串，它们可以配对x*(x-1)/2方式，所以sum遍历每个字谜类的出现次数并计算对的数量。这需要O(len(x)**2)时间，因为它必须遍历每个字谜类一次，并且字谜类的数量不能多于子字符串。

总的来说，该算法需要O(len(x)**3)时间，虽然不是很好，但比原来的好很多。对此仍有优化的空间，例如通过利用子串之间重叠的方式计算字谜类，或者使用更有效的字谜类表示。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

这段Python代码能更高效吗？的相关文章

优化完美平方问题，类似于Python中的硬币找零

我这里有一个硬币兑换的解决方案 python 中的 leetcode 硬币兑换 https stackoverflow com questions 69517078 coin change leetcode in python 因为完全平方
Pandas 字符串提取所有匹配项

我正在学习 pandas 系列字符串方法中的正则表达式操作我能够从字符串中提取第一个数字但我的正则表达式与第二个数字不匹配如何捕获这两个数字注意第二行第二个元素在这里是 NAN CODE import pandas as pd d
scipy.misc.imshow RuntimeError('无法执行图像视图')

我正在测试scipy misc imshow https docs scipy org doc scipy 0 15 1 reference generated scipy misc imshow html我得到了运行时错误无法执行图像查
使用 Python 在 Google Cloud Storage 存储桶中创建/上传新文件

如何使用 Python 和可用的客户端库在 Google Cloud Storage 中创建新的空文件或者如何使用 blob 函数 upload from filename 将新文件上传到选定的存储桶要初始化 blob 对象我们应该在
蜘蛛内的Scrapyd jobid值

Scrapy 框架 Scrapyd 服务器我在获取蜘蛛内部的 jobid 值时遇到一些问题将数据发布到后http localhost 6800 schedule json http localhost 6800 schedule jso
Spyder 导入模块出错

我正在尝试在 Spyder 中使用 sklearn 一开始当我尝试导入它时我收到 ImportError No module named sklearn 然后我用 PYTHONPATH 管理器设置 PATH 然后使用工具菜单中的更新模
turtle.Screen().screensize() 未输出正确的屏幕尺寸[重复]

这个问题在这里已经有答案了我编写了一些代码来在屏幕周围随机放置点但是它并没有覆盖整个屏幕 import turtle import random t turtle Turtle color red green blue pink ye
了解 asyncio 已经运行的永久循环和挂起的任务

我在理解如何将新任务挂起到已经运行的事件循环中时遇到问题这段代码 import asyncio import logging asyncio coroutine def blocking cmd while True logging in
python-polars 通过分隔符将字符串列拆分为许多列

在 pandas 中以下代码会将 col1 中的字符串拆分为许多列有没有办法在极地做到这一点 d col1 a b c d a b c d df pd DataFrame data d df a b c d df col1 str sp
使用 3d 对象作为 3d 散点图中的标记 - Python

使用下面的代码我尝试模拟一个用罐头制成的碗我希望每个标记都是一个罐头最好的方法是什么我真的很感激任何建议谢谢 import pylab import numpy as np from math import pi sin cos
如何在交互式绘图（Python）中获得鼠标指向的（x，y）位置？

我使用 ipython 笔记本带有魔法 matplotlib nbagg 我正在审查matplotlib widget Cursor但仅查看光标widgets Cursor http matplotlib org 1 4 3 exampl
使用 Python 脚本打开特定文件类型？

如何使 Python 脚本成为特定文件类型例如 foo 的默认应用程序例如当我双击 Finder Explorer 中的文件时我希望该文件在 Python 脚本中打开这可以在 Win 和或 OS X 中实现吗如果重要的话该应
使用 statsmodels.formula.api 中的 ols - 如何删除常数项？

我正在遵循第一个例子statsmodels教程 http statsmodels sourceforge net devel http statsmodels sourceforge net devel 如何指定在 ols 中不使用常数项进
如何可视化多维数据上的 kmeans 聚类

我在 mnist 数据集上使用 kmeans 聚类算法并希望可视化聚类后的图到目前为止我做了这个 from mnist import MNIST mndata MNIST Datasets X train y train mndata
如何将 fields 参数传递到 Google Drive Python API 调用中

I have results drive service files list body execute where body q query string maxResults 1 为了提高性能我想限制返回的字段如下所述 https
Scrapy 抓取并跟踪 href 中的链接

我对 scrapy 很陌生我需要从 url 的主页跟踪 href 到多个深度再次在 href 链接内我有多个 href 我需要遵循这些href 直到到达我想要抓取的页面我的页面的示例 html 是初始页 div class page
在多个图表上绘制一条线

I don t know how this thing is called or even how to describe it so the title may be a little bit misleading The first a
在至少 7 天内连续三天登录该产品的用户

我有一个用于用户参与的数据框 df 如下所示 time stamp user id 2013 01 01 10 05 23 1 2013 01 03 16 35 23 1 2013 01 06 11 06 35 1 2013 01 10 1
在Python中从CSV文件中获取随机行并找到相应的单词，就像测验一样

抱歉标题含糊不清想不出更好的表达方式我有一个包含德语英语单词的 CSV 文件如下所示 Ja Yes Nein No Katze Cat 我希望我的 python 脚本从 CSV 文件中打印一个随机的德语单词并要求他们输入英语单词
django admin 中内联模型的分页器

我有这个简单的 django 模型由一个传感器和特定传感器的值组成每个日射强度计的值数量很多 gt 30k 是否可以以某种方式分页PyranometerValues在特定日期或一般情况下将分页器应用于管理内联视图 class Pyran

随机推荐

是否还有其他具有非零索引数组位置的常见“类 c”或非“类 c”语言？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心以获得指导 C 编程语言被称为零索引数
如何在角度独立组件中使用动画

我正在尝试设置一个有角度的项目独立组件动画 Component selector my app standalone true imports CommonModule BrowserAnimationsModule template
发送点击消息到另一个应用程序进程

我有一个场景我需要将点击事件发送到独立的应用程序我使用以下代码启动了该应用程序 private Process app app new Process app StartInfo FileName app path app StartI
有没有办法在Python中引用当前函数？

我想要一个函数来引用它自己例如是递归的所以我做了类似的事情 def fib n return n if n lt 1 else fib n 1 fib n 2 大多数时候这都很好但是fib实际上并不指代其自身它指的是绑定fib在封闭
将 System.Drawing.Bitmap 缩放到给定大小，同时保持纵横比

我想扩展一个System Drawing Bitmap至少小于某个固定的宽度和高度这是为了在网站上生成图片库的缩略图所以我想保持纵横比相同我有一些解决方案但似乎没有一个真正能满足我的需要它们围绕基于保持宽度或高度相同但不改变两者的
模拟按键 C#

I want to simulate F5 key press in my C program When IE is open I want to be able refresh my website automatically 我怎样才能
Java 中的动态泛型类型

如果我有一个使用泛型类型的类例如 public class Record
谷歌地图 API 从 v2 升级到 v3，建议

我在我的网络应用程序中完全集成了谷歌地图版本 2 具有获取方向集群标记选项卡式信息窗口上下文菜单右键单击等功能该实现的设计非常糟糕导致了一些问题所以现在我需要修改核心实现以更好的设计我正在考虑升级到 google 地图 A
不区分大小写的列表搜索

我有一个清单testList包含一堆字符串我想添加一个新字符串到testList仅当列表中尚不存在时因此我需要对列表进行不区分大小写的搜索并使其高效我不能使用Contains因为这没有考虑外壳我也不想用ToUpper ToLowe
Symfony2 表单中的数据对象与需要填写的内容不完全匹配

我们有监控服务我们的监控单元可以监视某些机器我正在创建一个表单来在 Symfony2 中注册一台新机器所以我们有机器实体 id 机器名称显示器编号 And the 监控实体 id 序列号对于新机器客户需要填写form with
Internet Explorer 显然不支持 MouseEvent movingX 属性

我正在开发一个需要兼容 IE 9 及以上版本的应用程序我在 MouseEvent 对象上使用 movingX 属性但是该 MouseEvent 对象在 Internet Explorer 9 或 11 中没有 movingX 属性我浏
如何使用php在mysql中生成下一个自动递增编号？

我试图使用 php 获取 mysql 中的下一个自动递增数字我尝试了这样的方法但是当删除任何行时这不起作用我希望你明白我的意思我怎样才能使用 php 来做到这一点您无法执行此操作来获取表数据您必须使用 php 获取表状态才能
为什么Python 2.7的namedtuple实现__dict__？

The namedtuplePython 2 7 中的实现实现 dict 我很困惑这是在做什么为什么我们需要做一个特别的 dict 如果已经定义了属性 C tmp gt python Python 2 7 12 Anaconda 4 1
从 Python 数据中学习二元决策图 (BDD)

是否可以从数据中学习二元决策图 BDD 以机器学习的方式如果是这样怎么办背景我在 Python 中看到过一些工具可以完成此任务例如决策树 DT scikit学习但我还没有看到任何 BDD 举个例子我想做的事情如下前三列对应于
在 SQL Server 中读取并递增 int 值

我需要使用 C 在 SQL Server 2008 中自动读取并递增一个值例如我必须插入批次的项目为此我需要最后一批的编号并确保没有其他人获得该编号因此我有一张仅包含最后批号的表格并找到一种只需一步即可获取和更新编号的方法
使用ClassLoader方法检索类下的所有资源作为输入流

我的问题是一个你可能认为很常见的问题但到目前为止我还没有找到解决方案在 Tomcat 5 5 下构建 Java Web 应用程序尽管要求它可以部署在任何地方例如在 WebLogic 环境下因此需要将资源作为流加载良好的实践表明资
为什么 System.Transactions TransactionScope 默认隔离级别可序列化

我只是想知道什么是好的使用可序列化的原因作为创建时的默认隔离级别系统交易交易范围因为我想不出任何而且似乎你无法通过更改默认值web app config所以你总是必须在你的代码中设置它 using var transaction T
WCF，从服务访问 Windows 窗体控件

我有一个托管在 Windows 窗体内的 WCF 服务如何从我的服务中的方法访问表单的控件例如我有 public interface IService ServiceContract string PrintMessage string
Gwt 插件在 Chrome 42 中不起作用 [重复]

这个问题在这里已经有答案了新版chrome 42 不支持gwt插件在 Windows 8 1 上即使我将兼容模式更改为 Windows 7 我仍然会收到再次下载插件的提示我已尝试删除它并重新安装但仍然收到此消息有任何想法吗来自
这段Python代码能更高效吗？

我编写了一些代码来查找字符串中有多少个子串是字谜对要查找的函数anagram anagramSolution 复杂度为 O N substring函数的复杂度小于N平方但是这里的代码是有问题的能不能再优化一点 for i in ra

这段Python代码能更高效吗？

这段Python代码能更高效吗？ 的相关文章

随机推荐

热门标签

这段Python代码能更高效吗？的相关文章