如何使用Python内置的map和reduce函数计算字符串中的字母频率

2024-04-30

我想使用Python的map和reduce内置函数来计算字符串中字母的频率。谁能提供一些关于我如何做到这一点的见解？

到目前为止我所得到的：

s = "the quick brown fox jumped over the lazy dog"

# Map function
m = lambda x: (x,1)

# Reduce
# Add the two frequencies if they are the same
# else.... Not sure how to put both back in the list
# in the case where they are not the same.
r = lambda x,y: (x[0], x[1] + y[1]) if x[0] == y[0] else ????

freq = reduce(r, map(m, s))

当所有字母都相同时，这非常有效。

>>> s
'aaaaaaa'
>>> map(m, s)
[('a', 1), ('a', 1), ('a', 1), ('a', 1), ('a', 1), ('a', 1), ('a', 1)]
>>> reduce(r, map(m, s))
('a', 7)

当有不同的字母时，如何让它正常工作？

暂时回避有关代码的问题，我将指出，计算事物的常用（也是最快）方法之一是使用集合模块中的 Counter 类。下面是它在 Python 2.7.3 解释器中的使用示例：

>>> from collections import Counter
>>> lets=Counter('aaaaabadfasdfasdfafsdff')
>>> lets
Counter({'a': 9, 'f': 6, 'd': 4, 's': 3, 'b': 1})
>>> s = "the quick brown fox jumped over the lazy dog"
>>> Counter(s)
Counter({' ': 8, 'e': 4, 'o': 4, 'd': 2, 'h': 2, 'r': 2, 'u': 2, 't': 2, 'a': 1, 'c': 1, 'b': 1, 'g': 1, 'f': 1, 'i': 1, 'k': 1, 'j': 1, 'm': 1, 'l': 1, 'n': 1, 'q': 1, 'p': 1, 'w': 1, 'v': 1, 'y': 1, 'x': 1, 'z': 1})

要使用reduce，定义一个辅助函数addto(oldtotal,newitem)这增加了newitem to oldtotal并返回一个新的总数。总数的初始值设定项是一个空字典，{}。这是一个解释的例子。请注意，get() 的第二个参数是当键尚不在字典中时使用的默认值。

 >>> def addto(d,x):
...     d[x] = d.get(x,0) + 1
...     return d
... 
>>> reduce (addto, s, {})
{' ': 8, 'a': 1, 'c': 1, 'b': 1, 'e': 4, 'd': 2, 'g': 1, 'f': 1, 'i': 1, 'h': 2, 'k': 1, 'j': 1, 'm': 1, 'l': 1, 'o': 4, 'n': 1, 'q': 1, 'p': 1, 'r': 2, 'u': 2, 't': 2, 'w': 1, 'v': 1, 'y': 1, 'x': 1, 'z': 1}

下面显示的代码打印了几种方法中每种方法 1000 次传递的执行时间。在具有两个不同字符串的旧 AMD Athlon 5000+ Linux 3.2.0-32 Ubuntu 12 系统上执行时s它打印：

String length is 44   Pass count is 1000
horsch1 : 0.77517914772
horsch2 : 0.778718948364
jreduce : 0.0403778553009
jcounter: 0.0699260234833
String length is 4931   Pass count is 100
horsch1 : 8.25176692009
horsch2 : 8.14318394661
jreduce : 0.260674953461
jcounter: 0.282369852066

（reduce 方法的运行速度比 Counter 方法稍快。）时序代码如下。它使用timeit http://docs.python.org/2/library/timeit.html#module-timeit模块。在此处的代码中，第一个参数timeit.Timer是要重复计时的代码，第二个参数是设置代码。

import timeit
from collections import Counter
passes = 1000

m1 = lambda x: [int(ord(x) == i) for i in xrange(65,91)]

def m2(x):
    return [int(ord(x) == i) for i in xrange(65,91)]

def es1(s):
    add = lambda x,y: [x[i]+y[i] for i in xrange(len(x))]
    freq = reduce(add,map(m1, s.upper()))
    return freq

def es2(s):
    add = lambda x,y: [x[i]+y[i] for i in xrange(len(x))]
    freq = reduce(add,map(m2, s.upper()))
    return freq

def addto(d,x):
    d[x] = d.get(x,0) + 1
    return d

def jwc(s):
    return Counter(s)

def jwr(s):
    return reduce (addto, s, {})

s = "the quick brown fox jumped over the lazy dog"
print 'String length is',len(s), '  Pass count is',passes
print "horsch1 :",timeit.Timer('f(s)', 'from __main__ import s, m1,     es1 as f').timeit(passes)
print "horsch2 :",timeit.Timer('f(s)', 'from __main__ import s, m2,     es2 as f').timeit(passes)
print "jreduce :",timeit.Timer('f(s)', 'from __main__ import s, addto,  jwr as f').timeit(passes)
print "jcounter:",timeit.Timer('f(s)', 'from __main__ import s, Counter,jwc as f').timeit(passes)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用Python内置的map和reduce函数计算字符串中的字母频率的相关文章

Flask中使用的路由装饰器是如何工作的

我熟悉 Python 装饰器的基础知识但是我不明白这个用于 Flask 路由的特定装饰器是如何工作的以下是 Flask 网站上的代码片段 from flask import Flask escape request app Flask
定义Python源代码编码的正确方法

PEP 263 http www python org dev peps pep 0263 定义如何声明Python源代码编码通常 Python 文件的前两行应以以下内容开头 usr bin python coding
如何使用 python 的 http.client 准确读取一个响应块？

Using http client在 Python 3 3 或任何其他内置 python HTTP 客户端库中如何一次读取一个分块 HTTP 响应一个 HTTP 块我正在扩展现有的测试装置使用 python 编写 http clie
McNemar 在 Python 中的测试以及分类机器学习模型的比较 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有没有用 Python 实现的好的 McNemar 测试我在 Scipy stats 或 Scikit
从 pyspark.sql 中的列表创建数据框

我完全陷入了有线的境地现在我有一个清单li li example data map lambda x get labeled prediction w x collect print li type li 输出就像 0 0 59 0 0
如何将 sql 数据输出到 QCalendarWidget

我希望能够在日历小部件上突出显示 SQL 数据库中的一天就像启动程序时突出显示当前日期一样在我的示例中它是红色突出显示我想要发生的是当用户按下突出显示的日期时数据库中日期旁边的文本将显示在日历下方的标签上这是我使用 QT De
python celery -A 的无效值无法加载应用程序

我有一个以下项目目录 azima init py main py tasks py task py from main import app app task def add x y return x y app task def mul
在 Mac OS X 上安装 libxml2 时出现问题

我正在尝试在我的 Mac 操作系统 10 6 4 上安装 libxml2 我实际上正在尝试在 Python 中运行 Scrapy 脚本这需要我安装 Twisted Zope 现在还需要安装 libxml2 我已经下载了最新版本 2 7 7
时间序列数据预处理 - numpy strides 技巧以节省内存

我正在预处理一个时间序列数据集将其形状从二维数据点特征更改为三维数据点时间窗口特征在这样的视角中时间窗口有时也称为回顾指示作为输入变量来预测下一个时间段的先前时间步长数据点的数量换句话说时间窗口是机器学习算法在对
NumPy 相当于 Keras 函数 utils.to_categorical

我有一个使用 Keras 进行机器学习的 Python 脚本我正在构建 X 和 Y 它们分别是特征和标签标签的构建方式如下 def main depth 10 nclass 101 skip True output True video
Flask 应用程序路由中的多个参数

烧瓶怎么写app route如果我在 URL 调用中有多个参数这是我从 AJax 调用的 URL http 0 0 0 0 8888 createcm summary VVV change Feauure 我试图写我的烧瓶app rout
pygame：使用 sprite.RenderPlain 绘制精灵组的顺序

我有一个精灵组需要按一定的顺序绘制以便其精灵按应有的方式重叠然而即使使用运算符模块函数 sorted self sprites key attrgetter y x 对组进行排序顺序也是错误的我该如何解决这个问题直截了当地说
为正则表达式编写解析器

即使经过多年的编程我很羞愧地说我从未真正完全掌握正则表达式一般来说当问题需要正则表达式时我通常可以在一堆引用语法之后想出一个合适的正则表达式但我发现自己越来越频繁地使用这种技术所以自学并理解正则表达式properly 我决
将字符串中的随机字符转换为大写

我尝试随机附加文本字符串这样就不只是有像这样的输出 gt gt gt david 我最终会得到类似的东西 gt gt gt DaViD gt gt gt dAviD 我现在的代码是这样的 import random import stri
如何在 O(n) 时间内根据 Map 中的整数值相对于其他值随机选择一个键？

如果我们有一个Map
根据多个阈值将 SciPy 分层树状图切割成簇

我想将 SciPy 的树状图切割成多个具有多个阈值的簇我尝试过使用 fcluster 但它只能削减一个阈值例如这是我从另一个问题中摘取的一段代码 import pandas data pandas DataFrame total ru
仅允许正小数

在我的 Django 模型中我创建了一个如下所示的小数字段 price models DecimalField u Price decimal places 2 max digits 12 显然价格为负或零是没有意义的有没有办法将小数
将时间添加到日期时间

我有一个像这样的日期字符串然后使用strptime 所以就像这样 my time datetime datetime strptime 07 05 15 m d Y 现在我想添加 23 小时 59 分钟my time 我努力了 timed
在matlab中，如何读取python pickle文件？

在 python 中我生成了一个 p 数据文件 pickle dump allData open myallData p wb 现在我想在Matlab中读取myallData p 我的Matlab安装在Windows 8下其中没有Pyt
Python 中的 Unix cat 函数 (cat * > merged.txt)？ [复制]

这个问题在这里已经有答案了一旦建立了目录有没有办法在Python中使用Unix中的cat函数或类似的函数我想将 files 1 3 合并到 merged txt 我通常会在 Unix 中找到该目录然后运行 cat gt merged

随机推荐

swfobject.embedSWF 不起作用？

以下代码使用 SWFObject 将 Flash 动画嵌入到 HTML 文档中仅显示替代内容为什么
使用 lambda 内联过滤避免意外 null

我有每个元素的列表我想这样做使用Java 8 disabledUsersOnLDAP stream forEach user gt usersRepository findEnabledByUsername user getUserNa
exec：“pwsh”：在％PATH％中找不到可执行文件

我一直在尝试在 gitlab CI CD 上启动我的管道以进行演示项目我已在 Windows 本地计算机中安装了 gitlab runner 并将执行程序类型指定为 Shell 我已经成功地将 gitlab runner 与我的 gitl
MVVMCross 在 MvxBindableListView 中更改 ViewModel

我的 Android 应用程序出现了一些小问题我不知道如何使用 MVVM Cross 来解决它这是我的模型 public class Article string Label get set string Remark get set
将 MySQL 与实体框架结合使用 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案在 Google 上找不到任何有关实体框架 MySQL 的信息所以我希望有人知道已发布获取适用于
从 shell 和 sbt 在 android sdk 中运行 aapt 的程序

我有一个奇怪的问题我无法从 sbt 命令以及 shell 运行 aapt 我运行这个命令 sbt 更新包调试一切都在嗡嗡作响直到我收到此错误 java io IOException Cannot run program home eg
yahoo.finance 相关数据 api 是否发生变化（YQL 控制台）？

我正在尝试使用 yql 获取雅虎财务数据我检查了YQL控制台上的Show Community Table 看到了Yahoo标签下的数据库我可以看到它下面的表格但没有得到结果如下 select from yahoo finance a
水平滚动ListView列的某些部分

我想在 React Native 中水平滚动 ListView 的某些部分如何固定第一列的位置并使其他列水平滚动 ListView 的 renderRow 应该有一个 Text 后跟一个水平 ScrollView
将 a:visited 链接设置为与 a:link 和 a:hover 相同的状态

我正在研究一个想法其中我的 a link 有一个状态蓝色无下划线等而 a hover 为白色我想要我的访问过的链接具有相同的状态 as a link and a hover 这可能吗大多数常见浏览器都支持吗 a a link a
在 SAS 中生成数组的所有唯一排列

在 SAS 中如果我有一个如下所示的字符串或数组 array x 4 1 A B C D 我需要生成元素的所有独特排列如下所示 ABCD ABC BCD ACD ABD AB AC AD BC BD CD A B C D SAS中有
ASP.NET MVC：DropDownListFor 未选择任何选项

我用它来填充 ASP NET MVC 视图中的下拉列表调试这个我可以看到Selected属性设置为true当它应该是的时候但是当渲染视图时列表中的任何选项都不
为什么android找不到com.google.gson.Gson

我正在尝试在我的项目中使用 GSON 但我的应用程序崩溃了 logcat 说找不到 com google gson Gson 我已将 import com google gson Gson 放在我的类文件中我的包资源管理器中有 gson
jquery检测哪个按钮提交了表单

我有一个包含以下内容的表格
在 Windows 7 x64 上的任何源中均找不到 linecache19-0.5.13

我安装了 Ruby 如果我运行 ruby v I see ruby 1 9 3p125 2012 02 16 i386 mingw32 如果我在我的应用程序目录中运行 rails server output 31mCould not fin
在python中查找文件

我有一个文件可能位于每个用户计算机上的不同位置有没有办法实现文件的搜索我可以传递文件名和目录树进行搜索的方法吗 os walk http docs python org library os html os walk就是答案这将找到第
“找不到模块的声明文件”，typeRoots 文件夹中的自定义声明文件被忽略

您好我遇到了 TypeScript 问题我有以下目录结构 package json 顶级项目 node modules 所有已安装的库 tsconfig json build a generated folder index js 处理
如何使用 Pear Text_wiki

pear 网站上的文档链接到无法访问的网站有谁知道可以解释如何使用 Text wiki 包的网站文章或书籍 mario 的回答虽然简短但很准确我也因缺乏让我们快速入门文档而感到沮丧并花了一些时间与源代码进行交流诚然这绝不是
与 -webkit-filter 战斗：模糊而不是实心边缘（与过滤器一起使用：模糊）

我写了这支笔 http codepen io anon pen ByZPxw EDIT 请参阅 Alexander Omara 的这支钢笔了解我的钢笔的较短版本 http codepen io anon pen rawrog 基本上我们设
将 Java 8 Lambda 函数转换为 Java 7

嘿我是编码新手我已经掌握了 Java 8 的 Lambda 函数但我正在尝试将我为学校项目编写的一些代码转换为 Java 7 但我无法理解关于如何使这段代码在功能上相同但在 java 7 中很抱歉如果这是一个愚蠢的问题但我似乎
如何使用Python内置的map和reduce函数计算字符串中的字母频率

我想使用Python的map和reduce内置函数来计算字符串中字母的频率谁能提供一些关于我如何做到这一点的见解到目前为止我所得到的 s the quick brown fox jumped over the lazy dog Map

如何使用Python内置的map和reduce函数计算字符串中的字母频率

如何使用Python内置的map和reduce函数计算字符串中的字母频率 的相关文章

随机推荐

热门标签

如何使用Python内置的map和reduce函数计算字符串中的字母频率的相关文章