python 列中字母的频率

2024-01-24

我想计算所有列中每个字母出现的频率：例如我有这三个序列：

seq1=AATC
seq2=GCCT
seq3=ATCA

在这里，我们有：在第一列中 'A' 的频率是 2 ， 'G' 是 1 。对于第二列：“A”的频率为 1，“C”为 1，“T”为 1。（其余列中的频率相同）首先，我尝试执行计算频率的代码我尝试这样做：

例如：

s='AATC'

dic={}
for x in s:
    dic[x]=s.count(x)

这给出：{'A':2,'T':1,'C':1}现在，我想将其应用到列上。为此，我使用以下指令：

f=list(zip(seq1,seq2,seq3))

gives:

[('A', 'G', 'A'), ('A', 'C', 'T'), ('T', 'C', 'C'), ('C', 'T', 'A')]

所以，在这里，我计算了()中字母的出现频率：我怎样才能做到这一点？

如果我处理序列文件，如何使用此代码将其应用于文件序列？例如，每次我获取三个序列并应用此代码时，我的文件包含 100 个序列。

Here:

sequences = ['AATC',
             'GCCT',
             'ATCA']
f = zip(*sequences)
counts = [{letter: column.count(letter) for letter in column} for column in f]
print(counts)

输出（重新格式化）：

[{'A': 2, 'G': 1}, 
 {'A': 1, 'C': 1, 'T': 1}, 
 {'C': 2, 'T': 1}, 
 {'A': 1, 'C': 1, 'T': 1}]

显着特点：

而不是明确命名seq1, seq2等等，我们将它们放入一个列表中。
我们用以下命令解压列表*操作员。
我们在列表理解中使用字典理解来生成每列中每个字母的计数。这基本上就是您对单序列情况所做的操作，但更具可读性（IMO）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Frequency

python 列中字母的频率的相关文章

如何更改 FacetGrid 中的边距标题颜色

使用 Seaborn Facet Grids 如何仅更改边距标题的颜色注意g set titles color red 更改两个标题 p sns load dataset penguins sns displot data p x fli
在 Pandas 中，如何从基于另一个数据框的数据框中删除行？

我有 2 个数据框一个名为 USERS 另一个名为 EXCLUDE 他们都有一个名为电子邮件的字段基本上我想删除 USERS 中包含 EXCLUDE 中包含电子邮件的每一行我该怎么做您可以使用boolean indexing
numpy python 中的“AttributeError：'matrix'对象没有属性'strftime'”错误

我有一个维度为 72000 1 的矩阵该矩阵涉及时间戳我想使用 strftime 如下所示 strftime d m y 为了得到像这样的输出 11 03 02 我有这样一个矩阵 M np matrix timestamps 我使用了
NumPy linalg.eig

我有这个烦人的问题但我还没有弄清楚我有一个矩阵我想找到特征向量所以我写 val vec np linalg eig mymatrix 然后我得到了 vec 我的问题是当我小组中的其他人对相同的矩阵 mymatrix 做同样的事情时
无故运行测试时 PyCharm 抛出“AttributeError: 'module' object has no attribute”

因此我有一个 Django REST Framework 项目有一天它无法在 PyCharm 中运行测试从命令行我可以使用它们来运行它们paver or the manage py直接地曾经有一段时间当我们没有在文件顶部导入类的超
cv2.drawContours() - 取消填充字符内的圆圈（Python，OpenCV）

根据 Silencer的建议我使用了他发布的代码here https stackoverflow com questions 48244328 copy shape to blank canvas opencv python 482465
Python 是解释型的还是编译型的，或者两者兼而有之？

据我了解 An 解释的语言是由解释器将高级语言转换为机器代码然后执行的程序实时运行和执行的高级语言它一次处理一点程序 A compiled语言是一种高级语言其代码首先由编译器将高级语言转换为机器代码的程序转换为机器代码然后由执
小部件之间的自定义信号

尝试将信号从一个 gtk EventBox 子级发送到另一个在 init HeadMode 第 75 行上出现错误类型错误未知信号名称消息发送 why usr bin env python coding utf8 import p
如何在Python中高效地添加稀疏矩阵

我想知道如何在Python中有效地添加稀疏矩阵我有一个程序可以将大任务分解为子任务并将它们分配到多个 CPU 上每个子任务都会产生一个结果一个 scipy 稀疏矩阵格式为 lil matrix 稀疏矩阵尺寸为 100000x50
更改 x 轴比例

我使用 Matlab 创建了这个图使用 matplotlib x 轴绘制大数字例如 100000 200000 300000 我想要 1 2 3 和 10 5 之类的值来指示它实际上是 100000 200000 300000 有没有一
将 numpy 代码点数组与字符串相互转换

我有一个很长的 unicode 字符串 alphabet range 0x0FFF mystr join chr random choice alphabet for in range 100 mystr re sub W mystr 我想
如何根据 HTTP 请求使用 Python 和 Flask 执行 shell 命令并流输出？

下列的这个帖子 https stackoverflow com questions 15092961 how to continuously display python output in a webpage 我能够tail f网页的日志
Alembic：如何迁移模型中的自定义类型？

My User模型是 class User UserMixin db Model tablename users noinspection PyShadowingBuiltins uuid Column uuid GUID default
如何在 Django 中使用基于类的视图创建注册视图？

当我开始使用 Django 时我几乎使用 FBV 基于函数的视图来处理所有事情包括注册新用户但当我更深入地研究项目时我意识到基于类的视图通常更适合大型项目因为它们更干净且可维护但这并不是说 FBV 不是无论如何我将整个项目
Python Django-如何从输入文件标签读取文件？

我不想将文件保存在我的服务器上我只想在下一页中读取并打印该文件现在我有这个 index html
GradientTape 根据损失函数是否被 tf.function 修饰给出不同的梯度

我发现计算的梯度取决于 tf function 装饰器的相互作用如下所示首先我为二元分类创建一些合成数据 tf random set seed 42 np random seed 42 x tf random normal 2 1 y
在 Windows 上使用带有对数刻度的 matplotlib 时出现 Unicode 错误

我正在使用 python 2 6 和 matplotlib 如果我运行 matplotlib 库页面中提供的示例 histogram demo py 它工作正常我已经大大简化了这个脚本 import numpy as np import
以编程方式使用 Sphinx 特定指令解析 .rst 文件

我希望能够在 Python 中解析基于 sphinx 的 rst 以便进一步处理和检查就像是 import sphinx p sphinx parse path to file rst do something with p 似乎在 do
python 日志记录会刷新每个日志吗？

当我使用标准模块将日志写入文件时logging 每个日志会分别刷新到磁盘吗例如下面的代码会将日志刷新 10 次吗 logging basicConfig level logging DEBUG filename debug log fo
如何使用Python保存“完整的网页”而不仅仅是基本的html

我正在使用以下代码来使用 Python 保存网页 import urllib import sys from bs4 import BeautifulSoup url http www vodafone de privat tarife r

随机推荐

Tom Kyte 的 STRAGG 函数是否有支持 SQL Server 的实现？

STRAGG 函数实现将结果作为单列值返回 Oracle 的实现看起来非常通用可以用于不同的表和关系 SQL Server 能否实现类似的行为在网络上进行搜索似乎只返回硬编码的实现而不是通用的实现我们有任何已知的 Sql 服务器
Angular // 从 Angular 11 降级到 Angular 8

我需要进入一个 Angular 8 1 2 的项目但使用命令ng serve我收到此错误此版本的 CLI 仅与 Angular 版本兼容 11 0 0 下一个 gt 11 0 0 所以我的解决方案不起作用是 npm uninstal
Jinja2 宏导入“带有上下文”和全局变量： {% from file.html import macro_name with context %}

在Python的Jinja2模板引擎中我的宏 with context 无法从上下文访问全局变量进口声明 import en US my macro html as all macros from en US my macro html
无法使用 jQuery 将 HTML 代码附加到一个 div 中

我有一个 div id userinfo div div 现在我想根据 localStorage 向这个 div 添加一些内容 if localStorage 0 userinfo append p Test p else userinfo
docker 卷位于哪里？

在 macOS 上使用 docker 机器时需要知道 docker 卷所在的位置安装使用 boot2docker 因此虚拟机在后面运行 Example docker volume create test data docker检查显示了一
TextBox 自动换行将字符串拆分为行

这是我第一次就这个令人惊叹的服务提出问题因为今天它通过阅读它对我帮助很大目前我正在制作小型 C 应用程序需要使用大量文本框在文本框属性中我已经检查过多线 and 自动换行功能因此当用户输入文本时它会正确显示在多行中我的问题
使用 DTO 可空引用类型的最佳实践 [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我有一个 DTO 它是通过从 DynamoDB 表读取数据来填充的假设目前看起来像这样 public class Item public st
Torch / Lua，如何将训练好的神经网络模型保存到文件？

我从事一个 Torch Lua 项目在其中实现了一个人工神经网络模型一切正常但现在我想按以下方式修改我的代码由于我的输入数据集非常大我想将其划分为 N 20 个跨度然后我只想在第一个数据集跨度上训练我的神经网络然后并行测试其他
SSErrorDomain、SKReceiptRefreshRequest、SKRequest 确实失败并出现错误，代码 = 16，代码 = 110

iOS 9 2 1 Xcode 7 2 1 启用 ARC 我正在使用以下方法来检查失败SKProductsRequest and SKReceiptRefreshRequest void request SKRequest request
当父容器发生变换时如何强制固定位置？

我需要将位置固定到应用了转换的父项内的子 div 的视口不幸的是我无法删除父级的转换有什么想法如何覆盖这种行为吗我可以在子元素上使用变换使其看起来类似于固定位置吗 rotate transform rotate 30deg backg
openpyxl中如何进行列对齐？

我试图在 openpyxl 中对齐列但没有成功 wb Workbook ws wb active ws column dimensions A alignment Alignment horizontal left ws column d
如何创建自定义 ExtJS 表单字段组件？

我想创建自定义 ExtJS表单域组件中使用其他 ExtJS 组件例如 TreePanel 我怎样才能最轻松地做到这一点我读过的文档扩展表单字段基础 http docs sencha com ext js 4 0 api Ext form
wget 下载 CSS @import，但忽略其中引用的文件

我在用着wget如下 wget page requisites convert links e robots off span hosts restrict file names windows directory prefix ASSET
Android 控制台错误：“需要将 .class 兼容性设置为 5.0。请修复项目属性”

刚刚重新安装了 Eclipse 3 5 和 Android 平台 SDK 和 ADT 我已经在不同的机器上完成了几次这样的操作所以我很确定我已经正确配置了所有内容尝试导入 Android 项目并在控制台窗口中收到以下错误 Android
将 boost 与 MinGW 一起使用时对 WinMain@16 的未定义引用

我在 Windows 7 下使用 Eclipse 使用 C 进行编程我的makefile如下 build g shared o lib libCacheOpt a src cpp enable auto import I CWD incl
定制量角器测试报告/输出

您好我正在尝试通过在命令提示符中给出以下命令来获取文件中的量角器测试结果量角器conf js gt 位置 result txt 我可以在其中看到量角器测试的完整输出以自定义方式运行量角器测试后我可以在 txt 文件中仅获取执行的 S
在子进程中调用 execlp() 后如何 printf() ？

我目前正在尝试在子进程中调用 execlp 后从子进程打印消息但是调用 execlp 后终端上没有出现任何内容是什么导致我的 printf 调用不显示任何内容如何解决这个问题成功后execlp http linux die ne
自定义圆形视图[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我想创建一个如下图所示的视图我认为这是很晚的回应但它也对其他人有帮助我找到了一个库在列表视图上重新设计并实现了循环列表图书馆
IIS 7 中托管的 WCF 服务 - 绑定配置设置被忽略

我有一个 WCF 服务操作它接受字节数组作为其数据协定的一部分该服务仅在内部公开不公开到互联网我想增加配额以允许 10MB 字节数组该服务托管在 IIS7 中当我尝试发送超过默认长度的字节数组时我收到以下异常消息反序列化类型
python 列中字母的频率

我想计算所有列中每个字母出现的频率例如我有这三个序列 seq1 AATC seq2 GCCT seq3 ATCA 在这里我们有在第一列中 A 的频率是 2 G 是 1 对于第二列 A 的频率为 1 C 为 1 T 为 1 其余列中的频

python 列中字母的频率

python 列中字母的频率 的相关文章

随机推荐

热门标签

python 列中字母的频率的相关文章