突变残基和位置的数字编码

2024-01-20

我正在编写一个 python 程序，它必须计算突变残基和位置的数字编码一组字符串。这些字符串是蛋白质序列。这些序列存储在 fasta 格式文件中，每个蛋白质序列用逗号分隔。不同蛋白质的序列长度可能不同。在此我试图找到以下位置和序列：变异了。
我使用下面的代码来获得这个。

a = 'AGFESPKLH'
b = 'KGFEHMKLH'
for i in range(len(a)):
  if a[i] != b[i]:
     print i, a[i], b[i]

但我想要序列文件为输入文件下图将讲述我的项目。在该图中，第一个框代表输入文件序列的对齐。最后一个框代表输出文件。我怎样才能在Python中做到这一点？请帮我。感谢大家抽出宝贵的时间。

example:

input file

MTAQDD,MTAQDD,MTSQED,MTAQDD,MKAQHD




        positions  1  2  3  4  5  6                         1  2  3  4  5  6

protein sequence1  M  T  A  Q  D  D                            T  A     D

protein sequence2  M  T  A  Q  D  D                            T  A     D

protein sequence3  M  T  S  Q  E  D                            T  S     E

protein sequence4  M  T  A  Q  D  D                            T  A     D

protein sequence5  M  K  A  Q  H  D                            K  A     H


     PROTEIN SEQUENCE ALIGNMENT                          DISCARD NON-VARIABLE REGION

        positions  2  2  3  3  5  5  5

protein sequence1  T     A     D   

protein sequence2  T     A     D   

protein sequence3  T        S     E

protein sequence4  T     A     D   

protein sequence5     K  A           H

   MUTATED RESIDUE IS SPLITED TO SEPARATE COLUMN

输出文件应该是这样的：

position+residue   2T  2K  3A  3S  5D  5E  5H

       sequence1   1   0   1   0   1   0   0

       sequence2   1   0   1   0   1   0   0

       sequence3   1   0   0   1   0   1   0

       sequence4   1   0   1   0   1   0   0

       sequence5   0   1   1   0   0   0   1

    (RESIDUES ARE CODED 1 IF PRESENT, 0 IF ABSENT)

如果您要使用表格数据，请考虑pandas http://pandas.pydata.org/:

from pandas import *

data = 'MTAQDD,MTAQDD,MTSQED,MTAQDD,MKAQHD'

df = DataFrame([list(row) for row in data.split(',')])

print DataFrame({str(col)+val:(df[col]==val).apply(int) 
        for col in df.columns for val in set(df[col])})

output:

  0M  1K  1T  2A  2S  3Q  4D  4E  4H  5D
0   1   0   1   1   0   1   1   0   0   1
1   1   0   1   1   0   1   1   0   0   1
2   1   0   1   0   1   1   0   1   0   1
3   1   0   1   1   0   1   1   0   0   1
4   1   1   0   1   0   1   0   0   1   1

如果您想删除所有列：

print df.select(lambda x: not df[x].all(), axis = 1)    

   1K  1T  2A  2S  4D  4E  4H
0   0   1   1   0   1   0   0
1   0   1   1   0   1   0   0
2   0   1   0   1   0   1   0
3   0   1   1   0   1   0   0
4   1   0   1   0   0   0   1

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Alignment

突变残基和位置的数字编码的相关文章

pydev 调试器：严重警告：此版本的 python 似乎编译不正确（内部生成的文件名不是绝对的）[重复]

这个问题在这里已经有答案了通过运行 from sklearn datasets import fetch california housing import pandas as pd pd set option precision 4 m
在 Tensorflow tf.nn.nce_loss 中出现 TypeError：'Mul' Op 的输入 'y' 的类型为 float32，与参数 'x' 的 int32 类型不匹配

我正在研究 Tensor Flow 中的 Bag of Words 实现并得到了类型错误 Mul Op 的输入 y 的类型为 float32 与参数 x 的 int32 类型不匹配在 tf nn nce loss 中我尝试查看 tf
从 ffmpeg 获取实时输出以在进度条中使用（PyQt4，stdout）

我已经查看了很多问题但仍然无法完全弄清楚我正在使用 PyQt 并且希望能够运行ffmpeg i file mp4 file avi并获取流式输出以便我可以创建进度条我看过这些问题 ffmpeg可以显示进度条吗 https stack
在 Python distutils 中从 setup.py 查找脚本目录的正确方法？

我正在分发一个具有以下结构的包 mymodule mymodule init py mymodule code py scripts script1 py scripts script2 py The mymodule的子目录mymodul
将数据帧行转换为字典

我有像下面的示例数据这样的数据帧我正在尝试将数据帧中的一行转换为类似于下面所需输出的字典但是当我使用 to dict 时我得到了索引和列值有谁知道如何将行转换为像所需输出那样的字典任何提示都非常感激 Sample data pri
Django 模型在模板中不可迭代

我试图迭代模型以获取列表中的第一个图像但它给了我错误即模型不可迭代以下是我的模型和模板的代码我只需要获取与单个产品相关的列表中的第一个图像模型 py class Product models Model title models
if 语句未命中中的 continue 断点

在下面的代码中两者a and b是生成器函数的输出并且可以评估为None或者有一个值 def testBehaviour self a None b 5 while True if not a or not b continue pri
填充两个函数之间的区域

import matplotlib pyplot as plt import numpy as np def domain x np arange 0 10 0 001 f1 lambda x 2 x x 2 0 5 plt plot x
Pandas 数据帧到 numpy 数组 [重复]

这个问题在这里已经有答案了我对 Python 很陌生经验也很少我已经设法通过复制粘贴和替换我拥有的数据来使一些代码正常工作但是我一直在寻找如何从数据框中选择数据但无法理解这些示例并替换我自己的数据总体目标如果有人真的可以帮助
为什么在 Python 2.4 中使用 Unicode 数据会出现 ASCII 编码错误，而在 2.7 中却不会？

我有一个程序当在 Python 2 7 中运行时会生成正确的 Unicode 输出到标准输出当在 Python 2 4 中运行时我得到UnicodeEncodeError ascii codec can t encode chara
python suds SOAP 请求中的名称空间前缀错误

我使用 python suds 来实现客户端并且在发送的 SOAP 标头中得到了错误的命名空间前缀用于定义由element ref 在 wsdl 中 wsdl 正在引用数据类型 xsd 文件请参见下文问题出在函数上GetRecord
如何从Python中的字符串中提取变量名称和值

我有一根绳子 data var1 id 12345 name John White python中有没有办法将var1提取为python变量更具体地说我对字典变量感兴趣这样我就可以获得变量的值 id和name python 这是由提供
如何设置 Celery 来调用自定义工作器初始化？

我对 Celery 很陌生我一直在尝试设置一个具有 2 个独立队列的项目一个用于计算另一个用于执行到目前为止一切都很好我的问题是执行队列中的工作人员需要实例化一个具有唯一 object id 的类每个工作人员一个 id 我想知
Seaborn Pairplot 图例不显示颜色

我一直在学习如何在Python中使用seaborn和pairplot 这里的一切似乎都工作正常但由于某种原因图例不会显示相关的颜色我无法找到解决方案因此如果有人有任何建议请告诉我 x sns pairplot stats2 hue
在 pytube3 中获取 youtube 视频的标题？

我正在尝试构建一个应用程序来使用 python 下载 YouTube 视频pytube3 但我无法检索视频的标题这是我的代码 from pytube import YouTube yt YouTube link print yt titl
python Soap zeep模块获取结果

我从 SOAP API 得到如下结果 client zeep Client wsdl self wsdl transport transport auth header lb E authenticate self login res cl
创建嵌套字典单行

您好我有三个列表我想使用一行创建一个三级嵌套字典 i e l1 a b l2 1 2 3 l3 d e 我想创建以下嵌套字典 nd a 1 d 0 e 0 2 d 0 e 0 3 d 0 e 0 b a 1 d 0 e 0 2 d 0
使用 Firefox 绕过弹出窗口下载文件：Selenium Python

我正在使用 selenium 和 python 来从中下载某些文件web page http www oceanenergyireland com testfacility corkharbour observations 我之前一直使用设
您可以将操作直接应用于map/reduce/filter 中的参数吗？

map and filter通常可以与列表理解互换但是reduce并不那么容易被交换map and filter 此外在某些情况下我仍然更喜欢函数语法但是当您需要对参数本身进行操作时我发现自己正在经历语法体操最终必须编写整个函数
Python 无法使用套接字绑定我的外部/公共 IP 地址，给出错误但是当使用本地 IP 地址时，错误不会显示

这是出现主要错误的代码与我的本地 IP 的绑定将起作用 s bind 192 168 1 4 port 与我的公共 IP 的绑定失败并出现以下错误 s bind 99 99 99 99 port WinError 10049 请求的地址在

随机推荐

列表的 youtube 播放器 api 始终播放初始视频

我想切换播放列表https jsfiddle net g1xfh7rd https jsfiddle net g1xfh7rd 但它总是重新加载相同的初始播放列表我尝试了所有建议的解决方案包含视频的 YouTube 播放器 API 列表
RGB 帧编码 - FFmpeg/libav

我正在学习 FFmpeg 中的视频编码和解码我尝试了这个代码示例page http www ffmpeg org doxygen 0 6 api example 8c source html 仅视频编码和解码部分这里创建的虚拟图像是 Y
Go 中的 getpasswd 功能？

情况我想从以下位置获取密码条目stdin安慰不回显用户输入的内容有没有类似的东西getpasswdGo 中的功能我尝试过的我尝试使用syscall Read 但它与键入的内容相呼应以下是其中之一最好的方法完成它首先得到term
MPMoviePlayerController 音频显示“完成”按钮

我使用 MPMoviePlayerController 来播放音频流我的代码遵循以下示例 http iosdevelopertips com video getting mpmovieplayercontroller to coopera
如何使用 Node.js 将文件从一台服务器传输到另一台服务器

如果在其他地方问过这个问题我很抱歉但我找不到合适的解决方案来解决这个令人烦恼的问题所以这就是我的情况我有一个 node js 脚本它从头开始创建一个 Excel 文档一切都按预期工作但是我无法将这个新创建的文件保存到另一个运
onBackPressed 将数据发送到父活动[重复]

这个问题在这里已经有答案了有没有办法在按下后退时将更新的数据发送到父活动我想更新捆绑包中的数据但我不知道如何访问它例如我有一个打开图像查看器的画廊活动假设用户滚动浏览十几张图像然后返回到图库理想的做法是使用他们最后查看的图像
Rust 有没有办法用索引折叠？

在 Ruby 中如果我有一个数组a 1 2 3 4 5 我想得到每个元素乘以它的索引的总和 a each with index inject 0 s i j s i j 在 Rust 中是否有一种惯用的方法可以做同样的事情到目前为止我
使用 nghandsontable 访问 Handsontable 方法/属性

我在用着ngHandson表 https github com handsontable ngHandsontable角度指令手动表 http handsontable com 我成功地显示了数据但我正在努力访问修改后的行以便将数据发送
将对象转换为类型

我正在实现一个类的 List 接口该类将数据存储在
iOS 自定义地图、地理位置、地图绘制等

下一张图片取自 www Trimaps com 我希望这里允许使用图片如果不允许请告诉我我会立即删除这些图像完美地解释了我想要实现的目标我拥有所需的所有数据所需区域 4 个角的纬度经度以十进制值表示来自 Google 地图
Clojure：在嵌套哈希图中搜索 val 并返回包含该 val 的键序列的函数

假设我们有一个包含嵌套数据结构的集合 def coll a aa b d dd e f h hh i ii g gg c cc 我想创建一个函数在嵌套结构中的任何位置搜索 val 并返回包含该 val 的键序列 search parent
使用 Bootstrap ScrollSpy 将 div 折叠到固定的侧边栏

我将此代码作为页面的布局 span9 div 包含应应用滚动间谍的部分每个部分都是一组包含实际内容的可折叠 div span3 div 是固定的侧边栏必须使用滚动间谍突出显示正确的项目 div class span3 module si
iOS 配置文件在 6 天后过期

我是 iOS 开发新手因为我目前只为 Android 开发我遇到了一个问题我一直在寻找可能的解决方案我想做一个个人 iOS 应用程序比如个人笔记应用程序或个人提醒应用程序等我成功了唯一的问题是配置文件仅持续 6 天我认为并
iPhone 5屏幕尺寸VS CSS媒体查询[重复]

这个问题在这里已经有答案了可能的重复 iPhone 5 CSS 媒体查询 https stackoverflow com questions 12539697 iphone 5 css media query iPhone 5 技术规格规
如何生成一个随机数，然后将其显示在屏幕上？

好吧我对 Android 相当陌生但我已经设法自学了基础知识我正在制作一个应用程序您按下一个按钮就会打开一个新屏幕它会显示一个随机生成的数字唯一的问题是我不知道如何生成并显示随机数我已经在网络上搜索了很长时间只找到了很少的
UITextView 偏移文本的方式与 UILabel 不同

我在用UILabel and UI文本视图并且它们以不同的方式呈现文本看起来UI文本视图将文本偏移 4 下面是一个例子其中顶部是UILabel下面是UI文本视图他们都使用相同的字体这里有两个例子一个是自定义的OpenSans字体和
在 iOS16 中以编程方式推送 NavigationLink

在以前的 iOS 版本中我以编程方式推送了一个 NavigationLink NavigationLink isActive searched destination SearchView originalSearchPhrase sea
是否可以设置 html5 音频标签的样式？

我还没有找到任何关于如何做到这一点的资源像改变播放器颜色这样简单的事情就很好了是的您可以隐藏内置浏览器 UI 通过删除controls属性来自audio 而是构建您自己的界面并使用 Javascript 控制播放 source htt
Angular 如何根据路线更改导航菜单标题

我正在使用 Angular 4 在当前项目中开发仪表板布局当用户在应用程序的不同部分之间导航时我需要更新导航菜单标题标题以反映应用程序的当前部分例如当用户访问设置时页面标题应更改为设置该项目基于 net core 2 Ang
突变残基和位置的数字编码

我正在编写一个 python 程序它必须计算突变残基和位置的数字编码一组字符串这些字符串是蛋白质序列这些序列存储在 fasta 格式文件中每个蛋白质序列用逗号分隔不同蛋白质的序列长度可能不同在此我试图找到以下位置和序列变异了

突变残基和位置的数字编码

突变残基和位置的数字编码 的相关文章

随机推荐

热门标签

突变残基和位置的数字编码的相关文章