突变残基和位置的数字编码

2024-01-20

我正在编写一个 python 程序,它必须计算突变残基和位置的数字编码一组字符串。这些字符串是蛋白质序列。这些序列存储在 fasta 格式文件中,每个蛋白质序列用逗号分隔。不同蛋白质的序列长度可能不同。在此我试图找到以下位置和序列:变异了。
我使用下面的代码来获得这个。

a = 'AGFESPKLH'
b = 'KGFEHMKLH'
for i in range(len(a)):
  if a[i] != b[i]:
     print i, a[i], b[i]

但我想要序列文件为输入文件下图将讲述我的项目。在该图中,第一个框代表输入文件序列的对齐。最后一个框代表输出文件。 我怎样才能在Python中做到这一点? 请帮我。 感谢大家抽出宝贵的时间。

example:

input file

MTAQDD,MTAQDD,MTSQED,MTAQDD,MKAQHD




        positions  1  2  3  4  5  6                         1  2  3  4  5  6

protein sequence1  M  T  A  Q  D  D                            T  A     D

protein sequence2  M  T  A  Q  D  D                            T  A     D

protein sequence3  M  T  S  Q  E  D                            T  S     E

protein sequence4  M  T  A  Q  D  D                            T  A     D

protein sequence5  M  K  A  Q  H  D                            K  A     H


     PROTEIN SEQUENCE ALIGNMENT                          DISCARD NON-VARIABLE REGION

        positions  2  2  3  3  5  5  5

protein sequence1  T     A     D   

protein sequence2  T     A     D   

protein sequence3  T        S     E

protein sequence4  T     A     D   

protein sequence5     K  A           H

   MUTATED RESIDUE IS SPLITED TO SEPARATE COLUMN

输出文件应该是这样的:

position+residue   2T  2K  3A  3S  5D  5E  5H

       sequence1   1   0   1   0   1   0   0

       sequence2   1   0   1   0   1   0   0

       sequence3   1   0   0   1   0   1   0

       sequence4   1   0   1   0   1   0   0

       sequence5   0   1   1   0   0   0   1

    (RESIDUES ARE CODED 1 IF PRESENT, 0 IF ABSENT)

如果您要使用表格数据,请考虑pandas http://pandas.pydata.org/:

from pandas import *

data = 'MTAQDD,MTAQDD,MTSQED,MTAQDD,MKAQHD'

df = DataFrame([list(row) for row in data.split(',')])

print DataFrame({str(col)+val:(df[col]==val).apply(int) 
        for col in df.columns for val in set(df[col])})

output:

  0M  1K  1T  2A  2S  3Q  4D  4E  4H  5D
0   1   0   1   1   0   1   1   0   0   1
1   1   0   1   1   0   1   1   0   0   1
2   1   0   1   0   1   1   0   1   0   1
3   1   0   1   1   0   1   1   0   0   1
4   1   1   0   1   0   1   0   0   1   1

如果您想删除所有列:

print df.select(lambda x: not df[x].all(), axis = 1)    

   1K  1T  2A  2S  4D  4E  4H
0   0   1   1   0   1   0   0
1   0   1   1   0   1   0   0
2   0   1   0   1   0   1   0
3   0   1   1   0   1   0   0
4   1   0   1   0   0   0   1
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

突变残基和位置的数字编码 的相关文章

随机推荐

  • 列表的 youtube 播放器 api 始终播放初始视频

    我想切换播放列表https jsfiddle net g1xfh7rd https jsfiddle net g1xfh7rd 但它总是重新加载相同的初始播放列表 我尝试了所有建议的解决方案包含视频的 YouTube 播放器 API 列表
  • RGB 帧编码 - FFmpeg/libav

    我正在学习 FFmpeg 中的视频编码和解码 我尝试了这个代码示例page http www ffmpeg org doxygen 0 6 api example 8c source html 仅视频编码和解码部分 这里创建的虚拟图像是 Y
  • Go 中的 getpasswd 功能?

    情况 我想从以下位置获取密码条目stdin安慰 不回显用户输入的内容 有没有类似的东西getpasswdGo 中的功能 我尝试过的 我尝试使用syscall Read 但它与键入的内容相呼应 以下是其中之一最好的方法完成它 首先得到term
  • MPMoviePlayerController 音频显示“完成”按钮

    我使用 MPMoviePlayerController 来播放音频流 我的代码遵循以下示例 http iosdevelopertips com video getting mpmovieplayercontroller to coopera
  • 如何使用 Node.js 将文件从一台服务器传输到另一台服务器

    如果在其他地方问过这个问题 我很抱歉 但我找不到合适的解决方案来解决这个令人烦恼的问题 所以这就是我的情况 我有一个 node js 脚本 它从头开始创建一个 Excel 文档 一切都按预期工作 但是 我无法将这个新创建的文件保存到另一个运
  • onBackPressed 将数据发送到父活动[重复]

    这个问题在这里已经有答案了 有没有办法在按下后退时将更新的数据发送到父活动 我想更新捆绑包中的数据 但我不知道如何访问它 例如 我有一个打开图像查看器的画廊活动 假设用户滚动浏览十几张图像 然后返回到图库 理想的做法是使用他们最后查看的图像
  • Rust 有没有办法用索引折叠?

    在 Ruby 中 如果我有一个数组a 1 2 3 4 5 我想得到每个元素乘以它的索引的总和 a each with index inject 0 s i j s i j 在 Rust 中是否有一种惯用的方法可以做同样的事情 到目前为止 我
  • 使用 nghandsontable 访问 Handsontable 方法/属性

    我在用着ngHandson表 https github com handsontable ngHandsontable角度指令手动表 http handsontable com 我成功地显示了数据 但我正在努力访问修改后的行 以便将数据发送
  • 将对象转换为 类型

    我正在实现一个类的 List 接口 该类将数据存储在
  • iOS 自定义地图、地理位置、地图绘制等

    下一张图片取自 www Trimaps com 我希望这里允许使用图片 如果不允许 请告诉我 我会立即删除 这些图像完美地解释了我想要实现的目标 我拥有所需的所有数据 所需区域 4 个角的纬度 经度 以十进制值表示 来自 Google 地图
  • Clojure:在嵌套哈希图中搜索 val 并返回包含该 val 的键序列的函数

    假设我们有一个包含嵌套数据结构的集合 def coll a aa b d dd e f h hh i ii g gg c cc 我想创建一个函数 在嵌套结构中的任何位置搜索 val 并返回包含该 val 的键序列 search parent
  • 使用 Bootstrap ScrollSpy 将 div 折叠到固定的侧边栏

    我将此代码作为页面的布局 span9 div 包含应应用滚动间谍的部分 每个部分都是一组包含实际内容的可折叠 div span3 div 是固定的侧边栏 必须使用滚动间谍突出显示正确的项目 div class span3 module si
  • iOS 配置文件在 6 天后过期

    我是 iOS 开发新手 因为我目前只为 Android 开发 我遇到了一个问题 我一直在寻找可能的解决方案 我想做一个个人 iOS 应用程序 比如个人笔记应用程序或个人提醒应用程序等 我成功了 唯一的问题是配置文件仅持续 6 天 我认为 并
  • iPhone 5屏幕尺寸VS CSS媒体查询[重复]

    这个问题在这里已经有答案了 可能的重复 iPhone 5 CSS 媒体查询 https stackoverflow com questions 12539697 iphone 5 css media query iPhone 5 技术规格规
  • 如何生成一个随机数,然后将其显示在屏幕上?

    好吧 我对 Android 相当陌生 但我已经设法自学了基础知识 我正在制作一个应用程序 您按下一个按钮 就会打开一个新屏幕 它会显示一个随机生成的数字 唯一的问题是我不知道如何生成并显示随机数 我已经在网络上搜索了很长时间 只找到了很少的
  • UITextView 偏移文本的方式与 UILabel 不同

    我在用UILabel and UI文本视图并且它们以不同的方式呈现文本 看起来UI文本视图将文本偏移 4 下面是一个例子 其中顶部是UILabel下面是UI文本视图 他们都使用相同的字体 这里有两个例子 一个是自定义的OpenSans字体和
  • 在 iOS16 中以编程方式推送 NavigationLink

    在以前的 iOS 版本中 我以编程方式推送了一个 NavigationLink NavigationLink isActive searched destination SearchView originalSearchPhrase sea
  • 是否可以设置 html5 音频标签的样式?

    我还没有找到任何关于如何做到这一点的资源 像改变播放器颜色这样简单的事情就很好了 是的 您可以隐藏内置浏览器 UI 通过删除controls属性来自audio 而是构建您自己的界面并使用 Javascript 控制播放 source htt
  • Angular 如何根据路线更改导航菜单标题

    我正在使用 Angular 4 在当前项目中开发仪表板布局 当用户在应用程序的不同部分之间导航时 我需要更新导航菜单标题标题以反映应用程序的当前部分 例如 当用户访问设置时 页面标题 应更改为 设置 该项目基于 net core 2 Ang
  • 突变残基和位置的数字编码

    我正在编写一个 python 程序 它必须计算突变残基和位置的数字编码一组字符串 这些字符串是蛋白质序列 这些序列存储在 fasta 格式文件中 每个蛋白质序列用逗号分隔 不同蛋白质的序列长度可能不同 在此我试图找到以下位置和序列 变异了