将 FASTA 文件中的多个序列添加到 python 中的列表中

2024-03-11

我正在尝试组织具有多个序列的文件。在此过程中，我尝试将名称添加到列表中，并将序列添加到与名称列表并行的单独列表中。我弄清楚了如何将名称添加到列表中，但我不知道如何将其后面的序列添加到单独的列表中。我尝试将序列行附加到空字符串中，但它将所有序列的所有行附加到单个字符串中。

所有名称均以“>”开头

def Name_Organizer(FASTA,output):

    import os
    import re

    in_file=open(FASTA,'r')
    dir,file=os.path.split(FASTA)
    temp = os.path.join(dir,output)
    out_file=open(temp,'w')

    data=''
    name_list=[]

    for line in in_file:

        line=line.strip()
        for i in line:
            if i=='>':
                name_list.append(line)
                break
            else:
                line=line.upper()
        if all([k==k.upper() for k in line]):
            data=data+line

    print data

如何将序列作为一组字符串添加到列表中？

输入文件看起来像这样

如果您正在使用 Python 和 fasta 文件，您可能需要考虑安装生物Python。 http://biopython.org/wiki/Main_Page它已经包含此解析功能以及更多功能。

解析 fasta 文件就像这样简单：

from Bio import SeqIO
for record in SeqIO.parse('filename.fasta', 'fasta'):
    print record.id, record.seq

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

list

append

Sequence

fasta

将 FASTA 文件中的多个序列添加到 python 中的列表中的相关文章

Python Popen 与 psexec 挂起 - 不良结果

我对 subprocess Popen 和我认为是管道的问题有疑问我有以下代码块从 cli 运行时 100 都不会出现问题 p subprocess Popen psexec serverName get cmd c ver echo
pydev 调试器：严重警告：此版本的 python 似乎编译不正确（内部生成的文件名不是绝对的）[重复]

这个问题在这里已经有答案了通过运行 from sklearn datasets import fetch california housing import pandas as pd pd set option precision 4 m
在 Python distutils 中从 setup.py 查找脚本目录的正确方法？

我正在分发一个具有以下结构的包 mymodule mymodule init py mymodule code py scripts script1 py scripts script2 py The mymodule的子目录mymodul
if 语句未命中中的 continue 断点

在下面的代码中两者a and b是生成器函数的输出并且可以评估为None或者有一个值 def testBehaviour self a None b 5 while True if not a or not b continue pri
从零开始的 numpy 形状意味着什么

好的我发现数组的形状中可以包含 0 对于将 0 作为唯一维度的情况这对我来说是有意义的它是一个空数组 np zeros 0 但如果你有这样的情况 np zeros 0 100 让我很困惑为什么这么定义呢据我所知这只是表达空数组的
在Python中调整图像大小

我有一张尺寸为 288 352 的图像我想将其大小调整为 160 240 我尝试了以下代码 im imread abc png img im resize 160 240 Image ANTIALIAS 但它给出了一个错误TypeErro
更改 `base_compiledir` 以将编译后的文件保存在另一个目录中

theano base compiledir指编译后的文件存放的目录有没有办法可以永久设置theano base compiledir到不同的位置也许通过修改一些内部 Theano 文件的内容 http deeplearning net
如何通过在 Python 3.x 上按键来启动和中断循环

我有这段代码当按下 P 键时会中断循环但除非我按下非 P 键否则循环不会工作 def main openGame while True purchase imageGrab if a sum gt 1200 fleaButton ti
如何设置 Celery 来调用自定义工作器初始化？

我对 Celery 很陌生我一直在尝试设置一个具有 2 个独立队列的项目一个用于计算另一个用于执行到目前为止一切都很好我的问题是执行队列中的工作人员需要实例化一个具有唯一 object id 的类每个工作人员一个 id 我想知
按元组分隔符拆分列表

我有清单 print L I WW am XX newbie YY ZZ You WW are XX cool YY ZZ 我想用分隔符将列表拆分为子列表 ZZ print new L I WW am XX newbie YY ZZ You
将 JSON 对象传递给带有请求的 url

所以我想利用 Kenneth 的优秀请求模块 https github com kennethreitz requests 在尝试使用时偶然发现了这个问题自由库API http wiki freebase com wiki API 基本上
Pandas 根据 diff 列形成簇

我正在尝试使用 Pandas 根据表示时间以秒为单位的列中的差异来消除数据框中的一些接近重复项例如 import pandas as pd numpy as np df pd DataFrame 1200 1201 1233 1555
将 2D NumPy 数组按元素相乘并求和

我想知道是否有一种更快的方法专用 NumPy 函数来执行 2D NumPy 数组的元素乘法然后对所有元素求和我目前使用np sum np multiply A B 其中 A B 是相同维度的 NumPy 数组m x n 您可以使用np
使用 PyTorch 分布式 NCCL 连接失败

我正在尝试使用 torch distributed 将 PyTorch 张量从一台机器发送到另一台机器 dist init process group 函数正常工作但是 dist broadcast 函数中出现连接失败这是我在节点 0
限制 django 应用程序模型中的单个记录？

我想使用模型来保存 django 应用程序的系统设置因此我想限制该模型使其只能有一条记录极限怎么办尝试这个 class MyModel models Model onefield models CharField The fiel
字典和数组作为类变量与实例变量

这是赚取积分的简单方法请解释以下内容 class C a b 0 c def init self self x def d self k v self x k v self a k v self b v self c append v d
检查字典键是否有空值

我有以下字典 dict1 city name yass region zipcode phone address tehsil planet mars 我正在尝试创建一个基于 dict1 的新字典但是它不会包含带有空字符串的键它不会包
Python 无法使用套接字绑定我的外部/公共 IP 地址，给出错误但是当使用本地 IP 地址时，错误不会显示

这是出现主要错误的代码与我的本地 IP 的绑定将起作用 s bind 192 168 1 4 port 与我的公共 IP 的绑定失败并出现以下错误 s bind 99 99 99 99 port WinError 10049 请求的地址在
列表值的意外更改

这是我的课 class variable object def init self name name alias parents values table name of the variable self name 这是有问题的函数 f
Scrapy Spider不存储状态（持久状态）

您好有一个基本的蜘蛛可以运行以获取给定域上的所有链接我想确保它保持其状态以便它可以从离开的位置恢复我已按照给定的网址进行操作http doc scrapy org en latest topics jobs html http d

随机推荐

强制 QtCreator 在构建时运行“qmake”

在我的一些项目中我使用 pro 文件中配置的一些预构建步骤所以qmake每当激活时都会执行此步骤现在在 QtCreator 中当我构建时也是完全重建整个项目时它并不总是运行qmake 因为它试图变得聪明并优化它它仅在 pro
MapFragment 类型的 getSupportFragmentManager() 方法未定义

我正在尝试实现 Google 地图显示下面是我的代码 package com fragments import android os Bundle import android view LayoutInflater import and
如何将这些坐标转换为 Google 地图可读的坐标？

看看这个的地图坐标这是从维基百科链接进来的坐标通过查询字符串传递我不确定这的实际术语但如何转换坐标它们看起来像这样北纬 37 14 6 西经 115 48 40 我希望它们看起来像这样 37 235 115 811111 这是
Zest：将图表导出为图像/pdf

我使用 zest 框架创建了一个网络视图图它使用 SWT 显示 shell 来显示 UI 我想将 UI 导出为图像 pdf 怎么做有任何想法吗您可以使用 SWT GC copyArea 方法将控件的内容复制到图像然后将图像保存到文件
多页 WPF 应用程序

我是桌面应用程序开发的新手有一个非常基本的问题我有一个名为 MainWindow 的 WPF 表单我应该如何在其上拥有多个页面例如用户管理管理内容等我想我有以下选择使用多种形式 Tabs 分组框任何澄清都会很棒在我最近
如何防止 pandas 数据框中的索引显示在 Excel 中？

我有一个 pandas 数据框 df 其中包含一些我想输出到 Excel 的数据但是我不希望将默认索引或与此相关的任何索引打印到工作表中是 df values 吗 df2 1 category num 2 A 1 3 A 2 4 B 3
safari 上的 onbeforeunload 不显示确认消息

我的这部分代码适用于除Safari 10 iOS 和 OSX 问题是 Safari 会触发beforeunload event但它不会显示在确认消息中 function goodbye e console log goodbye en fa
Rscript 无法识别 setGeneric 函数

我正在尝试将 R 脚本转换为客户端可以在批处理模式下运行的脚本我的代码使用通用函数接近开头的一个片段如下 setGeneric testInput function inputData params list standardGener
Visual Studio 2017 MSBuild 任务开发

使用 Visual Studio 2017 RC 开发自定义 MSBuild 任务时我遇到以下问题只要添加其他依赖项而不仅仅是Microsoft Build Utilities Core 使用 v15 1 0 preview 0004
如何在 Android 应用程序中请求照片/媒体/文件权限

在此输入图像描述 https i stack imgur com 2M033 png我希望我的应用程序请求照片媒体文件权限因为第三方库需要它任何人都可以告诉我要请求哪个特定权限 Thanks 文件照片和媒体都保存在存储中您的 A
在 jboss 服务器中为 Web 应用程序进行新部署后，浏览器缓存文件未更新

我正在使用 jboss Server 7 1 1 来部署 java web 应用程序对于 js css 字体文件浏览器缓存不会随着新的更改而更新每次我们都坚持要求客户清除浏览器中的缓存以使新的更改生效是否有任何我可以配置的配置以便
VB6中列出文件夹中指定类型的所有文件的任何函数

我想知道是否有一些内置函数适用于下面描述的场景输入是父文件夹的路径该函数必须做的是它应该列出该父文件夹内的所有 zip 文件父文件夹可以包含任意数量的子文件夹这同样适用于子文件夹任何人都可以帮我解决这个问题吗 VB版不是路障 V
Java 桌面应用程序 - 哪种技术？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我需要实现一个Java桌面应用程序您会推荐哪种框架 SWT Swing Java FX 还是其他框架我要求该应用程序应在 Windows x
Inno Setup TInputQueryWizardPage (CreateInputQueryPage) 上如何减小两个输入框之间的行距

我有一个TInputQueryWizardPage具有 8 个用户输入的页面这增加了向导页面 https stackoverflow com q 11778292 但所有值仍然不可见有没有办法减少两个值之间的行距以便所有值都以当前向导
http-proxy-middleware 中的 60 秒超时

我在使用时看到 60 秒超时chimurai http proxy middleware in Create React App我不明白它是从哪里来的我正在端口 5000 上运行 API 并进行配置setupProxy js as con
在 matplotlib 中自定义 x 轴

In the figure below each unit in the x axis represents a 10mins interval I would like to customize the labels of x axis
如何在午夜更新应用程序小部件？

我的应用程序有一个小部件显示今天的日期需要在午夜更新该小部件在清单中定义为
为什么使用 UIPanGestureRecognizer 移动对象时会出现延迟？

我要搬家了UIView对象使用UIPanGestureRecognizer 我在屏幕上拖动手指的次数我向同一方向移动视图的次数仅在 X 方向上向左或向右 Y 方向不变它工作正常但是非常明显 delay 这是处理的方法UIPanG
重命名 IAM 角色

我在创建 IAM 角色以允许 lambda 函数访问 cloudwatch 日志并创建 EC2 卷快照时犯了一个拼写错误有没有办法重命名角色无论是使用控制台还是 AWS CLI 创建角色后您无法编辑 IAM 角色这在多个地方都提到过
将 FASTA 文件中的多个序列添加到 python 中的列表中

我正在尝试组织具有多个序列的文件在此过程中我尝试将名称添加到列表中并将序列添加到与名称列表并行的单独列表中我弄清楚了如何将名称添加到列表中但我不知道如何将其后面的序列添加到单独的列表中我尝试将序列行附加到空字符串中但它将所有序

将 FASTA 文件中的多个序列添加到 python 中的列表中

将 FASTA 文件中的多个序列添加到 python 中的列表中 的相关文章

随机推荐

热门标签

将 FASTA 文件中的多个序列添加到 python 中的列表中的相关文章