如何在Python中读取fasta文件？

2024-02-28

我正在尝试读取 FASTA 文件，然后找到特定的主题（字符串） https://en.wikipedia.org/wiki/Sequence_motif并打印出它发生的顺序和次数。 AFASTA文件 https://en.wikipedia.org/wiki/FASTA_format只是一系列以标题行开头的序列（字符串），标题的签名或新序列的开头是“>”。在标题之后的新行中紧接着是字母序列。我还没有完成代码，但到目前为止我已经有了这个，它给了我这个错误：

AttributeError：“str”对象没有属性“next”

我不确定这里出了什么问题。

import re

header=""
counts=0
newline=""

f1=open('fpprotein_fasta(2).txt','r')
f2=open('motifs.xls','w')
for line in f1:
    if line.startswith('>'):
        header=line
        #print header
        nextline=line.next()
        for i in nextline:
            motif="ML[A-Z][A-Z][IV]R"
            if re.findall(motif,nextline):
                counts+=1
                #print (header+'\t'+counts+'\t'+motif+'\n')
        fout.write(header+'\t'+counts+'\t'+motif+'\n')

f1.close()
f2.close()

该错误可能来自以下行：

nextline=line.next()

line是你已经读过的字符串，没有next()方法就可以了。

问题的一部分是你试图混合两种不同的读取文件的方式 - 你正在使用迭代行for line in f1 and <handle>.next().

另外，如果您正在使用 FASTA 文件，我建议使用生物蟒蛇 http://biopython.org/DIST/docs/tutorial/Tutorial.html：它使得处理序列集合变得更加容易。尤其，第14章 http://biopython.org/DIST/docs/tutorial/Tutorial.html#sec244您会对主题特别感兴趣。这可能需要您了解更多有关 Python 的知识才能实现您想要的目标，但如果您要做的生物信息学比您此处的示例显示的要多得多，那么绝对值得投入时间。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

fasta

如何在Python中读取fasta文件？的相关文章

Django 中的 Rpy2 错误 - 未为“”类型的对象定义转换“py2rpy”

我以前从未使用过 R 并且正在尝试使用 rpy2 从 python 调用 R 函数它可以在独立的 python 终端上运行但不能在 Django 中运行但rpy2似乎无法将python字符串转换为r对象我正在使用同事提供的自定义库
Python：使用 string.format() 将单词大写

是否可以使用字符串格式将单词大写例如 user did such and such format user foobar 应该返回 Foobar 做了这样那样的事情请注意我很清楚 capitalize 但是这是我正在使用的代码非常
正则表达式，选择最接近的匹配

假设以下单词序列 BLA text text text text text text BLA text text text text LOOK text text text BLA text text BLA 我想做的是将 BLA 中的文本
无法使用 BeautifulSoup 和 Requests 抓取下拉菜单

我想抓取百年灵网站上的产品页面以获取各种信息示例页面 https www breitling com gb en watches navitimer b01 chronograph 46 AB0127211C1A1 https www b
使用 pandas 将字符串对象转换为 int/float

import pandas as pd path1 home supertramp Desktop 100 life 180 data csv mydf pd read csv path1 numcigar Never 0 1 5 Ciga
通用详细视图 ProfileView 必须使用对象 pk 或 slug 调用

我是 Django 2 0 的新手在访问我的个人资料页面视图时收到此错误它适用于像这样的网址path users
对于相同的查询，MySQL Workbench 比 Python 快得多

MySQL Workbench 中的以下查询需要 0 156 秒才能完成 SELECT date time minute price id FROM minute prices WHERE contract id 673 AND TIMES
在 Linux 上的 Python 中使用受密码保护的 Excel 工作表

问题很简单我每周都会收到一堆受密码保护的 Excel 文件我必须解析它们并使用 Python 将某些部分写入新文件我得到了文件的密码当在 Windows 上完成此操作时处理起来很简单我只需导入 win32com 并使用 clie
pandas 中连续数据的平行坐标图

pandas 的 parallel coordinates 函数非常有用 import pandas import matplotlib pyplot as plt from pandas tools plotting import par
uri 警告中缺少端口：使用 Python OpenCV cv2.VideoCapture() 打开文件时出错

当我尝试流式传输 ipcam 时出现了如下所示的错误 tcp 000000000048c640 uri 中缺少端口警告打开文件时出错 build opencv modules videoio src cap ffmpeg impl h
用于多个窗口的 Tkinter 示例代码，为什么按钮无法正确加载？

我正在编写一个程序应该按一下按钮即可打开一个窗口按另一个按钮关闭新打开的窗口我使用类以便稍后可以将代码插入到更大的程序中但是我无法正确加载按钮 import tkinter as tk class Demo1 tk Frame
在seaborn中对箱线图x轴进行排序

我的数据框round data看起来像这样 error username task path 0 0 02 n49vq14uhvy93i5uw33tf7s1ei07vngozrzlsr6q6cnh8w 39 png 1 0 10 n49vq
如何使用 django-pyodbc (ubuntu 16.04) 配置数据库设置 Django-MSSQL？

我是 Django 新手目前正在尝试使用另一个数据库来保存我的模型即MS SQL 我的数据库部署在docker容器中 903876e64b67 microsoft mssql server linux bin sh c opt mssq
具有多个主键的 SQLAlchemy 不会自动设置任何

我有一个简单的表 class test Base tablename test id Column Integer primary key True title Column String def init self title self
如何分析组合的 python 和 c 代码

我有一个由多个 python 脚本组成的应用程序其中一些脚本正在调用 C 代码该应用程序现在的运行速度比以前慢得多因此我想对其进行分析以查看问题所在是否有工具软件包或只是一种分析此类应用程序的方法有一个工具可以将 python
根据列索引重命名 Dataframe 列

是否有内置函数可以按索引重命名 pandas 数据框我以为我知道列标题的名称但事实证明第二列中有一些十六进制字符根据我接收数据的方式我将来可能会在第 2 列中遇到这个问题因此我无法将这些特定的十六进制字符硬编码到 datafram
更换壳牌管道[重复]

这个问题在这里已经有答案了在 subprocess 模块的 Python 2 7 文档中我找到了以下片段 p1 Popen dmesg stdout PIPE p2 Popen grep hda stdin p1 stdout stdo
在 scipy 中创建新的发行版

我试图根据我拥有的一些数据创建一个分布然后从该分布中随机抽取这是我所拥有的 from scipy import stats import numpy def getDistribution data kernel stats gauss
Python 导入非常慢 - Anaconda python 2.7

我的 python import 语句变得非常慢我使用 Anaconda 包在本地运行 python 2 7 导入模块后我编写的代码运行得非常快似乎只是导入需要很长时间例如我使用以下代码运行了一个 tester py 文件 imp
Python：无法使用 os.system() 打开文件

我正在编写一个使用该应用程序的 Python 脚本pdftk http www pdflabs com tools pdftk the pdf toolkit 几次来执行某些操作例如我可以在 Windows 命令行 shell 中使用

随机推荐

以编程方式分离数据库

我有一个数据库 D MDF CONNECTION SAMPLE BIN DEBUG HARMDATABASE MDF 我正在尝试使用以下代码分离或重命名它 SqlConnection conn new SqlConnection Data
使用迭代器的 ConcurrentModificationException

我使用迭代器来循环集合如下所示 Iterator
使用 Python 快速测试端口是否正在使用的方法

我有一个 python 服务器它监听几个套接字启动时我尝试在侦听之前连接到这些套接字因此我可以确定没有其他东西正在使用该端口这使我的服务器启动时间增加了大约 3 秒未经测试大约需要 0 54 秒我想将其缩短由于我只测试 lo
访问 Microsoft.Win32.UnsafeNativeMethods？

Microsoft 在 NET 框架中包含了一个非常好的 Windows API 包装器它存储在Microsoft Win32 UnsafeNativeMethods Microsoft Win32 SafeNativeMethods a
何时在 F# 中优先使用非类型化引用而不是类型化引用？

F 既有类型化代码引用也有非类型化代码引用我想知道在什么用例中人们会选择其中一种而不是另一种区别只是为了方便非类型化和类型化引文在所有情况下都可以转换为每种类型或者是类型化引文 e G 可能使用非类型化引用的子集是否有任何示例仅
Google Play 商店“管理应用程序和设备”（我的应用程序/更新）的意图不再起作用

以前的 Google Play 我的应用和游戏更新 Action com google android finsky VIEW MY DOWNLOADS Package com android vending Class com goog
Databinder.Eval 和 Substring

我使用中继器控件和数据绑定器将数据库中的数据显示到我的网站示例 DataBinder Eval Container DataItem title 有时文字太长通常我使用子字符串来显示首选字符串的长度但是我如何使用数据绑定器做到这一点
如何更改hbase表中列族的名称

我有一个 Hbase 表只有 1 个列族 cf1 下面有 100 列我需要将 cf1 更改为新的列族 CF1 简而言之我需要修改列族名称我已经浏览了以下链接http comments gmane org gmane comp jav
Angular 6 ServiceWorker - index.html 返回响应 404 Not Found

我已经在我的测试服务器上部署了 PWAhttps www mytestserver me dev pwa https wwww mytestserver me dev pwa 在 dev pwa 文件夹下该应用程序以 100 PWA 分数
在 emacs 中跳转 java 方法

我想通过方法跳转我的java文件例如当我到达任何地方时执行一个键盘快捷键即可跳转到方法的下一个结尾或方法的开头 Emacs 的通过 defuns 移动与 C M a 和 C M e 对于 C 来说非常有用并且完全符合我的要求但显
查询以计算列中所有值的不同单词数

我有一个 mysql 表 post id Post 1 Post Testing 2 Post Checking 3 My First Post 4 My first Post Check 我需要计算所有值中不同单词的数量Post colu
Scikit-learn 的 RandomForestRegressor 中的“feature_importances_”如何排序

如果我运行一个模型在本例中称为 clf 我会得到如下所示的输出如何将其与用于训练分类器的特征输入联系起来 gt gt gt clf feature importances array 0 01621506 0 18275428 0 09
C#、Unity3D、JSON 解析：无法将 JSON 解析为 C# 对象

我一直在使用统一引擎构建英语游戏我正在努力让 C 解析 JSON 最近几天我一直在尝试解析 JSON 但没有成功我已经验证了 JSON 可以将 jsonString 调试到控制台但是一旦 jsonUtility 拿到了 json 我就
如何使用python跳过文本文件中的空行

我有一个如下的文本文件 l 0 l 1 l 2 l 3 l 4 l 5 l 6 1 abc is a book and cba too 2 xyz is a pencil and zyx too 3 def is a pen and fed
HTML 标记内有两个

如何在Python中读取fasta文件？

如何在Python中读取fasta文件？ 的相关文章

随机推荐

如何在Python中读取fasta文件？的相关文章