Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
按序列大小对 fasta 进行排序
我目前想按序列大小对 hudge fasta 文件 10 8 行和序列 进行排序 fasta 是生物学中用于存储序列 遗传或蛋白质 的明确定义的格式 gt id1 序列 1 可以位于多行 gt id2 序列2 我运行了一个提供 tsv 格式
python3x
Sorting
Bioinformatics
fasta
如何使用 Perl 从 NCBI 获取 FASTA 核苷酸格式的基因特征?
我可以手动下载 FASTA 文件 如下所示 gt lcl CR543861 1 gene 1 ATGCTTTGGACA gt lcl CR543861 1 gene 2 GTGCGACTAAAA 通过单击 发送到 并选择 基因特征 FAST
database
perl
fasta
bioperl
ncbi
正则表达式删除特定字符之前的新行
我的文件中有一系列字符串 格式如下 gt HEADER Text1 Information here yada yada yada Some more information here yada yada yada Even some mo
python
regex
fasta
将 FASTA 文件中的多个序列添加到 python 中的列表中
我正在尝试组织具有多个序列的文件 在此过程中 我尝试将名称添加到列表中 并将序列添加到与名称列表并行的单独列表中 我弄清楚了如何将名称添加到列表中 但我不知道如何将其后面的序列添加到单独的列表中 我尝试将序列行附加到空字符串中 但它将所有序
python
list
append
Sequence
fasta
如何在Python中读取fasta文件?
我正在尝试读取 FASTA 文件 然后找到特定的主题 字符串 https en wikipedia org wiki Sequence motif并打印出它发生的顺序和次数 AFASTA文件 https en wikipedia org w
python
fasta
使用生成器解析 fasta 文件( python )
我正在尝试解析一个大的 fasta 文件 但遇到内存不足错误 一些改进数据处理的建议将不胜感激 目前 程序正确打印出名称 但是部分通过文件我得到了 MemoryError 这是发电机 def readFastaEntry fp name s
python
file
Parsing
fasta
从 fasta 文件中删除多个序列
我有一个字符序列的文本文件 由两行组成 标题和下一行中的序列本身 该文件的结构如下 gt header1 aaaaaaaaa gt header2 bbbbbbbbbbb gt header3 aaabbbaaaa gt headerN a
bash
awk
sed
fasta
将一个文件的内容以换行符分隔附加到另一个文件
我想 我正在尝试复制cat以与平台无关的方式使用 Linux shell 的功能 这样我就可以获取两个文本文件并按以下方式合并它们的内容 file 1 包含 42 bottles of beer on the wall file 2 包含
python
python27
concatenation
fasta
shutil
如何合并两个fasta文件并删除重复信息?
我想合并两个 fasta 文件并删除重复信息 这是一些例子 gt Symbiotaphrina buchneri DQ248313 SH1641879 08FU reps k Fungi p Ascomycota c Xylonomycet
cat
fasta
AttributeError:'str'对象没有属性'id'使用BioPython,解析fasta
我正在尝试使用 Bio 和 SeqIO 打开包含多个序列的 FASTA 文件 编辑序列名称以删除所有名称末尾的 seq gt SeqID20 seq 应变为 gt SeqID20 然后将所有序列写入新的 FASTA 文件 但出现以下错误 A
python
python3x
Bioinformatics
biopython
fasta
将 fasta 序列解析到字典中
我需要最简单的解决方案来转换包含多个核苷酸序列的 fasta txt 例如 gt seq1 TAGATTCTGAGTTATCTCTTGCATTAGCAGGTCATCCTGGTCAAACCGCTACTGTTCCGG CTTTCTGATAATT
python
Dictionary
fasta
删除 FASTA 文件中的换行符
我有一个 fasta 文件 其中序列用换行符分隔 我想删除换行符 这是我的文件的示例 gt accession1 ATGGCCCATG GGATCCTAGC gt accession2 GATATCCATG AAACGGCTTA 我想把它转
unix
awk
newline
Bioinformatics
fasta
读取 .fasta 序列以提取核苷酸数据,然后写入 TabDelimited 文件
在继续之前 我想请读者参考我之前使用 Perl 时遇到的问题 因为我是这一切的初学者 以下是我这几天发的帖子 按时间顺序排列 如何平均制表符分隔数据中的列值 Solved 为什么我在输出文件中看不到计算结果 Solved 使用 fasta
perl
Bioinformatics
Radix
sequences
fasta
读取 FASTA 文件
我想将文件的以下行转换为 JSON 我想将其保存到猫鼬模式中 gt HWI ST700660 96 2 1101 1455 2154 5 0 1 GAA GAATG 应该 gt HWI ST700660 96 2 1101 1455 215
json
csv
fasta
Bio.SeqUtils.molecular_weight() 函数在 molecular_weight 间隔内打印序列时出错
我正在尝试在 python 中创建一个函数 给定一个 不 模糊的序列 并且分子量间隔返回该序列表示的所有明确序列的列表 我用以下代码尝试了这一点 def extend ambiguous dna file name mw min mw ma
python
Sequence
biopython
fasta
Biopython SeqIO 到 Pandas Dataframe
我有一个可以轻松解析的 FASTA 文件SeqIO parse 我对提取序列 ID 和序列长度感兴趣 我用这些行来做到这一点 但我觉得它太重了 两次迭代 转换等 from Bio import SeqIO import pandas as
python
pandas
biopython
fasta