fasta

按序列大小对 fasta 进行排序

我目前想按序列大小对 hudge fasta 文件 10 8 行和序列进行排序 fasta 是生物学中用于存储序列遗传或蛋白质的明确定义的格式 gt id1 序列 1 可以位于多行 gt id2 序列2 我运行了一个提供 tsv 格式

python3x Sorting Bioinformatics fasta

我可以手动下载 FASTA 文件如下所示 gt lcl CR543861 1 gene 1 ATGCTTTGGACA gt lcl CR543861 1 gene 2 GTGCGACTAAAA 通过单击发送到并选择基因特征 FAST

database perl fasta bioperl ncbi

我的文件中有一系列字符串格式如下 gt HEADER Text1 Information here yada yada yada Some more information here yada yada yada Even some mo

python regex fasta

我正在尝试组织具有多个序列的文件在此过程中我尝试将名称添加到列表中并将序列添加到与名称列表并行的单独列表中我弄清楚了如何将名称添加到列表中但我不知道如何将其后面的序列添加到单独的列表中我尝试将序列行附加到空字符串中但它将所有序

python list append Sequence fasta

我正在尝试读取 FASTA 文件然后找到特定的主题字符串 https en wikipedia org wiki Sequence motif并打印出它发生的顺序和次数 AFASTA文件 https en wikipedia org w

python fasta

我正在尝试解析一个大的 fasta 文件但遇到内存不足错误一些改进数据处理的建议将不胜感激目前程序正确打印出名称但是部分通过文件我得到了 MemoryError 这是发电机 def readFastaEntry fp name s

python file Parsing fasta

我有一个字符序列的文本文件由两行组成标题和下一行中的序列本身该文件的结构如下 gt header1 aaaaaaaaa gt header2 bbbbbbbbbbb gt header3 aaabbbaaaa gt headerN a

bash awk sed fasta

我想我正在尝试复制cat以与平台无关的方式使用 Linux shell 的功能这样我就可以获取两个文本文件并按以下方式合并它们的内容 file 1 包含 42 bottles of beer on the wall file 2 包含

python python27 concatenation fasta shutil

我想合并两个 fasta 文件并删除重复信息这是一些例子 gt Symbiotaphrina buchneri DQ248313 SH1641879 08FU reps k Fungi p Ascomycota c Xylonomycet

cat fasta

我正在尝试使用 Bio 和 SeqIO 打开包含多个序列的 FASTA 文件编辑序列名称以删除所有名称末尾的 seq gt SeqID20 seq 应变为 gt SeqID20 然后将所有序列写入新的 FASTA 文件但出现以下错误 A

python python3x Bioinformatics biopython fasta

我需要最简单的解决方案来转换包含多个核苷酸序列的 fasta txt 例如 gt seq1 TAGATTCTGAGTTATCTCTTGCATTAGCAGGTCATCCTGGTCAAACCGCTACTGTTCCGG CTTTCTGATAATT

python Dictionary fasta

我有一个 fasta 文件其中序列用换行符分隔我想删除换行符这是我的文件的示例 gt accession1 ATGGCCCATG GGATCCTAGC gt accession2 GATATCCATG AAACGGCTTA 我想把它转

unix awk newline Bioinformatics fasta

在继续之前我想请读者参考我之前使用 Perl 时遇到的问题因为我是这一切的初学者以下是我这几天发的帖子按时间顺序排列如何平均制表符分隔数据中的列值 Solved 为什么我在输出文件中看不到计算结果 Solved 使用 fasta

perl Bioinformatics Radix sequences fasta

我想将文件的以下行转换为 JSON 我想将其保存到猫鼬模式中 gt HWI ST700660 96 2 1101 1455 2154 5 0 1 GAA GAATG 应该 gt HWI ST700660 96 2 1101 1455 215

json csv fasta

我正在尝试在 python 中创建一个函数给定一个不模糊的序列并且分子量间隔返回该序列表示的所有明确序列的列表我用以下代码尝试了这一点 def extend ambiguous dna file name mw min mw ma

python Sequence biopython fasta

我有一个可以轻松解析的 FASTA 文件SeqIO parse 我对提取序列 ID 和序列长度感兴趣我用这些行来做到这一点但我觉得它太重了两次迭代转换等 from Bio import SeqIO import pandas as

python pandas biopython fasta