初探生物信息数据库——生信原理第一次实验报告(华农)

2023-11-03

初探生物信息数据库——生信原理第一次实验报告(华农)

1 实验目的

熟悉NCBI数据库Entrez检索系统,会使用关键词检索NCBI、UnitProtKB、PubMed等数据库,能理解检索结果页面各条目含义。

2 实验题目与解答

2.1 水稻抗病基因Xa21

2.1.1 详细题目

水稻抗病基因Xa21有多少条序列具有全长CDS,分别由多少碱基构成?编码多少个氨基酸?选择修改时间最早的一条序列,指出该基因exon和intron的位置。该基因编码的蛋白质有多少个氨基酸残基?该蛋白质可能位于细胞中哪个位置?是否有三维结构信息?

2.1.2 解答过程

2.1.2.1 高级检索Xa21

为了找到水稻基因Xa21有多少条续流具有全长CDS,我们需要在高级搜索中将Organism限定为rice,此外在也需要将Xa21和complete CDS添加到Title中。

图1 在高级搜索中添加关键词及限定关键词类型

图1 在高级搜索中添加关键词及限定关键词类型

2.1.2.2 分析碱基构成及编码氨基酸个数

由检索结果(图二)可知,共有三条序列具有全长CDS,从每一条序列名称的第二行可以看到其碱基数,点击protein选项可以查看其氨基酸个数。
图2 Xa21的检索结果

图2 Xa21的检索结果

图3 点击Protein选项后的蛋白质GeneBank数据

图3 点击Protein选项后的蛋白质GeneBank数据

三条具有全长CDS的序列的碱基数以及编码氨基酸数目如下表:

表1 三条序列的碱基和氨基酸数目
Accession 碱基数 氨基酸数
AB212798 4623 1025
AB212799 4623 1025
U37133 3921 1025

2.1.2.3 查找修改时间最早的序列的相关信息

在检索结果页面将排序方式改为“Sort by Data Modified”,找到最后一条即修改时间最早的那条序列,其Accession是U37133查看其GeneBank数据,得知其外显区区在1-2677和3521-3921,内含子区在2678-3520。编码氨基酸残基由上文可知是1025个。

图4 U37133的外显子与内含子区数据

图4 U37133的外显子与内含子区数据

为了获取其编码蛋白的亚细胞定位和三维结构信息,我们在UniProt数据库中检索其Accession,在其检索结果的“Sequence”中也可以知道共有1025个氨基酸残基,在“Subcellular Location”中可以知道该蛋白位于细胞膜上,在“Structure”中可以看到AlphaFold预测的三维结构。
图5 在UniProt中检索U37133

图5 在UniProt中检索U37133

图6 U37133的序列信息

图6 U37133的序列信息

图7 U37133的亚细胞定位

图7 U37133的亚细胞定位
![图8 U37133的三维结构(AlphaFold)](https://img-blog.csdnimg.cn/b920b696636b4aeaaf19e267fe7ac9b4.png)
图8 U37133的三维结构(AlphaFold)

2.2 检索特定序列并批量下载FASTA序列

2.2.1 详细题目

检索注册号在AF123456-AF123478之间并且序列长度在1500到1800 bp之间的核苷酸数据,共有多少条?如何批量下载它们FASTA的序列?

2.2.2 解答过程

2.2.2.1 高级检索

我们将关键词的类型设置为Accession和Sequence Length,并添加关键词进行高级检索。

图9 问题二高级检索

图9 问题二高级检索

2.2.2.2 批量下载FASTA格式文件

点击“Send to”,并如图9一样设置,点击“Create File”即可下载。
图10 批量下载FASTA格式文件

图10 批量下载FASTA格式文件

3. 讨论

这次实验学习了如何在NCBI上查找核苷酸数据,并且在UniProt上查找蛋白质的相关信息,可以看到这次查找的蛋白质没有已经测定的三维结构,而是用AlphaFold预测得到的,这在三年前是不能实现的,我不禁人工智能对生命科学的贡献感到又一次震撼,在之后的学习生活中,我会好好学习计算机知识,并争取为生命科学做出大贡献!

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

初探生物信息数据库——生信原理第一次实验报告(华农) 的相关文章

  • 干货分享丨精心整理了份Python知识点高清速查表!太受用了!

    去年底北大保安 神仙打架 的新闻 让本来就火得一塌糊涂的Python又上了把热搜 资料来源 北大官微 不过 最吸引我的不是这条微博本身 而是一条 学会Python 可以上天 的评论 此语一出 立刻遭到群嘲 最扎眼的 莫过于那句 学会Pyth
  • Hive源码阅读--导读

    总述 Hive的执行流程大致分为两部分 即任务的提交与返回 命令的编译与执行 前者在CliDriver类中流转 后者主要在Driver与ParseDriver类 核心编译在BaseSemanticAnalyzer和QueryPlan类中 任

随机推荐

  • C 函数 strstr 的高效实现

    C函数库中有一个函数 strstr char char 它实现的是在一个原字符串中查找一个子串 如果找到这样的一个子串 返回这个子串在原字符串中的起始位置 若没有找到这样的一个子串 则返回NULL 但是 函数库中实现的仅是一般情况下的查找
  • ValueError: not enough values to unpack (expected 3, got 2) 解决办法

    这个错误通常是由于函数返回值的数量与解包变量的数量不匹配导致的 导致这个问题的原因可能是版本不同 或函数参数的不同导致的 比如在比较新的opencv中 cv2 findContours 返回的是两个参数 而老一点的版本是三个参数 列如 bi
  • docker之volumes

    数据卷 卷是保存由 Docker 容器生成和使用的数据的首选机制 虽然绑定挂载依赖于主机的目录结构和操作系统 但卷完全由 Docker 管理 与绑定挂载相比 卷有几个优点 卷比绑定挂载更容易备份或迁移 您可以使用 Docker CLI 命令
  • CV算法工程师面试问题总结(下) 2021.06.16

    本篇主要包含数据类问题 正则化 激活函数与梯度以及回归 SVM支持向量机 K Means均值以及机器学习相关常考内容等相关面试经验 数据类问题 1 样本不平衡的处理方法 欠采样 随机删除观测数量足够多的类 使得两个类别间的相对比例是显著的
  • 【pip】解决ERROR: Could not build wheels for pycuda which use PEP 517 and cannot be installed directly

    参考 https stackoverflow com questions 64038673 could not build wheels for which use pep 517 and cannot be installed direc
  • java中四种操作(dom、sax、jdom、dom4j)xml方法

    java中四种操作 dom sax jdom dom4j xml方式详解与比较 1 DOM JAXP Crimson解析器 DOM是用与平台和语言无关的方式表示XML文档的官方W3C标准 DOM是以层次结构组织的节点或信息片断的集合 这个层
  • csv反序列化_1.6.2python 文件复制、CSV、序列化和反序列化

    1 文件复制 单个文件复制 多个文件复制 使用系统模块 os 获取指定文件夹的所有文件名 复制流程 根据地址读取源文件 将读取的写入新地址 地址用os模块获取的文件名和文件夹名整合而成 2 CSV文件的写入与读取 导入CSV模块 CSV文件
  • Qt 使用QMediaPlayer类在VS中播放音乐

    qt有许多类都可以进行播放音频文件 这里我主要讲QMediaPlayer类 如何在vs中进行播放音乐 所遇到的问题该如何解决 QMediaPlayer可以对各种后缀的音频文件进行播放 包括 wav mp3等 1 向 pro文件中添加代码 由
  • requirejs之demo

    具体的理论就不讲了 可以参考 http www ruanyifeng com blog 2012 10 javascript module html http www ruanyifeng com blog 2012 10 asynchro
  • Linux下c++遍历文件夹中文件及读取绝对路径

    文件读取等操作是程序编写的基础 因此在总结了网上多个博客的基础上 写出了如下读取文件及保存绝对路径的代码片段 整理出来供大家学习 注意 这里dirent h是只有在Linux下才有的 include
  • c高级 day2

    1 写一个1 sh脚本 将以下内容放到脚本中 在家目录下创建目录文件 dir 在dir下创建dir1和dir2 把当前目录下的所有文件拷贝到dir1中 把当前目录下的所有脚本文件拷贝到dir2中 把dir2打包并压缩为dir2 tar xz
  • ios小程序上传文件使用onHeadersReceived获取header中的参数

    在上周做小程序上传的时候出现的问题 由于使用的oss 在安卓手机上获取header中的Etag是可以正常获取的 到了ios上传获取不到header中的参数 尝试了很多方法 后来发现onHeadersReceived可以获取到header就去
  • vi中不区分大小写查找的两种方法

    2019独角兽企业重金招聘Python工程师标准 gt gt gt 在 vim中 进行关键字查找 如果内容中分了大小写的 那么 查找默认是区分了大小写的 比如 ssh的配置文件中 etc ssh sshd config中 要去禁用 root
  • sqlserver存储过程加密和解密

    加密存储过程 IF EXISTS SELECT name FROM sysobjects WHERE name encrypt this AND type P DROP PROCEDURE encrypt this GO USE pubs
  • Python 在 JMeter 中如何使用?

    要在JMeter中使用Python 需要使用JSR223 Sampler元素来执行Python脚本 使用JSR223 Sampler执行Python脚本时 需要确保已在JMeter中配置了Python解释器 并设置了正确的环境路径 1 确保
  • 性能测试-JMeter分布式测试及其详细步骤

    性能测试概要 性能测试是软件测试中的一种 它可以衡量系统的稳定性 扩展性 可靠性 速度和资源使用 它可以发现性能瓶颈 确保能满足业务需求 很多系统都需要做性能测试 如Web应用 数据库和操作系统等 性能测试种类非常多 有些概念也很相近 Lo
  • 如何编写一个完整的Linux命令

    作者 gzshun 原创作品 转载请标明出处 来源 http blog csdn net gzshun 一个完整的Linux命令需要有以下几个重要的部分组成 1 使用方法 2 命令行参数 3 移植性 1 使用方法 在每个命令当中 都需要提供
  • uniapp开发小程序,上传图片和视频功能

    1 需求 可以上传图片和视频 并且都可以删除 图片可以预览 2 效果图 3 代码
  • JS金额千分位加逗号,多种实例

    涉及到金额展示的都需要在千分位上加逗号 以下为vue项目的实例 1 在main js下挂载一个全局方法 金额千分位加逗号 Vue prototype amountRule amount gt let defaultAmount let se
  • 初探生物信息数据库——生信原理第一次实验报告(华农)

    初探生物信息数据库 生信原理第一次实验报告 华农 1 实验目的 熟悉NCBI数据库Entrez检索系统 会使用关键词检索NCBI UnitProtKB PubMed等数据库 能理解检索结果页面各条目含义 2 实验题目与解答 2 1 水稻抗病