在 NGS 数据中查找 CDR

2024-03-07

我有数百万个fasta格式的序列，想要提取CDR（CDR1、CDR2和CDR3）。我只选择了一个序列作为示例，并尝试提取CDR1，但无法提取CDR1。

顺序：-'FYSHSAVTLDESGGGLQTPGGGLSLVCKASGFTFSSYGMMWVRQAPGKGLEYVAGIRNDA GDKRYGSAVQGRATISRDNGQSTVRLQLNNLRAEDTGTYFCAKESGCYWDSTHCIDAWGH GTEVIVSTGG'。

cdr1 开始于：-“VCKASGFTFS”，最多可更换 3 名，但第二名 C 是必须的。cdr1 结束于：-'WVRQAP'，最多可替换两名，但第三名的 R 是必须的。

提取的 cdr1 应该是SYGMM

def cdr1_in(cdr_in): #VCKASGFTFS
    pin=0
    max_pin=3       
    
    if cdr[1]!='C':
        pin+=1
    if cdr[0]!='V':
        pin+=1
    if cdr[2]!='K':
        pin+=1
    if cdr[3]!='A':
        pin+=1    
    if cdr[4]!='S':
        pin+=1
    if cdr[5]!='G':
        pin+=1
    if cdr[6]!='F':
        pin+=1
    if cdr[7]!='T':
        pin+=1    
    if cdr[8]!='F':
        pin+=1
    if cdr[9]!='S':
        pin+=1   
  
    if pin<max_pin:
        print('CDR_in pattern', cdr_in)
        # print('CDR_starts from', arr.index(cdr_in)+9)
        return (arr.index(cdr_in)+9)
 
    def cdr1_out(cdr_out):#WVRQAP
    
        pin=0
        max_pin=2            
        if cdr[1]!='V':
            pin+=1
        if cdr[0]!='W':
            pin+=1
        if cdr[2]!='R':
            pin+=1
        if cdr[3]!='Q':
            pin+=1    
        if cdr[4]!='A':
            pin+=1
        if cdr[5]!='P':
            pin+=1
            
        if pin<max_pin:
            # print('CDR_in pattern', cdr_out)
            # print('CDR_ends at', arr.index(cdr_out))
            return (arr.index(cdr_out))
 

K=10
arr=sequence
for i in range(len(arr)-k+1):
        slider=arr[i:k+i]
        print("CDR_1 is:", arr[cdr1_in(slider): cdr1_out(slider)])

我是否正确地假设您正在分析免疫测序数据，并且 CDR 是指 B 或 T 细胞受体的互补决定区域？数据来自人类还是小鼠？如果是这种情况，您可能想看看现有的工具，而不是重新发明轮子。我用过mixcr https://github.com/milaboratory/mixcr。另一个流行的工具是IMGT/HighV-QUEST https://www.imgt.org/IMGTindex/IMGTHighV-QUEST.php但据我所知，它只能作为网络应用程序使用，不能用于大型数据集。如果它们不符合您的目的，您至少可能会得到有关如何继续的提示。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 NGS 数据中查找 CDR 的相关文章

如何使用 Python boto3 获取 redshift 中的列名称

我想使用 python boto3 获取 redshift 中的列名称创建Redshift集群将数据插入其中配置的机密管理器配置 SageMaker 笔记本打开Jupyter Notebook写入以下代码 import boto3
使用 Python 3 动态插入到 sqlite

我想使用 sqlite 写入多个表但我不想提前手动指定查询有数十种可能的排列例如 def insert sqlite tablename data list global dbc dbc execute insert into tab
python array(10,1) 和 array(10,) 之间的区别

我正在尝试将 MNIST 数据集加载到数组中当我使用 X train y train X test y test mnist load data 我得到一个数组 y test 10000 但我希望它的形状为 10000 1 数组 1000
从 pyspark.sql 中的列表创建数据框

我完全陷入了有线的境地现在我有一个清单li li example data map lambda x get labeled prediction w x collect print li type li 输出就像 0 0 59 0 0
使用 Pytest 的参数化添加测试功能的描述

当其中一个测试失败时可以在测试正在测试的内容的参数化中添加描述快速了解测试失败的原因有时您不知道测试失败的原因您必须查看代码通过每个测试的描述您就可以知道例如 pytest mark parametrize num1 num2
如何在 jQuery 中将标题转换为 URL slug？

我正在 CodeIgniter 中开发一个应用程序我试图在表单上创建一个字段来动态生成URL slug 我想做的是删除标点符号将其转换为小写然后用连字符替换空格例如 Shane s Rib Shack 将变成 shanes rib
Slim 3 - 斜杠作为路由参数的一部分

我需要使用可以包含斜杠的参数来编写 URL 例如经典的 hello username 路线默认情况下 hello Fabien将匹配此路线但不匹配 hello Fabien Kris 我想问你如何在 Slim 3 框架中做到这一点
在Python中读取tiff标签

我正在尝试用 Python 读取 tiff 文件的标签该文件是 RGB 的uint16每个通道的值我目前正在使用tifffile import tifffile img tifffile imread file tif 然而 img是一
在 Mac OSX 上从 Python 3.6 运行 wine 命令

我正在尝试用 Python 编写一个打开的脚本wine然后发送代码到wine终端打开一个 exe程序这 exe程序也是命令驱动的我可以打开wine 但我无法进一步 import shlex subprocess line usr bin
更改QLineEdit的ClearButton图标

我想在Windows 10 1909 64位上的Python 3 8和PyQt5 5 15 0 上更改我的QLineEdit的ClearButton图标稍后我想在Linux上运行代码我尝试应用此处找到的代码如何在 QLineEdit
时间序列数据预处理 - numpy strides 技巧以节省内存

我正在预处理一个时间序列数据集将其形状从二维数据点特征更改为三维数据点时间窗口特征在这样的视角中时间窗口有时也称为回顾指示作为输入变量来预测下一个时间段的先前时间步长数据点的数量换句话说时间窗口是机器学习算法在对
numpy：如何连接数组？（获得多个范围的并集）

我使用Pythonnumpy 我有一个 numpy 索引数组a gt gt gt a array 5 7 12 18 20 29 gt gt gt type a
Flask 应用程序路由中的多个参数

烧瓶怎么写app route如果我在 URL 调用中有多个参数这是我从 AJax 调用的 URL http 0 0 0 0 8888 createcm summary VVV change Feauure 我试图写我的烧瓶app rout
如何在 Seaborn 中的热图轴上表达类

我使用 Seaborn 创建了一个非常简单的热图显示相似性方阵这是我使用的一行代码 sns heatmap sim mat linewidths 0 square True robust True sns plt show 这是我得到的
使用 suds SOAP 库进行 HTTP 身份验证的奇怪行为

我有一个正在运行的 python 程序它使用 suds 通过 SOAP 获取大量数据 Web服务是通过分页功能实现的这样我就可以抓取nnn每个 fetch 调用的行并获取下一个nnn与后续的电话如果我使用如下代码向 HTTP 服务器进
确定分割形状几何体的“左”侧和“右”侧

我的问题是我怎样才能确定哪一个Aside and Bside的侧面已经分割的旋转矩形几何体 http nbviewer jupyter org urls dl dropbox com s ll3mchnx0jwzjnf determine
如何检查号码是否是巴基斯坦用户的手机号码而不是固定电话号码

我所做的是从开头删除 92 或 0092 并使用以下代码检查它是否是巴基斯坦人的有效手机号码 if preg match 3 0 4 0 9 number 1 Pakistani mobile number else not a pakis
仅允许正小数

在我的 Django 模型中我创建了一个如下所示的小数字段 price models DecimalField u Price decimal places 2 max digits 12 显然价格为负或零是没有意义的有没有办法将小数
django jet 中的自定义徽标

我目前正在尝试对 django 管理面板的皮肤进行一些定制以使其更符合我们的品牌目前我们使用 django jet 来美化管理面板 django jet 可以自定义 css html 吗所有评论都说我应该更改一些 html 文件但我
如何使用xlwt设置文本颜色

我无法找到有关如何设置文本颜色的文档在 xlwt 中如何完成以下操作 style xlwt XFStyle bold font xlwt Font font bold True style font font background col

随机推荐

AttributeError：“TimedeltaProperties”对象没有属性“分钟”

我有一个看起来像这样的数据框 df output date time 2020 02 28 00 30 45 2020 02 28 00 30 45 2020 03 09 00 21 06 2020 03 09 00 21 06 2020
应用程序退出，退出代码为 -1073740771

我有一个 WPF 应用程序有时会以退出代码 1073740771 退出该问题不会以任何模式出现并且因系统而异在某些系统中该问题的发生率不到总案例的 10 而在其他系统中我发现该问题的发生率几乎占总案例的 30 我无法形成任何可靠
UIImagePickerController 选择视频会阻止 MPMoviePlayerViewController 实例工作

我有一个视图控制器我在其中呈现UIImagePickerController在弹出窗口中如果用户选择视频则关闭弹出窗口并移至下一个页面视图控制器并尝试使用以下方式播放任何电影MPMoviePlayerViewController
如何将图片转换为html？

有没有办法将图像转换为html相当于图像通过有一个html表分为许多单元格每个单元格都有特定的背景颜色就像图像中的像素一样很像 ASCII 艺术我认为这是一种在电子邮件签名中包含公司徽标的方法而不必担心电子邮件客户端阻止图像是
每个数据库提供程序类型允许的最大参数数是多少？

可以传递到 Sql Server 查询即通过 ADO Net 的参数限制为 2 100 个但是 Net 开发人员使用的其他常见数据库的记录限制是什么特别是我感兴趣的是甲骨文10g 11g MySql PostgreSQL Sqlit
JavaFX 偶发渲染问题 - 按钮/控件消失

我有一个 Java JavaFX 应用程序部署为 Windows 和 Mac 的本机安装目前捆绑的运行时间为 8 121 您可以在此处找到安装程序和 Java 代码乔治下载 http www george andante no down
基于 SML 的文件查找

有没有办法使用 SML Basis 库在特定位置打开文件也就是说使用操作系统调用来更改位置而不是扫描文件并丢弃数据这很棘手不幸的是不直接支持搜索此外文件位置仅对于二进制文件是透明的即您使用BinIO结构 1 对于该结构体
如何获取两个列表并将它们组合起来排除任何重复项？

我想从两个单独的独特项目列表中创建一个列表还有其他类似的问题但似乎没有任何问题涉及有效地解决这个问题因为列表有几百万个项目长完全无关我是唯一一个讨厌标签建议框掩盖发布你的问题按钮的人吗 Use a set gt gt gt f
Protractor / Selenium XHR 保持“待处理”状态

我正在使用 Protractor 和 selenium 来测试我的 Angular 页面在某些随机点它只是停止执行因为 XHR 请求仍处于待处理状态在 Chrome 开发工具中当我复制请求 URL 这是一个简单的 GET 请求
如何从 Eclipse 在 jetty 8 上运行 Web 服务 Maven 项目？

我有一个之前创建并部署在 Tomcat7 中的 REST Web 服务按照建议我想将其部署在 Jetty 上在上一个问题中 https stackoverflow com questions 11691036 is it possibl
使用 HTML5 服务器事件和 Java Servlet 时如何防止 net::ERR_INCOMPLETE_CHUNKED_ENCODING？

我刚刚开始玩服务器事件遇到了一条我想了解的 chrome 错误消息我很快在网上搜索但没有找到解释所以我想我可能做了一些非常错误的事情在服务器端我有一个简单的 servlet 它接受请求并创建一个虚拟事件创建器任务 private
Rails 4：如何访问 ActiveRecord_Relation-Object 的属性？

我有一个国家模型和一个游记模型一个国家有很多游记一篇游记属于一个国家在 Rails 控制台中 TravelNote published country 248
VBA 哈希字符串

如何使用 Excel VBA 获取长字符串的短哈希给予什么输入字符串不超过80个字符有效输入字符为 0 9 A Z 有效输出字符为 0 9 AZ az 大小写均可输出哈希值不应超过 12 个字符越短越好根本不需要唯一因为这会导
React Routing 在本地有效，但在 Heroku 中无效

我的问题与中概述的问题即使不完全相同也非常相似this https stackoverflow com questions 41772411 react routing works in local machine but not her
Remix 上没有自动完成/代码完成功能？

我在 Youtube 上观看 Remix 上的教程他在输入代码时具有自动完成功能但我没有有谁知道如何启用它这将帮助我更轻松地编写代码但我在任何地方都找不到解决方案对我来说只需点击左下角的设置按钮并启用在编辑器中启用代码完
Docker构建特定的本地git分支

我是 docker 新手想要容器化我的应用程序的特定 git 分支如果我运行 docker build 并给出 dockerfile 的位置则会构建一个图像但默认情况下从本地 master 分支构建我希望能够要构建另一个分支请说
将 node.js 服务器端代码移植到 HTML5 WebSockets

注意这不是关于同时使用 node js 和 HTML5 套接字我也没有兴趣讨论我所描述的设置的优点 node js 在服务器上运行并且由于它支持通过套接字连接作为客户它可以充当 HTML5 JS 客户端和使用 TCP IP 的服务器
为什么.NET中没有IDateTimeProvider而DateTime有Now getter？

目前我正在为执行日期时间特定验证的组件编写单元测试我创造了IDateTimeProvider接口用作DateTime UtcNow包装器和业务对象使用接口而不是DateTime直接地看来 DateTime 有点过载应该分为一个值和
页内分析不起作用

当尝试在 Firefox 中查看页内分析时我收到以下消息加载页内分析时出现问题我们发现您的设置存在问题这些可能会导致加载页内分析时出现问题您的网站不会从 Google 加载 ga js 如果您在自己的服务器上托管 Google 跟
在 NGS 数据中查找 CDR

我有数百万个fasta格式的序列想要提取CDR CDR1 CDR2和CDR3 我只选择了一个序列作为示例并尝试提取CDR1 但无法提取CDR1 顺序 FYSHSAVTLDESGGGLQTPGGGLSLVCKASGFTFSSYGMMWVR

在 NGS 数据中查找 CDR

在 NGS 数据中查找 CDR 的相关文章

随机推荐

热门标签