错误的snakemake glob_wilcards 和 wildcard_constraints

2024-03-09

在我的 Snakemake 管道中，我试图检索正确的通配符。我研究过 wildcard_constraints 和这个帖子 https://stackoverflow.com/questions/66882849/snakemake-how-to-use-glob-wilcards-properly and 这个帖子 https://stackoverflow.com/questions/46856698/cant-get-this-regex-to-work-for-wildcard-constraints-in-snakemake，但是我无法找出确切的解决方案。

以下是 2 个数据集中的文件名示例。 1 个数据集包含配对的小鼠 RNAseq 读取文件，另一个数据集包含人类配对的 RNAseq 读取文件。

“Mus_musculus”数据集为“PRJNA362883_GSE93946_SRP097621”，文件名：

“SRR5195524_GSM2465521_KrasT_45649_NoDox_Mus_musculus_RNA-Seq_1.fastq.gz” “SRR5195524_GSM2465521_KrasT_45649_NoDox_Mus_musculus_RNA-Seq_2.fastq.gz”

“Homo_sapiens”数据集为“PRJNA362883_GSE93946_SRP097621”，文件名：

“SRR7942395_GSM3406786_sAML_Control_1_Homo_sapiens_RNA-Seq_1.fastq.gz” “SRR7942395_GSM3406786_sAML_Control_1_Homo_sapiens_RNA-Seq_2.fastq.gz”

我希望 glob_wildcards 吐出以下通配符

> ['PRJNA362883_GSE93946_SRP097621', 'PRJNA362883_GSE93946_SRP097621',
> 'PRJNA493818_GSE120639_SRP162872', 'PRJNA493818_GSE120639_SRP162872']
> ['SRR5195524_GSM2465521_KrasT_45649_NoDox',
> 'SRR5195524_GSM2465521_KrasT_45649_NoDox',
> 'SRR7942395_GSM3406786_sAML_Control_1',
> 'SRR7942395_GSM3406786_sAML_Control_1'] ['Mus_musculus', 'Mus_musculus',
> 'Homo_sapiens', 'Homo_sapiens'] ['1', '2', '1', '2']

我尝试过以下代码：

> import glob import os
> 
> DATASET,SAMPLE,SPECIES,FRR,
> =glob_wildcards(config["project_path"]+"resources/raw_datasets/{dataset}/{sample}_{species}_RNA-Seq_{frr}.fastq.gz")
> print(DATASET,SAMPLE,SPECIES,FRR)

但是，我得到了这个作为输出。许多下划线弄乱了 glob_wildcards

> ['PRJNA362883_GSE93946_SRP097621', 'PRJNA362883_GSE93946_SRP097621',
> 'PRJNA493818_GSE120639_SRP162872', 'PRJNA493818_GSE120639_SRP162872']
> ['SRR5195524_GSM2465521_KrasT_45649_NoDox_Mus',
> 'SRR5195524_GSM2465521_KrasT_45649_NoDox_Mus',
> 'SRR7942395_GSM3406786_sAML_Control_1_Homo',
> 'SRR7942395_GSM3406786_sAML_Control_1_Homo'] ['musculus', 'musculus',
> 'sapiens', 'sapiens'] ['1', '2', '1', '2']

例如，我尝试了这个，但输出保持不变：通配符约束：物种 = '!(sapiens)'

谁能建议正确的代码来获得想要的通配符？提前致谢！

如果适合您的情况，最好准备一个样本表或 yaml 文件来指示每个文件的特征（例如物种、数据集等）。然后使用 python 代码（例如使用 pandas）提取通配符值并引导管道。

在我看来，从文件名中提取信息很脆弱，除非名称是在管道中创建的并且您可以完全控制它们。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

错误的snakemake glob_wilcards 和 wildcard_constraints 的相关文章

2d 图像点和 3d 网格之间的交点

Given 网格源相机我有内在和外在参数图像坐标 2d Output 3D 点是从相机中心发出的光线穿过图像平面上的 2d 点与网格的交点我试图找到网格上的 3d 点 This is the process From Multip
ValueError：请使用“Layer”实例初始化“TimeDistributed”层

我正在尝试构建一个可以在音频和视频样本上进行训练的模型但出现此错误ValueError Please initialize TimeDistributed layer with a Layer instance You passed Te
尝试从网页Python和BeautifulSoup获取编码

我试图从网页检索字符集这会一直改变目前我使用 beautifulSoup 来解析页面然后从标题中提取字符集这工作正常直到我遇到一个网站到目前为止我的代码以及与其他页面一起使用的代码是 def get encoding soup
Python re无限执行

我正在尝试执行这段代码 import re pattern r w w s re compiled re compile pattern results re compiled search COPRO HORIZON 2000 HOR p
指示电子邮件的类型

我有以下自动化程序它将电子邮件发送给我自己并添加了特定的链接 import win32com client as win32 import easygui import tkinter as to from tkinter import
数据框 - 平均列

我在 pandas 中有以下数据框 Column 1 Column 2 Column3 Column 4 2 2 2 4 1 2 2 3 我正在创建一个数据框其中包含第 1 列和第 2 列第 3 列和第 4 列等的平均值 ColumnA
将 C++ 指针作为参数传递给 Cython 函数

cdef extern from Foo h cdef cppclass Bar pass cdef class PyClass cdef Bar bar def cinit self Bar b bar b 这总是会给我类似的东西 Can
python array(10,1) 和 array(10,) 之间的区别

我正在尝试将 MNIST 数据集加载到数组中当我使用 X train y train X test y test mnist load data 我得到一个数组 y test 10000 但我希望它的形状为 10000 1 数组 1000
检查 python 中命令行参数的数量

我是蟒蛇新手还是把脚弄湿了我正在尝试做这样的事情 import sys if len sys argv lt 3 or lt len sys argv gt 3 print This script will compare two fi
如何获取numpy.random.choice的索引？ - Python

是否可以修改 numpy random choice 函数以使其返回所选元素的索引基本上我想创建一个列表并随机选择元素而不进行替换 import numpy as np gt gt gt a 1 4 1 3 3 2 1 4 gt gt
使用 Pytest 的参数化添加测试功能的描述

当其中一个测试失败时可以在测试正在测试的内容的参数化中添加描述快速了解测试失败的原因有时您不知道测试失败的原因您必须查看代码通过每个测试的描述您就可以知道例如 pytest mark parametrize num1 num2
将 pandas 剪切操作转换为常规字符串

我明白了 pandas cut 操作的输出 0 0 20 1 0 20 2 0 20 3 0 20 4 0 20 5 0 20 6 0 20 7 0 20 8 0 20 9 0 20 如何将 0 20 转换为 0 20 我正在这样做 str
如何使用 Homebrew 在 Mac 上安装 Python 2 和 3？

我需要能够在 Python 2 和 3 之间来回切换我如何使用 Homebrew 来做到这一点因为我不想弄乱路径并陷入麻烦现在我已经通过 Homebrew 安装了 2 7 我会用pyenv https github com yyuu
使用标签或 href 传递 Django 数据

我有一个包含链接的表当单击该链接进行更多操作时我想将一些数据传递给我的函数 my html table tbody for query in queries tr td value a href internal my func que
Flask 应用程序路由中的多个参数

烧瓶怎么写app route如果我在 URL 调用中有多个参数这是我从 AJax 调用的 URL http 0 0 0 0 8888 createcm summary VVV change Feauure 我试图写我的烧瓶app rout
pygame：使用 sprite.RenderPlain 绘制精灵组的顺序

我有一个精灵组需要按一定的顺序绘制以便其精灵按应有的方式重叠然而即使使用运算符模块函数 sorted self sprites key attrgetter y x 对组进行排序顺序也是错误的我该如何解决这个问题直截了当地说
numpy polyfit 中使用的权重值是多少以及拟合误差是多少

我正在尝试对 numpy 中的某些数据进行线性拟合 Ex 其中 w 是该值的样本数即对于点 x 0 y 0 我只有 1 个测量值该测量值是2 2 但对于这一点 1 1 我有 2 个测量值值为3 5 x np array 0 1 2 3
在 numpy 中连接维度

我有x 1 2 3 4 5 6 7 8 9 10 11 12 shape 2 2 3 I want 1 2 3 4 5 6 7 8 9 10 11 12 shape 2 6 也就是说我想连接中间维度的所有项目在这种特殊情况下我可以得到这
django jet 中的自定义徽标

我目前正在尝试对 django 管理面板的皮肤进行一些定制以使其更符合我们的品牌目前我们使用 django jet 来美化管理面板 django jet 可以自定义 css html 吗所有评论都说我应该更改一些 html 文件但我
使用 paramiko 运行 Sudo 命令

我正在尝试执行sudo使用 python paramiko 在远程计算机上运行命令我尝试了这段代码 import paramiko ssh paramiko SSHClient ssh set missing host key polic

随机推荐

不使用 Excel 写入 Excel 电子表格中的某些单元格？

我想在未安装 Excel 的服务器上写入 Excel 电子表格所以Excel自动化是不可能的我还需要写信给certain使用 NET 的单元这可能吗如何实现 ODBC 驱动程序可用于在某些工作表单元格插入数据吗无需使用昂贵的第三方
Assert.That 与 Assert.True

更喜欢什么 Assert That obj Foo Is EqualTo true or Assert True obj Foo 对我来说这两种资产是等价的应该优先选择哪一种在这种特殊情况下没有区别您将看到大致相同详细程度的输出
IntelliJ IDEA 中的“变量从未分配”警告只能“部分”抑制

Java EE IntelliJ Idea 2016 3 我编写了一个类并声明了一个私有字段 Inject注解我已经通过添加成功地从检查结果窗口中删除了未使用的声明通知javax inject Inject to 设置 gt 编辑
grunt-contrib-connect 中间件 CORS 解决方案，具有 keepalive true

对于我的本地开发系统我尝试使用 grunt contrib connect 为前端资产提供服务我需要一个在 Firefox 中使用字体的跨域解决方案服务器运行得很好但我似乎无法设置标头我正在使用 grunt contrib con
单个元素中的多个文本节点？

有人可以帮我看一下下面的屏幕截图并解释以下内容到底是怎么回事我如何以编程方式检测它我如何以编程方式修复摆脱它我相信发生的事情是我在一个单一的文本节点中有多个文本节点preelement 我感觉很多年前我在MDN上读到这样的事情是可
android:dither="true" 不抖动，出了什么问题？

我一直在尝试让 android 抖动活动的背景图像到目前为止没有成功我不知道出了什么问题这就是我所做的我的活动布局的根元素是 LinearLayout
为什么自定义类型接受 Python 中的临时属性（而内置类型不接受）？

我想知道为什么人们能够为自定义类型的实例创建一个新属性新意味着先前未在类主体中定义但无法为内置类型执行相同的操作在类型上比如object本身代码示例 gt gt gt class SomeClass object pass gt
Python导入模块错误

我在项目中导入模块时遇到问题我正在创建测试但无法从测试文件导入我的 main 来测试应用程序的一个端点teste ex py 这是我的项目结构 backend api api init py main py testes init py
如何在django模板中使用生成器方法？

我想在 django 模板中使用 python 生成器可以吗例如我有模型它包含生成器对象如下所示 class TestMe models Model property def gen self yield 1 yield 2 上下
Pycharm不显示数据库表

更新PyCharm 版本2017 1 后 PyCharm不显示sqlite3数据库表不再存在我已经测试了连接并且可以正常工作 In sqlite客户端我可以列出所有表并进行查询其他人也遇到这个问题吗在这种情况下无论如何都能解决吗我使
为 Clojure 协议提供多种实现

我有一个公开常见数据相关函数的命名空间 get images insert user 然后我有两个具有相同功能并以不同方式实现它们的数据库后端他们按原样实现接口每个后端都包含在一个命名空间中我似乎无法找到如何完成此任务的良好解决方案
Java 项目中服务器和客户端包的共享资源

我有一个 Java 项目其中包含服务器包和客户端包另外我还有一个图书馆包我使用 eclipse 并将所有内容放入一个 Java 项目中每个部分服务器客户端和库都位于单独的包中问题是当我导出时所有内容都会添加到 Jar 文件中
如何在 Azure Key Vault 中序列化和反序列化 PFX 证书？

我有一堆字符串和 pfx 证书我想将它们存储在 Azure Key Vault 中只有允许的用户应用程序才能获取它们将字符串存储为 Secret 并不难但是如何以可以检索它并反序列化为证书的方式序列化证书 X509证书2 http
Pandas：连接数据帧并保留重复索引

我有两个数据框我想将它们按列 axis 1 与内部联接连接起来其中一个数据帧有一些重复的索引但行不重复我不想丢失其中的数据 df1 pd DataFrame a 1 b 2 a 1 b 3 a 2 b 4 columns a b s
Laravel - 计算目录的总大小？

我试图获取 Laravel 中 directory 的总大小到目前为止我只能使用 size 函数获取单个文件的大小好像没有这方面的例子或者文档任何对此的意见将不胜感激谢谢我认为你不能 Laravel 5 用途飞行系统 http f
如何将负数转换为正数？

如何在Python中将负数转换为正数并保持积极的态度 gt gt gt n 42 gt gt gt n if you know n is negative 42 gt gt gt abs n for any n 42 不要忘记检查docs
如何将枚举类型变量转换为字符串？

如何使 printf 显示枚举类型变量的值例如 typedef enum Linux Apple Windows OS type OS type myOS Linux 我需要的是类似的东西 printenum OS type My OS
CSS 弹跳线加载动画

我正在尝试创建一个简单的加载动画来回绘制一条线但目前仅朝一个方向移动一旦到达动画的中间它就不会以相反的方向动画这是我的CSS keyframes loader animation 0 width 0 49 width 100 50
在TabLayout设计支持库中无法看到Tab Indicator

我正在使用材料设计库并使用创建布局CoordinatorLayout 应用栏布局 RecyclerView and TabLayout 我的问题是我无法看到选项卡指示器Tablayout 下面是我正在使用的 xml 文件AppCompact
错误的snakemake glob_wilcards 和 wildcard_constraints

在我的 Snakemake 管道中我试图检索正确的通配符我研究过 wildcard constraints 和这个帖子 https stackoverflow com questions 66882849 snakemake how t

错误的snakemake glob_wilcards 和 wildcard_constraints

错误的snakemake glob_wilcards 和 wildcard_constraints 的相关文章

随机推荐

热门标签