使用snakemake条件执行多重分析

2024-03-15

我在Snakemake上遇到了一些麻烦，到目前为止我还没有找到相关信息在文档中（或其他地方）。事实上，我有一个包含不同样本（多重分析）的大文件，我想根据规则后找到的结果停止某些样本的管道执行。

我已经尝试从规则定义中更改此值（使用检查点或 def），为以下规则进行条件输入，并将通配符视为删除一项的简单列表。下面是我想要做的一个例子（条件 if 在这里只是指示性的）：

# Import the config file(s)
configfile: "../PATH/configfile.yaml"

# Wildcards
sample = config["SAMPLE"]
lauch = config["LAUCH"]

# Rules

rule all:
    input:
        expand("PATH_TO_OUTPUT/{lauch}.{sample}.output", lauch=lauch, sample=sample)


rule one:
    input:
        "PATH_TO_INPUT/{lauch}.{sample}.input"
    output:
        temp("PATH_TO_OUTPUT/{lauch}.{sample}.output.tmp")
    shell:
        """
        somescript.sh {input} {output}
        """

rule two:
    input:
        "PATH_TO_OUTPUT/{lauch}.{sample}.output.tmp"
    output:
        "PATH_TO_OUTPUT/{lauch}.{sample}.output"
    shell:
        """
        somecheckpoint.sh {input}       # Print a message and write in the log file for now

        if [ file_dont_pass_checkpoint ]; then
            # Delete the correspondant sample to the wildcard {sample}
            # to continu the analysis only with samples who are pass the validation
        fi


        somescript2.sh {input} {output}
        """

如果有人有想法，我很感兴趣。预先感谢您的答复。

如果我理解正确的话，我认为这是一个有趣的情况。如果样本通过了一些检查，则继续分析它。否则，就早点停下来。

在管道的末端，每个样本必须有一个PATH_TO_OUTPUT/{lauch}.{sample}.output既然这是什么规则all无论检查结果如何都要求。

您可以让执行检查的规则写入一个包含标志的文件，该标志指示该样本的检查是否通过（例如标志“通过”或“失败”）。然后根据该标志，执行分析的规则要么进行完整分析（如果通过），要么如果标志为失败则写入空文件（或其他任何内容）。要点如下：

rule all:
    input:
        expand('{sample}.output', sample= samples),

rule checker:
    input:
        '{sample}.input',
    output:
        '{sample}.check',
    shell:
        r"""
        if [ some_check_is_ok ]
        then
            echo "PASS" > {output}
        else
            echo "FAIL" > {output}
        fi
        """

rule do_analysis:
    input:
        chk= '{sample}.check',
        smp= '{sample}.input',
    output:
        '{sample}.output',
    shell:
        r"""
        if [ {input.chk} contains "PASS"]:
            do_long_analysis.sh {input.smp} > {output}
        else:
            > {output} # Do nothing: empty file
        """

如果您根本不想看到失败的空输出文件，您可以使用成功 https://snakemake.readthedocs.io/en/stable/snakefiles/rules.html#onstart-onsuccess-and-onerror-handlers在管道末尾删除它们的指令：

onsuccess:
    for x in expand('{sample}.output', sample= samples):
        if os.path.getsize(x) == 0:
            print('Removing failed sample %s' % x)
            os.remove(x)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

snakemake

使用snakemake条件执行多重分析的相关文章

Snakemake 将文件夹定义为输出

我尝试使用snakemake运行prokka并统治一切在后者中我定义了 prokka 将生成的所有输出文件夹以写入结果 Prokka 需要提供一个文件夹作为输出而不是文件我所拥有的简化版本在这里 PATIENTID ls range
Snakemake：使用run指令时如何实现log指令？

Snakemake 允许为每个规则创建日志log参数指定日志文件的名称通过管道传输结果相对简单shell输出到此日志但我无法找出记录输出的方法run输出即 python 脚本一种解决方法是将 python 代码保存在脚本中然后从
当集群（slurm）取消作业时 Snakemake 挂起

也许答案对很多人来说都是显而易见的但我很惊讶我找不到关于这个主题的问题这对我来说是一个主要问题我将不胜感激的提示当在 slurm 管理的集群上提交作业时如果队列管理器取消该作业例如由于资源或时间不足 snakemake 似乎不
在snakemake规则的日志部分中定义的文件与在输出部分中定义的文件有很大不同吗？

我认为的文档log蛇形规则的一部分必须手动将内容发送到日志文件在我看来使用中定义的文件可以获得相同的结果output部分这两种可能的方法之间的重要区别是什么其真正的用处是什么log部分对我来说日志的最佳实践是 Snakem
Snakemake 无法处理很长的命令行？

这是一个很奇怪的问题当我的 input 中指定的rule部分是 input 有超过 500 个文件 snakemake 刚刚退出并显示消息 one of the commands exited with non zero exit cod
在 Snakemake HTML 报告中包含参数和源代码

我想在我的html报告中包含shell命令以及snakemake规则的外部脚本的源代码我看到人们在RULE序列的表中包含这些下面的示例是文档中基本示例的一部分 https snakemake readthedocs io en stab
Snakemake - 下载数据的规则

我在实现管道时遇到一些麻烦其中第一步是从某个服务器下载数据据我了解所有规则都必须有文件输入然而在我的例子中输入是提供给访问服务器并下载数据的脚本的 ID 字符串我知道远程文件Snakemake 中的选项但我正在下载的服务器
awk 命令在 Snakemake --use-singularity 中失败

我正在尝试将 Snakemake 与 Singularity 结合起来我注意到一个简单的awk使用奇点时命令不再起作用这 1最后一行被 bash 替换而不是被用作第一个字段awk 这是一个最小的工作示例蛇形锉刀 singularit
在参数中使用通配符

在snakemake中使用config yaml文件定义参数时是否可以使用通配符我使用通用 R 脚本来制作相同的基本热图但使用不同的输入矩阵我想使用通配符为 config yaml 文件中的每个热图指定热图的配置例如 K 均值聚类的
Snakemake：如何有效地使用配置文件

我正在使用以下配置文件格式蛇形对于一些测序分析实践我有大量样本每个样本包含 2 个 fastq 文件 samples Sample1 XY fastq files SRR4356728 1 fastq gz fastq files SR
如何收集与输入函数匹配通配符的Snakemake输入文件？

我有一组使用 BWA MEM 生成并使用 GATK IndelRealigner 等进一步处理的 BAM 文件我正在以较小的块对 BAM 文件进行预处理以加快处理速度然而我必须在变体调用之前将这些单独的文件合并到一个 BAM 文件中
如何快速识别 Snakemake 中的规则是否需要输入函数

我正在关注其文档页面上的 Snakemake 教程并且确实陷入了输入函数的概念https snakemake readthedocs io en stable tutorial advanced html step 3 input fun
引用另一个 Snakemake 规则的输入或输出文件

如何以编程方式引用另一个 Snakemake 规则的属性我需要更换什么
默认内存请求是否可以在 Snakefile 中覆盖？

我有一个包含多个规则的 Snakefile 只有少数规则需要超过 1 GB 核心才能在集群上运行这resources指令对此非常有用但我找不到设置默认值的方法我宁愿不用写resources mem per cpu 1024对于每条不需
Snakemake 输入函数异常。 AttributeError：“通配符”对象没有属性

我有一个带有 ChIP seq 单端 fastq 文件名的列表对象allfiles path file1 fastq path file2 fastq path file3 fastq 我正在尝试设置该对象 allfiles 作为通配符我
接受略有不同的 Snakemake 规则输入（.fq 与 .fq.gz）

我是 Snakemake 的新手希望能够选择一对 fq文件或一对 fq gz文件并运行它们trim galore得到一对修剪过的 fq gz输出文件在不提供所有 Snakefile 的情况下我得到了下面丑陋的解决方案我只是复制了规则
最后执行一定的规则

我目前正在编写一个 Snakefile 它进行了大量的对齐后质量控制 CollectInsertSizeMetics CollectAlignmentSummaryMetrics CollectGcBiasMetrics 在 Snakefi
在snakemake规则中使用pyenv

我正在使用 Snakemake 来实现一个漫长而复杂的管道其中涉及一些外部编写的 python2 脚本当我尝试使用 pyenv 指定 python2 时 pyenv shell命令失败同时pyenv global and pyenv
Snakemake根据字典输入和输出

我正在尝试重命名 Snakemake 管道中的一些文件假设我有三个文件 FileA txt FileB txt FileC txt 我希望根据字典重新命名它们dict A 0 B 1 C 2 to get RenamedFile0 txt
Snakemake如何在上游规则失败时执行下游规则

抱歉标题不好我不知道如何最好地用几句话解释我的问题当其中一条规则失败时我在处理 Snakemake 中的下游规则时遇到困难在下面的示例中黑桃规则在某些样本上失败这是预料之中的因为我的一些输入文件会有问题黑桃将返回错误并且

随机推荐

如何从程序访问控制寄存器cr0、cr2、cr3？出现分段错误

我编写了一个程序尝试读取和写入控制寄存器程序编译得很好但是当内联汇编即将执行时它会产生分段错误 Code void instructions int val int i int value for i 0 i lt val i as
请求被中止：请求被取消。没有解决方案有效

我们的控制台应用程序每分钟向 Facebook 发出数百个 Web 请求使用多个应用程序和数百个访问令牌现在他们开始失败标题中出现异常消息请求已中止请求已取消我们在互联网上搜索了几个小时并尝试了所有可能的解决方案但没有任何
Promise.promisify 后无法读取未定义的属性

let nasPath return getFamInfo args familyID then function famInfo nasPath some code involving famInfo here return getSFT
Java：getter 方法与公共实例变量：性能和内存

抱歉提出菜鸟问题通过引用传递与通过值传递是很困难的所以我有一个具有相当大的数据结构的类多维数组我需要从另一个类访问这些数组我可以将数组公开并执行经典的 objectWithStructures structOne 或者我可以做
Google API 的 Android 授权令牌类型别名列表在哪里？

跟随时this https developers google com google apps tasks oauth and tasks on android关于将 OAuth 2 与 Android AccountManager 一起使
JQuery 在鼠标单击时显示和隐藏 div（动画）

这是我的 HTML 代码 div Click Here div div class menu style display none ul li Button1 li li Button2 li li Button3 li ul div 我想
生成器是否同时返回迭代器和可迭代对象？

From 这个问题我之前问过 https stackoverflow com questions 50917742 can i make an iterator with a simple function no generator or
C# 中的 Foreach 结构奇怪的编译错误

namespace MyNamespace public struct MyStruct public string MyString public int MyInt public bool MyBool public class MyC
如果我使用 AWS CLI S3“mv”命令，其背后的请求类型是什么？

我在任何地方都找不到那个如果我使用类似的命令aws s3 mv s3 bucket
Elasticsearch 匹配字符串数组

我的 Elasticsearch v5 4 1 文档有一个 patents字段如下 Other fields title text date etc patents cc US cc MX cc KR cc JP cc CN cc CA c
Android 上的 UDP 视频流

我有一个 Android 项目需要构建一个客户端应用程序来接收 UDP 或 RTP 单播视频流并播放它们不幸的是我似乎无法使其正常工作并且已经广泛搜索了解决方案我已经在 Xoom Android 3 2 和 Nexus S And
AutoMapper 使用私有设置器映射属性

是否可以使用 AutoMapper 通过私有设置器分配属性 AutoMapper 现在允许我不确定从什么时候开始使用私有设置器映射属性它使用反射来创建对象示例类 public class Person public string N
AWS Elastic Beanstalk EFS 挂载错误：未知文件系统类型“efs”

我正在尝试使用 Dockerrun aws json 的任务定义将我的 EFS 安装到多 Docker Elastic Beanstalk 环境另外我已将 EFS 的安全组配置为接受来自 EC2 EB 环境安全组的 NFS 流量但是
检测通知托盘中的向左滑动？

我想检测用户何时在通知上向左滑动它可以在任何通知上因为我将使用通知侦听器检测最近取消了哪个通知是否有一个全局手势滑动我可以监听并且仅在检测到我的通知被忽略时触发我的应用程序特定事件尝试以下 1 创建一个接收器来处理滑动关闭事件
如何更改日期范围选择器的样式？

在颤振中添加this https pub dev packages date range picker插件这是我的代码 onPressed async final List
在 iOS 应用程序的文档文件夹中创建一个文件夹

我只想在 iPhone 应用程序的文档文件夹中创建新文件夹有人知道该怎么做吗感谢你的帮助我通过以下方式做到这一点 NSError error NSArray paths NSSearchPathForDirectoriesInDoma
PHP计数，每2个字符添加冒号

我有这个字符串 1010081 COP 8 27 20110616214459 我需要计算从该字符串末尾开始的最后 6 个字符因为从开头开始可能会很长然后我需要在每 2 个字符后添加冒号所以从末尾算起 6 个字符后它将是 21445
如何允许 DIV 的文本选择，但阻止父 DIV 的文本选择？

我想允许用户选择驻留在多个 DIV 中的文本这些 DIV 一个接一个地排列它们之间有很小的间隙问题是当用户拖动鼠标执行选择时他们会越过间隙这会导致整个父 DIV 被瞬间选中直到进入下一个子 DIV 这会导致闪烁行为和糟糕
动态调整行内按钮的文本大小

我正在使用本地化来支持我的应用程序中的多种语言这会导致按钮中的文本长度不同所以我需要让它具有响应能力我有两个按钮Row 我想调整这些按钮内的文本大小这样它们就不会产生任何溢出目前在某些语言中它看起来像这样我尝试使用自动大小文本
使用snakemake条件执行多重分析

我在Snakemake上遇到了一些麻烦到目前为止我还没有找到相关信息在文档中或其他地方事实上我有一个包含不同样本多重分析的大文件我想根据规则后找到的结果停止某些样本的管道执行我已经尝试从规则定义中更改此值使用检查点或 d

使用snakemake条件执行多重分析

使用snakemake条件执行多重分析 的相关文章

随机推荐

热门标签

使用snakemake条件执行多重分析的相关文章