通配符 Snakemake 规则的预处理

2024-01-26

我有一个 Snakemake 配方，其中包含一个非常昂贵的准备步骤，对于所有调用来说都很常见。这是用于演示的伪规则：

rule sample:
    input:
        "{name}.config"
    output:
        "{name}.npz"
    run:
        import somemodule
        
        data = somemodule.Loader("some_big_data")  # expensive
        np.savez(output, data.process(input))  # also expensive

眼下data已加载de novo对于每个目标，这都不是最理想的。我怎样才能让它只加载一次？

我寻找一些允许重写规则的东西：

rule sample:
    input:
        "{name}.config"
    output:
        "{name}.npz"
    setup:
        import somemodule
        
        data = somemodule.Loader("some_big_data")  # expensive
    run:
        np.savez(output, data.process(input))  # also expensive

or:

rule sample:
    input:
        "{name}.config"
    output:
        "{name}.npz"
    run:
        import somemodule

        data = somemodule.Loader("some_big_data")  # expensive
        
        for job in jobs:
            np.savez(job.output,
                     data.process(job.input))  # also expensive

在另一个问题中我已经描述了代码Loader.__init__()是基于 https://stackoverflow.com/questions/68694729/how-can-i-load-fenics-objects-faster.

一种可能的解决方案是使用感兴趣的数据创建一个腌制对象。请研究安全考虑 https://docs.python.org/3/library/pickle.html使用腌制对象来检查它是否适合您的情况。如果是的话，那么它会沿着以下路线：

rule sample:
    input:
        "{name}.config"
    output:
        pickle = "{name}.pickle",
    run:
        import somemodule
        import pickle
        
        data = somemodule.Loader("some_big_data")  # expensive
        pickle.dump(pickle, output.pickle)

在下游规则中，您将像任何其他文件一样引用腌制文件，只需确保使用pickle.load.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

snakemake

通配符 Snakemake 规则的预处理的相关文章

如何实现 __eq__ 进行集合包含测试？

我遇到了一个问题我将一个实例添加到一个集合中然后进行测试以查看该对象是否存在于该集合中我已经覆盖了 eq 但在包含测试期间不会调用它我必须覆盖吗 hash 反而如果是这样我将如何实施 hash 鉴于我需要对元组列表和字典进行哈
Python：使用 string.format() 将单词大写

是否可以使用字符串格式将单词大写例如 user did such and such format user foobar 应该返回 Foobar 做了这样那样的事情请注意我很清楚 capitalize 但是这是我正在使用的代码非常
使用 OpenCV 和/或 Numpy 对两个图像进行 Alpha 混合 [重复]

这个问题在这里已经有答案了我想将一个填充纯色的半透明矩形添加到已加载的半透明 PNG 中这是我正在使用的输入图像示例该图像加载了标准cv2 IMREAD UNCHANGED标志以便完美保留 alpha 通道该输入图像存储在imag
如何在 Google App Engine 的 Python 中获取 StringProperty 的值？

如何获取 nbd Model 的值我想返回由多个字段组成的描述但我无法让它工作这是我的班级代码 class User ndb Model name ndb StringProperty email ndb StringProperty
Python GTK + webkit - 在 gtk.main() 之后插入 JavaScript

我在终端中尝试了这个一切正常但是如果我在脚本内运行这个我无法在 gtk main 之后插入 JavaScript import gtk import webkit w gtk Window b webkit WebView w add
matplotlib 中的 R 风格数据轴缓冲区

R 绘图自动设置 x 和 y 限制以在数据和轴之间留出一些空间我想知道 matplotlib 是否有办法自动执行相同的操作如果没有是否有一个好的公式或经验法则来说明 R 如何设置其轴限制在 matplotlib 中您可以通过
Pandas 连接问题：列重叠但未指定后缀

我有以下数据框 print df a mukey DI PI 0 100000 35 14 1 1000005 44 14 2 1000006 44 14 3 1000007 43 13 4 1000008 43 13 print df b
Python 的 mysqldb 晦涩文档

Python 模块 mysqldb 中有许多转义函数我不理解它们的文档而且我努力查找它们也没有发现任何结果 gt gt gt print mysql escape doc escape obj dict escape any speci
在Python中以交互方式执行多行语句

我是 Python 世界的新手这是我用 Python 编写的第一个程序我来自 R 世界所以这对我来说有点不直观当我执行时 In 15 import math import random random random math sqrt
张量流和线程

下面是来自 Tensorflow 网站的简单 mnist 教程即单层 softmax 我尝试通过多线程训练步骤对其进行扩展 from tensorflow examples tutorials mnist import input dat
reStructuredText：README.rst 未在 PyPI 上解析

我有一个托管在 Github 和 PyPI 上的 Python 项目在 Github 上 https github com sloria TextBlob blob master README rst https github com s
在 Linux 上的 Python 中使用受密码保护的 Excel 工作表

问题很简单我每周都会收到一堆受密码保护的 Excel 文件我必须解析它们并使用 Python 将某些部分写入新文件我得到了文件的密码当在 Windows 上完成此操作时处理起来很简单我只需导入 win32com 并使用 clie
在 iPython/pandas 中绘制多条线会生成多个图

我试图了解 matplotlib 的状态机模型但在尝试在单个图上绘制多条线时遇到错误据我了解以下代码应该生成包含两行的单个图 import pandas as pd import pandas io data as web aapl
具有多个主键的 SQLAlchemy 不会自动设置任何

我有一个简单的表 class test Base tablename test id Column Integer primary key True title Column String def init self title self
计算 pyspark df 列中子字符串列表的出现次数

我想计算子字符串列表的出现次数并根据 pyspark df 中包含长字符串的列创建一个列 Input ID History 1 USA UK IND DEN MAL SWE AUS 2 USA UK PAK NOR 3 NOR NZE 4
Python 导入非常慢 - Anaconda python 2.7

我的 python import 语句变得非常慢我使用 Anaconda 包在本地运行 python 2 7 导入模块后我编写的代码运行得非常快似乎只是导入需要很长时间例如我使用以下代码运行了一个 tester py 文件 imp
如何使用 os.chdir 转到减去最后一步的路径？

例如一个方法传递了一个路径作为参数这个路径可能是 C a b c d 如果我想使用 os chdir 更改为 C a b 怎么办 c 没有最后一个文件夹 os chdir 可以接受命令吗 os chdir 可以采取作为论点是的然
在 Python 中访问 argparse 的参数值

我正在尝试为我的程序设置一些简单的标志参数但无法弄清楚如何访问它们我有 argparser parser argparse ArgumentParser description Simple PostScript Interpreter
如何在Tensorflow中保存估计器以供以后使用？

我按照教程 TF Layers 指南构建卷积神经网络以下是代码 https github com tensorflow tensorflow blob r1 1 tensorflow examples tutorials layers
使用 SERVER_NAME 时出现 Flask 404

在我的 Flask 配置中我将 SERVER NAME 设置为 app example com 之类的域我这样做是因为我需要使用url for with external网址如果未设置 SERVER NAME Flask 会认为服务器

随机推荐

关于 Django 的问题：显示多对多字段

当 Django 在模板中渲染 ManyToManyField 时我似乎遇到了问题我可以让它部分工作但我不能让它按照我想要的方式正常工作首先我有一个发票模板它显示我的数据库中的发票详细信息 invoice details htm
在 Ruby 中，如果我们定义“c=(foo)”并且它返回 foo + 1，为什么它没有分配给 d = (self.c = 3)？

代码是 def c foo p hello return foo 1 end p self c 3 d self c 3 p d 它只会打印出 3 换句话说返回值 4 没有分配给d why Setter 总是返回他们的参数或正确的操作数
为什么这个应用程序被拒绝？

苹果拒绝了这个应用程序甚至在解决中心提供了很长的解释但我不确定为什么有人可以帮我翻译一下吗 2 23 我们发现您的应用程序不遵循iOS数据存储指南这是 App Store 审核指南所要求的特别是我们发现在启动和或内容下载时
研究在 tkinter 中单击按钮后返回按钮文本的方法[重复]

这个问题在这里已经有答案了我正在尝试创建一个使用此 lambda 函数单击的按钮列表 button1 config command lambda x clicked append x button1 cget text 它似乎有点工作但
如何更改企业项目的上下文路径

所以我的企业项目名称TestProject 其中包含TestProject ejb and TestProject war 所以当我运行该项目时网址是这样的locahost 8080 TestProject war 我怎样才能改变这个网址
css div之间的垂直间隙

我知道这是一个常见问题但我似乎找不到有效的解决方案我有这样的设置 div div class content area top div div class content area h1 Title h1 some other text
Kadane 的算法是贪婪算法还是优化 DP 算法？

我觉得 Kadane 算法是最大子数组问题的真正动态规划解决方案的修改版本为什么我有这样的感觉我觉得因为计算最大子数组的方法可以采取 for i 0 i
尝试先按数字排序，最后按字母排序

我正在尝试对数组进行排序我正在尝试按 itemCommodity 排序我只需要先按数字排序然后再按数字和字母排序例如 1000 A120 B330 2020年 J954 5000 应显示为 1000 2020年 5000 A120
mySQL 临时表已满

我正在尝试使用以下语法创建临时 mySQL 表并将其加载到内存中但遇到表已满错误 CREATE TEMPORARY TABLE IF NOT EXISTS tmpHistory ENGINE MEMORY SELECT FROM hi
XSLT 中的嵌套 for-each 循环不起作用

我似乎无法让这个嵌套的 for 循环正常工作我想在带有 EP 名称和其他详细信息的行中打印 EP 上的所有曲目第一个 for each 循环中的所有内容都显示正确但 for each 循环中没有任何内容可以获取曲目这是我的 XML
ruby 正则表达式查找和替换

我有以下输出 time 15 40 32 81 我想消除和这样它看起来像这样 15403281 我尝试做一个 time gsub s 但这没有用 15 40 32 81 gsub
检测 Android TextView 中的剪切

我的 Android 应用程序中有一个 TextView 它有一个固定的宽度目前它的重力为 center horitonzal 并且设置了 textSize 9sp 我从 sqlite 数据库中提取要放在此标签上的值其中一些值太大无法
POST 与 post、GET 与 get

我意识到两者都可以但其中一个比另一个更正确吗
如何证明水平列表的合理性？

我有一个水平导航栏如下所示 ul li a href About html About a li li a href Contact html Contact a li ul 我使用 CSS 删除项目符号点并使其水平 Navigation
paymentQueueRestoreCompletedTransactionsFinished：当队列中应该有交易时，返回一个空队列

这是我第一次使用 Store Kit 一切都很顺利直到我尝试恢复购买我在堆栈溢出上看过其他几篇关于类似问题的帖子但我还没有找到适合我的解决方案我的应用程序中有一个按钮可以调用 SKPaymentQueue defaultQueue
Amazon RDS Aurora 与 RDS MySQL 与 EC2 上的 MySQL 比较？

在云上设置数据库时我一直在寻找最佳实践但我仍然不清楚我们应该采用以下哪种解决方案亚马逊 RDS 极光亚马逊 RDS MySQL EC2 实例上的 MySQL 我认为 Amazon Aurora 被宣传为更好的选择但经过一些研究后
服务参考使用数组而不是列表<类型>，即使设置说使用列表

我正在使用 Visual Studio 2010 并且我有一个对我们创建的 Web 服务的服务引用我们的方法返回包含通用 List 属性的对象 public class ExampleResponse private System Col
AngularJS 密码确认 noMatch 不起作用？

我这里有这个脚本 angular module UserValidation directive validPasswordC function return require ngModel link function scope elm
在 Chrome 55 中，防止显示 HTML 5 视频的下载按钮 [重复]

这个问题在这里已经有答案了 I am getting this download button with
通配符 Snakemake 规则的预处理

我有一个 Snakemake 配方其中包含一个非常昂贵的准备步骤对于所有调用来说都很常见这是用于演示的伪规则 rule sample input name config output name npz run import somem

通配符 Snakemake 规则的预处理

通配符 Snakemake 规则的预处理 的相关文章

随机推荐

热门标签

通配符 Snakemake 规则的预处理的相关文章