Snakemake 和 pandas 语法

2023-12-19

我有一个输入文件如下

SampleName Run Read1 Read2
A run1 test/true_data/4k_R1.fq test/true_data/4k_R2.fq
A run2 test/samples/A.fastq test/samples/A2.fastq
B run1 test/samples/B.fastq test/samples/B2.fastq
C run1 test/samples/C.fastq test/samples/C5.fastq
D

所以我获取数组中的所有索引：

sample_table    = pd.read_table('samples.tsv', sep=' ', lineterminator='\n')
sample_table    = sample_table.drop_duplicates(subset='SampleName', keep='first', inplace=False)
sample_table    = sample_table.dropna()
sample_table.set_index('SampleName',inplace=True)
sample_ID=sample_table.index.values

在此刻sample_ID=['A' 'B' 'C']这就是我想要的。然后我想设置一个变量 r1 ，它将对应于每个样本的 Read2 的 Read1 和 r2 。

rule all:
    input:
        expand("test/fltr/{ID_sample}.fq", ID_sample=sample_ID)

rule send_reads:
    input:
        #Tried both way but it does not work 
        r1=sample_table.loc["{ID_sample}",'Read1']
        r2=sample_table.Read2["{ID_sample}"]
    output:
       "test/fltr/{ID_sample}{input.r1}.fq"
    shell:
       "touch {output}"

我收到错误

标签 [{ID_sample}] 不在 [索引] 中

这是语法错误还是更大的错误？

我刚刚开始使用 Snakemake，我以为我在教程之后已经理解了它，但显然我没有。

多谢，干杯

lambda可以使用函数来获取该值。

input:
    lambda wildcards, output: sample_table.Read2[wildcards.ID_sample]

另外，根据您的rule all, your output需要是test/fltr/{ID_sample}.fq。并且，您必须使用逗号分隔两个变量input.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

pandas

snakemake

Snakemake 和 pandas 语法的相关文章

为什么 pandas.to_datetime 对于非标准时间格式（例如“2014/12/31”）很慢

我有一个这种格式的 csv 文件 timestmp p 2014 12 31 00 31 01 9200 0 7 2014 12 31 00 31 12 1700 1 9 当通过阅读时pd read csv并将时间字符串转换为日期时间使用p
以矢量化方式在另一个 DataFrame 中查找包含值子集的行

如何匹配此 DataFrame 中的值source car id lat lon 0 100 10 0 15 0 1 100 12 0 10 0 2 100 09 0 08 0 3 110 23 0 12 0 4 110 18 0 32 0
在 iPython/pandas 中绘制多条线会生成多个图

我试图了解 matplotlib 的状态机模型但在尝试在单个图上绘制多条线时遇到错误据我了解以下代码应该生成包含两行的单个图 import pandas as pd import pandas io data as web aapl
用 Pandas 计算该月的最后一个星期五

我编写了这个函数来获取该月的最后一个星期四 def last thurs date date month date dt month year date dt year cal calendar monthcalendar year mon
如何使用 python-pandas 和 gensim 将数据框中的单词映射到整数 ID？

给定这样一个数据框包括项目和相应的评论文本 item id review text B2JLCNJF16 i was attracted to this B0009VEM4U great snippers 我想绘制顶部的地图5000最常用
如何按升序或降序对 Seaborn 条形图进行排序 [重复]

这个问题在这里已经有答案了 EXCEL 文件包含有关 7000 个 Apple App store 的信息如下所示这是我的代码 gt import seaborn as sns import matplotlib pyplot as p
pandas 中的滚动减法

我正在尝试做类似的事情 ff pd DataFrame uid 1 1 1 20 20 20 4 4 4 date 09 06 10 06 11 06 09 06 10 06 11 06 09 06 10 06 11 06 balance
Pandas 堆积条形图中元素的排序

我正在尝试绘制有关某个地区 5 个地区的家庭在特定行业赚取的收入比例的信息我使用 groupby 按地区对数据框中的信息进行排序 df df orig groupby District Portion of income value co
如何在 pandas 中读取并标准化以下 json？

我在 stackoverflow 中使用 pandas 看到了很多 json 读取问题但我仍然无法解决这个简单的问题 Data session id 0 X061RFWB06K9V 1 5AZ2X2A9BHH5U unix timesta
根据列 value_counts 过滤数据框（pandas）

我是第一次尝试熊猫我有一个包含两列的数据框 user id and string 每个 user id 可能有多个字符串因此会多次出现在数据帧中我想从中导出另一个数据框一个只有那些user ids列出至少有 2 个或更多string
Pandas 每周计算重复值

我有一个Dataframe包含按周分组的日期和 ID df date id 2022 02 07 1 3 5 4 2022 02 14 2 1 3 2022 02 21 9 10 1 2022 05 16 我想计算每周有多少 id 与上周重
Pandas 中的 Groupby、转置和追加？

我有一个数据框如下所示每个用户有10条记录现在我想创建一个如下所示的数据框 userid name1 name2 name10 这意味着我需要反转该列的每 10 条记录name并附加到新的数据框那么它是如何做到的呢有什么办法可
从节点列表中提取边和社区

我的数据集有超过 50k 个节点我试图从中提取可能的边缘和社区我确实尝试使用一些图形工具如 gephi cytoscape socnet nodexl 等来可视化和识别边缘和社区但节点列表对于这些工具来说太大了因此我正在尝试编写
pandas read_excel(sheet name = None) 返回字符串字典，而不是数据帧？

The pandas read excel 文档 https pandas pydata org pandas docs stable generated pandas read excel html说指定工作表名称无应该返回所有工作表
Pandas 交叉表与 Pandas 数据透视表有何不同？

两只熊猫的crosstab and pivot table函数似乎提供完全相同的功能有什么区别吗两者之间的主要区别是pivot table期望您的输入数据已经是一个 DataFrame 你将一个 DataFrame 传递给pivot t
scipy.optimize on pandas dataframe

我试图搜索它但结果很差有人可以向我解释一下如何在 Pandas DataFrame 上执行 optimize minimize 以便最小化 DataFrame 中的类别和结果列之间的错误考虑这个例子 import pandas as
将 Python Pandas DataFrame 写入 Word 文档

我正在努力创建一个使用 Pandas DataFrames 的 Python 生成的报告目前我正在使用DataFrame to string 方法但是这会作为字符串写入文件有没有办法让我实现这一目标同时将其保留为表格以便我可以使
高级描述熊猫

有没有像 pandas 那样更高级的功能通常我会继续这样 r pd DataFrame np random randn 1000 columns A r describe 我会得到一份很好的总结就像这样 A count 1000 000
类型错误：此 COM 对象无法自动执行 makepy 过程 - 请为此对象手动运行 makepy

这是什么错误回溯错误 C Users DELL PycharmProjects MyNew venv Scripts python exe C Users DELL PycharmProjects MyNew agaaaaain py T
如何获取分类数据的分组条形图

I have a big dataset with information about students And I have to build a graph of dependencies between different value

随机推荐

WriteAsync 超时

我尝试编写一个带有超时的简单异步写入代码如下所示并期望该函数在给定非常大的缓冲区和较小的 waitTime 的情况下抛出 TaskCanceledException 然而这并没有发生 WriteAsync 将阻塞很多秒直到写入完成
哪个队列与 requestAnimationFrame 关联？

今天我在接受采访时被问到这个问题我无法回答这个问题面试官说有一个特殊的队列用于 requestAnimationFrame 回调但我找不到任何这方面的信息如果 rAF 有它自己的队列那么为什么这个队列从未在任何地方被提及当我们谈
Swift：呈现主要和替代（登录/入门）流程时出现视觉故障？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有一个应用程序需要用户登录或创建帐户第一次启动应用程序时虽然一般不建议这样做但这是一个非常具体的用例此外如果他们已经登录当
有人能够在 python 中使用 poppler new_from_data 吗？

使用Python3和Poppler 我可以毫无问题地使用new from file加载文件但是new from data有问题这是显然是一个简单测试的代码因为从文件读取然后使用 new from data 没有意义因为 new fr
在分组依据查询中包含缺失的月份

我想我这里有一个艰难的人我试图按月获取订单数即使为零这是问题查询 SELECT datename month OrderDate as Month COUNT OrderNumber AS Orders FROM OrderTable
方法引用与 lambda 表达式

我想用下面示例中的方法引用替换 lambda 表达式 public class Example public static void main String args List
使用 JavaScript 的逻辑运算符压缩 if/else if 语句

我正在学习 AngularJS 试图制作一个简单的计算器并且我正在尝试压缩它if else if 陈述使用 Javascript 逻辑运算符鉴于这个例子我怎样才能减少它呢如果你不明白 scope 忽略它它基本上是一个视图因此当
在引导程序轮播中加载多个谷歌图表

我创建了一个引导程序轮播来说明我们公司的数据在这个轮播中我有引导表图片和两个谷歌图表饼图和堆积条形图如果我没有为谷歌图表保留活动类它们将无法正确加载有时图表大小会发生变化有时图例不会显示如果我使饼图处于活动状态则它可以正
Clojure 中的自动 TCO

有没有办法在 Clojure 中定义自动尾部调用优化的函数 e g defrecur fact x if x 1 1 x fact dec x 将在内部翻译为 defn fact x loop n x f 1 if n 1 f recur
HTML 服务提交表单不调用 google.script.run 函数

我有一个脚本曾经工作得很好但突然停止工作了用户从用户创建的菜单中选择一个选项该菜单将启动一个对话框 HTML 服务表单来收集两个参数这一切工作正常当用户提交表单时应执行此代码
Rails：相同两个模型之间的多个联接表

我有两个模型玩家和事件它们之间有两个连接表参与者和课程 class Event has many participants has many players through participants has many lessons
SSIS 包中 ReadUncommissed 隔离级别的解决方法

SSIS 中的 ReadUncomfilled IsolationLevel 是 Microsoft 承认的一个错误但不会修复如下所述 http connect microsoft com SQLServer feedback det
使用extend.js有什么好处？

我刚刚认识扩展 js https github com searls extend js 并且想知道使用该库是否比使用本机 JavaScript 具有附加价值让我演示一下 With 扩展 js 我会声明一个命名空间如下所示 extend
MySQL：永久设置 sql_mode

通过 MySQL 命令行客户端我尝试设置全局 mysql mode SET GLOBAL sql mode TRADITIONAL 这适用于当前会话但在我重新启动服务器后 sql mode 将返回到其默认值一个空字符串如何将 sql
Codeigniter - 使用force_download函数下载文件

我正在使用最新的 CI 我在当地工作时没有任何问题但是当我将作品转移到实时服务器时我遇到了问题当我从下载选项卡下载文件时文件将以正确的大小和格式下载但是当我打开下载的文件时例如如果是图像则图像不显示或者如果是单词则要求选
Java 不运行带参数的准备语句

我正在使用PreparedStatement 来查询我的表不幸的是我没能做到这一点我的代码很简单 PreparedStatement preparedStatement connection prepareStatement Sele
我们可以在 Cubism 上使用自定义 JSON 数据吗？

我看到了立体图它们简直太神奇了我有一个很大的 JSON 文件其中包含 1000 个条目其中包含时间戳和值整数 Cubism 可以绘制这些图吗我似乎找不到这方面的文档 Cubism 通常适用于实时数据但您可以实现一个仅从 JSO
Swift：获取字典中键的数量

对于快速数组我们可以简单地使用count属性来找出集合中有多少个元素然而我们不能对字典键做同样的事情执行此操作的唯一方法是使用 for 循环和计数器吗 var myDict String AnyObject intialize di
FFmpeg：如何将带有黑边的垂直视频转换为背景边模糊的 16:9 视频

如何使用 FFmpeg 实现这一点没有 FFmpeg 的示例 Adobe After Effects http www youtube com watch v yCOrqUA0ws4 索尼维加斯专业版 http www youtube c
Snakemake 和 pandas 语法

我有一个输入文件如下 SampleName Run Read1 Read2 A run1 test true data 4k R1 fq test true data 4k R2 fq A run2 test samples A fastq

Snakemake 和 pandas 语法

Snakemake 和 pandas 语法 的相关文章

随机推荐

热门标签

Snakemake 和 pandas 语法的相关文章