列表列中的设置操作

2024-05-08

我正在尝试做集合运算在存储在列表列中的向量之间，例如this https://stackoverflow.com/questions/38712196/text-file-to-dataframe-with-a-list-column.

DT  <- data.table(exp = c("exp1", "exp2", "exp2"), 
                  sample = c(1L, 1L, 2L), 
                  listdata = list(c(2L,5L), c(2L,3L,5L,7L), c(1L,2L,6L)))

> DT
    exp sample listdata
1: exp1      1      2,5
2: exp2      1  2,3,5,7
3: exp2      2    1,2,6

虽然很麻烦，但我可以做

DT$inc = list(setdiff(unlist(DT$listdata[2]), unlist(DT$listdata[1])))

并获取一个新的列表列，其值为c(3,7)。但是如果我尝试使用计算当前行和第一行之间的差异

DT$inc = list(list(setdiff(unlist(DT$listdata, recursive = FALSE), unlist(DT$listdata[1]))))

期待新专栏“inc”

0
c(3,7)
c(1,6)

I get c(3,7,1,6)。显然unlist将整个列表列压平在一起。知道发生了什么事吗？

我也在学习 dplyr 和 data.table。因此，如果您可以使用其中之一提供解决方案，那将会非常有帮助。

[...]我尝试计算当前行和第一行之间的差异

嗯，你可以做...

DT[, inc := .(Map(setdiff, listdata, listdata[1L]))]

#     exp sample listdata inc
# 1: exp1      1      2,5    
# 2: exp2      1  2,3,5,7 3,7
# 3: exp2      2    1,2,6 1,6

但我认为不使用列表列要好得多。

不使用列表列可能看起来像......

DT[, r := .I]
DT2 = DT[,c(.SD[rep(.I, lengths(listdata))], .(v = unlist(listdata))), .SDcols=!"listdata"]

#     exp sample r v
# 1: exp1      1 1 2
# 2: exp1      1 1 5
# 3: exp2      1 2 2
# 4: exp2      1 2 3
# 5: exp2      1 2 5
# 6: exp2      1 2 7
# 7: exp2      2 3 1
# 8: exp2      2 3 2
# 9: exp2      2 3 6

然后我们就可以使用这个数据集，并且可以做

DT2[!DT2[r==1L], on="v"]

#     exp sample r v
# 1: exp2      1 2 3
# 2: exp2      1 2 7
# 3: exp2      2 3 1
# 4: exp2      2 3 6

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

list

dataTable

dplyr

列表列中的设置操作的相关文章

如何优化 R 中的 sapply 来计算数据帧上的运行总计

我在 R 中编写了一个函数来按月份计算累积总数但随着数据集变大我的方法的执行时间呈指数增长我是一名 R 程序员新手你能帮我提高效率吗该函数以及我调用该函数的方式 accumulate lt function recordnum d
创建序列组合

我正在尝试解决以下问题考虑 5 个简单序列 0 100 100 0 rep 0 101 rep 50 101 rep 100 101 我需要 3 个数字变量的集合它们的所有组合都具有上述序列由于有 5 个序列和 3 个变量因此可以有
for 循环与 cor.test 在许多类别上

我正在尝试在 R 中编写一个循环它将循环遍历 3 个不同的物种以计算两个连续变量 Redness 和 VarNormAbund 之间的相关性我的循环正在运行但 3 个物种中每一个的输出都是相同的这让我认为循环卡在第一个物种上 co
Sql批量复制截断小数

当我使用批量复制将十进制值从 C DataTable 插入 Sql Server 2005 时值会被截断而不是四舍五入 DataTable 中的数据类型为 Decimal 数据库中的数据类型为Decimal 19 3 数据表中的值为 1
使用 dplyr 的 select 引用变量名[重复]

这个问题在这里已经有答案了通常我会想要选择变量的子集其中该子集是函数的结果在这个简单的例子中我首先获取与宽度特征相关的所有变量名称 library dplyr library magrittr data iris width var
在 ggplot 中过滤管道 df

我正在使用 dplyr 管道来清理我的 df 然后直接输入到 ggplot 中但是我只想一次只绘制一组因此我需要过滤到该组问题是我希望比例保持不变就好像所有群体都存在一样是否可以在 ggplot 命令中进一步过滤管道 df 例
在 R 中收集多组列[重复]

这个问题在这里已经有答案了我有一个宽数据框需要将其收集或融化成一个高数据框我遇到的问题是我有几组列需要保持关联分组我每个表单提交有 2 个用户每个用户有 3 列数据我想将这 6 列基本上以 3 组的形式堆叠起来以便每个用户都
求解非线性方程组

我正在尝试求解以下四个方程组我尝试过使用 rootSolve 包但似乎我无法通过这种方式找到解决方案我正在使用的代码如下 model lt function x F1 lt sqrt x 1 2 x 3 2 1 F2 lt sqrt
R - 如何为数据范围内的缺失值绘制条形图零点？

假设我对 1 到 10 之间的整数的 200 个点有 10 个观察值 mysample sample rep seq 1 10 20 10 我想用条形图绘制它 barplot table mysample barplot https i s
dplyr：同一公式中全年每日值的总和以及特定每日值的总和

Using df数据框 date lt rep as Date seq as Date 2003 01 01 as Date 2005 12 31 by 1 format Y m d 9 site lt c rep Site 1 3 109
将数据框分成相等的部分

我有一个示例数据框 df lt data frame x 1 112 y runif 112 有没有办法打印数据框列表其中列表的第一部分包含行1 10 第二11 20等等直到最后 111 112 你可以使用split with rep
R markdown PDF：为测验者暂时隐藏剧透代码

我正在使用 R markdown 创建 PDF R 课程我想插入一个如下所示的测验 output pdf document What is the class of the following R object 1 pi r class
在 JSF 中动态创建表列

我正在开发仪表板应用程序我必须检索一组记录并显示在动态表框中页框长度是固定的现在可以初始化列和行它应该看起来像这个示例目前我正在使用数据表来显示但它将所有数据打印在一列中我如何将我的代码更改为上述模式
rollapply用于累积窗口[关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案我试图弄清楚如何在数据窗口上使用 R rollapply 该窗口从数据的开头累积扩展在时间 t 滚动应用应使用 1 t
循环 2 个列表，重复最短的列表，直到最长的列表结束 [重复]

这个问题在这里已经有答案了我确信有一种简单而明显的方法可以做到这一点但我一直在谷歌搜索和阅读文档但我找不到任何东西这就是我想要实现的目标 la a1 a2 a3 a4 lb b1 b2 result a1 b1 a2 b2 a3 b
R 的 read.csv 在第一列名称前面加上垃圾文本[重复]

这个问题在这里已经有答案了我已将数据从 SQL Server Management Studio 中的结果网格导出到 csv 文件 csv 文件看起来正确但是当我使用 read csv 将数据读入 R 数据帧时第一个列名称前面带有如
如何在 R 中为所有plot.default、plot 或lines 调用设置默认颜色

为了简化我的日常 R 交互我想为所有绘图设置默认颜色例如假设我想要用红线绘制所有绘图例如在 gnuplot 中到目前为止这是我的 Rprofile 的片段 setHook packageEvent grDevices onLoa
如何在 R 中“推断”面板数据的值？

我有一个带有 NA 值的面板数据如下所示 uid year month day value 1 1 2016 8 1 NA 2 1 2016 8 2 NA 3 1 2016 8 3 30 4 1 2016 8 4 NA 5 1 2016
R：中断 for 循环

你能确认下一个break是否取消了内部for循环吗 for out in 1 n old id velho lt old table df id out for in in 1 n id novo lt new table df ID in
为什么在 data.frame 中预先指定类型会比较慢？

我预先分配了一个大 data frame 以便稍后填写我通常这样做NA是这样的 n lt 1e6 a lt data frame c1 1 n c2 NA c3 NA 我想知道如果我预先指定数据类型是否会让事情变得更快所以我测试了 f1

随机推荐

严格标准：在 wordpress/wp-includes/class-oembed.php 第 116 行中，仅应通过引用传递变量

我已经查看了很多类似的问题但关于我的代码我没有得到它错误 Strict Standards Only variables should be passed by reference in wordpress wp includes c
二维数组中的寻路

假设我有这个二维数组地图 0 0 0 0 7 1 1 1 1 1 1 1 1 0 7 7 7 7 1 1 1 24 1 1 1 1 0 7 24 24 24 24 24 24 24 1 1 3 1 0 7 23 23 23 23 23 23
Flask：缓存静态文件（.js、.css）

我真的找不到任何这方面的资源那么如何将视图函数的缓存与静态文件即 css js 分开我想将静态对象缓存一周另一方面我只需要缓存函数视图几分钟当我执行以下操作时 from flask ext cache import Cach
使用Web蓝牙API时找不到移动设备

我正在学习 Web 蓝牙 API 使用 google 开发控制台我无法找到我的移动设备还尝试了 github 上提供的演示 https github com WebBluetoothCG demos https github com W
msmq - 触发器 - 独立可执行调用不起作用

过去几天我一直在尝试使用 msmq 触发器来调用 exe 文件它永远不会被调用这些是我遵循的步骤创建了一个提及队列路径并检查了查看的触发器启用选中创建了一个不带任何条件的规则以便每当获得新消息时都会触发触发器并选择提到独立可
无法触发我的活动

第一次加载页面时 IsPostback 我在代码中创建一个按钮并将其添加到我的页面然后向单击事件添加一个事件处理程序但是当单击按钮时页面重新加载后我的事件处理程序不会触发谁能解释为什么 Brad 你的答案不完整他很可能在页面生
如何在 Visual Studio 2015 中为多个解决方案和项目设置单个 Nuget 包文件夹

我们正在 Visual Studio 2015 中开发多个解决方案这些解决方案共享一些需要 nuget 包的核心项目当从一个解决方案添加 nuget 包并随后由另一解决方案打开时无法解析 nuget 引用文件夹结构如下 Codeba
当应用程序处于后台时，phonegap-plugin-push on("notification") 事件不会触发

我正在 Ionic2 中使用以下插件进行推送通知 http ionicframework com docs native push http ionicframework com docs native push 预期行为当应用程序关闭并
Spring Boot 是否支持服务器名称指示（SNI）？

Spring Boot 是否支持服务器名称指示 SNI 具体来说运行嵌入式 Tomcat 服务器并打包为可执行 jar 文件的 Spring Boot 2 2 2 RELEASE 应用程序是否可以根据传入请求的主机名支持多个 SSL 证书
元素特定区域的背景颜色

我想要实现的是将悬停效果放在光标的位置上像这样的东西 https drmportal com https drmportal com 这是一个小提琴 https jsfiddle net onnmwyhd https jsfiddle n
连接到 VPN 时 HttpClient.GetAsync 超时

当系统不使用 VPN 时 C 4 5 2 框架 HttpClient GetAsync 方法在 Windows 10 上运行良好连接 VPN 后对同一地址的 HttpClient GetAsync 调用只会阻塞直到超时 Edge 和
为什么 S3 上的压缩文件返回 403 Forbidden 错误？

我正在使用 django compressor 和 django storages 在 S3 上提供我的压缩文件使用以下说明 http django compressor readthedocs org en latest remote
C++ 模板静态成员实例化

include
詹金斯：${BUILD_LOG, maxLines, escapeHtml} 不起作用

我正在尝试使用 BUILD LOG maxLines escapeHtml 如下所述如何从 BUILD LOG 变量中获取最后 20 行 https stackoverflow com questions 16089096 how can
如何将推送的分支复制到另一个目录？

我有一个分支叫master 生产另一个称为development 当我从 master 推送提交时 post receive 挂钩执行 git work tree var www mywebsite com git dir var rep
Java中的String为什么是不可变的对象，但我在创建一个对象后仍然可以更改它的值？ [复制]

这个问题在这里已经有答案了如果我可以创建一个字符串并给它一个值这怎么可能呢然后我可以像这样简单地覆盖它的值 String a abc a def 我怎么可能改变的值a 我一定在这里遗漏了一些东西我知道每当创建 String 对象时
实体框架将本地数据添加到数据库中的列表

我对实体框架相当陌生我正在使用此方法来查询我的数据库 var context new StudioEntities var results context tblStudios Select u gt new u Standort u N
现在 JavaScript 的无限循环会导致浏览器崩溃吗？

我正在学习 JavaScript 对编程很陌生碰巧遇到了这些无限循环据说这些循环会永远持续下去并使浏览器崩溃但是当我用这些代码创建一个循环时 i 0 while i lt 10 document write i 浏览器只是继续加载它
Netflix Archaius 动态配置

我正在将 Hystrix 集成到现有项目中并且希望从 xml 文件中读取配置值而不是使用配置管理器提供配置属性当 xml 文件中的值更新时我希望 Hystrix 配置在运行时更新这是我遵循的指南 https github com
列表列中的设置操作

我正在尝试做集合运算在存储在列表列中的向量之间例如this https stackoverflow com questions 38712196 text file to dataframe with a list column DT l

列表列中的设置操作

列表列中的设置操作 的相关文章

随机推荐

热门标签

列表列中的设置操作的相关文章