cSplit 库（splitstackshape）总是删除该列

2024-02-20

我正在寻找一种通过分隔符拆分列内容并将表格转换为长格式的方法。我发现cSplit来自splitstackshape包，它几乎就是我想要的。

现在的问题是drop选项。我希望以某种方式复制我的拆分列，但这并没有发生。我做错了吗？有人遇到过这个问题吗？

我不确定我是否做错了什么，但是drop = FALSE选项在我的情况下不起作用。

这是一个例子：

library(splitstackshape)
jnk <- data.table(a = '1,2,3,4,5', b = 5)
jnk
#            a b
# 1: 1,2,3,4,5 5

cSplit(jnk, 'a', ',', 'long', drop = FALSE)
#    a b
# 1: 1 5
# 2: 2 5
# 3: 3 5
# 4: 4 5
# 5: 5 5

我所期望的是这样的：

cSplit(jnk, 'a', ',', 'long', drop = FALSE)
#    a b    a.orig
# 1: 1 5 1,2,3,4,5
# 2: 2 5 1,2,3,4,5
# 3: 3 5 1,2,3,4,5
# 4: 4 5 1,2,3,4,5
# 5: 5 5 1,2,3,4,5

我使用的是1.4.2版本

“长”格式使用以下方式修改列list(unlist(...))在“data.table”中，分配为:=。因此，如果drop使用时，您将拆分该列，然后将其删除！

我会尝试在文档中明确说明drop仅适用于wide格式，或添加message如果用户尝试使用drop以长格式。随意地提交 FR 或提交 PR https://github.com/mrdwab/splitstackshape/issues.

解决方法是分配另一列（例如“a_orig”），然后进行拆分：

jnk <- data.table(a=c('1,2,3,4,5','1,2,3','2,3'),b=c(5,4,3))
cSplit(jnk[, a_orig := a], "a", ",", "long")
#     a b    a_orig
#  1: 1 5 1,2,3,4,5
#  2: 2 5 1,2,3,4,5
#  3: 3 5 1,2,3,4,5
#  4: 4 5 1,2,3,4,5
#  5: 5 5 1,2,3,4,5
#  6: 1 4     1,2,3
#  7: 2 4     1,2,3
#  8: 3 4     1,2,3
#  9: 2 3       2,3
# 10: 3 3       2,3

我还没有进行广泛的测试，但可能的解决方法是：

cSplit2 <- function(indt, splitCols, sep = ",", direction = "wide", 
                    fixed = TRUE, drop = TRUE, stripWhite = TRUE, 
                    makeEqual = NULL, type.convert = TRUE) {
  if (direction == "long" & !drop) {
    indt <- as.data.table(indt)
    indt[, `:=`(eval(paste(splitCols, "orig", sep = "_")),
                lapply(splitCols, function(x) indt[[x]]))]
  }
  cSplit(indt, splitCols, sep, direction, fixed, drop, stripWhite, 
         makeEqual, type.convert)
}

基本思想是仅在以下情况下更改输入数据集：direction == "wide" and drop = FALSE。这与您的想法类似，但可以possibly是集成到实际包中的解决方案，在某个地方line 94 https://github.com/mrdwab/splitstackshape/blob/master/R/cSplit.R#L94。在这种情况下，只有indt[, `:=`(eval(paste(splitCols, "orig", sep = "_")), lapply(splitCols, function(x) indt[[x]]))]部分应该是必要的。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

splitstackshape

cSplit 库（splitstackshape）总是删除该列的相关文章

如何从 data.frame 中删除列？

不是你怎么但更多的是你怎么如果有人给你一个包含 200 列的文件并且你想将其减少到分析所需的少数列你会如何做呢一种解决方案是否比另一种解决方案更有优势假设我们有一个包含列 col1 col2 到 col200 的数据框如果
有没有一种简单的方法可以在 R 的 igraph 中按度数对网络节点进行着色？

使用igraphR 包我想按度数对网络节点进行着色颜色应代表渐变例如从蓝色到红色或从黄色到红色从网络中观察到的最低程度到最高程度我找到了一个可行的解决方案 https stackoverflow com questions 40
合并的 xts 对象未对齐

请尝试以下代码 library quantmod getSymbols SPY from 1950 01 01 SPY lt to monthly SPY temp lt xts Cl SPY index SPY 您将获得一个xts具有相同
删除第一次出现某个值后的行

我有以下 df df lt data frame var1 c 1 2 2 3 4 5 5 6 7 8 9 var2 c a b c d e f g h i j k 我想在达到前 5 var1 后进行过滤所以结果应该是 var1 var2
ggplot 中的条形图，每组有不同数量的条形图

我的数据集如下所示 DSET lt data frame cbind c rep V1 3 rep V2 3 V3 c rep c X1 X2 X3 2 X1 c rep 1 7 names DSET lt c A B C DSET 3 l
在 R data.table 中计算时间增量

我有一个篮球运动员数据的数据表其中包括每场比赛和多名球员的比赛日期我想创建一个列来计算自上一场比赛以来的天数我在 R 中使用 data table 包 PLAYERID GAME DATE 1 2989 2014 01 1 2 298
如何检查向量是否是单个 NA 值，没有长度警告且没有抑制

我有一个功能NA作为默认值但如果没有NA应该是一个不限于大小 1 的字符向量我有一个检查来验证这些但是is na当向量是字符向量时产生标准警告length大于1 so function lt function x NA if is n
计算横截面积作为高度的函数

我试图弄清楚如何计算不同水位的河流横截面的充满水的面积对于横截面我有 5 m 宽河流上每 25 cm 的深度并且可以根据之前很好回答的问题来计算面积计算不同高度的横截面积 https stackoverflow com questio
if(interactive()) 是否相当于 Python 中的“if __name__ == ”__main__“: main()”？

我希望 R 脚本有一个 main 函数可以在交互模式下执行但在获取文件时不应执行 main 函数已经有一个关于这个的问题了 https stackoverflow com questions 2968220 is there an r
写入抓取数据的 csv 文件时如何拆分项目名称

我有兴趣使用 R 从网上抓取的数据创建 csv 或类似的 Excel 兼容文件到目前为止我通过执行以下操作来存储数据 require textreadr spiegel lt read html http www spiegel de
ggplot2 geom_function 可以跨 arg 值进行分面吗？

我想通过分面 geom function 创建 ggplot2 图以便函数的参数在网格中变化例如像这样的东西 my function lt function x par if par 1 return sin x else return
连接路径的函数？

是否有现有的函数来连接路径我知道实施起来并不困难但仍然除了照顾尾随 or 我需要注意正确的操作系统路径格式检测即我们是否编写C dir file or dir file 正如我所说我相信我知道如何实施它问题是我应该这样做吗现
如何从数据框中按降序获取前n家公司

我正在尝试从数据框中获取排名前 n 的公司下面是我的代码 data Forbes2000 package HSAUR sort Forbes2000 profits decreasing TRUE 现在我想从这个排序向量中获取前 50 个
R闪亮：基于checkboxgroupinput的子集数据

我想根据复选框输入动态选择的列对数据进行子集有什么方法可以使我的输入文件在我的代码中全局可用以便可以方便地进行进一步的操作以下是我的代码 Server R library shiny shinyServer function inpu
为什么在 R 中绘图时，hovertemplate 无法正确显示某些数据点

mydat2 lt data frame subject c math english chemistry score c 80 50 65 class c A B A count c 50 60 70 library plotly plo
ggplot2 中的颜色和填充参数有什么区别？

ggmap location geom density 2d aes long lat df geom point aes long lat color special alpha 0 5 data df 当我更改填充颜色时我看不出有什么
R：igraph、社区检测、edge. Betweenness 方法、统计/列出每个社区的成员？

我有一个相对较大的图表其中顶点 524 边 1125 是现实世界的交易边是有向的并且具有权重包含是可选的我正在尝试调查图中的各个社区并且本质上需要一种方法计算所有可能的社区计算最佳社区数量返回每个最佳社区的成员成员数量
省略 RColorBrewer 调色板上较亮的颜色以在 ggplot2 中使用

我想在 RColorBrewer 的 Oranges 调色板中使用较深的颜色以便在我的 ggplot 条形图中使用然而我却做不到帮助下面是示例代码 my palette brewer pal n 9 Oranges 4 9 Bar
当我添加形状时，分组哑铃图变得不稳定

我有以下数据显示白人与黑人在各个领域的一致性百分比我想创建一个分组哑铃图其中国家值和州值彼此相邻以便于比较 Domain c A B C D E F G A B C D E F G A B C D E F G A B C D E F
二部图匹配以匹配两个集合

我是新手igraphR 中的包我有两套A and B 每个都有N顶点 A1 A2 AN and B1 B2 BN 每个元素之间都有一个边缘A对每一个元素B 我有一个函数fWgt Ai Bj 返回之间的边的权重Ai and Bj 我一直在尝

随机推荐

我如何显示提交做了什么？

我知道的一个愚蠢的方法是 git diff commit number1 commit number2 有没有更好的办法我的意思是我想知道 commit1 本身我不想在它之前添加 commit2 作为参数 git show
将 WPF 控件设置为扩展以填充可用空间，仅此而已

如何设置 WPF 控件来填充其父级容器中的可用空间但不展开父级以下代码片段描述了我正在尝试的布局我想要Grid伸展以适应Expander 我想要ListBox只为了填补Grid 我想要ListBox的滚动条出现时Grid太小无法显示
如何在 Airflow 2.x 中将 XComArg 转换为字符串值？

Code from airflow models import BaseOperator from airflow utils decorators import apply defaults from airflow providers
逻辑：tr_rev_ Correct 的辅助引理

在逻辑章节中介绍了反向列表函数的尾递归版本我们需要证明它可以正确工作 Fixpoint rev append X l1 l2 list X list X match l1 with gt l2 x l1 gt rev append l1
.NET Compact Framework 3.5 上是否提供像 AutoMapper 这样的映射库？

是否有人在研究 AutoMapper 的 NET Compact Framework 端口或者是否有任何类似的 NET Compact Framework 映射库你可以建立在奥姆地图绘制器 https stackoverflow com
如何删除 Scrapy Spider 数据中的空白

我正在用 Scrapy 编写我的第一个蜘蛛并尝试遵循文档我已经实现了 ItemLoaders 蜘蛛提取数据但数据包含许多行返回我尝试了很多方法来删除它们但似乎没有任何效果 Replace escape chars 实用程序应该可以工
BigInteger 时间最优化的乘法

你好我想以最及时的优化方式乘以 2 个大整数我目前正在使用 karatsuba 算法任何人都可以建议更优化的方法或算法来做到这一点 Thanks public static BigInteger karatsuba BigIntege
Google Cloud Natural Language API 的 IAM 角色

我想将 Google Cloud Natural Language API 与其 Node js 库一起使用对于身份验证我使用建议的服务帐户docs https cloud google com natural language doc
prepend 和appendchild 之间的区别

我在列表中插入了一个新行这是我的代码 function newToDo var newTODoList document getElementById toDoListInput var newLine document createEl
更改 Django 视图中的时间格式

importdatetime in my Django 视图以节省时间database and now datetime datetime now 当我saving它在数据库中的价值returns就像是 2013 04 28 22 54 3
多个 Google 自动完成和地点搜索问题

我需要一些有关 Google 地图 API 以及使用自动完成和地址完成的帮助这是目前我的代码 JS function fillInAddress show console log show var place autocomplete g
Python在同一文件夹中找不到模块

我的 python 不知怎的在同一目录中找不到任何模块我究竟做错了什么 python2 7 所以我有一个目录 2014 07 13 test 其中有两个文件 test py hello py 哪里你好 py usr local bin p
在视图控制器之间传递数据

我是 iOS 和 Objective C 的新手MVC https en wikipedia org wiki Model E2 80 93view E2 80 93controller范式我坚持以下几点我有一个充当数据输入表单的视图
如何使 C# .NET CF 程序的 AssemblyInfo 版本传播到资源管理器属性窗口？

看起来如果您编译 Visual Studio 解决方案并在 AssemblyInfo cs 文件中包含版本号则应该传播到 Windows 资源管理器属性对话框这样某人只需右键单击 exe 并单击属性即可查看版本号 Visual
无法从用法推断 SelectMany [重复]

这个问题在这里已经有答案了当我尝试编译代码时出现以下错误方法的类型参数 System Linq Enumerable SelectMany System Collections Generic IEnumerable 系统 Func g
PHP 中使用 pthreads 的 Worker 和 Pool

我目前正在学习 PHP 中的多线程我已经了解多线程的基础知识例如创建线程并将多个线程一起运行但我仍然对 Worker 和 Pool 感到困惑目前我有这个脚本
Subversion 在存储大量二进制文件方面有多好？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我正在寻找一个地方来放置几 GB 的文档主要是 doc and xls 我的团队已经设置了一个 Subversion 服务器来管理我们创建的文
使用模拟器测试 AdMob 时出现“E/Ads：等待未来时出错”错误

我按照所有必需的步骤在模拟器上测试 AdMob 但日志中出现以下错误 E Ads Error waiting for future java util concurrent ExecutionException java util conc
如何解决“node_modules为空”？

使用时ng serve on my local 错误是 node modules 为空已经检查过npm install g angular cli 我认为我的安装存在一些问题node npm or 角度 cli 但我无法得到正确的理由 N
cSplit 库（splitstackshape）总是删除该列

我正在寻找一种通过分隔符拆分列内容并将表格转换为长格式的方法我发现cSplit来自splitstackshape包它几乎就是我想要的现在的问题是drop选项我希望以某种方式复制我的拆分列但这并没有发生我做错了吗有人遇到过这个问

cSplit 库（splitstackshape）总是删除该列

cSplit 库（splitstackshape）总是删除该列 的相关文章

随机推荐

热门标签

cSplit 库（splitstackshape）总是删除该列的相关文章