str在 data.frame 中按行分割并按列分配结果

2024-04-12

所以我有数据框

dat = data.frame(x = c('Sir Lancelot the Brave', 'King Arthur',  
                       'The Black Knight', 'The Rabbit'), stringsAsFactors=F)

> dat
                       x
1 Sir Lancelot the Brave
2            King Arthur
3       The Black Knight
4             The Rabbit

我想将它转换成数据框

> dat2
                       x    1            2       3      4
1 Sir Lancelot the Brave    Sir   Lancelot     the  Brave
2            King Arthur    King    Arthur
3       The Black Knight    The      Black  Knight 
4             The Rabbit    The     Rabbit

strsplit 以列表形式返回数据

sbt <- strsplit(dat$x, " ")
> sbt
[[1]]
[1] "Sir"      "Lancelot" "the"      "Brave"   

[[2]]
[1] "King"   "Arthur"

[[3]]
[1] "The"    "Black"  "Knight"

[[4]]
[1] "The"    "Rabbit"

并且 as.data.table 不会在应有的位置创建 NULL 值，而是重复值

> t(as.data.table(sbt))
   [,1]   [,2]       [,3]     [,4]    
V1 "Sir"  "Lancelot" "the"    "Brave" 
V2 "King" "Arthur"   "King"   "Arthur"
V3 "The"  "Black"    "Knight" "The"   
V4 "The"  "Rabbit"   "The"    "Rabbit"

我想我真的想要 as.data.table(x, Repeat=FALSE) 的参数，否则我怎样才能完成这项工作？

我知道这是一个老问题，但我想我会分享两个额外的选项。

Option 1

concat.split我的“splitstackshape”包正是为此类事情而设计的。

library(splitstackshape)
concat.split(dat, "x", " ")
#                        x  x_1      x_2    x_3   x_4
# 1 Sir Lancelot the Brave  Sir Lancelot    the Brave
# 2            King Arthur King   Arthur             
# 3       The Black Knight  The    Black Knight      
# 4             The Rabbit  The   Rabbit

Option 2

data.table最近（我相信从版本 1.8.11 开始）对其武器库进行了一些补充，特别是在本例中dcast.data.table。要使用它，unlist分割数据（如@mnel的答案中所做的那样），使用创建一个“时间”变量.N（每行有多少个新值），并使用dcast.data.table将数据转换为您正在寻找的形式。

library(data.table)
library(reshape2)
packageVersion("data.table")
# [1] ‘1.8.11’

DT <- data.table(dat)
S1 <- DT[, list(X = unlist(strsplit(x, " "))), by = seq_len(nrow(DT))]
S1[, Time := sequence(.N), by = seq_len]
dcast.data.table(S1, seq_len ~ Time, value.var="X")
#    seq_len    1        2      3     4
# 1:       1  Sir Lancelot    the Brave
# 2:       2 King   Arthur     NA    NA
# 3:       3  The    Black Knight    NA
# 4:       4  The   Rabbit     NA    NA

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dataTable

strsplit

str在 data.frame 中按行分割并按列分配结果的相关文章

聚合日期时间以总结在特定条件下花费的时间

我很困惑我应该如何继续我下面有一些虚拟数据 Date lt as POSIXct c 2018 03 20 11 52 25 2018 03 22 12 01 44 2018 03 20 12 05 25 2018 03 20 12 10
stat_function 从函数生成平线

我有以下代码 library ggplot2 f lt function x if x gt 2 1 x 0 3 else 0 graph lt ggplot data frame x c 0 10 aes x graph lt graph
在函数中使用 quit/q 会导致 RStudio 出现致命错误

更多的是好奇但当你使用时q or quit在 R studio 内的函数内部它会导致致命错误如下所示但 rgui 中的相同函数会导致 R 像往常一样停止并且仅使用q 在 RStudio 中按预期关闭 R 为什么q在函数中导致 RS
R闪亮：使用闪亮的JS从数据表中获取信息

我想读出所有列名称以及它们在数据表中显示的顺序由于不同的原因我无法使用 stateSave 等选项我对 JS 没有什么把握但我确信用它可以完成所以我需要你帮助我我尝试过类似的代码片段 datatable data callbac
改进R中从google获取股票新闻数据的功能

我已经编写了一个函数来从 Google 获取和解析给定股票代码的新闻数据但我确信有一些方法可以改进它对于初学者来说我的函数返回一个 GMT 时区的对象而不是用户当前的时区如果传递的数字大于 299 它就会失败可能是因为 goog
R data.table 多个条件连接

我设计了一种解决方案用于从两个单独数据表的多个列中查找值并添加基于新列的值计算多个条件比较代码如下它涉及在计算两个表中的值时使用 data table 和联接但是这些表没有联接在我正在比较的列上因此我怀疑我可能无法获得 da
根据 R 数据框中的名称对列进行平均

我想知道是否有一种有效的方法来获取每组的平均值类似命名的列谁的名字结尾为 1S and 2S ex ex1S ex2S at time 1并取每组的平均值类似命名的列谁的名字结尾为 1C or 2C ex ex1C ex2C at time
如何在R中匹配具有相同主键的两个表中的数据

我有两个表其中包含有关人员的数据 df1 lt data frame id c 113 202 377 288 359 name c Alex Silvia Peter Jack Jonny 这为我提供了 id name 1 113 Al
R参考类问题

我正在尝试在 R 中创建一个简单的参考类这是我的代码 R 初学者 MyClass lt setRefClass MyClass fields list a numeric b numeric methods list initialize
R Leaflet Legend：colorBin-删除中断之间的小数

我正在使用 Leaflet 库在 R 中创建交互式 HTML 地图传说中采用的是colorBin用于创建将数据分为 6 个类别的方法使用min values and max values 我已经定义了美国社区调查收入数据的特定范围可能落
R data.table fwrite 到 fread 空间分隔符并清空

我在使用 fread 以作为分隔符和散布的空白值时遇到问题例如这个 dt lt data table 1 5 1 5 1 5 make a simple table dt 3 V2 NA add a blank in the midd
如何确定 R 包的作者？

如何确定包的作者是谁鉴于我们拥有这个广泛使用的代码库我认为参考我在分析中使用的软件是合适的有没有办法以编程方式检索作者和任何其他相关信息在伪代码中我想执行以下操作 references base 我怎样才能做到这一点为了能够引用
如何绘制每条线之间具有特定距离的图形

实际上我尝试绘制一个图形但它将所有列线放在一起并显示因此它不具有代表性我尝试制作模拟数据并向您展示我如何绘制它并向您展示我想要的内容我不知道如何制作像下面所示的示例的数据但我在这里做了什么 set seed 1 M lt
如何在 R 中绘制一列与其余列的关系图

我有一个数据集其中 1 是时间接下来的 14 个是幅度我想在一张图表上散布所有大小与时间的关系其中每个不同的列都是网格化的分层在另一个之上我想使用原始数据来制作这些图表并单独制作它们但只想执行此过程一次数据集A 唯一的自变
更快的 %in% 运算符

The 快速匹配 https cran r project org web packages fastmatch index html包实现了更快的版本match对于重复匹配例如在循环中 set seed 1 library fastma
按特定样本前缀对列名称向量进行子集化

假设我有一个如下所示的数据框 ca01 lt c 1 10 ca02 lt c 2 11 ca03 lt c 3 12 stuff 1 lt rep test 10 other lt rep 9 10 data lt data frame
R - 与 SpatialPolygonsDataFrame 对象相交的 SpatialLinesDataFrame 列表的嵌套循环

我有一系列需要完成的步骤SpatialLinesDataFrame 此处的线基于对象与多特征中各个特征的关系SpatialPolygonsDataFrame 多边形对象简而言之每个线列表元素源自单个面要素内部并且可能会也可能不会
RStudio 如何确定控制台宽度，为什么它似乎总是出错？

我刚刚发现wid lt options width在 RStudio 中它似乎是我日常控制台使用中令人烦恼的根源或者更确切地说更接近根源我应该先说一下我目前使用的是 R 3 2 2 RStudio 0 99 491 Linux M
如何绘制堆积比例图？

我有一个数据框 x lt data frame id letters 1 3 val0 1 3 val1 4 6 val2 7 9 id val0 val1 val2 1 a 1 4 7 2 b 2 5 8 3 c 3 6 9 我想绘制一个
如何绘制大时间序列（数千次给药次数/药物剂量）？

我正在尝试绘制医院中如何开出单一药物的图解在这个虚拟数据库中我在 2017 年 1 月 1 日之后遇到了 1000 名患者绘图的目的是了解该药物的给药模式在接近入院出院或患者住院期间是否更频繁高剂量给药 Get random d

随机推荐

自定义强类型 BindingSource 项目添加

我想自定义添加一个新项目到BindingSource 均为强类型如以下 MSDN 文章所述如何使用 Windows 窗体 BindingSource 自定义项目添加 http msdn microsoft com en us libr
CSS：固定大小的div，固定垂直位置并水平居中？

在CSS中是否可以有一个 div 它既水平居中又固定在浏览器底部我正在为内部 div 使用设置的宽度和高度我试过放一个divposition relative在固定的外部 div 内垂直对齐内容但外部 div 不居中我又回到了原
为什么Kotlin for Android Developers（书）需要再次添加扩展parseList？

我知道 Anko 提供了 parseSingle parseOpt 和 parseList 函数我不明白为什么 Android 开发者书的代码需要再次设计扩展 parseList 你可以告诉我吗谢谢 https github com
角度 4 |如何在点击时动态注入指令？

美好的一天如何实现在单击按钮时注入自定义指令请参阅下面我的代码
nvm安装了node和npm，安装本地browserify时出现符号链接问题

今天我已经安装了最新版本node通过nvm在 Linux Mint Ubuntu 13 10 上感谢 nvm 我现在不必将 sudo 命令与 npm 一起使用这已经解决了一些软件包的问题 node v v0 10 29 npm v 1
achartengine - 无法弄清楚如何使用日期作为 x 轴 - 我保存的文件是空的

我有一个活动我从编辑文本中获取输入并将其存储在列表中我还将当前日期存储在列表中然后我按保存按钮保存上述内容第二天用户再输入一些数据并保存依此类推我想制作一个 x 轴日期格式和 y 轴用户输入的值的图在一项活动中我有 Str
NSXMLParser 可以用来解析 HTML [重复]

这个问题在这里已经有答案了可能的重复使用 NSXMLParser 解析 HTML https stackoverflow com questions 8866376 using an nsxmlparser to parse html
Xcode：复制标头：公共、私有、项目？

我正在构建一个 Cocoa Touch 静态库我应该如何决定是否将头文件复制为公共私有或项目 Public 该界面已最终确定可供产品的客户使用公共标头作为可读源代码包含在产品中不受限制 Private 该界面不适用于您的客户或者
std::mutex 会创建栅栏吗？

如果我锁定一个std mutex我总会得到一个记忆栅栏吗我不确定这是否暗示或强迫你获得栅栏 Update 根据 RMF 的评论找到了这个参考资料多线程编程和内存可见性 http en wikipedia org wiki Memory
如何深度复制混有特征的类

这是一些示例 scala 代码 abstract class A val x Any abstract def copy A class b i Int extends A i override def copy new B x class
python中，什么时候可以省略self？

下面定义的代码Duck类由以下组合而成Bill类和Tail班级我的问题是至于方法about inside Duck类定义为什么可以写bill description and tail length Is self这里省略了如果是我什
neo4j cypher节点之间的多重关系

例如 a r gt b 两个节点之间存在多个r 每个r userId都是唯一的例如 a r R userId user1 gt b a r R userId user2 gt b 对于 a r gt c 也是如此而情况是a r gt b
Mojolicious REST 调用中错误的 HTTP 响应

我使用的mojolicious应用程序是基于JSON的即客户端和服务器之间的交互更多的是JSON结构化数据的交换我正在尝试实现一种标准方法当在 REST 调用期间发生错误时使用正确的 HTTP 响应代码来处理错误实施此类标准的最佳
插入符使用插入符训练对象返回的预测与使用提取的最终模型返回的预测不同

在拟合模型时我更喜欢使用插入符号因为它的相对速度和预处理功能然而我对它如何做出预测有点困惑当比较直接从训练对象做出的预测和从提取的最终模型做出的预测时我看到了非常不同的数字来自火车对象的预测似乎更准确 library caret
如何执行 CompletableFuture 数组并组合其结果

我正在研究 Java 8CompletableFutures并阅读并看到我应该采用thenCompose代替thenApply 我已将我的代码转换为使用thenCompose但我有一种不正确的感觉这是我的控制代码 final Comp
Spark 和 AWS S3 连接错误：无法通过 Spark-shell 从 S3 位置读取文件

在下面的 Spark shell 中我尝试连接到 S3 并加载文件以创建数据帧 spark shell packages com databricks spark csv 2 10 1 5 0 scala gt val sqlContex
哪个 ORM 支持这个

我有一个可选的查询部分需要在特定条件下执行这是示例代码 int cat 1 int UserID 12 string qry select from articles if cat gt 0 qry where categoryID c
如何仅在特定 API 级别上执行代码

例如这段代码 if Build VERSION SDK INT gt Build VERSION CODES GINGERBREAD myCalendarView setOnDateChangeListener new OnDateCha
如何向 CMFCPopupMenu 添加图标？

我想用CMFCPopupMenu用于右键单击期间的弹出菜单如何添加图标CMFCPopupMenu 这是我在基本 MFC 应用程序中尝试的示例代码 CMFCPopupMenu TestCMFCPopMenu new CMFCPopupMen
str在 data.frame 中按行分割并按列分配结果

所以我有数据框 dat data frame x c Sir Lancelot the Brave King Arthur The Black Knight The Rabbit stringsAsFactors F gt dat x 1

str在 data.frame 中按行分割并按列分配结果

Option 1

Option 2

str在 data.frame 中按行分割并按列分配结果 的相关文章

随机推荐

热门标签

str在 data.frame 中按行分割并按列分配结果的相关文章