将列添加到数据框，测试其他列中的分类变量

2024-02-09

我已经提到过：

如何根据另一列的条件语句将因子列添加到数据框？ https://stackoverflow.com/questions/16570302/how-to-add-a-factor-column-to-dataframe-based-on-a-conditional-statement-from-an,
如何在R编程中根据条件将列添加到数据框中 https://stackoverflow.com/questions/15016723/how-to-add-column-into-a-dataframe-based-on-condition-in-r-programming and
R：添加对三列进行条件检查的列？ https://stackoverflow.com/questions/6557714/r-add-column-with-condition-check-on-three-columns .

所有示例均基于对其他列中的数值向量或 NA 进行测试并添加新变量。这是一个简短的可重现示例：

x <- c("dec 12", "jan 13", "feb 13", "march 13", "apr 13", "may 13",
       "june 13", "july 13", "aug 13", "sep 13", "oct 13", "nov 13")
y <- c(234, 678, 534, 122, 179, 987, 872, 730, 295, 450, 590, 312)
df<-data.frame(x,y)

我想加上“冬天”df$x= 十二月 |一月 |二月，“春天”，三月|四月|五月，“夏天”和“秋天”。

I tried

df$season <- ifelse(df[1:3, ], "winter", ifelse(df[4:6, ], "spring", 
                    ifelse(df[7:9, ], "summer", "autumn")))

我知道这是一种非常低效的做事方式，但我是一个新手，也是一个混杂者。它返回了错误：

Error in ifelse(df[1:3, ], "winter", ifelse(df[4:6, ], "spring",
ifelse(df[7:9,  : (list) object cannot be coerced to type 'logical'

如果同一个数据框有数千行，并且我想循环遍历它并根据一年中的月份为季节创建一个新变量，我该怎么做？我提到：”循环遍历数据框以添加依赖于其他列中的变量的列 https://stackoverflow.com/questions/18336343/looping-through-a-data-frame-to-add-a-column-depending-variables-in-other-column“但这是循环并设置一个数学运算符来创建新变量。我尝试了外部资源：R 邮件列表中的一个帖子 http://r.789695.n4.nabble.com/R-help-Adding-a-column-in-a-data-frame-with-multiple-conditions-td4645072.html and TalkStats 论坛上的一个帖子 http://www.talkstats.com/showthread.php/30924-Adding-a-new-column-in-R-data-frame-with-values-conditional-on-another-column。然而，两者都是基于数值变量和条件。

如果你有一个非常大的数据框，那么data.table会对你很有帮助。以下作品：

library(data.table)
x <- c("dec 12", "jan 13", "feb 13", "march 13", "apr 13", "may 13",
   "june 13", "july 13", "aug 13", "sep 13", "oct 13", "nov 13")
y <- c(234, 678, 534, 122, 179, 987, 872, 730, 295, 450, 590, 312)
df <-data.frame(x,y)
DT <- data.table(df)
DT[, month := substr(tolower(x), 1, 3)]
DT[, season := ifelse(month %in% c("dec", "jan", "feb"), "winter",
               ifelse(month %in% c("mar", "apr", "may"), "spring",
               ifelse(month %in% c("jun", "jul", "aug"), "summer", 
               ifelse(month %in% c("sep", "oct", "nov"), "autumn", NA))))]
DT
          x   y month season
1:   dec 12 234   dec winter
2:   jan 13 678   jan winter
3:   feb 13 534   feb winter
4: march 13 122   mar spring
5:   apr 13 179   apr spring
6:   may 13 987   may spring
7:  june 13 872   jun summer
8:  july 13 730   jul summer
9:   aug 13 295   aug summer
0:   sep 13 450   sep autumn
1:   oct 13 590   oct autumn
12:  nov 13 312   nov autumn

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

将列添加到数据框，测试其他列中的分类变量的相关文章

在 igraph 中为社区分配颜色

我在 igraph 中使用 fastgreedy community 检测算法在 R 中生成社区代码返回 12 个社区但是在绘图时很难识别它们因为它返回的图的颜色数量有限我怎样才能用十二种不同的颜色绘制这个图表 l2 lt layo
更快的 %in% 运算符

The 快速匹配 https cran r project org web packages fastmatch index html包实现了更快的版本match对于重复匹配例如在循环中 set seed 1 library fastma
读取R中打开的Excel文件

有没有办法将打开的Excel文件读入R 当Excel中打开一个excel文件时 Excel会对文件加锁比如R中的read方法无法访问该文件你能绕过这个锁吗 Thanks 编辑这发生在带有原始 Excel 的 Windows 下发生错
操作错误：(sqlite3.OperationalError) SQL 变量太多，同时将 SQL 与数据帧一起使用

我有一个熊猫数据框如下所示 activity User Id 0 VIEWED MOVIE 158d292ec18a49 1 VIEWED MOVIE 158d292ec18a49 2 VIEWED MOVIE 158d292ec18a4
不同 R/lme4 版本的单一拟合结果不匹配

我试图将 R 版本 3 5 3 lme4 1 1 18 1 的随机效应估计与 R 版本 4 1 1 lme4 1 1 27 1 相匹配然而当存在奇异拟合时这两个版本之间的随机效应存在微小差异我对奇点警告很满意但令人费解的是不同版本
从 df 中提取具有两列的重叠行对

我想找出这两个表之间哪些对重叠 gt dput data1 structure list Name x c MDH1 MDH1 IDH2 IDH2 IDH2 IDH2 IDH2 IDH2 IDH2 SCOALB SCOALB CSY4 CS
如何在ubuntu的conda环境中更改Rstudio中的R版本

我在基本系统中安装了 R 4 3 和 Rstudio 在 conda 环境中安装了旧版本的 R 4 2 3 命令which R返回环境中安装的 R 的目录 home 用户 miniconda3 envs anndata2ri pip bin
将第 N 行上的 NA 行插入 data.frames 列表，其中 N 来自列表

经过几个小时后我发现自己无法解决以下问题我有一个数据框列表我想分别向每个 DF 插入而不是替换一行或多行 NA 始终至少一行要插入的 NA 数量存储在单独的列表中为了说明这一点我有以下两个列表 list of datafra
从日期变量创建月末日期

我有一个包含日期变量的大型数据框它反映了该月的第一天有没有一种简单的方法来创建代表该月最后一天的新数据框日期变量以下是一些示例数据 date start month seq as Date 2012 01 01 length 4 by
if else 在 ansible 打印语句中

我需要有关具有多个条件的打印语句的语法的帮助目前报价为 inventory hostname 导致错误如果我删除剧本运行的引号但列出文本 inventory hostname 而不是变量我想知道如何打印变量以及 if else 语
rpart“as.character(x) 中的错误：无法强制类型 'builtin' 为类型 'character' 的向量”消息是什么意思？

我一直在用头撞rpart几天了尝试为我拥有的这个数据集制作分类树我认为现在是时候询问生命线了我确信这是我没有看到的愚蠢的事情但这里是我一直在做什么 EuropeWater lt read csv file paste Users a
为什么数据帧上的 is.vector 不返回 TRUE？

tl dr R 中的向量到底是什么长版 R 中很多东西都是向量例如数字是长度为 1 的数值向量 is vector 1 1 TRUE 列表也是一个向量 is vector list 1 1 TRUE 好的所以列表是一个向量显然数
R中的重叠矩阵

我有以下数据框 id channel 1 a 1 b 1 c 2 a 2 c 3 a 我想创建并重叠矩阵它基本上是一个方阵行和列标签为 a b c 表中的每个条目显示每个通道共有多少个 id 例如在上面的例子中矩阵看起来像 a b
R 中两个时间戳之间的左连接

我的目标是执行左连接intervals哪里的bike id比赛和created at时间戳在records在之间start and end in the intervals table gt class records 1 data ta
正态分布平均值的贝叶斯推理玩具 R 代码 [降雪量数据]

我有一些降雪观测 x lt c 98 044 107 696 146 050 102 870 131 318 170 434 84 836 154 686 162 814 101 854 103 378 16 256 我被告知它遵循正态分布
访问或解析 R 中的 summary() 中的元素

我运行以下 R 命令来进行 Dunnett 测试并获取摘要如何访问下面线性假设的每一行这是摘要输出的一部分基本上我不知道摘要的结构我尝试使用名称但它似乎不起作用因为我没有看到任何命名属性来提供这一点 library multco
警告消息 - 来自 dummies 包的 dummy

我正在使用 dummies 包为分类变量生成虚拟变量其中一些变量具有两个以上类别 testdf lt data frame A as factor c 1 2 2 3 3 1 B c A B A B C C C c D D E D D E
如何在 data.table 中分组后使用条件计算行数

我有以下数据框 dat lt read csv s1 s2 v1 v2 a b 10 20 a b 22 NA a b 13 33 c d 3 NA c d 4 5 NA c d 10 20 dat gt A tibble 6 x 4 gt
Pandas 将多行列数据帧转换为单行多列数据帧

我的数据框如下 code df Car measurements Before After amb temp 30 268212 26 627491 engine temp 41 812730 39 254255 engine eff 15
在R中循环子文件夹

我正在 R 环境中包含多个子文件夹的文件夹中工作我想要循环遍历多个子文件夹然后在每个子文件夹中调用 R 脚本来执行我想出了下面的代码但我的代码似乎添加了到子文件夹列表我收到错误文件中的错误文件名 r 编码编码无效的描述

随机推荐

如何创建二维以上的 pandas 数据框？

我希望能够创建n dimensional数据框我听说过一种使用 3D 数据帧的方法panels in pandas但是如果可能的话我想通过将不同的数据集组合成一个将维度扩展到超过 3 个维度超级数据框我尝试了这个但我不知道如何在
是否可以从 vb.net dll 中的 dll 导入 c# 类？

集成开发环境 VS2010 框架网 4 0 我在 Visual Studio 2010 下创建了一个 C dll 项目其中包含几个公共类我想在另一个 dll 项目中使用它的类但用 vb net 编写在vb net dll项目中我引
禁用所有 jquery datepicker 输入的自动完成功能

我想禁用autocomplete对于使用 jquery ui datepicker 的所有输入无需手动对每个输入执行此操作这怎么可能做到呢尝试这个 datepicker on click function e e preventDef
两个字段的唯一约束及其相反

我有一个数据结构必须在其中存储元素对每对恰好有 2 个值因此我们使用一个表其中包含字段左值右值这些对应该是唯一的如果密钥发生更改它们将被视为相同 Example Fruit Apple is the same as App
从 ASP.NET 应用程序获取入口程序集 [重复]

这个问题在这里已经有答案了可能的重复用于 Web 应用程序的 GetEntryAssembly https stackoverflow com questions 4277692 getentryassembly for web app
使用 int 13h 读取的扇区数量多于磁道上的扇区数量

顺序是什么int 13h with ah 02h会读19部门起始于 C H S 0 0 1 提供了 2 个磁头每磁道 18 个扇区每面 80 个磁道的软盘磁盘几何结构或者更一般地说当它到达磁道 0 的末尾磁头 0 时会发生什
如何处理数据透视表中的重复条目以及如何在 Excel 仪表板中填充查询

我有两张桌子capacity and demand 容量表如下所示 RESOURCE NAME SKILL GROUP PROJECT START DATE END DATE COST PER HOUR CAPACITY Resource
分片数据库的 ID 生成（Azure 联合数据库）

我一直在寻找一些有关 Azure 联合数据库 id 生成联合主键最佳实践的文章或指南但没有发现任何引人注目的内容联合表不支持标识列因此在我看来唯一实用的 id 类型是 GUID 因为尝试集中创建和使用 BigInt 会在应用程序
将 xib 文件替换为 App 委托类中的 Main.storyboard 文件

现在项目正在应用程序委托类中使用 MainWindow xib 作为主 nib 文件 main m 文件中有此代码 int main int argc char argv NSAutoreleasePool pool NSAutorelea
Bootstrap 4 的数据表看起来很混乱

当尝试将 Datatables 与 Bootstrap 4 一起使用时它看起来不太好我尝试遵循数据表网站上的基本示例但它看起来仍然像这样请参见下面的屏幕截图我链接到 Datatables 在其自定义页面上提供的文件这是我的 ht
GWT/GXT 标签编辑器？ [复制]

这个问题在这里已经有答案了我正在寻找基于 GWT 或 GXT 的标签编辑器控件类似于http tagedit webwork albrecht de http tagedit webwork albrecht de or http le
Bean 方法验证

public class Register NotNull private String password NotNull private String passwordRepeat AssertTrue private boolean c
使用 Java 1.6 和 Windows 7 操作系统进行深度递归时出现 java.lang.StackOverflowError

我有一个程序在执行时会遇到非常深的递归在这中间我得到java lang StackOverflowError我的应用程序冻结了我使用的是 JDK 1 6 和 Windows 7 操作系统奇怪的是我不明白这个StackOverfl
与内存相关的“竞技场”一词的含义是什么？

我正在读一本关于内存作为编程概念的书在后面的一章中作者大量使用了这个词arena 但从未定义它我搜索了这个词的含义以及它与记忆的关系但一无所获以下是作者使用该术语的一些上下文序列化的下一个例子采用了一种称为从特定的内存分配ar
iPhone 应用程序在后台运行 10 分钟后终止

我正在开发一个需要在 iOS4 上后台运行的应用程序我希望它像常规的基于位置的应用程序一样因此背景模式是设置为位置应用程序进入后台后运行良好状态但 10 分钟后它不再响应或许它被暂停终止我想做的是永远在后台运行应用程
为什么我不能在任何方法之外修改类成员变量？ [复制]

这个问题在这里已经有答案了我有一个带有一些变量的类当我在主类中实例化该类的对象时我只能访问和修改一个方法中的成员变量任何方法不在他们之外这是为什么我被困住了似乎无法在谷歌上找到答案 class SomeVariables S
第一次尝试简单的 GUI

我正在尝试自学如何使用 Java swing 和 Window Builder Pro 制作 GUI 在观看了几个 youtube 视频并阅读了一些教程后我已经完成了以下任务 import javax swing JFrame impor
按带有日期值的单个键对对象数组进行排序

我有一个包含多个键值对的对象数组我需要根据 updated at 对它们进行排序 updated at 2012 01 01T06 25 24Z foo bar updated at 2012 01 09T11 25 13Z foo ba
Jsoup SocketTimeoutException：读取超时

I get a SocketTimeoutException当我尝试使用 Jsoup 解析大量 HTML 文档时例如我得到了一个链接列表 a href www domain com url1 html link1 a a href ww
将列添加到数据框，测试其他列中的分类变量

我已经提到过如何根据另一列的条件语句将因子列添加到数据框 https stackoverflow com questions 16570302 how to add a factor column to dataframe based o

将列添加到数据框，测试其他列中的分类变量

将列添加到数据框，测试其他列中的分类变量 的相关文章

随机推荐

热门标签

将列添加到数据框，测试其他列中的分类变量的相关文章