rfactor

基于因子变量中观测值数量的子集化

如何根据因子变量水平的观察次数进行子集化我有一个包含 1 000 000 行和近 3000 个级别的数据集我想用少于 200 个观察值对级别进行子集化 data lt read csv Dropbox Shared data csv s

r subset rfactor

我发现在 R 中操作因子变量过于复杂清洁因素时我经常想做的事情包括排序级别不仅设置参考类别而且将所有级别按逻辑非字母顺序排列为汇总表 x lt factor x levels new order 重新编码重命名因子级别简化名

r regex rfactor

我在计算从 csv 文件导入的日期时遇到问题我想要做的是在因素 DateClosed 中获取该日期并在日期字段 a 中生成日期例如如果 a 203 我希望日期等于 DateClosed 203 但是我在使用下面列出的代码时遇到了问题

r date rfactor

下面的绘图代码给出Error Discrete value supplied to continuous scale 这段代码有什么问题它工作正常直到我尝试更改比例所以错误就在那里我试图从类似问题中找出解决方案但不能 meltDF

r ggplot2 Scale categoricaldata rfactor

我很少使用因子通常认为它们是可以理解的但我经常对特定操作的细节感到模糊目前我正在将很少观察到的类别编码折叠到其他中并正在寻找一种快速的方法来做到这一点我有一个变量的大约 20 个级别但有兴趣将其中一堆折叠为一个 data

r rfactor

这个问题在这里已经有答案了给定一个由一系列整数年龄组成的数据帧列我想将整数范围转换为序数变量我当前的代码不起作用我该怎么做 df lt read table http dl dropbox com u 822467 df csv

r dataprocessing rfactor

我无法通过这个rle函数在一个data frame 函数在另一组上效果很好 fgroup lt aggregate fevents2 3 14 list weeks fevents2 1 function x rle x values 这会

r rfactor

我经常遇到这种情况所以我想一定有一个很好的习语假设我有一个带有一堆属性的 data frame 其中包括产品我还有一把钥匙可以将产品转换为品牌尺寸产品代码 1 3 为 Tylenol 4 6 为 Advil 7 9 为 Bay

r rfactor recode

我想用以下方法进行线性回归lm功能我的因变量是一个称为AccountStatus 1 0 days in arrears 2 30 60 days in arrears 3 60 90 days in arrears and 4 90 d

r LM categoricaldata rfactor