Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
基于因子变量中观测值数量的子集化
如何根据因子变量水平的观察次数进行子集化 我有一个包含 1 000 000 行和近 3000 个级别的数据集 我想用少于 200 个观察值对级别进行子集化 data lt read csv Dropbox Shared data csv s
r
subset
rfactor
使用正则表达式匹配编辑(重新编码、折叠、排序)因子级别
我发现在 R 中操作因子变量过于复杂 清洁因素时我经常想做的事情包括 排序级别 不仅设置参考类别 而且将所有级别按逻辑 非字母顺序 排列为汇总表 x lt factor x levels new order 重新编码 重命名因子级别 简化名
r
regex
rfactor
将日期作为因子错误转换为日期
我在计算从 csv 文件导入的日期时遇到问题 我想要做的是在因素 DateClosed 中获取该日期并在日期字段 a 中生成日期 例如 如果 a 203 我希望日期等于 DateClosed 203 但是 我在使用下面列出的代码时遇到了问题
r
date
rfactor
使用 ggplot2 绘图:“错误:在分类 y 轴上提供连续刻度的离散值”
下面的绘图代码给出Error Discrete value supplied to continuous scale 这段代码有什么问题 它工作正常 直到我尝试更改比例 所以错误就在那里 我试图从类似问题中找出解决方案 但不能 meltDF
r
ggplot2
Scale
categoricaldata
rfactor
R:因子水平,将其余部分重新编码为“其他”
我很少使用因子 通常认为它们是可以理解的 但我经常对特定操作的细节感到模糊 目前 我正在将很少观察到的类别编码 折叠到 其他 中 并正在寻找一种快速的方法来做到这一点 我有一个变量的大约 20 个级别 但有兴趣将其中一堆折叠为一个 data
r
rfactor
用因子替换一定范围内的数字[重复]
这个问题在这里已经有答案了 给定一个由一系列整数 年龄 组成的数据帧列 我想将整数范围转换为序数变量 我当前的代码不起作用 我该怎么做 df lt read table http dl dropbox com u 822467 df csv
r
dataprocessing
rfactor
为什么 rle 不接受因子作为输入?
我无法通过这个rle函数在一个data frame 函数在另一组上效果很好 fgroup lt aggregate fevents2 3 14 list weeks fevents2 1 function x rle x values 这会
r
rfactor
用于多个类别的 if else 风格记录的惯用语
我经常遇到这种情况 所以我想一定有一个很好的习语 假设我有一个带有一堆属性的 data frame 其中包括 产品 我还有一把钥匙 可以将产品转换为品牌 尺寸 产品代码 1 3 为 Tylenol 4 6 为 Advil 7 9 为 Bay
r
rfactor
recode
当因变量是因子/分类变量时的线性模型(lm)?
我想用以下方法进行线性回归lm功能 我的因变量是一个称为AccountStatus 1 0 days in arrears 2 30 60 days in arrears 3 60 90 days in arrears and 4 90 d
r
LM
categoricaldata
rfactor
«
1
2