使用 dplyr 创建因子变量？

2024-01-02

假设我有一个看起来像这样的数据框：

df1=structure(list(Name = structure(1:6, .Label = c("N1", "N2", "N3", 
                                                    "N4", "N5", "N6", "N7"), class = "factor"), sector = structure(c(4L, 
                                                                                                                     4L, 4L, 3L, 3L, 2L), .Label = c("other stuff", "Private for-profit, 4-year or above", 
                                                                                                                                                     "Private not-for-profit, 4-year or above", "Public, 4-year or above"
                                                                                                                     ), class = "factor"), flagship = c(1, 0, 0, 0, 0, 0)), .Names = c("Name", 
                                                                                                                                                                                       "sector", "flagship"), row.names = c(NA, 6L), class = "data.frame")

我想创建一个新的因子变量“Sector”。我可以用很多行代码来完成它，但我确信有一种更有效的方法。

现在这就是我正在做的事情：

df1$PublicFlag=0
df1$PublicFlag[df1$sector=="Public, 4-year or above" & df1$flagship==1]=1
df1$Public=0
df1$Public[df1$sector=="Public, 4-year or above" & df1$flagship==0]=1
df1$PrivateNP=0
df1$PrivateNP[df1$sector=="Private not-for-profit"]=1
df1$Private4P=0
df1$Private4P[df1$sector=="Private for-profit, 4-year or above"]=1

library(reshape)
df2 = melt(df1, id=c("Name", "sector", "flagship"))
df2 = df2[df2$value==1,c("Name", "sector", "flagship", "variable")]
library(plyr)
df2 = rename(df2, c("variable"="Sector"))

谢谢您的帮助！

这是一篇老帖子，但我经常偶然发现它。这就是为什么我想给出一个最新的答案。dplyr 0.5.0 版本 https://blog.rstudio.com/2016/06/27/dplyr-0-5-0/引入了很多有用的向量函数来解决这个问题。

使用 case_when() 避免 ifelse 嵌套（从而让很多很多小猫活下来）：

df1 %>% 
  mutate(Sector = case_when(
        sector=="Public, 4-year or above" & flagship==1 ~ "PublicFlag",
        sector=="Public, 4-year or above" & flagship==0 ~ "Public",
        sector=="Private not-for-profit" ~ "PrivateNP",
        sector=="Private for-profit, 4-year or above" ~ "Private4P"),
    Sector = factor(Sector, levels=c("Public","PublicFlag","PrivateNP","Private4P"))
  )

使用 recode_factor() 从字符（或数字）变量生成因子：

df1 %>%
    mutate(Sector = recode_factor(sector,
                               "Public, 4-year or above" = "Public",
                               "Private not-for-profit" = "PrivateNP",
                               "Private for-profit, 4-year or above" = "Private4P"))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dplyr

使用 dplyr 创建因子变量？的相关文章

反转默认比例梯度ggplot2

我是新手我正在尝试设计热图这是我的代码 ggplot gd aes Qcountry Q6 1 Q6d order TRUE geom tile aes fill prob colour white theme minimal labs
返回带有参数的函数的函数

创建一个应返回包含原始函数参数的函数时我应该如何处理例如考虑这个函数 a lt function value function x x value 我希望它返回我在结果函数的参数中指定的值如下所示 b lt a 3 gt b gt f
如何从 data.frame 中选择行和列的子集

我有这个 d d Age gt 2 它返回 Age 超过 2 的所有行但我只想返回几列中的值例如 d X 和 d Y 而不是全部无论如何我可以做到这一点吗 Thanks d d Age gt 2 c X Y
Quarto/Rmarkdown 中的美人鱼图：狭窄且模糊

我正在尝试生成 pdf 格式的四开文档稍后会生成 word 格式我遇到了美人鱼图的问题请在下面找到一个示例 qmd 文件来说明该问题所以首先它应该支持 mermaid 标签但当我这样做时我无法在 rstudio 中运行单元
udunits2 R 安装：找不到 udunits2.h

我正在尝试在 R 中安装 udunits2 以满足对ggforce包裹但是安装程序在检查 udunits2 时始终失败我已经尝试过中的说明this https stackoverflow com questions 47059517
Dplyr 多重滞后整齐评估？

我试图在 dplyr 中使用尽可能少的代码来实现多个滞后同时坚持整洁的评估以下标准评估 SE 代码有效 if require dplyr install packages dplyr library dplyr a as tibble
将文本添加到 ggplot 中的轴标签

我从下表中绘制了一个图表 BoatPhs fit se lower upper 1 Before 3 685875 0 3287521 3 038621 4 333130 2 After0 20NTA 3 317189 0 6254079
使用 ggplotly（ggplot2 withplotly）时可以去掉注释中的跟踪标签吗？

使用ggplotly时是否可以删除注释中的跟踪标签例如 library ggplot2 library plotly g lt ggplot iris aes Sepal Width Sepal Length geom point ann
仅在具有重复块名称的另一个 Rmarkdown 文档中运行一个 Rmarkdown 文档中的代码

我正在 Rmarkdown 中编写一系列相互补充的报告我想将上一份报告的结果纳入我目前正在编写的报告中我看到其他建议使用的问题purl从 Rmarkdown 文档中提取 R 代码然后运行它所以我尝试了以下操作 r read previ
如何判断某个软件包是否已经安装？

当我安装 yaml 包时如果之前已经安装过 RStudio 则会弹出一条烦人的错误消息如何判断该软件包是否已安装以便我可以在代码中决定是否安装该软件包该消息位于弹出窗口中内容如下此安装将更新的一个或多个软件包当前已加载在更新
r Shiny 中的 fileInput 函数没有响应

我是 R 和 R闪亮的新手一直致力于构建一个统计应用程序该应用程序将允许用户导入文件然后对数据运行不同的统计程序直到最近 fileData 函数一直对我来说运行良好现在每当我尝试上传文件时都不会打开任何内容我已尝试了所有我能想
mclapply 用户时间大于已用时间

我正在尝试使用mclapply的功能parallel封装在R 该函数通过计算对数似然距离将值分配给序列矩阵这是一个 CPU 密集型操作所结果的system time价值观令人困惑 gt system time mclapply work
通过 RSelenium 单击按钮

我正在尝试使用 Rselarium 和 Rvest 来抓取 REI 的评论吊床我想点击底部的按钮 x 次这样我就可以抓取所有评论我有点失落这是我到目前为止所拥有的如果您也知道如何在取景器中预览您正在做的事情而不是屏幕打印那就
当子集长度为零时，如何简洁地处理子集？

从向量中排除元素x x lt c 1 4 3 2 我们可以减去位置向量 excl lt c 2 3 x excl 1 1 2 这也是动态工作的 excl lt which x which max x gt quantile x 25 1 2
如何优化 R 中的 sapply 来计算数据帧上的运行总计

我在 R 中编写了一个函数来按月份计算累积总数但随着数据集变大我的方法的执行时间呈指数增长我是一名 R 程序员新手你能帮我提高效率吗该函数以及我调用该函数的方式 accumulate lt function recordnum d
无法在 Powershell 中运行 R.exe

我经常发现在命令行 Windows 上运行 R 更有用然而当我在 Powershell 中尝试时我往往会遇到问题但这可以通过第一次运行轻松克服cmd然后就可以了这是我执行此操作时遇到的错误R CMD BATCH Invoke Hi
创建序列组合

我正在尝试解决以下问题考虑 5 个简单序列 0 100 100 0 rep 0 101 rep 50 101 rep 100 101 我需要 3 个数字变量的集合它们的所有组合都具有上述序列由于有 5 个序列和 3 个变量因此可以有
在 R Shiny 中显示/隐藏整个框元素

我目前正在尝试找到一种方法来隐藏显示 R Shiny 中的整个 box 元素以及里面的所有内容我想创建一个可能的按钮它允许用户展开特定框然后使用相同甚至不同的按钮隐藏它我不想使用条件面板因为我的应用程序非常大并且会产生一些
R：如何更改ggvis闪亮应用程序中特定范围的绘图背景颜色

I have a simple shiny app like below and you can run it The plots are created by ggvis and user can choose student name
DT数据表中的列对齐

In my shiny我正在使用的应用程序datatable函数来自DT库构建一个表格并希望将列居中对齐我可以用formatStyle column textAlign center 但它只影响列体而不影响标题我们必须设置columnD

随机推荐

如何让 ZK webfragment 与嵌入式 Jetty 9 一起工作？

这个最小的嵌入式 Jetty 项目可以正确启动扫描注释并查找并映射带注释的 TestServlet 项目结构 src main java test Test java webapp test zul pom xml 测试 java pac
为什么 IIS 不支持分块传输编码？

我正在与 IIS Web 服务器建立 HTTP 连接并使用使用 Transfer Encoding chunked 编码的数据发送 POST 请求当我这样做时 IIS 只是关闭连接没有错误消息或状态代码根据HTTP 1 1 规范 h
当应用程序部署到 JBoss 时显示一条消息

当我通过 JBoss AS 7 1 1 部署应用程序时如何显示消息来提醒用户我正在使用的技术四郎1 2 3 莫贾拉2 1 7 PrimeFaces 5 1 JDK 1 7 JBoss 7 1 1 在 JBoss AS 前面放置一个准系
java中什么时候应该使用finalize()方法？

我们什么时候应该真正使用java中的finalize 方法如果我们想在finalize 方法中关闭连接那么最好使用下面的代码因为等待GC调用finalize 方法然后释放连接是没有意义的 try Connection creation
GWT 设计器不适用于 Maven-GWT 项目

我刚刚启动了一个 GWT 项目环境如下日食赫利俄斯 Eclipse 3 6 的谷歌插件 eclipse 的 maven2 插件 Eclipse 3 6 的 Gwt 设计器该项目是由 gwt maven plugin 创建的该项目可以
如何在Android中为长度不超过屏幕尺寸的较小文本创建跑马灯效果？

我一直试图在我的应用程序中为 HELLO 一词提供选框效果但 Android 不允许这样做除非文本的长度超过屏幕尺寸有解决办法吗 PS 这看起来很简单我还没有得到任何解决方案我使用了我在早期 Android 时代开发的简单的轻量级
我可以为我的 RDS 实例使用 Amazon ELB 来实现负载均衡吗？

我有两个问题我可以在 RDS 实例上使用 ELB 来实现负载均衡吗我可以在 EC2 实例上安装多个服务器并为所有服务器运行单个 ELB 实例吗 1 如果您的意思是只有一个 RDS 实例那么在它前面的负载均衡请求就没有意义如果您的意思
django mysql 强制使用索引

我正在使用 django orm 和 mysql 由于某种原因 mysql 使用了错误的索引我想手动覆盖使用的索引我看到 django 团队出于跨平台原因决定阻止使用 with hints 扩展来强制建立索引有没有人有任何解决方案建
在 ggplot 上显示两个平行轴 (R)

假设我们有以下类型的简单情节 library ggplot2 df data frame y c 0 1 1 2 3 3 1 2 9 5 8 6 7 4 8 2 9 1 x seq 1 100 length out 10 ggplot df
Java 中的复选框列表？ [复制]

这个问题在这里已经有答案了我正在设计一个用户界面我想让用户可以选择为特定课程选择一名或多名培训师有没有这样的事情Checkboxlist在Java中我正在使用 Netbeans 您推荐什么作为最佳 UI 解决方案发现这个 http
Django 邮递员不工作

我尝试实施Django postman用于用户到用户的消息传递系统我克隆了存储库并在我的settings py and URLs py文件也 In URLs py我包含的主文件 re path r messages include pos
selenium.common.exceptions.InvalidArgumentException：消息：使用 Selenium Python 从文本文件读取的 url 调用 get() 时出现无效参数错误

我在 txt 文件中有一个 URL 列表我想使用 selenium 运行它假设文件名为 b txt 其中包含 2 个 url 格式如下 https www google com https www bing com https www
使用 Roslyn 查找所有不继承 C# 类并更改为从基础对象继承（类似 java）

我正在开发一个小型 Roslyn 项目其中包括更改解析树并将更改写回文件我从独立的代码分析器开始希望将其构建为命令行应用程序不过我遇到了挑战与以下人员合作使用 Roslyn 查找从特定基类派生的类 https stackove
我必须将 Pandas DataFrame 的每一行的数据与其余行的数据进行比较，有没有办法加快计算速度？

假设我有一个具有以下结构的 pandas DataFrame 从 csv 文件加载 var 和 err 列的数量不固定并且因文件而异 var 0 var 1 var 2 32 9 41 47 22 41 15 12 32 3 4 4 10
如何在 VB6 中复制打开的文件？ [复制]

这个问题在这里已经有答案了使用VB6 当文件被其他人打开时如何将文件从另一台计算机复制到我的计算机如果尝试对当前打开的文件使用 FileCopy 语句则会发生错误但是 FileSystemObject 的 CopyFile 函数没
oct2py 没有看到 OCTAVE_EXECUTABLE 环境变量 (Windows)

所以我尝试在 Windows 上使用 oct2py 如下所示 from oct2py import octave 这实际上是我重现错误所需的唯一代码当我执行这个时我得到OSError Octave Executable not fou
识别人名与字典单词

有什么方法可以识别一个单词可能是不可能是一个人的名字吗因此如果我看到 understanding 这个词我会得到 0 01 的概率而 Johnson 这个词会返回 0 99 的概率而像 Smith 这样的词会返回 0 75 而像
关闭当前用户控件

我有一个 Window1 xaml 主窗口在某些事件之后我显示一个 UserControl EditFile xaml 背后的代码是 public static int whichSelected 1 private void butt
Fastcgi++：如何创建 404 或 503 响应

Fastcgi 是一个用于简化用 C 实现 fastcgi 服务器的库这是我想要做的非常简单的用例检查文件是否存在如果不存在则生成一些错误消息这是代码寻找问号 struct the fastcgi server t Fastcg
使用 dplyr 创建因子变量？

假设我有一个看起来像这样的数据框 df1 structure list Name structure 1 6 Label c N1 N2 N3 N4 N5 N6 N7 class factor sector structure c 4L 4

使用 dplyr 创建因子变量？

使用 dplyr 创建因子变量？ 的相关文章

随机推荐

热门标签

使用 dplyr 创建因子变量？的相关文章