在 R 中对数据进行分类

2023-11-30

我试图根据数据类型将我的数据分类为不同的组。我的数据和代码如下：

bank    ROE
bank1   0.73
bank2   0.94
bank3   0.62
bank4   0.57
bank5   0.31
bank6   0.53
bank7   0.39
bank8   0.01
bank9   0.16
bank10  0.51
bank11  0.84
bank12  0.18

sob <- c('bank1', 'bank2','bank3',)
fob <- c('bank4','bank5', 'bank6')
jov <- c('bank7', 'bank8','bank9', 'bank10','bank11')

test$type <- ifelse(test$bank == sob, 1, ifelse(test$bank == fob, 2, ifelse(test$bank == jov, 3,     4)))
test

但是，此代码不起作用，因为类别显示错误，我收到此警告：

Warning messages:
1: In is.na(e1) | is.na(e2) :
longer object length is not a multiple of shorter object length
2: In `==.default`(test1$bank, jov) :
longer object length is not a multiple of shorter object length

谁能告诉我我做错了什么以及我应该做什么才能改正？

Thanks

您应该使用%in%- 运算符而不是身份 - 您在这里与向量进行比较。

Like so:

test$type <- ifelse(test$bank %in% sob, 1, ifelse(test$bank %in% fob, 2, ifelse(test$bank %in% jov, 3,     4)))

> test
     bank  ROE type
1   bank1 0.73    1
2   bank2 0.94    1
3   bank3 0.62    1
4   bank4 0.57    2
5   bank5 0.31    2
6   bank6 0.53    2
7   bank7 0.39    3
8   bank8 0.01    3
9   bank9 0.16    3
10 bank10 0.51    3
11 bank11 0.84    3
12 bank12 0.18    4

或者，为了避免繁琐的 if-else 结构，您可以对因子的分类重置级别。

首先复制银行变量测试$类型

然后，使用上面定义的向量（sob、fob、job）重新设置级别。注意最后一步，'other'被设置为剩余值，因为其他向量中未定义bank12。

levels(test$type) <- list('sob' = sob,
                          'fob' = fob,
                          'jov' = jov,
                          'other' = 'bank12')

导致

> test
     bank  ROE  type
1   bank1 0.73   sob
2   bank2 0.94   sob
3   bank3 0.62   sob
4   bank4 0.57   fob
5   bank5 0.31   fob
6   bank6 0.53   fob
7   bank7 0.39   jov
8   bank8 0.01   jov
9   bank9 0.16   jov
10 bank10 0.51   jov
11 bank11 0.84   jov
12 bank12 0.18 other

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

在 R 中对数据进行分类的相关文章

将嵌入其他文本的长州名称转换为两个字母的州缩写

我的目标是识别以具有其他文本的字符向量写出的美国各州并将各州转换为缩写形式例如北卡罗来纳州到北卡罗来纳州如果向量只有长形式的状态名称那就很简单但是我的向量在随机位置有其他文本如示例 states 中所示 states l
使用 R 中的 reshape 函数处理多个匹配行

所以我有以下数据框df X Y Z ID value 1 0 20 135 a 20 2 0 20 135 a 30 3 0 20 135 b 40 4 20 104 20 c 10 5 20 104 20 b 15 我想要的最终输出 X
使用 ``magrittr::`%>%` `` 时 magrittr 管道出错

不管出于什么原因我在玩magrittr管道语法并遇到一个奇怪的错误当您 scope 显式限定调用时发生 gt 我知道使用下面的语法会破坏管道的用途但我很好奇为什么会发生错误第一次致电sum按预期工作并输出1 第二次调用会导致错误 E
不同元素的ggplot字体大小

我知道在创建 ggplot 图后我可以使用theme get 返回所有主题元素的详细信息这对于弄清楚诸如此类的事情非常有帮助strip text x等等但我有两件事无法弄清楚 1 在下面的ggplot图形中代表短语被土拨鼠卡住的木头
查找表中第三个四分位数以上的频率

我有一个大数据框架对 57 个变量的超过 239k 观察值其中包含一些疾病描述以及针对不同年龄段的人针对这些疾病使用的药物我想在每种疾病描述的使用频率前四分之一中找到这些药物为了制作一个可重现的示例我创建了一个包含 1000 个观
R - Rstudio - 如果生成警告/错误，则使 R 播放声音

我正在运行一个循环遍历股票对组合列表的脚本偶尔由于对组合之间的数据长度不同而产生错误脚本会停止运行我只是将不匹配的股票从考虑中删除 Error in model frame default formula stckY stckX 0
加载 plyr 包时出现问题

我使用 R 2 13 1 但未能成功尝试在 R 中加载包 plyr 1 6 我已将其手动安装到目录 R library 中我的代码是 libPaths R library library plyr 我收到消息库 plyr 中的错误 pl
selectInput 的动态数量

我是闪亮的新手所以这可能是一个非常基本的问题我想编写一个闪亮的应用程序其中用户输入 n 我们得到 n 个 selectInput 选项但我无法做到这一点基本上任何形式的 for 循环都不起作用我尝试的代码如下 library s
将 RMarkdown 文档编织为 Word 时方程式和引用丢失

我不确定这个问题是否更适合LaTeX论坛我将其发布在这里是因为我怀疑问题更多是关于knitr和 RMarkdown 相比于 LaTeX 我在 RStudio 中有以下 RMarkdown 文档 title Capricious Behav
R：从本地 tar.gz 安装 R 软件包时找不到“make”

R 包ConvCalendar不再位于 Cran 存储库中请参阅here https cran r project org web packages ConvCalendar index html 然而因为我在之前的项目中大量使用了这个
dplyr：取消选择由给出的列

如何取消选择中给出的列自写函数的参数我还需要在另一点选择列因此只需使用 in 没有解决我的问题任何解决方案表示赞赏 select 帮助者操纵者quosures或表达方式 very simple example data test
成对散点图；一对多[重复]

这个问题在这里已经有答案了有没有一种简洁的方法来创建pairs仅将一个变量与许多其他变量进行比较的图换句话说我可以只绘制标准的一行或一列吗 pairs不使用循环的散点图矩阵融化你的数据然后使用带有facet的ggplot libr
使用不同的阈值替换多列中的值

我有一个包含多个列的数据集其中包含我想要转换为二进制的定量数据为此我想使用每列不同的阈值 Example Input antigen1 antigen2 antigen3 antigen4 1 215 421 2 12 2 1524
使用shinyjs通过javascript在闪亮的应用程序中操作现有的Leaflet地图

我有一个闪亮的应用程序其中包含现有的传单地图我希望能够在渲染后使用自定义 javascript 通过shinyjs包裹一个最小的例子如下 app R packages library dplyr library leaflet lib
基于列重复数据集中的行，但增加行[重复]

这个问题在这里已经有答案了我有一个数据集其中包含项目名称开始年份和合同期限我需要将这个数据集开发成时间序列例如我的数据集中的一行是项目 A 开始年份 2003 年合同期限 5 我想根据合同期限重复每一行我的数据集如下所示
如何很好地注释 ggplot2（手册）

Using ggplot2我通常使用geom text和类似的东西position jitter注释我的情节然而对于一个漂亮的情节我经常发现手动注释是值得的像下面这样 data2 lt structure list type str
在R中使用plotly在轴标题中换行和下标

我刚开始使用plotly对于 R 中的一些交互式散点图并且在轴标签上遇到困难通常我设计我的情节ggplot2然后使用ggplotly函数来转换它们但这有时由于某种原因非常慢所以我想直接在中创建我的图plotly 我现在尝试更改轴标题
如何测试字符串中的前三个字符是r中的字母还是数字？

下面给出了我拥有的数据集的示例请注意总数据集中我有超过两列 ID X 1 MJF34 2 GA249D 3 DEW235R 4 4SDFR3 5 DAS3 我想测试 X 中的前三个字符是否是字母如果是那么我想替换该值以仅显示前三个字
R + ggplot2 - 无法分配大小为 128.0 Mb 的向量

我有一个 4 5MB 9 223 136 行的文件其中包含以下信息 0 0 0 0147938 3 67598e 07 0 0226194 7 35196e 07 0 0283794 1 10279e 06 0 033576 1 470
是否有 R 函数可以将这些数据从长形重塑为宽形？

数据现在看起来如何 Coach ID Student score 1 A 8 1 B 3 2 A 5 2 B 4 2 C 7 看起来像这样 Coach ID Student score student 2 score 2 student 3

随机推荐

System.IO.File.ReadAllBytes 对于大于 2GB 的文件

我有一个大文件需要将其复制到内存中以供进一步处理该软件对于小于 2GB 的文件运行良好但一旦超过此限制我就会得到一个例外即 ReadAllBytes 仅支持小于 2GB 的文件 byte buffer System IO File
ClearCase：是否可以选择性地交付或变基？

当将流A传递到流B时是否可以只将选定的元素准确地说是目录从A传递到B 当从基线 B 变基流 A 时是否可以仅将所选元素准确地说是目录从 B 变基到 A 使用 ClearCase UCM 您正在交付的是基线或活动您正在重新设定的
HERE 地图 Android 集成，MISSING_LIBRARIES 错误

我按照步骤操作https developer here com mobile sdks documentation android topics app simple android studio html 但我收到错误无法初始化地图片段
将文本字符 ☢ 在圆圈内垂直和水平居中 (CSS)

我正在尝试将此文本字符置于圆圈内虽然 IE 10 显示文本垂直和水平居中但 Chrome 和 Firefox 在顶部呈现过多的填充任何想法如何解决这一问题 Flexbox 不是必须具备的 HTML div class tl icon
更新 IPython/Jupyter 中使用的 R

我想在 Jupyter Notebook 中使用 R 因此我通过 R Essentials 安装请参阅 https www continuum io blog developer jupyter and conda r 安装的版本如下 R
如何知道安装何时完成

我正在创建一个应用程序来安装从服务器下载的应用程序我想安装这些应用程序下载文件后我用于安装的方法的代码位于此处 public void Install String name prompts user to accept any in
这段代码中 malloc 做了什么？

你能解释一下下面的代码吗 str char malloc sizeof char num 1 什么是malloc在这里做什么 Why is num 1 used malloc是一个函数在堆上分配一块内存并返回一个pointer到它它类似于
jQuery .append() 函数

Why this mydiv append ul mydiv append li Hello li mydiv append ul alert mydiv html produces ul ul li Hello li and not ul
理解类变量的继承

我正在建造一个Challenge24SolverJava 中的类逻辑本身起作用并找到预期的解决方案具有任意数量的参数无论如何这部分项目正在按我的预期进行这个问题来自于解决方案的表示问题可以公平地说我已经用 Python 完成了
如果用户喜欢该页面，则signedRequest不会返回

您好我正在使用 facebook sdk php 版本开发一个 fb 应用程序但由于某种原因 signedRequest 没有返回我喜欢的变量以确定用户是否喜欢该页面以下是signedrequest的print r Array id
如何在 TypeScript 中定义一种类型，该类型可以具有除特定属性之外的任何属性？

当编写像商店这样的字典的接口时我想区分数据模型和商店中的项目即id和模型我想添加模型本身不使用字段的约束id在他们的界面中但我不知道该怎么做 type Item
将 Joomla 安装在子目录中

你们中有些人可能知道 Wordpress 在设置中有一个选项允许将站点安装在子目录中同时将站点 URL 设为主域它类似于站点 url 和 Wordpress url 我正在 Joomla 中寻找类似的东西我知道它没有内置选项但如
Azure 存储队列和多个 WebJobs 实例：QueueTrigger 是否会在触发时设置消息租用时间？

场景生产者发送一条消息到Storage Queue 一个WebJobs在QueueTrigger上处理该消息每条消息只能处理一次可以有多个WebJob实例我一直在谷歌搜索根据我读到的内容我需要编写处理消息的函数使其具有幂等性
Webbrowser，检测是否安装了PDF阅读器？

有没有办法检查用户是否安装了PDF阅读器也许使用 ActiveX 组件请你帮助我好吗您可以使用以下命令检测已安装的插件window navigator plugins这将返回一个包含已安装插件详细信息的数组但这不适用于 Intern
使用 Clang 与全局模板变量重复符号

我有这三个文件 foo h pragma once template
具有CurrencyFormat 和PropertyChanged 触发器的TextBox 不接受正确的文本

我有一个TextBox在绑定到类型窗口的依赖属性的 WPF 窗口中double 见下文每当用户输入TextBox when The TextBox为空或者全部文字都被选中键入的文本被错误地接受例如如果我在这两种情况下键入 5 则
在获取请求中显示不同的结果，按属性分组并计算该属性的总数

设想我有一个费用跟踪 iOS 应用程序并且有一个名为 DashBoardViewController 的视图控制器表视图控制器带 FRC 它基本上可以对给定一周一个月或一年的费用收入进行分类并将其显示为节标题例如标题 2012
如何使方法的返回对象通用？

我需要执行类似下面的代码的操作但是 new T 不起作用它说无法创建变量类型 T 的实例因为它没有 new 约束 public static T MapToBaseDropDown2
如何启动电子邮件客户端，然后使用 Javascript 进行页面重定向？

我需要使网站在其他浏览器上的功能与 IE6 中的功能完全相同当前代码的一部分类似于以下内容在 IE 中这会导致邮件客户端打开并准备好指定的消息然后将浏览器重定向到 newPage html 然而其他浏览器仅重定向到 newPage
在 R 中对数据进行分类

我试图根据数据类型将我的数据分类为不同的组我的数据和代码如下 bank ROE bank1 0 73 bank2 0 94 bank3 0 62 bank4 0 57 bank5 0 31 bank6 0 53 bank7 0 39 ba

在 R 中对数据进行分类

在 R 中对数据进行分类 的相关文章

随机推荐

热门标签

在 R 中对数据进行分类的相关文章