为每个因子组添加单独的 vlines 到 ggplot（变量重要性随机森林的点图）

2024-04-10

我正在使用 ggplot2 制作随机森林中六个相关变量重要性结果的点图。我的数据（我已经使用 reshape2 将其转换为长格式）如下所示（我的真实数据集有点大）：

Factor    Group    Value
Gender      A      0.000127
Age         A      0.000383
Informant   A     -0.000191
Gender      B     -0.000255
Age         B      0.000389
Informant   B     -0.000312
Gender      C     -0.000285
Age         C      0.000389
Informant   C     -0.000282

我可以像这样制作点图：

ggplot(mydata, aes(x = Value, y = Factor, colour = Group)) + geom_point()

here is an example of what this looks like with a different dataset: from r-bloggers.com/summarising-data-using-dot-plots

然而，我想要画一条线来指示哪些因素对每个组都很重要。如第 4 页所述本指南 http://www.stanford.edu/~stephsus/R-randomforest-guide.pdf，在这样的数据集中“如果变量的重要性值高于最低负分变量的绝对值，则变量可以被认为是信息丰富且重要的”.

我想要一个类似于上面的图，同时每个组都有单独的重要性线。这段代码让我很接近，但没有为每个组做单独的行。有人知道该怎么做吗？我尝试过将美学颜色映射到组，但显然缺少一些东西。

ggplot(mydata, aes(x = Value, y = Factor, colour = Group)) +
geom_point() +geom_vline(data=mydata, aes(xintercept=abs(min(Value)),
colour=Group))

我不太确定为什么你的代码不起作用，但是方式出了问题geom_vline正在应用中的功能xintercept范围。相反，在外部执行此操作ggplot创建一个单独的数据框，其中包含每个级别的 x 截距值Group并将其提供给geom_vline.

# Create the dotplot without the significance lines
p = ggplot(mydata, aes(x = Value, y = Factor, colour = Group)) +
           geom_point()

# Create a separate data frame with the x-intercept for each level of Group 
# (I used dplyr for this, but you can of course do this in base R, data.table, 
#  or whatever your favorite method happens to be)
library(dplyr)
signif.lines = mydata %.%
  group_by(Group) %.%
  summarise(xvalue=abs(min(Value)))

# Add significance lines to the plot using the new data frame
p + geom_vline(data=signif.lines, aes(xintercept=xvalue, colour=Group))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为每个因子组添加单独的 vlines 到 ggplot（变量重要性随机森林的点图）的相关文章

在 R 中提取 data.frames 列表的名称以及 data.frame 中的值

在下面的代码中 j是 data frames 的命名列表我想知道是否有办法 a 提取变量的数值即one short and one long 在 data frames 内并附加它们的相关名称即 AAA or BBB or CCC 到
在 RMarkdown 输出到 PDF 时缩进而不添加项目符号点或编号

之前有人问过如何在没有项目符号的情况下缩进文本 RMarkdown 中的点但这是针对 HTML 输出的在 RMarkdown 中缩进而不添加项目符号点或数字 https stackoverflow com questions 47087
如何根据 ggplot2 中的汇总数据创建堆积条形图

我正在尝试使用 ggplot 2 创建堆积条形图我的宽格式数据如下所示每个单元格中的数字是响应的频率 activity yes no dontknow Social events 27 3 3 Academic skills works
ggplot：如何限制条形图中的输出，以便仅显示最频繁出现的情况？

我几个小时以来一直在寻找这个简单的东西但没有结果我有一个数据框其中一列为变量国家地区我想要两件事以下绘制最常见的国家地区最常见的位于顶部找到部分解决方案EDIT找到完整的解决方案 gt gt 重点问题是根据频率限制条形图
平滑连续 2D 点

UPDATE 感谢 user20650和李哲源Zheyuan Li 这是我想出的解决方案 Example data set df 3600 observations points Create a vector of the cumula
如何在 R 中的 dygraph 标题中使用 UTF-8 字符

使用 Rstudio Windows8 当我使用 dygraph 函数绘制时间序列时在尝试在主标题中使用 UTF 8 字符时遇到问题 library dygraphs dygraph AirPassengers main T tulo 这
使用数据帧的 R 中的 EWMA 波动性

我正在尝试从一系列股票每日收益中获取 EWMA 波动性这些收益来自一个名为base retorno diario Data IBOV ABEV3 AEDU3 ALLL3 BBAS3 BBDC3 BBDC4 1 2000 01 04 0 0
R - 基于列名称的子集

我的数据框有超过 120 列变量我想根据列名称创建子集例如我想创建一个子集其中列名称包含字符串心情这可能吗我一般用 SubData lt myData grep whatIWant colnames myData 我很清楚
如何像在facet_grid中一样在facet_wrap中定位条带标签

我想在使用时删除多余的条带标签facet wrap 并用两个变量进行分面并且都是自由尺度的例如这个facet wrap下图的版本 library ggplot2 dt lt txhousing txhousing year in 20
StatET调试工具

我想我只是很密集但我似乎无法弄清楚如何在 Eclipse 中的 R 中使用调试工具 StatET 插件有人有关于这个主题的任何提示或教程吗 StatET 2 00 现在对高级可视化调试提供实验性支持需要 Eclipse 3 6 或
HTTR GET 新错误：SSL 证书问题：证书已过期

我已经运行这段代码几个月了没有出现任何问题今天我突然开始在我的两台 AWS 服务器上收到以下错误消息错误 curl curl fetch memory url handle handle SSL证书问题证书已过期当尝试运行以下代码
在 Google Colab 上的 R 笔记本中安装 python 库

我正在尝试在 Google Colab 上的 R 笔记本中安装 python 库为此我使用 reticulate 包 library reticulate py install pandas 但我得到的结果是这个错误 Error coul
我如何查看 quantmod 包中所有可用的数据系列？

如何显示可用的所有报价数据系列的列表例如使用雅虎的 getSymbols 我不知道有什么办法 TTR包有一个功能 stockSymbols 下载 NYSE AMEX 和 NASDAQ 的所有当前代码它试图将它们采用雅虎可接受的格式但
R 数据结构的运算效率

我想知道是否有任何关于操作效率的文档R 特别是那些与数据操作相关的例如我认为向数据框添加列是有效的因为我猜您只是向链接列表添加一个元素我想添加行会更慢因为向量保存在数组中C level你必须分配一个新的长度数组n 1并将所有元素复
是否有weighted.median()函数？

我正在寻找类似形式的东西weighted mean 我通过搜索找到了一些解决方案这些解决方案写出了整个函数但希望有一些更用户友好的解决方案以下软件包都有计算加权中位数的函数 aroma light isotone limma cwhm
将 Excel 文件读入 R 并锁定单元格

我有一个 Excel 电子表格要读入 R 它受密码保护并锁定了单元格我可以使用 excel link 导入受密码保护的文件但我不知道如何解锁取消保护单元格 excel link 给了我这个错误 gt
如何在R中分离两个图？

每当我运行这段代码时第一个图就会简单地覆盖前一个图 R中有没有办法分开得到两个图 plot pc title main abc xlab xx ylab yy plot pcs title main sdf xlab sdf ylab x
更改ggplot2中的字体

曾几何时我改变了我的ggplot2字体使用windowsFonts Times windowsFont TT Times New Roman 现在我无法摆脱这一切在尝试设置family in ggplot2 theme 当我用不同的字
斯皮尔曼相关性和联系

我正在一小组配对排名上计算斯皮尔曼的 rho 斯皮尔曼因处理领带不当而闻名例如取2组8个排名即使两组中有6个是平局相关性仍然很高 gt cor test c 1 2 3 4 5 6 7 8 c 0 0 0 0 0 0 7 8 met
闪亮井板宽度

library shiny library shinydashboard ui lt dashboardPage dashboardHeader dashboardSidebar dashboardBody wellPanel tags d

随机推荐

如何获取 JavaScript 对象的类？

我创建了一个 JavaScript 对象但是如何确定该对象的类我想要类似于Java的东西 getClass 方法没有与 Java 完全对应的东西getClass http docs oracle com javase 7 docs a
瞬态部分NameKeyPath & NSSortDescriptor NSFetchedResultsController

我在核心数据中有一个任务列表我使用 NSFetchedResultsController 将它们提取到 UITableView 中我需要自定义订单中的自定义部分 OVERDUE ACTIVE ONGOING 推迟完全的为了确定任务应
Delphi：30 天试用

如何为我的应用程序提供 30 天试用期我需要允许用户仅使用应用程序 30 天这几天怎么算我将第一个和最后一个日期保存在注册表中但如果更改系统时间则不会有任何保护我需要数一下这30天您可能会想出一个需要互联网连接的系统但如果没
告诉 Iron Router 不要拦截链接

我正在将相当大的应用程序迁移到 Iron Router 在客户端所有未知路由都被重定向到 404 此外有些路由是从服务器端管理的例如 static 仅通过中间件显示静态页面问题是 Iron Router 现在拦截所有链接点击所以当
通过 Azure AD Graph API 作为电子邮件别名发送电子邮件

在 Graph API 浏览器中您可以使用端点发送电子邮件 https graph microsoft com v1 0 me sendMail https graph microsoft com v1 0 me sendMail和一个基
如何生成一定范围内的加密安全随机整数？

我必须为生成密码的程序生成给定范围内的统一安全的随机整数现在我用这个 RNGCryptoServiceProvider rng new RNGCryptoServiceProvider byte rand new byte 4 rng
ASP.NET MVC GetFullHtmlFieldId 未返回有效 ID

我已经看过了但它对我没有帮助 GetFullHtmlFieldId 返回错误的 id 属性值 https stackoverflow com questions 15457883 getfullhtmlfieldid returning
Excel 中的排序保持风格？

我得到了一个带有交替背景的 Excel 文件以提高可读性 Row 1 White Background Row 2 Gray Background Row 3 White Backgrund 我使用 VBA 函数对 Excel 文件的内容
Rust 中模式匹配中的类型注释？

我正在深入研究 Rust 特别是优雅地处理错误但我在类型推断方面遇到了一些麻烦 extern crate mysql use mysql as my fn main my test fn my test gt Result lt my E
Oracle SQL 将日期格式从 DD-Mon-YY 转换为 YYYYMM

我要比较 2 个表中的日期但问题是一个表的日期采用 DD Mon YY 格式另一个表的日期采用 YYYYMM 格式我需要将它们都设为 YYYYMM 进行比较我需要创建这样的东西 SELECT FROM offers WHERE of
为什么元素在警报之前不显示？

在这个简单的例子中https jsfiddle net 4rsje4b6 1 https jsfiddle net 4rsje4b6 1 为什么是 test在警报出现之前元素未显示 jQuery 不应该吗 css 方法是同步的吗 test
如何告诉 TSC 脚本文件不会共享作用域并忽略重新声明

问题疑问我正在使用 VSCode 的 TS 驱动的 JS 检查功能来对一堆 JS 文件进行类型检查这些文件将通过以下方式导入
如何制作具有部分透明边框的任意大小的 html 元素？

考虑下图这应该看起来像一片边缘粗糙有斑点的草这是一张 200x200 像素的 png 图像边缘具有透明度以提供自然的外观问题是我正在尝试设计一个网页我希望所有不同尺寸的各种元素都具有此背景但我无法使用简单的 css 背景属
如何向 Android 应用程序提供 Jacoco 代理？

我正在尝试使用 Jacoco 进行手动测试来获得代码覆盖率我正在尝试使用离线仪器 http www eclemma org jacoco trunk doc offline html http www eclemma org jacoco
如何创建自己的 Haar 级联分类器以进行自定义对象检测？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我想检测汽车但可用的 xml 文件对于准确检测来说不太强大如何创建自定义 xml 文件我可以为任何对象创建任何帮助将不胜感激
如何使用 JQuery 访问 WTForm

我想请求有关访问 WTForm 字段的帮助我有以下表格 class model bolt InputForm FlaskForm Bolt Inputs bolt size SelectField Bolt size mm choices
动态初始化

C 03标准 basic start init 第3点 states 是否动态是实现定义的命名空间对象的初始化 8 5 9 4 12 1 12 6 1 作用域是在 main 的第一个语句之前完成的如果初始化被推迟到第一次之后的某个时间
如何在使用 jQuery 添加新行时刷新简单的数据表

我认为这个很简单但我找不到与 ajax 加载的数据或数组中提供的数据无关的参考我在现有的 HTML 表上使用 DataTables 基本代码如下 table wizard dataTable lengthChange false iDi
测试使用 IntersectionObserver 的代码

我的应用程序中有一个处理无限滚动分页的 JavaScript 组件我正在尝试重写它以使用IntersectionObserver 如上所述here https developers google com web updates 2016
为每个因子组添加单独的 vlines 到 ggplot（变量重要性随机森林的点图）

我正在使用 ggplot2 制作随机森林中六个相关变量重要性结果的点图我的数据我已经使用 reshape2 将其转换为长格式如下所示我的真实数据集有点大 Factor Group Value Gender A 0 000127 Ag

为每个因子组添加单独的 vlines 到 ggplot（变量重要性随机森林的点图）

为每个因子组添加单独的 vlines 到 ggplot（变量重要性随机森林的点图） 的相关文章

随机推荐

热门标签

为每个因子组添加单独的 vlines 到 ggplot（变量重要性随机森林的点图）的相关文章