在汇总表中添加一列，其中包含每个变量的分布图

2024-05-06

有没有一种好方法来添加包含每个变量的分布图的列？

例如这里：

library(vtable)
st(iris)

没有必要使用这个包。接受建议

尽管我知道这可能更容易做到ggplot，我总是渴望看看我是否可以达到类似的结果base R绘图工具。我将利用iris本例中的数据。

我们首先需要确定我们的哪些列data.frame是数字。

# returns logical which is TRUE if column p is numeric
numeric_cols <- c(rep(NA, ncol(iris)))
for(p in seq_len(ncol(iris))) {
  numeric_cols[p] <- inherits(iris[, p], 'numeric')
}

然后，我们可以选择一些任意颜色的密度。在这里，我选择了三种颜色，分别对应于级别的数量iris$Species.

my_cols <- c('blue4', 'darkorange', '#00b0a4')
adj_col <- \(x) adjustcolor(x, alpha.f = 0.2)
my_transp_cols <- c(
  adj_col('blue4'), adj_col('darkorange'), adj_col('#00b0a4')
)

现在我们需要绘制密度。下面给出的函数（即plot_densities）可以选择提供边际密度或以某些因子变量为条件的密度。如果您想获得以某些因子变量为条件的密度，只需设置include_factor to TRUE并将感兴趣的因子变量传递给factor争论。

plot_densities <- \(DF, columns, include_factor = FALSE, factor) {
  name_vars <- names(DF)
  DF <- DF[complete.cases(DF[name_vars]), ]
  ## setting up plotting device
  layout(matrix(seq_len(4L), ncol = 4L))
  ## only use the TRUEs indicating numeric columns
  n_cols <- length(columns[columns])
  ## if densities are to be shown per factor level
  if (include_factor) {
    par(mar = c(5, 4, 4, 8) + 0.1, xpd = TRUE)
    lvls <- unique(levels(DF[[factor]]))
    for (i in seq_len(n_cols)) {
      ## preallocation
      max_y <- max_x <- min_x <- rep(NA, length(unique(levels(DF[[factor]]))))
      means <- SDs <- rep(NA, length(unique(levels(DF[[factor]]))))
      no_of_levels <- length(lvls)
      for (j in seq_len(no_of_levels)) {
        ## only proceed with this loop if column i is numeric else next
        if (columns[i]) {
          ## subset consisting values of column i for factor level j
          sub <- subset(DF, DF[[factor]] %in% lvls[j])[, i]
          ## make sure that the densities of column i per factor level j
          ## are depicted in the same panel
          if (j == 1) {
            ## limits for the x and y axes per panel for column i
            for (k in seq_len(no_of_levels)) {
              sub_k <- subset(DF, DF[[factor]] %in% lvls[k])[, i]
              x <- density(sub_k)$x
              y <- density(sub_k)$y
              min_x[k] <- min(x)
              max_x[k] <- max(x)
              max_y[k] <- max(y)
            }
            ## mean and SD for column i per factor level j
            r <- \(x) format(round(x, 1L), nsmall = 1L)
            for (kk in seq_len(no_of_levels)) {
              sub_kk <- subset(DF, DF[[factor]] %in% lvls[kk])[, i]
              means[kk] <- r(mean(sub_kk, na.rm = TRUE))
              SDs[kk] <- r(sd(sub_kk, na.rm = TRUE))
            }
            x_lim <- c(min(min_x), max(max_x))
            y_lim <- c(0L, max(max_y))
            plot(density(sub), main = '',
                 las = 1, col = my_cols[j], xlab = '',
                 xlim = x_lim, ylim = y_lim, bty = 'n')
            title(main = names(DF)[i], xpd = TRUE, adj = 1)
            polygon(density(sub), density = -1L, col = my_transp_cols[j])
          } else {
            lines(density(sub), col = my_cols[j])
            polygon(density(sub), density = -1L, col = my_transp_cols[j])
          }
        } else next
      }
      ## add legend to the plot
      legend('topright', paste0(lvls, ': ', means, ' (', SDs, ')'),
             fill = my_transp_cols, bty = 'n',
             inset = c(-0.5, 0.1))
    }
  } else {
    ## if densities are NOT to be shown per factor level
    for (i in seq_len(n_cols)) {
      par(mar = c(5, 4, 4, 8) + 0.1, xpd = TRUE)
      ## only proceed with this loop if column i is numeric else next
      if (columns[i]) {
        ## mean and SD for column i
        r <- \(x) format(round(x, 1L), nsmall = 1L)
        means <- SDs <- rep(NA, n_cols)
        for(j in seq_len(n_cols)) {
          means[j] <- r(mean(DF[, j], na.rm = TRUE))
          SDs[j] <- r(sd(DF[, j], na.rm = TRUE))
        }
        plot(density(DF[, i]),
             las = 1, main = names(DF)[i], col = my_cols[1L], xlab = '',
             bty = 'n')
        polygon(density(DF[, i]), density = -1L, col = my_transp_cols[1L])
        ## add legend to the plot
        legend('topright', paste0(names(DF)[i], ': ', means[i], ' (', SDs[i], ')'),
               fill = my_transp_cols[1L], bty = 'n',
               inset = c(-0.5, 0.1))
      } else next
    }
  }
}

我们可以将输出保存为 .pdf 文件。如果你想改变layout绘图设备，比你还必须玩一点width and height使其适合您的具体情况。

# marginal densities
pdf(file = 'my_directory/my_plot.pdf', # change my_directory
    width = 13, height = 4) 
plot_densities(DF = iris, columns = numeric_cols)
dev.off()

# conditional densities
pdf(file = 'my_directory/my_plot2.pdf', # change my_directory
    width = 13, height = 4) 
plot_densities(DF = iris, columns = numeric_cols,
               include_factor = TRUE, factor = 'Species')
dev.off()

我通常制作我的图的 .pdf 文件，然后使用这个在线转换工具 https://pdf2jpg.net/将它们转换为 .png 文件。

我在图例中显示了平均值 (SD)，但您可以选择显示您喜欢的任何统计数据。只是改变mean(sub) and sd(sub)在您感兴趣的统计功能中。

Output

Marginal densities

Conditional densities

注意：使用function(x)代替\(x)如果您使用 R

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

在汇总表中添加一列，其中包含每个变量的分布图的相关文章

使用 R 数学独立库使用 C++ 编写矩阵/向量？

All 我一直在使用 C 中的 R 数学独立库我非常喜欢能够生成随机数并使用我熟悉的 R 分布函数我的问题是是否可以使用 R 中可用的矩阵运算乘法转置逆 Chol 等一个独立的库我在 Rmath h 中没有看到它们如果矩阵
按值对 geom_bar ggplot2 中的条形重新排序

我正在尝试制作一个条形图其中的图是从miRNA与最高的value to the miRNA与最低的为什么我的代码不起作用 gt head corr m miRNA variable value 1 mmu miR 532 3p pos
从数据帧创建 sf 多边形

我有一个包含一组多边形坐标的数据框这就是我将其转换为spatialPolygons 包sp 的方法 my df lt data frame Plot c A A A A A B B B B B Corner c SW NW NE SE S
相对于时间求平均值

我有以下带有日期时间和相应值的数据集时间间隔为每10分钟一次我需要以 15 分钟的间隔生成新行例如 15 40 的值为 599 15 50 的值为 594 因此需要在两者之间生成一个新行即 15 45 的平均值为 599 和 594
可以使用部分名称访问列表成员吗？这是一个功能吗？

考虑这个 R 代码 gt l list key 1 gt l k 1 1 gt l ke 1 1 gt l k NULL gt names l 1 key 这是否意味着您可以使用以下方式访问列表成员及其部分名称当我在一次令人沮丧的错误搜
在 R 中创建 xlsx 工作表 - 字体颜色不起作用

我正在开发一个项目需要从特定类型的数据框架自动生成数据电子表格我读过关于如何执行此操作的有用解释here http www sthda com english wiki r xlsx package a quick start guid
如何从 Matlab 运行 R 脚本 [重复]

这个问题在这里已经有答案了我有 m 文件我想用它来运行 R 脚本我怎样才能做到这一点 Matlab文件 caller m some matlab code need to call a R script some matlab cod
R 彩色树状图建议？

我想制作彩色树状图但尚未找到足够的库 http addictedtor free fr graphiques RGraphGallery php graph 79 http addictedtor free fr graphiques R
在 jupyter 笔记本中内联显示 R ggplots

我正在尝试运行这里找到的一个简单示例 https www datacamp com community blog jupyter notebook r gs OczVCjA https www datacamp com community
如何找到连续数字的区间开始和结束的位置？

我有一个向量 vec lt c 2 3 5 6 7 8 16 19 22 23 24 连续的数字是 c 2 3 c 5 6 7 8 c 22 23 24 所以第一个向量从 2 开始到 3 结束第二个向量从 5 开始到 8 结束对于第
从 R 中的函数绘制到文件

背景嘿大家我是 R 的新手在一位团队成员提供了关于 R 在学术环境中的有用性的教程后我对使用它产生了兴趣我正在尝试编写一个脚本来自动从多个文件中读取数据然后将结果图表绘制到多个文件中以便可以轻松地将它们添加到手稿中 Power
R中舍入单位的舍入数字[重复]

这个问题在这里已经有答案了我正在尝试按舍入单位对数字进行舍入例如 value lt c 8 21 1 76 6 42 1 94 10 38 如果舍入单位为 0 2 则结果为 8 2 1 8 6 4 2 0 10 4 我怎样才能在R中做到
当隐含 ID 列时，如何合并 csv 文件中的多个数据框？

我想将一堆数据框合并在一起因为如果您只处理一个数据框则许多操作似乎会更容易但如果我错了请纠正我目前我有一个像这样的数据框 ID var1 var2 A 2 2 B 4 5 Z 3 2 每个 ID 位于单行上并带有多个单个测量值
错误消息：fn(x, ...) 中的错误：已过时的 VtV 不是正定的

我正在尝试使用 lmer 函数创建一个最小足够模型我的模型已配对尺寸尝试状态随机因素 as logical Mated as numeric Size as factor Attempts as factor Status 这些都
使用 tidymodel 运行多个回归模型

我最近一直在使用 tidymodels 来运行模型并选择最能满足某些目标函数的参数例如对 mtcars 数据使用假设回归使用此问题底部答案中的回归示例作为示例 https stackoverflow com questions 241
使用 rpy2 将 NULL 从 Python 转换为 R

在 R 中经常NULL值用作默认值使用 Python 和 RPy2 如何显式提供NULL争论 None不可兑换 NotImplementedError 字符串 NULL 只会被转换为字符串并在执行过程中导致错误采取以下示例使用tsi
从 R 中的因子记录创建变量

我有点迷失了我有一个如下所示的数据框 tract ageClass count 1 0 4 71 2 0 4 192 3 0 4 81 1 5 8 9 2 5 8 86 3 5 8 42 我想要这样的结果 tract 0 4 5 8 1
如何在data.table中使用OR条件连接表

在 data table 中是否可以使用 OR 条件连接表例如 library data table X lt data table x c a b c d e f y c 1 1 2 2 3 3 z c 10 11 12 13 14 1
如何在变成因子的变量中保留原始值？

这是一些工作代码来说明我的问题 Categorical variable recorded as numeric integer df1 lt data frame group c 1 2 3 9 3 2 9 1 9 3 2 我有一个分类变
即使设置了语言环境，data.frames中的藏文字符也无法在R控制台中显示（中文可以，矩阵中的藏文可以）

在 R 中藏文字符位于 data frames 中时无法正确显示 gt Sys setlocale LC CTYPE Tibetan 1 Tibetan China 950 gt data frame a a 1

随机推荐

在 Android 模拟器上运行 google 地图应用程序

My application uses Google Maps v2 This application successfully working on Android powered device I tried to run the sa
Virtualbox“端口转发”从访客到主机[关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案这是我的设置 Host Windows XP Guest Ubuntu 10 04 Networking NAT 我正在 Guest 上设置 Apac
Anaconda：永久包含外部包（如 PYTHONPATH 中的包）

我知道如何使用 Anaconda 安装软件包conda install以及如何安装上的软件包PyPi https pypi python org pypi中描述的manual http conda pydata org docs build
Swift 1.2 重新声明 Objective-C 方法

我刚刚从 swift 1 1 更新到 swift 1 2 并得到编译器错误 Method setVacation redeclares Objective C method setVacation 这里有一些代码 var vacation
Angular 4 默认单选按钮默认选中

我试图根据从对象获得的值将单选按钮标记为默认值它可以是 True 或 False 根据选项我可以做什么来标记为默认单选按钮
我认为 *.DDS 文件应该能够快速加载？

好的所以我正在尝试权衡使用各种不同纹理压缩技术的利弊我 99 999 的时间都在使用 DirectX 为 Windows 机器编写 2D 精灵游戏到目前为止我已经研究了带有 alpha 修剪的纹理打包 SpriteSheets 这似
UseMethod("select") 中的错误：没有适用于“select”的方法应用于“character”类的对象

这个问题与这个问题非常相似为所有日期类别制作系数 https stackoverflow com questions 69520290 make coefficient for all dates categories 不同的是retur
用 C 语言实现 FIR 滤波器的循环缓冲区

我正在嵌入式微控制器 TMS320F28069 上进行编程这是一个 32 位浮点 MCU 我正在研究一些示例项目其中一个在 ADC 采样数据上实现了一个简单的 FIR 滤波器框图在这里 https i stack imgur com
在类中使用静态互斥体

我有一个可以有很多实例的类它在内部创建并初始化来自第三方库使用一些全局变量的一些成员并且不是线程安全的我考虑过使用 static boost mutex 它将被锁定在我的类构造函数和析构函数中因此在我的线程中创建和销毁实例对于
获取邮件附件列表，无需下载整个邮件

我想要一种方法来获取消息的附件列表而不必下载整个消息使用 Users messages get 我们可以设置要返回的字段但我们只能选择 Payload 它将返回消息的整个有效负载 https developers google com
使用 div 作为链接 - 打开新选项卡的选项？

目前我在我的网站中使用这一小段 js 来允许我的 div 充当按钮 div Google div 但当我浏览网页时我经常做的事情是打开大量标签有什么方法可以修改我的代码以实现此目的吗这应该可以做到
C# 带有泛型的异常继承语法

我在 NHibernate 类定义中偶然发现了这一点 public class SQLiteConfiguration PersistenceConfiguration
如何对 KDB 中的每一行应用 max 函数？

我想确保列中的所有值x不小于 0 5 所以我这样做 update x max x 0 5 from myTable 但这会产生错误在KDB 工作室 http code kx com wiki StudioForKdb An error o
Android：删除行后如何刷新表格布局？

我有一个从 txt 文件检索数据的表格布局 txt文件中的每一行数据都会有一行数据假设我现在 txt 文件中有两行数据那么将生成两个表行是有意义的然后我添加了一个 OnLongPress 监听器当调用该监听器时它将从 txt 文
添加 Git 远程后“致命：拒绝合并不相关的历史记录”

我已将远程存储库添加到我正在使用的文件夹中 git remote add origin https github com
在有其他限制的情况下向有向无环图添加边

我有一个 DAG 我有这个操作来在两个节点之间添加一条边如果 A 可从 B 到达则 B 是 A 的父级如果 A 可以从 B 到达而无需通过另一个节点则 B 是 A 的直接父节点该图的要求是没有循环对于任何节点都有一个直接父
如何在 TextView 中显示西班牙语文本？

我有以下代码我尝试在文本视图中显示西班牙语文本当我运行应用程序时它显示在某些地方谁能告诉我显示西班牙语的详细程序 protected void onCreate Bundle savedInstanceState super on
TypeError：“WebElement”对象不是可迭代错误

我试图从维基百科主页提取所有链接但此代码显示 TypeError WebElement object is not iterable 错误 import time from selenium import webdriver from s
如何使用 Python 将具有非英语字符的变量打印到命令提示符

我有一个 python 程序可以生成泰米尔语字符串例如字符串可以是我可以在打开文件时使用 utf 8 将其完全按照此处显示的方式写入文本文件但是当我使用 print 函数将相同的字符串变量写入 stdout 时它会显示 3 个
在汇总表中添加一列，其中包含每个变量的分布图

有没有一种好方法来添加包含每个变量的分布图的列例如这里 library vtable st iris 没有必要使用这个包接受建议尽管我知道这可能更容易做到ggplot 我总是渴望看看我是否可以达到类似的结果base R绘图工具我将利

在汇总表中添加一列，其中包含每个变量的分布图

在汇总表中添加一列，其中包含每个变量的分布图 的相关文章

随机推荐

热门标签

在汇总表中添加一列，其中包含每个变量的分布图的相关文章