ggplot2：调整 R 中 PCA 双图中 PCA 载荷的标签位置

2024-02-20

Issue:

我制作了一个PCA biplot使用包ggbiplot/ggplot2。我使用该函数延长了载荷（箭头）geom_segment()我想删除原始加载（短箭头），保留较长加载（新箭头），保留带有灰色背景的标签，但重新定位它们，使它们不重叠并很好地位于较长加载的末尾箭头。在下面的 PCA 双图中，有 10 个载荷，但只有 8 个参数。有什么不对劲。

我通过 StackOverflow 在网络上进行了广泛的研究，并且我已要求 R Studio 社区解决我的问题，尽管如此，我能找到的唯一信息是通过不同的双标图函数或对其他完全不同的 PCA 包的引用（MASS、factoextra、FactoMineR、PCAtools 等），这些都没有解决我想回答的问题。

我真的很想继续使用ggbiplot/ggplot2为了更好地理解这两个包，我更喜欢视觉表示PCA biplot (see below)我创造了。我理想地希望双标图看起来像desired output (see below)。请参阅下面所附的数据。

如果有人可以提供帮助，我将不胜感激。

提前谢谢了

R-code:

install.packages("remotes")
remotes::install_github("vqv/ggbiplot")
install_github("vqv/ggbiplot")

#install.packages("devtools")
library(devtools)
library(ggbiplot)
library(ggplot2)
library(remotes)

#You can do a PCA to visualize the difference between the groups using the standardised box cox data
PCA=prcomp(Whistle_Parameters[2:18], center = TRUE, scale=TRUE, retx = T)

#PCA loadings
PCAloadings <- data.frame(Variables = rownames(PCA$rotation), PCA$rotation)

#Place label into an object
Country<-data$Country

#PCA biplots
PCA_plot1<-ggbiplot::ggbiplot(PCA, ellipse=TRUE, circle=TRUE, varname.adjust = 2.5, groups=Country, var.scale = 1) +
                     ggtitle("PCA of Acoustic Parameters") +
                     theme(plot.title = element_text(hjust = 0.5)) +
                     theme_minimal() +
                     theme(panel.background = element_blank(), 
                     panel.grid.major = element_blank(), 
                     panel.grid.minor = element_blank(),
                     panel.border = element_blank()) + 
                     geom_vline(xintercept = 0, lty = 2) +
                     geom_hline(yintercept = 0, lty = 2) +
                     theme(axis.line.x = element_line(color="black", size = 0.8),
                     axis.line.y = element_line(color="black", size = 0.8)) +
                     geom_segment(data = PCAloadings, aes(x = 0, y = 0, xend = (PC1*4.6),
                                yend = (PC2*4.6)), arrow = arrow(length = unit(1/2, "picas")),
                                color = "black", alpha=0.75) +
                     scale_color_manual(values=c('#E69F00', '#56B4E9')) 

#The options for styling the plot within the function itself are somewhat limited, but since it produces a 
#ggplot object, we can re-specify the necessary layers. The following code should work on any object 
#output from ggbiplot. First we find the geom segment and geom text layers:
seg <- which(sapply(PCA_plot1$layers, function(x) class(x$geom)[1] == 'GeomSegment'))
txt <- which(sapply(PCA_plot1$layers, function(x) class(x$geom)[1] == 'GeomText'))

#We can change the colour and width of the segments by doing
PCA_plot1$layers[[seg[1]]]$aes_params$colour <- 'black' 
PCA_plot1$layers[[seg[2]]]$aes_params$colour <- 'black'

#To change the labels to have a gray background, we need to overwrite the geom_text layer with a geom_label layer:
PCA_plot1$layers[[txt]] <- geom_label(aes(x = xvar, y = yvar, label = PCAloadings$Variables,
                                         angle = 0.45, hjust = 0.5, fontface = "bold"), 
                                         label.size = NA,
                                         data = PCA_plot1$layers[[txt]]$data, 
                                         fill = '#dddddd80')

PCA_plot1

主成分分析双标图

所需输出

Data

structure(list(Country = structure(c(1L, 1L, 1L, 1L, 1L, 1L, 
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L), .Label = c("France", "Germany"
), class = "factor"), Low.Freq = c(1229.098358827, 759.408910773596, 
627.156561121131, 857.914227798394, 816.020512657709, 726.252107003186, 
603.388640229802, 1120.43591201848, 521.916239230762, 66.4277073927702, 
842.827028732445, 1548.00685289626, 743.586603639966, 982.298813187027, 
938.898554484786, 908.067281510105, 1650.51840217509, 435.837013213028, 
905.64518713548, 621.693057238002, 408.874626715846, 763.284854056395, 
1163.36397892984, 1267.90558781017, 1561.05494859439, 269.110242829792, 
1628.20258277437, 1381.52801863709, 1259.64885050619, 582.429604337893
), High.Freq = c(270.037998321385, 673.100410969792, 1354.51641087434, 
582.818682820139, 1949.42791374982, 533.072062804075, 1462.73353623344, 
1475.85981044777, 1672.72713391206, 1360.85064740235, 1027.62671423916, 
1637.72929840934, 555.708652550379, 683.537132648398, 1714.01010661954, 
267.117743854174, 738.883902818488, 842.919932827166, 124.511854388999, 
1940.70836004547, 991.37814311059, 1959.73951887933, 435.882938574683, 
223.944759894009, 827.050231552967, 1929.9835959516, 731.983627515309, 
934.515637669084, 1381.80407878684, 1735.12129509753), Start.Freq = c(209.223178720873, 
1243.93824398519, 714.942866646311, 1230.88587487336, 1133.38920481274, 
655.640254812419, 176.783487591076, 566.793710992312, 1259.4101411541, 
135.19626803044, 1188.65745695622, 1055.06564740433, 145.269654935287, 
994.102001940972, 611.97046714505, 1239.25416627405, 273.254811174704, 
1187.0983873612, 532.369927415851, 730.144132713145, 306.959091815357, 
761.432150933258, 833.35964575595, 633.492439842001, 1011.91529244509, 
1002.6837164403, 874.223664731894, 1039.77329580107, 571.716041690428, 
358.734914494325), End.Freq = c(3100.50977989246, 2865.99128764993, 
3749.07057886566, 1662.75251781181, 3469.5453928947, 1223.29004528624, 
1571.69393815622, 3877.90064918956, 3467.9046701139, 2812.46639335828, 
3344.48917919081, 823.479192696172, 3587.72640978872, 1943.42597579601, 
3726.46938122543, 904.270327650973, 2199.36865174236, 1608.75061469279, 
1233.86988042306, 3573.54022639883, 3840.13648049746, 2696.92512488242, 
2152.58952962537, 2225.74334558365, 2836.8576276391, 3909.86535579565, 
2642.3514330105, 3830.39875611625, 2532.59589574087, 2047.68204963624
), Peak.Freq = c(615.103200058515, 781.386010343022, 1254.22250479111, 
1042.32081012698, 1785.4136370848, 609.196990586287, 936.529532621528, 
628.617072934145, 1138.00887772997, 965.752651960148, 331.381776986669, 
831.243197072226, 1396.09323352817, 796.57855885715, 1434.02692184993, 
581.91826512844, 1482.84787412806, 712.229765737013, 711.849861782499, 
379.432018940052, 1495.87429192735, 1375.38825516007, 1568.51147252198, 
39.6849748542959, 254.973241980045, 526.048000326837, 1599.41223732841, 
1723.40465012645, 461.157566614546, 847.403323972557), Center.Freq = c(-0.00396318509300687, 
0.377462792184857, 1.66350671788962, -0.152573382048654, 0.438259482923988, 
1.62149800844459, 0.501892326424285, -0.166579179714419, 1.06081611813746, 
1.39199162769052, 1.52164843383928, -0.389958351497529, 0.00261034688899059, 
0.0726410215179534, 1.00473421813784, 1.27072495569536, 1.41569796343226, 
0.737375815997266, 0.412628778604207, 0.51099123600198, 1.65512836540775, 
-1.12408230668747, 0.438260531725931, -1.11347230908714, 1.09021071848368, 
1.26465014876586, -0.663254496003035, 0.64384027394782, 1.29816899903361, 
0.0302328674903059), Delta.Freq = c(2374.48934930825, 2535.28648042237, 
930.363518659463, 2372.94461226817, 2578.50041236941, 1652.93682378145, 
2412.64071270543, 1643.35808756239, 1597.6988634255, 2347.87731769764, 
1545.35983248752, 417.894712991398, 676.404759114593, 2717.74464723351, 
2750.52013318133, 1387.50061490775, 1088.18301844773, 208.885548316239, 
982.856603814324, 1304.55461743298, 2064.83914948351, 1454.17493801179, 
1975.72909682146, 1340.40119652782, 1358.81720189322, 398.974468430338, 
1807.83210129773, 197.995771350184, 1458.91300578134, 2459.54002342707
), Delta.Time = c(1.52332103330495, -0.729369599299347, 0.5446606158259, 
-0.0806278952890181, -1.03355982391612, 0.381391555011319, -0.710006011318096, 
0.184876103317229, -0.0939796220798944, 0.878826387745255, 0.889598364118577, 
0.929698941247702, 0.734996499853458, -0.43364546563554, -0.176575903721404, 
0.556057576098353, -0.31543237357059, 1.31950129257089, 1.08676447814548, 
-1.08756351145615, -0.163851619861579, -0.945982375537661, 0.473134073749239, 
-0.231569591521918, -0.565159893817776, 1.14721196081124, -1.14555651287826, 
1.60486934195338, -1.00704726744845, 1.14020903183312)), row.names = c(NA, 
30L), class = "data.frame")

将载荷保存在单独的数据框中，然后使用 ggplot::geom_segment 进行绘图怎么样？像这样：

#You can do a PCA to visualize the difference between the groups using the standardised box cox data
PCA = prcomp(df[2:9], center = TRUE, scale=TRUE, retx = T)

#PCA loadings
PCAloadings <- data.frame(Variables = rownames(PCA$rotation), PCA$rotation)

# add PCA scores to the dataset
df[, c('PC1', 'PC2')] = PCA$x[, 1:2]

# save variable loadings in a separate dataset
rot = as.data.frame(PCA$rotation[, 1:2])
rot$var = rownames(PCA$rotation)

# rescale the loadings to fit nicely within the scatterplot of our data
mult = max(abs(df[, c('PC1', 'PC2')])) / max(abs(rot[, 1:2])) / 2
rot[, 1:2] = rot[, 1:2] * mult

# ggplot the scatterplot and rotation taken from separate data.frames
ggplot(data = rot, aes(x = 0, y = 0, xend = PC1, yend = PC2, label = var)) +
  geom_point(data = df, aes(PC1, PC2), inherit.aes = FALSE) +
  geom_segment(color = 'red', arrow = arrow(length = unit(0.03, "npc"))) +
  geom_label(aes(PC1 * 1.2, PC2 * 1.2)) +
  theme_bw() +
  theme(panel.grid = element_blank())

# if there are many variables to plot, you can play with ggrepel 
library(ggrepel)  
ggplot(data = rot, aes(x = 0, y = 0, xend = PC1, yend = PC2, label = var)) +
  geom_point(data = df, aes(PC1, PC2), inherit.aes = FALSE) +
  geom_segment(color = 'red', arrow = arrow(length = unit(0.03, "npc"))) +
  geom_label_repel(aes(PC1 * 1.2, PC2 * 1.2)) +
  theme_bw() +
  theme(panel.grid = element_blank())

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

ggplot2：调整 R 中 PCA 双图中 PCA 载荷的标签位置的相关文章

上传到 Shiny 服务器后在 R 中解压文件

我正在尝试在我们的本地服务器上使用 Shiny 来构建一个应用程序允许用户上传包含 ESRI shapefile 和关联文件的 zip 文件 Shiny 服务器的 fileInput 可以获取数据并且当它这样做时它会将其存储在临时目录
将文件名附加到 R 中的数据框

我想将文件名附加到我的表中但它似乎并没有真正起作用我正在做的是迭代文件名列表打开它们将所有数据附加到一个数据帧对于每个附加文件我想添加其文件名我希望将其附加到每一行以便稍后当我查看数据时我会知道给定行源自哪个文件但似乎并
tidyverse - 将命名向量转换为 data.frame/tibble 的首选方法

使用tidyverse我经常面临将命名向量转换为向量的挑战data frame tibble列是向量的名称执行此操作的首选 tidyverse 方式是什么编辑这与 this https github com hadley dplyr
将动物园转换为数据框

我转换了一个zoo time series到数据框中R日期成为数据框的索引有没有办法将日期表示为数据框中的普通列 monthly df lt data frame monthly zoo head monthly zoo head mon
如何使用合并或替换来更新 R 中具有多列的表

我想做一些与这个问题非常相似的事情如何使用 merge 更新 R 中的表 https stackoverflow com questions 3190118 how to use merge to update a table in r
sklearn 中的 pca.inverse_transform

将我的数据拟合后 X 我的数据 pca PCA n components 1 pca fit X X pca pca fit transform X 现在 X pca 具有一维当我根据定义执行逆变换时它不是应该返回原始数据即 X 二维
用于安装 R 软件包的备用编译器：clang：错误：不支持的选项“-fopenmp”

我正在尝试在 OS X 10 11 6 上使用 R 版本 3 4 0 安装 rJava 包 install packages rJava type source 我收到以下错误 clang o libjri jnilib Rengine o
使用 dplyr 对连续变量进行分类[重复]

这个问题在这里已经有答案了我想基于连续数据创建一个具有 3 个任意类别的新变量 set seed 123 df lt data frame a rnorm 100 使用基地我会 df category df a lt 0 5 lt low
使用括号表示 y 轴上的负值 ggplot2

我想在括号中显示 y 轴负值而不是用负号例如我想显示 2 000 而不是 2 000 我在 R 中使用 ggplot2 我尝试在scale y continuous内部使用 negative parens TRUE 如下所示但没有成
Rplotly：悬停时显示图像

我正在尝试重现this https plotly r com interactives tooltip image html显示数据点悬停图像的简单绘图代码可用here https plotly r com supplying custo
如何从 ISI Web of Knowledge 检索有关期刊的信息？

我正在从事一些预测文章引用计数的工作我遇到的问题是我需要 ISI Web of Knowledge 中有关期刊的信息他们逐年收集这些信息期刊影响因子特征因子但无法一次下载所有一年期期刊信息只有标记全部选项该选项始终标记列表
将所有 0 值替换为 NA

我有一个包含一些数字列的数据框某些行具有 0 值在统计分析中应将其视为空在R中将所有0值替换为NULL的最快方法是什么将所有零替换为 NA df df 0 lt NA 解释 1 它不是NULL你应该用什么来替换零正如它所说 NUL
R 中的“右”滚动平均值和“左”滚动平均值是什么？

如果我想计算之前的n意味着年份滞后于当年我将如何实现这一点它像右滚动平均窗口一样简单吗或者它是一个左滚动平均窗口我不确定这里使用哪个窗口样本数据 set seed 1234 dat lt data frame year c
使用 ggplot 2 使用线条或线段将堆栈条形图与多个组连接起来

我正在对一些患有某种疾病的患者进行一项研究并在 3 个不同的时间点使用顺序量表评估功能状态我想在这些时间点的堆叠条形图中连接多个组我查看了这些主题但尚未使用这些建议使其发挥作用如何将线条放置在堆积条形图的边缘 https stac
R 中的卡方拟合优度检验

我有一个观察值向量还有一个用模型计算的值向量 actual lt c 1411 439 214 100 62 38 29 64 expected lt c 1425 3 399 5 201 6 116 9 72 2 46 3 30 4 6
单击 hPlot 图表中闪亮的数据点时打印组名称

我有一个闪亮的应用程序它使用 rCharts 中的 highcharts 库显示一些图表在某些情况下我在单个图表上有多个图表这些图表是使用 hPlot 中的组选项创建的我希望在单击图表时打印单个数据点的所有参数 x y 和组值我
使用格式表过滤数据框

样本数据修改自formattablegithub 文档 df lt data frame id 1 10 name c Bob Ashley James David Jenny Hans Leo John Emily Lee age c
在 R 中，如何获得某些向量值的所有可能组合？

背景我有一个需要一些参数的函数我想要获得所有可能的参数组合的函数结果一个简化的例子 f lt function x y return paste x y sep colors c red green blue days c Monda
将 SAS sas7bdat 数据读入 R

R 有哪些选项可以读取本机 SAS 格式的文件 sas7bdat 进入R The NCES 共同核心 https nces ed gov ccd pubschuniv asp例如包含以此格式保存的大量数据文件存储库为了具体起见让我们集
R：交换两个变量而不使用第三个变量

我有两个变量即 a lt 1 b lt 2 我想交换他们的价值观是否有任何内置的 R 函数能够执行该操作或者是否有其他优雅的方式而不使用第三个临时变量 Note 如果可能的话适用于字符串或其他数据类型有一个通用的解决方案或技

随机推荐

com.google.android.gms.maps.MapFragment：无法解析符号“地图”

我已遵循此处的所有指示没有任何问题 https developers google com maps documentation android start getting the google maps android api v2 h
我在 Nhibernate Query Over fetch 上做错了什么吗？

我有这个 using ITransaction transaction session BeginTransaction Task tAlias null CompletedTask cAlias null List
从 D 中的字符串获取普通 char*？

我正在尝试弄清楚如何从 D 字符串不可变 char 获取普通的可变 C 字符串 char 以便将字符数据传递给遗留的 C 代码 toStringz 不起作用因为我收到一条错误说我无法将 immutable char 类型的表达式 t
在 Python 中切片字符串时如何使用变量作为索引？

我一直在尝试使用循环从字符串中切出两个字符但它不是抓取两个字符而是只抓取一个我试过了 input i i 1 and input i i 1 但似乎都不起作用如何使用变量进行切片完整的例程 def StringTo2ByteLis
查看netbeans中的执行线

当我按下运行程序按钮向右指向的绿色箭头时如何查看 netbean v6 8 用于执行我的 java 应用程序的执行行我正在寻找类似的东西 java cp 构建类主要我正在尝试从 15 年使用 vi 编写 c 和 c 转向 jav
iPhone iOS 5.0 OpenGl ES 2.0

说真的我已经花了几周甚至几个月的时间来寻求有关 iPhone 上使用 XCode 4 2 的 OpenGL 的一些认真帮助我需要一个很好的教程介绍如何从使用新的 XCode 4 2 的 OpenGL 游戏模板开始然后从那里开始进展
Chrome 不支持 css @page？

我有用于打印的CSS 就像这样简单 page top left content TOP SECRET color red bottom center content counter page font style italic 但Chrom
如何使用 Riverpod 在 Flutter 中刷新 FutureProvider 而无需再次显示加载指示器？

目前我正在刷新一个 FutureProvider 它负责从 Firebase 获取数据并将其显示在一个简单的 ListView 中液体拉动刷新 https pub dev packages liquid pull to refresh包这
JavaScript：那个与这个

我试图更好地理解 JavaScript 中 that 和 this 的用法我在这里关注 Douglas Crockford 的教程 http javascript crockford com private html http javas
按行拆分数据框并另存为 csv

我只有一个数据框想要按行分割数据框将几个新数据框分配给新变量并将它们保存为 csv 文件 a lt rep 1 5 each 3 b lt rep 1 3 each 5 c lt data frame a b a b 1 1 1 2 1
将 zip 文件解压到本地文件夹

我有带有 Express 的节点应用程序我从邮递员等客户端发送请求我需要从req并将其解压到我的本地文件夹中我该怎么做我找到了以下开源但不知道如何获取req body并将其提取到我的本地文件夹中例如 C Test extractD
Selenium WebDriver + Tor 作为 Stem 的代理？

我需要确认是否可以使用 Stem 启动公开 127 0 0 1 port 的 Tor 进程然后在 selenium 脚本上使用它作为代理 SOCKS 我正在使用 Python 3 4 2 Stem 1 3 0 和 Tor tor win3
如何在 IPython jupyter 笔记本中传递命令行参数

我是 Ipython 的新手目前我已经使用 Anaconda 安装了 Ipython 并编写了使用 jupyter Notebook UI 绘制图表的代码我想在 argparse 模块的帮助下将一些参数传递给我的工作脚本下面是代码 i
从 Python AST 生成 .pyc？

如何从 Python AST 生成 pyc 文件以便可以从 Python 导入该文件我用过compile创建一个代码对象然后编写co code属性到文件但是当我尝试从 Python 导入文件时我得到一个ImportError Bad
对元素进行随机排列，使得任何元素都不应出现在其原始索引处

我有一个对象元素列表 SourceList ResultList Expected Obj A Obj F Obj B Obj C Obj C Obj G Obj D Obj B Obj E Obj A Obj F Obj B Obj G
我们如何让 DynamicData 与 EFPocoAdapter 一起工作？

我的团队希望使用 EFPocoAdapter 但也希望使用 DynamicData 工具但遇到了一些问题我们基本上将动态数据实体 Web 应用程序项目添加到 EFPocoAdapter Northwind 示例解决方案我使用的是最
当我尝试在 Windows Server 2008 中安装 64 位 mongodb 时，出现“访问被拒绝”的情况

我所做的就是运行下面的脚本 D Tools MongoDb bin mongod exe dbpath D MongoDb data 然后我得到了例外连接到服务控制管理中心时出错访问被拒绝 5 我使用管理员帐户来操作此操作我已经创建了
needDisplayForKey/actionForKey 覆盖是否正常工作？

我正在尝试将一些在 Objective C 中运行的代码转换为 Swift 我遇到的问题是 needsDisplayForKey actionForKey 没有以相同的方式被调用据我所知自定义键值未正确传递这是我调试时得到的结果默认
讲解Tkinter文本搜索方法

我不太明白 text search 方法是如何工作的比如有一句话 Today a red car appeared in the park 我需要找到a red car序列并突出显示它它已找到但我的突出显示如下所示我在用self t
ggplot2：调整 R 中 PCA 双图中 PCA 载荷的标签位置

Issue 我制作了一个PCA biplot使用包ggbiplot ggplot2 我使用该函数延长了载荷箭头 geom segment 我想删除原始加载短箭头保留较长加载新箭头保留带有灰色背景的标签但重新定位它们使它们不重叠

ggplot2：调整 R 中 PCA 双图中 PCA 载荷的标签位置

ggplot2：调整 R 中 PCA 双图中 PCA 载荷的标签位置 的相关文章

随机推荐

热门标签

ggplot2：调整 R 中 PCA 双图中 PCA 载荷的标签位置的相关文章