在 ggplot2 中使用 geom_point 有条件地使用抖动

2024-04-02

I have a graph with 12 variables divided into two groups. I can't use facets, but using colour and shape, I have been able to make the visualization easy to understand. However, there are some points that overlap (partially or wholly). I am using jitter to deal with these, but as you can see from the attached graph, this leads to all points being moved around, not just those with overlap. enter image description here

有没有办法有条件地使用抖动或闪避？更好的是，有没有办法将部分重叠的点并排放置？正如您所看到的，我的 x 轴是离散类别，向左/向右轻微移动并不重要。我尝试使用点图binaxis='y'，但这完全破坏了 x 轴。

Edit: 这张图 http://www.biomedcentral.com/1471-2180/7/56/figure/F1?highres=y已经成功地完成了我正在寻找的事情。

进一步编辑：添加此可视化背后的代码。

disciplines <- c("Comp. Sc.\n(17.2%)", "Physics\n(19.6%)", "Maths\n(29.4%)", "Pol.Sc.\n(40.4%)", "Psychology\n(69.8%)")

# To stop ggplot from imposing alphabetical ordering on x-axis
disciplines <- factor(disciplines, levels=disciplines, ordered=T)

# involved aspects
intensive   <- c( 0.660,  0.438,  0.515,  0.028,  0.443)
comparative <- c( 0.361,  0.928,  0.270,  0.285,  0.311)
wh_adverbs  <- c( 0.431,  0.454,  0.069,  0.330,  0.577)
past_tense    <- c(0.334, 0.229, 0.668, 0.566, 0.838)
present_tense <- c(0.680, 0.408, 0.432, 0.009, 0.996)
conjunctions <- c( 0.928,  0.207,  0.162, -0.299, -0.045)
personal      <- c(0.498, 0.521, 0.332, 0.01, 0.01)
interrogative <- c(0.266, 0.202, 0.236, 0.02, 0.02)
sbj_objective <- c(0.913, 0.755, 0.863, 0.803, 0.913)
possessive    <- c(0.896, 0.802, 0.960, 0.611, 0.994)
thrd_person <- c(-0.244, -0.265, -0.310, -0.008, -0.384)
nouns       <- c(-0.602, -0.519, -0.388, -0.244, -0.196)

df1 <- data.frame(disciplines,
                 "Intensive Adverbs"=intensive,
                 "Comparative Adverbs"=comparative,
                 "Wh-adverbs (WRB)"=wh_adverbs,
                 "Verb: Past Tense"=past_tense,
                 "Verb: Present Tense"=present_tense,
                 "Conjunctions"=conjunctions,
                 "Personal Pronouns"=personal,
                 "Interrogative Pronouns"=interrogative,
                 "Subjective/Objective Pronouns"=sbj_objective,
                 "Possessive Pronouns"=possessive,
                 "3rd-person verbs"=thrd_person,
                 "Nouns"=nouns,
                 check.names=F)

df1.m <- melt(df1)
grp <- ifelse(df1.m$variable %in% c('3rd-person verbs','Nouns'), 'Informational Features', 'Involved Features')
g <- ggplot(df1.m, aes(group=grp, disciplines, value, shape=grp, colour=variable))
g <- g + geom_hline(yintercept=0, size=9, color="white")
g <- g + geom_smooth(method=loess, span=0.75, level=0.95, alpha=I(0.16), linetype="dashed")
g <- g + geom_point(size=4,  alpha=I(0.7), position=position_jitter(width=0.1, height=0))
g <- g + scale_shape_manual(values=c(17,19))

我很好奇其他人可能会建议什么，但为了获得并排效果，您可以将主要的 x 轴类别编码为数字 (10, 20,..50) 加/减少量，例如 (0.. 10)/2 基于您使用的颜色类别。因此，您可以获得 x 轴为 9.6、9.8、10.0、10.2 ...，然后为 20.0、20.2、20.4。这可以创建一个有组织的图，而不是随机分配这些分数调整。

这是针对您的数据集的该想法的快速实现。它抵消了主 x 变量disciplines子类别的六分之一variable并将其用于无抖动的 x 值...

M = df1.m
ScaleFactor = 6
xadj = as.numeric(M$variable)/ScaleFactor
xadj = xadj - mean(xadj)   # shift it to center around zero
x10  = as.numeric(M$disciplines) * 10
M$x = x10 + xadj
g = ggplot(M, aes(group=grp, x, value, shape=grp, colour=variable)) 
g + geom_point(size=4,alpha=I(0.7)) + scale_x_discrete(breaks=x10,labels=disciplines)

请注意，每个类别中的值均匀分布且顺序相同。（此代码不包括图中所示的所有曲线拟合等）。

变化：如果“量化” y 值，您可以更清楚地看到效果，因此更多的值并排绘制。

M$valmod = M$value - M$value %% 0.2 + .1

然后使用valmod代替value in the aes()声明看看效果。

要恢复类别标签，请手动设置scale_x_discrete。这个版本使用了不同的ScaleFactor对于更宽的间距和量化的 y 轴：

M=df1.m
ScaleFactor = 3
# Note this could just be xadj instead of adding to data frame
M$xadj = as.numeric(M$variable)/ScaleFactor
M$xadj = M$xadj - mean(M$xadj)   # shift it to center around zero
M$x10  = as.numeric(M$disciplines) * 10
M$x = M$x10 + M$xadj

Qfact = 0.2  # resolution to quantize y values
M$valmod = M$value - M$value %% Qfact + Qfact/2  # clump y to given resolution

g = ggplot(M, aes(group=grp, x, valmod, shape=grp, colour=variable)) +
    scale_x_discrete(limits = M$x10, breaks=unique(M$x10),labels=levels(M$disciplines))
g + geom_point(size=3,alpha=I(0.7))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 ggplot2 中使用 geom_point 有条件地使用抖动的相关文章

mutate() 尝试在使用美元符号运算符时使用全局变量的值进行提取

我使用得到了有趣的结果mutate with a 当全局环境中碰巧存在与要提取的元素同名的变量时进行提取我正在运行 R 3 1 3 和 dplyr 0 4 3 9 这工作正常 library dplyr df lt data frame
r - 根据第一个向量重新排序第二个向量

寻找解决方案来执行以下操作有两个向量 a lt c 2 1 3 4 7 6 5 9 8 10 b lt c 3 2 1 6 5 4 7 8 9 10 我想创建第三个向量它给出向量的顺序b需要重新排序使其顺序与a 在这种情况下我想得到
成对散点图；一对多[重复]

这个问题在这里已经有答案了有没有一种简洁的方法来创建pairs仅将一个变量与许多其他变量进行比较的图换句话说我可以只绘制标准的一行或一列吗 pairs不使用循环的散点图矩阵融化你的数据然后使用带有facet的ggplot libr
尖点灾难的绘图表面（使用 gnuplot）

是否可以绘制曲面尖峰灾难 http en wikipedia org wiki Catastrophe theory Cusp catastrophe与 Gnuplot 这是一个可比情节 http ars els cdn com conte
替换因子列中的

我想更换
仅当 ggplot 中 y 轴的下限设置为 0 时才会出现图条[重复]

这个问题在这里已经有答案了我正在尝试创建一个条形图当我将限制设置为 0 7 时就会出现条形但是我希望下限为 1 而不是 0 当我将下限设置为 1 时条形图不会出现我收到以下错误消息 Removed 8 rows contain
基于列重复数据集中的行，但增加行[重复]

这个问题在这里已经有答案了我有一个数据集其中包含项目名称开始年份和合同期限我需要将这个数据集开发成时间序列例如我的数据集中的一行是项目 A 开始年份 2003 年合同期限 5 我想根据合同期限重复每一行我的数据集如下所示
如何很好地注释 ggplot2（手册）

Using ggplot2我通常使用geom text和类似的东西position jitter注释我的情节然而对于一个漂亮的情节我经常发现手动注释是值得的像下面这样 data2 lt structure list type str
magrittr 管道中的 WOE

如何将下面的证据代码权重放入 magrittr 管道中 df gt 我尝试过的一切似乎都不起作用 df library Information library magrittr df a c aa bb cc aa aa aa bb cc
VBScript for Excel：如何选择源数据 (.SetSourceData)？

我已经在谷歌和这里搜索了这个问题的答案但没有成功如果之前有人问过那么我道歉我正在尝试使用 VBScript 自动执行一些管理任务此特定脚本的目的是从文本文件包含文本和数字列中获取一些使用情况统计信息并根据数据制作折线图创建
在 R 中编写多重积分函数

为了将以下内容转换为函数我想知道如何用 R 代码编写以下二重积分 bar x mu 假设pi0 and pi1以向量化方式实现函数 pi 0 和 pi 1 可能的解决方案是 integral lt function n mu s pi0
有什么方法可以访问 makeActiveBinding 安装的函数吗？

标题基本上说明了一切如果我这样做 makeActiveBinding x function runif 2 GlobalEnv x 1 0 7332872 0 4707796 x 1 0 5500310 0 5013099 那我有什么办法
在 R 中查找 Windows 用户名

有没有办法在 R 会话中获取当前的 Windows 用户名或 Windows 主目录 Thanks 抱歉如果我错过了什么但我找不到任何东西你可以做 Sys getenv USERNAME Sys getenv HOME 如果你只是输入
挖泥机子集 (MuMIn) - 如果存在主效应，则必须包括交互作用

我正在使用 dredge MuMIn 进行一些探索性工作在此过程中我想将两个变量设置为仅当它们之间存在相互作用时才允许一起出现即它们不能仅作为主要效果一起出现使用样本数据我想挖掘模型 fm1 尽管它可能没有意义如果变量 GNP
列值的切换功能

我有一个缩写变量名称错误地分散在整个列表中请参阅下面的示例结构 ID lt c SPW SM DLS SJ joe schmoe CEJ teddy roos GVF MJC LH sally fields Full names sho
在另一个函数中定义一个函数的优雅方式

我想构建 f lt function g lt function x x 2 list 这样我就可以使用调用f g 4 并有list 导致list 16 一般来说我会在里面定义几个临时函数f用户在调用时可以调用f 我已经尝试过assign
如何在双对数图（ggplot2）中添加趋势线？

我需要绘制一个遵循幂律分布的数据向量所以如果我将它们绘制在对数轴上它们将是一条直线但是如果我没有明确提供 y 参数我不知道如何绘制这是代码 library poweRlaw library ggplot2 xmin 1 alph
重叠并固定小平面中的 x 尺度（尺度=“自由”）以制作电影

在另一篇文章中 Justin 的帮助下我用以下方法绘制了模拟结果facet gridggplot2 中的选项包含数据和答案的帖子在这里使用facet grid选项通过ggplot2绘制数据框的列 https stackoverflow
删除ggplot2 geom_bar中没有数据的日期列[重复]

这个问题在这里已经有答案了我想隐藏 ggplot2 中没有数据的列这是使用 nycflights13 库的可重现示例 library nycflights13 library dplyr library ggplot2 small da
有条件地将字符串转换为特定数值

我确信对此有一个简单的答案但我已经扫描了堆栈溢出但无法找到解决方案似乎 sapply 和 ifelse 函数的组合可能可以完成这项工作但我不确定所以我有一个包含字符的数据框除了一列是数值 Create dataframe whi

随机推荐

提交消息中的 Git 魔术关键字（签名者、共同创作者、修复等）

Git 命令本身supports https git scm com docs git commit the Signed off by Person s name
可以运行更新并且它可以工作，但是提交说非法存储库 url ''？

在颠覆中我试图提交一个项目但遇到了问题我得到的错误是非法存储库 URL 为什么我可以运行更新但在同一棵树上提交却显示这一点试试这个它对我有用创建一个文件夹右键单击文件夹并在此处创建存储库当弹出窗口出现时选择创建文件夹结
Python：从以非零退出代码退出的命令行获取输出

我在用Python 2 7 1在 Windows Server 2008 R2 x64 机器上我正在尝试获取命令行进程的输出该进程在输出我需要的信息后给出非零退出状态我最初使用的是subprocess check output 并捕获
Xcode 4 / iOS - 从我的应用程序内部使用 SMTP 发送电子邮件

我一直在寻找一个框架来简单地允许我从我的应用程序内部发送电子邮件我尝试过 MailCore Pantomime 和 SKPSMTP 但都没有成功我无法让它们在 Xcode 中编译所以我认为它们已经过时了我有什么办法可以做到这一点吗
如何列出自特定变更列表以来的 P4 变更

有没有办法在特定分支的特定变更列表之后获取变更列表列表 p4 changes some flag CL depot project 这可以使用以下语法来完成假设您希望查看自更改列表 12345 含以来提交到此分支的所有更改 p4 cha
Spring boot和Gradle多模块项目，无法正确加载依赖项

基本上我有一个使用 Gradle 构建的 Spring Boot 项目该项目有一个根项目其中包含另外 4 个子模块根项目settings gradle如下所示 rootProject name proj include proj ap
OpenID 登录机制 - 保持登录状态

我正在用 PHP 开发一个网站并尝试使用 OpenID 进行登录机制我想要类似于 StackOverflow 的行为我的意思是每当我打开 stackoverflow 时我就已经登录了我在 StackOverflow 上发现了两个
实体框架 POCO - 如果字段更新两次如何防止错误？

我正在开始使用模型优先配置中的 POCO 实体框架我有一个稍微不标准的模型通过自定义 tt 文件生成以响应 edmx 中的自定义属性使我能够触发 NotifyPropertyChanged 事件来记录对某些属性的更新这导致一个实际上
Asp.net objectdatasource TypeName 属性错误

I use ASP ObjectDataSource用于网格数据绑定我的问题是当我运行此代码时出现错误
在 Rails 初始化程序运行之前运行 rspec “before” 块

我想运行 rspecbefore阻止设置一些东西beforeRails 初始化程序运行因此我可以测试初始化程序应该做什么这可能吗如果初始化程序中的逻辑足够复杂则应该对其进行测试您应该将其提取到一个帮助程序中您可以在不处于初始化
xaml 中的 WPF ObservableCollection

我在用户控件的代码后面创建了一个 ObservableCollection 它是在窗口加载时创建的 private void UserControl Loaded object sender RoutedEventArgs e Entiti
找不到列“dbo”或用户定义函数或聚合“dbo.Splitfn”，或者名称不明确

我使用了以下分割函数 CREATE FUNCTION dbo Splitfn String varchar 8000 Delimiter char 1 returns temptable TABLE items varchar 8000 a
加密 web.config 失败错误

我知道有人已经问过有关加密 web config 的问题我还尝试加密我的测试配置文件但我收到此错误 aspnet regiis pef connectionStrings C encryptedWeb config 正在加密配置部分无
从 Javascript 方法返回全局变量 [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我有一个方法 function ca
在 PySpark 中读取 Lzo 文件

我是 Spark 新手我的文件夹中有一堆 LZO 索引文件索引已完成如上所示https github com twitter hadoop lzo https github com twitter hadoop lzo 文件如下 1
如何检查所有列表项是否具有相同的值并返回它，或者如果没有则返回另一个值？

如果列表中的所有项目都具有相同的值那么我需要使用该值否则我需要使用 otherValue 我想不出一个简单明了的方法来做到这一点当列表为空时它应该返回其他值也可以看看编写对集合中的第一项具有特殊逻辑的循环的巧妙方法 https
JQGRID , 获取过滤后的所有行

过滤 JQgrid 后我无法获取所有行分页我试过 gt var myData grid jqGrid getGridParam data var myData grid jqGrid getRowData 但第一个选项给出了所有行并
崩溃时退出代码

我想通过 shell 脚本知道应用程序是否崩溃如果应用程序崩溃退出代码是什么应用程序的退出代码将位于 shell 变量中如果您的应用程序崩溃即操作系统认为它做了坏事并导致它终止向其发送信号那么这会反映在退出状态中这是我使用
在 Excel VBA 中使用 COM 插件中的 CLR 类吗？

我有一个 Excel VSTO COM 插件我可以成功加载 Excel VBA 中的引用我可以交换基本类型如字符串但我也可以在 VBA 中使用我的外接程序中的复杂类吗假设我有 C 类 public class TestClass
在 ggplot2 中使用 geom_point 有条件地使用抖动

I have a graph with 12 variables divided into two groups I can t use facets but using colour and shape I have been able

在 ggplot2 中使用 geom_point 有条件地使用抖动

在 ggplot2 中使用 geom_point 有条件地使用抖动 的相关文章

随机推荐

热门标签

在 ggplot2 中使用 geom_point 有条件地使用抖动的相关文章