在facet_wrap中绘制平均线

2024-03-17

我有以下数据集：

structure(list(Geschaeft = c(0.0961028525512254, 0.0753516756309475, 
0, 0.0722803347280335, 0, 0.000877706260971328), Gaststaette = c(0.0981116914423463, 
0.0789718659495242, 0.0336538461538462, 0.0905857740585774, 0, 
0.00175541252194266), Bank = c(0.100843712334271, 0.0717832023169218, 
0.00480769230769231, 0.025, 0.00571428571428572, 0.00965476887068461
), Hausarzt = c(0.0633989554037766, 0.0589573851882499, 0.0288461538461538, 
0.0217573221757322, 0.00685714285714286, 0.0128730251609128), 
    Einr..F..Aeltere = c(0.0337484933708317, 0.0550268928423666, 
    0.00480769230769231, 0, 0.00114285714285714, 0.000292568753657109
    ), Park = c(0.0738449176376055, 0.0726623913942904, 0.0625, 
    0.0846234309623431, 0.00228571428571429, 0.112053832650673
    ), Sportstaette = c(0.0449979911611089, 0.0612846503930492, 
    0.00480769230769231, 0.0619246861924686, 0.00114285714285714, 
    0), OEPNV = c(0.10847730012053, 0.089056681836988, 0.264423076923077, 
    0.135669456066946, 0, 0.185488589818607), Mangel.an.Gruenflaechen = c(0.0867818400964243, 
    0.071369466280513, 0.144230769230769, 0.117259414225941, 
    0.260571428571429, 0.186951433586893), Kriminalitaet = c(0.108316593009241, 
    0.083678113363674, 0.389423076923077, 0.139330543933054, 
    0.334857142857143, 0.216500877706261), Auslaender = c(0.00715146645239052, 
    0.0212039718659495, 0.0480769230769231, 0.0550209205020921, 
    0.0114285714285714, 0), Umweltbelastung = c(0.108879067898755, 
    0.0846607364501448, 0, 0.143828451882845, 0.376, 0.228203627852545
    ), Einr..f..Kinder = c(0.0693451185214946, 0.0825403392635499, 
    0.0144230769230769, 0.0527196652719665, 0, 0.0444704505558806
    ), Einr..f..Jugendliche = c(0, 0.0934526272238312, 0, 0, 
    0, 0.000877706260971328), count = c(1466, 1821, 81, 1491, 
    330, 793), cluster = c(1, 2, 3, 4, 5, 6)), .Names = c("Geschaeft", 
"Gaststaette", "Bank", "Hausarzt", "Einr..F..Aeltere", "Park", 
"Sportstaette", "OEPNV", "Mangel.an.Gruenflaechen", "Kriminalitaet", 
"Auslaender", "Umweltbelastung", "Einr..f..Kinder", "Einr..f..Jugendliche", 
"count", "cluster"), row.names = c(NA, -6L), class = "data.frame")

我用它排序

mdf <- melt(nbhpp[,-15], id.vars = 'cluster')
mdf <- transform(mdf, variable = reorder(variable, value, mean), y = cluster)

并绘制

ggplot(mdf, aes(x=variable, y=value, group=cluster, colour=factor(cluster))) + 
  geom_line() + 
  scale_y_continuous('Anteile', formatter = "percent") +
  scale_colour_hue(name='Cluster') +
  xlab('Infrastrukturmerkmal') +
  theme_bw() +
  opts(axis.text.x = theme_text(angle=90, hjust=1), legend.position = "none") +
  facet_wrap(~cluster, ncol=3)

如果我理解正确的话，变换函数按平均值对数据进行排序。但如何才能将这些平均值作为灰线包含到每个图中呢？

感谢您的帮助

UPDATE:

只是为了澄清：

如果我看一下重新排序语句的输出

with(mdf, reorder(variable, value, mean))

比我得到以下属性：

attr(,"scores")
   Einr..f..Jugendliche        Einr..F..Aeltere              Auslaender            Sportstaette 
             0.01572172              0.01583642              0.02381364              0.02902631 
               Hausarzt                    Bank               Geschaeft         Einr..f..Kinder 
             0.03211500              0.03630061              0.04076876              0.04391644 
            Gaststaette                    Park                   OEPNV Mangel.an.Gruenflaechen 
             0.05051310              0.06799505              0.13051918              0.14452739 
        Umweltbelastung           Kriminalitaet 
             0.15692865              0.21201772

它们在图中从左（最低）到右（最高）排序。问题是，如何用这些属性画一条线......

编辑后的答案

要添加一条包含聚类平均值的线，您需要构造一个data.frame包含数据。您可以从中提取值mdf:

meanscores <- attributes(mdf$variable)$scores
meandf <- data.frame(
  variable = rep(names(meanscores), 6),
  value    = rep(unname(meanscores), 6),
  cluster  = rep(1:6, each=14)
  )

然后使用绘图geom_line:

ggplot(mdf, aes(x=variable, y=value, group=cluster, colour=factor(cluster))) + 
  geom_line() + 
  scale_y_continuous('Anteile', formatter = "percent") +
  scale_colour_hue(name='Cluster') +
  xlab('Infrastrukturmerkmal') +
  theme_bw() +
  opts(axis.text.x = theme_text(angle=90, hjust=1), legend.position = "none") +
  facet_wrap(~cluster, ncol=3) +
  geom_line(data=meandf, aes(x=variable, y=value), colour="grey50")

原答案

我最初的解释是你想要一条具有整体平均值的水平线。

只需添加一个geom_hline图层到你的图上，并映射yintercept to mean(value):

ggplot(mdf, aes(x=variable, y=value, group=cluster, colour=factor(cluster))) + 
  geom_line() + 
  scale_y_continuous('Anteile', formatter = "percent") +
  scale_colour_hue(name='Cluster') +
  xlab('Infrastrukturmerkmal') +
  theme_bw() +
  opts(axis.text.x = theme_text(angle=90, hjust=1), legend.position = "none") +
  facet_wrap(~cluster, ncol=3) +
  geom_hline(aes(yintercept=mean(value)), colour="grey50")

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

ggplot2

在facet_wrap中绘制平均线的相关文章

将 r 数据框中的列字符串转换为数字

我有一个数据框其中有一列字符串如下所示 mydata lt c 1 356670 35 355030 1 356670 35 355030 1 356620 35 355890 1 356930 35 358660 1 357000 3
带有 geom_errorbar 的position_dodge

我有以下代码 require ggplot2 pd lt position dodge 0 3 ggplot dt aes x Time y OR colour Group geom errorbar aes ymin CI lower y
如何在 switch 语句中将向量作为参数传递

我对问题的谷歌搜索没有返回有用的结果和文档 switch没有告诉我如何做所以我希望我能在这里得到答案假设我有一个向量 cases lt c one two three 我想使用 switch 语句并将这些元素作为 switch 语句的参
mclapply 调用应该嵌套吗？

正在筑巢parallel mclapply是个好主意吗 require parallel ans lt mclapply 1 3 function x mclapply 1 3 function y y x unlist ans Outpu
使用 gtable 排列 ggplot 绘图（具有相同宽度的 grobs）以创建 2x2 布局

我正在尝试使用 grobs 和 gtable 将 4 个 ggplot2 图排列成 2x2 网格我不知道如何设置宽度也不知道如何设置非 1xn 或 nx1 排列使用此代码 data iris a lt ggplot iris aes
使用 X11 窗口的 R 脚本仅打开一秒钟

我正在通过 Linux Mint 16 命令行运行 R 脚本它包含我想在窗口中显示的箱线图所以我使用 x11 函数来创建该窗口这是我的代码 testdata lt data frame sample 1 1000 size 100 r
R中的不定积分

我正在计算方程的不定积分我将加速度计的数据通过可视化 C 程序输入到 R 中然后就可以很简单地得出一个方程来表示加速度曲线这一切都很好但是我还需要计算撞击速度根据我在高中时代的理解我的加速度曲线的不定积分将产生速度方程我知道执
了解用于处理色边距的scale_fill_continuous_divergingx参数输入

这个问题是我上一个问题的延续here https stackoverflow com questions 58718527 setting midpoint for continuous diverging color scale on a
ggplot堆叠条 - 隐藏标签但保留标签位置

我在 ggplot 中有一个堆积条形图其中 geom text 标签位于每个条形的中心我想隐藏小条上的标签以便图表看起来不会过于拥挤我可以使用下面的代码来完成此操作但它会弄乱标签的位置正如您在下面的链接图片中看到的那样它们不再
按列分组的数据帧上 R 中的行之间的差异

我希望通过 app name 获得不同版本的计数差异我的数据集如下所示 app name version id count difference 这是数据集 data structure list app name structure c
修复 ggplot 中构面中的数据顺序

我在使用 ggplot 绘制数据时遇到问题我无法使每个方面内的数据正确排序我的样本数据是 data lt structure list Parameter c 0 1 0 7 0 0 0 2 0 2 0 7 0 0 0 1 0 3 0
R 中的 as.numeric 有什么问题？ [复制]

这个问题在这里已经有答案了 gt X864291X8X74 1 8 0000000000 9 0000000000 10 0000000000 6 0000000000 8 0000000000 10 Levels 0 0000000000
在嵌套 tibbles 上应用 ntile

我正在尝试申请ntile在一些嵌套的小标题上但我似乎无法让它工作你能看出我错在哪里吗 data iris iris gt group by Species gt mutate quintile ntile Petal Length 5
根据不平凡的标准有效合并两个数据帧

正在接听这个问题 https stackoverflow com questions 18821862 data selection error 18823432 18823432昨晚我花了一个小时试图找到一个没有增长的解决方案data
删除 R 中具有重复属性的行

我有一个大数据框其中包含以下列 ID time OS IP 该数据帧的每一行对应一个条目在该数据框中对于某些IDs存在多个条目行我想删除这些多行显然同一 ID 的其他属性会有所不同或者换句话说我只想要每个 ID 一个条目行
循环中的knitr模板和子文档

圣诞节前我之前问过跨多个 knitr 文档的单一样式表 https stackoverflow com questions 20370584 single style sheet across multiple knitr document
确定向量中是否存在元素的最有效方法

我有几种算法取决于确定元素是否存在于向量中的效率在我看来这 in 这相当于is element 应该是最有效的因为它只返回一个布尔值在测试了几种方法之后令我惊讶的是这些方法是迄今为止效率最低的以下是我的分析随着向量大小的增加
按具有作业的组划分的 R 分位数

我有以下 df group rep seq 1 3 30 variable runif 90 5 0 7 5 df data frame group variable 我需要 i 按组定义分位数 ii 将每个人分配到相对于其组的分位数因此
抑制 R 中的错误消息

我正在 R 中运行模拟研究有时我的模拟研究会产生错误消息当我在函数中实现模拟研究时当出现此错误消息时模拟停止我知道抑制错误是不好的做法但此时对我来说除了抑制错误然后继续下一个模拟直到达到我喜欢运行的模拟总数为止没有其他选择
在 R Shiny 中，如何使用可排序 js 将其在列表中出现的顺序次数附加到每个列表元素？

下面的可重现代码适用于将元素从一个面板拖动到另一个面板并在拖动到面板中自动使用 HTML CSS 对拖入的每个元素进行排名顺序编号但是我现在尝试附加到每个拖动到列表元素的末尾使用某种形式的paste0 我假设该元素在拖至

随机推荐

我无法修改 React 应用程序中的 SVG 组件

我一直在尝试在 React 中填充 SVG 组件的颜色但它不起作用我尝试过使用图像标签来做出反应但是我在 React 文档中读到不支持带有 img 标签的 CSS css dotSvg position relative fill
当还安装了 NETFX 4.6.1 工具时，如何配置 Visual Studio 以使用 NETFX 4.7 工具

从 Visual Studio 2017 15 2 发布 WebApp 期间的合并仍然使用版本 4 6 1 中的 asp net merge exe 根据发布输出日志与安装的 Net Framework 版本 4 7 不对应 Framew
向 f.submit 添加一个类但保留默认功能？

非常简单的问题我有我要申请class btn 到它我知道我可以轻松地做到这一点但是我如何实现同样的事情即应用一个类而不指定按钮的静态名称换句话说鉴于我在部分表单中执行此操作我希望按钮的名称根据所调用的操作即新建创建更
Java 8 BufferedReaderlines()方法打印不同的计数

我遇到了使用lines 方法计算行号的问题BufferedReader 以下是内容test txt file 1 Career 2 Filmography 3 Awards 4 References 5 External 这是计算行数两次的
Discord.py 检查用户是否对特定表情符号做出反应

我想知道是否有办法检查某人是否有反应specific使用 Discord py 的表情符号下面的命令将回复一条消息然后等待 smile or custom emoji 对该消息的反应 from discord utils import
GraphQL 解析器参数的顺序错误（根、参数、上下文）

我想知道为什么我的参数似乎在我的 GraphQL 解析器中发生了变化我正在使用express graphql 一个解析器的示例 getLocalDrivers async parent args ctx gt console log ct
访问 Kubernetes clusterIP 服务请求超时

我正在寻求帮助来解决这个无法正常工作的基本场景安装了三个节点kubeadm on VirtualBox 虚拟机在 MacBook 上运行 sudo kubectl get nodes NAME STATUS ROLES AGE VERSI
地理编码器 grpc 失败

上个月地理编码器每次都开始失败出现 grpc failed 错误我似乎无法解决它我看过java io IOException grpc 失败 https stackoverflow com questions 45012289 ja
是否可以在设置应用程序中动态更改 iPhone 应用程序的设置页面？

对于我正在开发的 iPhone 应用程序我希望能够动态添加或删除应用程序设置区域的部分理想情况下我希望能够更改多值说明符中的选项列表并添加可深入到一个设置页面的副本的新行我没有在苹果文档中看到任何关于此的内容但是编译后是否可以更
CSS3 - 添加类来触发动画并在完成时删除类

我有一个 div 当我单击它时 jquery 会添加一个启动动画运行的类当动画停止时 3 秒后我希望删除该类以便再次单击 div 时动画将重新开始这只是测试目前仅限 Chrome 浏览器这是我的 CSS3 spin360 web
DataGrid 是 UWP 的替代品吗？

我正在开发一个 UWP 应用程序该应用程序应该在 PC 和平板电脑上使用并在稍后的手机上使用精简版在 PC 上我想在两列中提供数据在移动设备上我打算隐藏其中一列或者我将创建一个不同的页面具体取决于用户的操作我需要的功能是
如何在打字稿中执行 document.getElementById().value 之类的操作？

我有一些代码其中包含一个反应表单其中包含类似以下内容
mysql 5.7在中型sql中比mysql 5.6慢很多

我们正在升级到 mysql 5 7 只是发现它比 5 6 版本慢得多虽然两者具有几乎相同的配置但 5 6 版本以毫秒为单位执行大部分 sql 而另一个版本则需要大约 1 秒或更长的时间来执行中等复杂的 sql 例如下面的 SQL Get
flask_sqlalchemy create_all 无需导入模型

我想了解如何设置一个独立的脚本来调用create all无需将我的所有模型导入其中以下是相关文件 db py from flask sqlalchemy import SQLAlchemy db SQLAlchemy test model
获取 mysqldump 转储适合 psql 输入的数据（转义单引号）

我正在尝试将数据库从 MySQL 移植到 PostgreSQL 我已经在 Postgres 中重建了架构所以我需要做的就是获取数据而不需要重新创建表我可以使用迭代所有记录并一次插入一条记录的代码来完成此操作但我尝试了这一点但对于我
默认使用哪个 Google 地图 API 版本？

如果您不指定版本号则使用哪个版本的 Google Maps API 也许是最新的发行版本这有关版本控制的文档 https developers google com maps documentation javascript basic
Python - 释放/替换字符串变量，如何处理？

假设我将密码以纯文本形式存储在名为的变量中passWd作为字符串一旦我放弃这个变量 python如何释放它例如使用del passWd or passWd new random data 字符串是否存储为字节数组这意味着它可以在最初
类库和命名空间有什么区别？

类库和命名空间之间的实际区别是什么我知道两者都用于将类命名空间等分组在一起任何人都可以告诉我在哪种情况下应该使用类库以及何时创建新的命名空间命名空间为类提供了概念上的分离类库提供了物理上的分离在 Windows 中认为是独立的
导入错误：没有名为 model_selection 的模块

我正在尝试使用train test split函数并写 from sklearn model selection import train test split 这导致 ImportError No module named model s
在facet_wrap中绘制平均线

我有以下数据集 structure list Geschaeft c 0 0961028525512254 0 0753516756309475 0 0 0722803347280335 0 0 000877706260971328 Gas

在facet_wrap中绘制平均线

编辑后的答案

原答案

在facet_wrap中绘制平均线 的相关文章

随机推荐

热门标签

在facet_wrap中绘制平均线的相关文章