我的目标是比较多年来收入等各种社会经济因素的分布,以了解特定地区的人口在五年内的变化情况。这方面的主要数据来自于公共使用微观数据样本。我在用R
+ ggplot2
作为我的首选工具。
在比较两年的数据(2005 年和 2010 年)时,我有两个数据框hh2005
and hh2010
以及这两年的家庭数据。两年的收入数据存储在变量中hincp
在两个数据框中。使用ggplot2
我将按如下所示创建各个年份的密度图(以 2010 年为例):
p1 <- ggplot(data = hh2010, aes(x=hincp))+
geom_density()+
labs(title = "Distribution of income for 2010")+
labs(y="Density")+
labs(x="Household Income")
p1
如何将 2005 年密度叠加到该图上?我无法弄清楚它已经读过data
in as hh2010
我不知道如何继续。我是否应该从一开始就以根本不同的方式处理数据?
你可以通过data
单个几何图形的参数,因此您应该能够将第二密度添加为新的几何图形,如下所示:
p1 <- ggplot(data = hh2010, aes(x=hincp))+
geom_density() +
# Change the fill colour to differentiate it
geom_density(data=hh2005, fill="purple") +
labs(title = "Distribution of income for 2010")+
labs(y="Density")+
labs(x="Household Income")
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)