如何处理重叠的因子水平？（例如，生成表格和图表时）

2024-05-09

我面临一个数据集的问题重叠因素水平.

我想按因素级别生成时间线、条形图和统计数据- 但是，我希望因子水平是模棱两可的。这意味着属于多个级别的观察结果应该在图中出现多次。

这是我的数据结构的示例：

head <- c("ID","YEAR","BRAZIL","GERMANY","US","FRANCE")
data <- data.frame(matrix(c(1,2000,1,0,0,0,
                            2,2010,0,1,1,0,
                            3,2011,0,1,0,0,
                            4,2012,1,0,0,1,
                            5,2012,0,1,0,0,
                            6,2013,0,0,0,1), 
                         nrow=6, ncol=6, byrow=T))
names(data) <- head

显然，一个可能的因子变量"COUNTRY"无法以通常的方式创建。这将迫使因素水平变得清晰（在我们的例子中，有 4 个水平：巴西、德国、美国 and France):

data$COUNTRY[data$BRAZIL==1 & 
             data$GERMANY==0 & 
             data$US==0 & 
             data$FRANCE==0]  <- "Brazil"
data$COUNTRY[data$BRAZIL==0 & 
             data$GERMANY==1 & 
             data$US==0 & 
             data$FRANCE==0]  <- "Germany"

etc...

factor(data$COUNTRY)

但这不是我想要的……

我的问题是，只有在因子水平适当明确的情况下，按因子绘图才有效。我想制作这样的东西：

require(ggplot2)
MYPLOT <- qplot(data$YEAR, data$COUNTRY)
MYPLOT + geom_point(aes(size=..count..), stat="bin") + scale_size(range=c(0, 15))

观察结果属于i出现的因子水平i情节中的次数。

我应该如何转换我的 data.frame 以获得我想要的东西？
我应该简单地重复那些属于i因素水平i次？如果是，我该怎么做？
是否有一种不需要重复案例的解决方法？

有人有想法吗？

我认为你必须复制这些行来代表每个观察结果。并删除任何带有 0 的内容。

library(reshape2)
d2<-melt(data, id.var=c("ID","YEAR"))
d3<-d2[d2$value!=0,]
library(ggplot2)
qplot(d3$YEAR, d3$variable)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

DataFrame

ggplot2

rfactor

如何处理重叠的因子水平？（例如，生成表格和图表时）的相关文章

data.table 抛出“找不到对象”错误[重复]

这个问题在这里已经有答案了我有一个数据表 library data table mydt lt data table index 1 10 当我在全局环境中尝试它时我可以让它工作但当我在调试器中或在包测试中使用它时却无法工作问题是我
如何计算数据框中按另一列的列值分组的一列的连续字符串值？

我有以下数据框 Levels Labels Confidence 0 Hands 0 8 0 Leg 0 7 0 Eye 0 9 1 Ear 0 9 1 Eye 0 8 2 Hands 0 9 2 Eye 0 8 3 Eye 0 8 我想检
dplyr：连接中的 NSE (by)

我很难弄清楚如何使用 dplyr left join 和 NSE 连接两个表问题是我无法为 by 提供正确的值我想我现在已经找到了解决方案但感觉我正在以一种额外复杂的方式来做因此如果您知道更简单更优雅的解决方案请告诉我这就是
如何为自定义 S3 类实现提取/取子集 ([ [<-, [[ [[<-)] 函数？

我有一个自定义的 S3 类foo 它在正常的基础上添加了一些自定义行为data frame foo object lt data frame class foo object lt c foo data frame 对于这个类还应该有一个
需要在R中跳过不同数量的行

我正在使用以下代码来处理我的数据但最近我意识到使用skip 27 在数据开始之前跳过存储在我的文件中的信息不是一个好的选择因为每个文件中要跳过的行数不同我的目标是读取存储在多个文件夹中的各种txt文件并非所有文件都有相同的列数列的
R：如何将字符/数字转为1，NA转为0？

有没有一种简单的方法可以将列的字符数字变为 1 将 NA 变为 0 这里有一些示例数据我想将其应用于 3 4 structure list Item Code c 176L 187L 191L 201L 217L 220L Item x
将维基百科中的表格加载到 R 中

我正在尝试从以下 URL 将最高法院法官表加载到 R 中 https en wikipedia org wiki List of Justices of the Supreme Court of the United States http
R - 基于列名称的子集

我的数据框有超过 120 列变量我想根据列名称创建子集例如我想创建一个子集其中列名称包含字符串心情这可能吗我一般用 SubData lt myData grep whatIWant colnames myData 我很清楚
自定义轴缩放后 ggplot2 缺少标签

我正在尝试使用我的 x 轴应用自定义缩放ggplot2 and scales trans new 但是当我这样做时一些轴标签丢失了有人可以帮我弄清楚为什么吗 Setup library tidyverse the data ds lt
从数据框中按索引删除行

我有一个数组wrong indexes train其中包含我想从数据框中删除的索引列表 0 63 151 469 1008 要删除这些索引我正在尝试这样做 df train drop wrong indexes train 但是代码失败
我如何查看 quantmod 包中所有可用的数据系列？

如何显示可用的所有报价数据系列的列表例如使用雅虎的 getSymbols 我不知道有什么办法 TTR包有一个功能 stockSymbols 下载 NYSE AMEX 和 NASDAQ 的所有当前代码它试图将它们采用雅虎可接受的格式但
切片 Dataframe 时出现 KeyError

我的代码如下所示 d pd read csv Collector Output csv df pd DataFrame data d dfa df copy dfa dfa rename columns OBJECTID Object ID
R 数据结构的运算效率

我想知道是否有任何关于操作效率的文档R 特别是那些与数据操作相关的例如我认为向数据框添加列是有效的因为我猜您只是向链接列表添加一个元素我想添加行会更慢因为向量保存在数组中C level你必须分配一个新的长度数组n 1并将所有元素复
条件和分组 mutate dplyr

假设我有以下每个抽屉库存增加的数据 gt socks year drawer nbr sock total 1990 1 2 1991 1 2 1990 2 3 1991 2 4 1990 3 2 1991 3 1 我想要一个二进制变量来标
在闪亮的数据表中为每个单元格显示工具提示或弹出窗口？

有没有什么方法可以为 r闪亮数据表中的每个单元格获取工具提示有很多方法可以获取悬停行或列但我找不到一种方法来获取行和列索引并为每个单元格显示不同的悬停工具提示任何人都可以修改以下代码吗 library shiny library DT
是否有weighted.median()函数？

我正在寻找类似形式的东西weighted mean 我通过搜索找到了一些解决方案这些解决方案写出了整个函数但希望有一些更用户友好的解决方案以下软件包都有计算加权中位数的函数 aroma light isotone limma cwhm
安装 2.15 后 ggplot2 中的 alpha 通道不起作用

更新到 R 2 15 后 ggplot 中的 alpha 通道似乎不再起作用 plot rnorm 100 rnorm 100 bg cc000055 pch 21 工作得很好但是 qplot rnorm 100 rnorm 100 col
使用“assign()”为列表项分配值

首先了解一些背景我写了一个中缀函数本质上取代了这个习惯用法 x length x 1 lt y 或者简单地说x lt append x y 对于向量这里是 lt function x y xcall lt substitute x x
将 Excel 文件读入 R 并锁定单元格

我有一个 Excel 电子表格要读入 R 它受密码保护并锁定了单元格我可以使用 excel link 导入受密码保护的文件但我不知道如何解锁取消保护单元格 excel link 给了我这个错误 gt
如何在R中分离两个图？

每当我运行这段代码时第一个图就会简单地覆盖前一个图 R中有没有办法分开得到两个图 plot pc title main abc xlab xx ylab yy plot pcs title main sdf xlab sdf ylab x

随机推荐

JKS、BKS 和 PKCS12 文件格式

我正在设置一个无头服务器该服务器使用用户提供的数据 JS CSS HTML 密钥库为 Android 构建 Phonegap 混合应用程序我想进行一些基本的客户端检查以确保上传的密钥库有效对于 JKS 文件我发现可以通过确保提供
Excel 2013 COM API 在服务帐户下挂起 ExportAsFixedFormat

我有一个 NET Windows 服务它调用 Excel 2013 COM API 以在 PDF 上导出 Excel 文档我已尝试使用在两个不同域帐户下运行的 Windows 服务来执行此代码这两个帐户都是运行代码的计算机上的本地管理
Matplotlib：imshow 中 set_data 对绘图没有影响

我有一个奇怪的错误没有你的帮助我无法修复当我设置图像后imshow在 matplotlib 中即使我用方法更改它它也始终保持不变set data 看看这个例子 import numpy as np from matplotlib i
GUI设计技术增强用户体验[关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
将文本置于圆形按钮上居中

我想创建一个按钮圆形链接其中包含文本但我在将文本置于圆形按钮内居中时遇到问题行高太大对这个问题有什么建议吗这是代码 https jsfiddle net hma443rL https jsfiddle net hma443rL b
如何在 PowerShell 中使用参数执行外部程序？

我读过这个答案堆栈溢出 https stackoverflow com questions 1673967 how to run exe in powershell with parameters with spaces and quote
更改svg中半圆的背景颜色

我想在此 svg 代码上创建上弦月和第三弦月
Azure 工作簿中的可选下拉参数

我想在 Azure 工作簿中创建可选下拉参数创建下拉参数有了本指南 https 20https learn microsoft com en us azure azure monitor visualize workbooks dropd
提交 ID 从哪里来？

我只是对此很好奇提交 ID 不能是随机的因为它们需要是唯一的不过它们似乎是随机的这让我想知道为什么它们不只是连续的数字我的意思是它们只需要在存储库中是唯一的对吧或者我在这里错了 Thanks Git 提交 ID 是 SH
我在哪里可以学习如何使 C++ 程序与操作系统 (Linux) 交互

我是一个 C 初学者我想创建与操作系统交互的小程序使用 Kubuntu Linux 到目前为止我还没有找到任何教程或手册来让 C 与操作系统交互在 PHP 中我可以使用命令 exec 或反引号运算符来启动通常在控制台中执行的命令
xml2 包 (R) 中的 xml_find_all 函数未找到相关节点

我使用 R 中的 xml2 包来访问 xml 数据发现它在不同的 xml documents 上表现不同在这个宠物的例子中 library xml2 doc lt read xml
访问函数中的环境

In main我可以读取我的配置文件并将其提供为runReader somefunc myEnv正好但somefunc不需要访问myEnv读者提供链中的下一对也没有提供需要 myEnv 中某些内容的函数是一个微小的叶函数如何在不将
使用 gbuffer 在 R 中缓冲（地理）空间点

我正在尝试缓冲数据集中半径为 100 公里的点我正在使用该功能gBuffer从包装中rgeos 这是我到目前为止所拥有的 head sampledf postalcode lat lon city province 1 A0A0A0 47
iOS 中的 NSCachesDirectory 和 NSDownloadsDirectory 有什么区别？

我想将下载的杂志保存到我的 iOS 应用程序中的一个目录中它似乎NSCachesDirectory and NSDownloadsDirectory是合适的我不知道它们之间有什么区别以及哪一种适合下载杂志任何建议表示赞赏内存不足时
Facebook Messenger 平台 - 检测用户输入

在开发机器人时通常的做法是向用户显示打字指示器而机器人在后台工作但是是否可以检测相反的情况用户是否正在打字或空闲我在文档或谷歌中找不到任何信息有人知道如何实现这一目标吗目前还无法做到这一点您只能向用户显示您正在输入 typi
DateTime2 之后的数字是用于纳秒目的吗？

我已经阅读了该文档但我不完全理解默认精度是datetime2 7 7代表纳秒的精度不该数字表示秒的小数点后保留的位数 3 表示毫秒 6 微秒 7 相当于 100 纳秒的精度
使用 AWS SSO 时 AWS Java SDK 未找到配置文件

当我使用 AWS SSO 登录时我无法访问 aws 我使用以下方式从计算机登录 aws sso login profile staging 配置文件的配置如下 profile staging sso start url https som
使用 ssh 身份验证的 IntelliJ 设置存储库

我正在尝试使用设置存储库Intellij 2017 1 中的功能但我想使用 ssh url 作为存储库而不是 https 我不喜欢处理那些在第一次创建后无法复制的个人访问令牌所以我尝试使用 ssh 但当我单击覆盖本地时出现以下错误
使用 StretchDIBits 使用 Delphi 6 处理条形码图像 - 输出中缺少条形线

我的应用程序是在 Delphi 6 中开发的由于后台处理和大量数据它消耗大约 60MB 120MB 物理内存这是一个资源密集型应用程序该应用程序的功能之一是在进行某些处理后创建条形码图像如果用户继续生成条形码那么至少十分之一的条
如何处理重叠的因子水平？（例如，生成表格和图表时）

我面临一个数据集的问题重叠因素水平我想按因素级别生成时间线条形图和统计数据但是我希望因子水平是模棱两可的这意味着属于多个级别的观察结果应该在图中出现多次这是我的数据结构的示例 head lt c ID YEAR BRAZIL G

如何处理重叠的因子水平？ （例如，生成表格和图表时）

如何处理重叠的因子水平？ （例如，生成表格和图表时） 的相关文章

随机推荐

热门标签

如何处理重叠的因子水平？（例如，生成表格和图表时）

如何处理重叠的因子水平？（例如，生成表格和图表时）的相关文章