R 中的条件交叉表

2024-03-20

寻找使用“expss”包实现以下任务的最快方法。

有了一个很棒的“expss”包，我们可以轻松地进行交叉表（它具有其他优点和交叉表的有用功能。），我们可以轻松地对多个变量进行交叉表，如下所示。

 #install.packages("expss")

 library("expss")
 data(mtcars)


  var1 <- "vs, am, gear, carb"
  var_names = trimws(unlist(strsplit(var1, split = ","))) 


  mtcars %>%
    tab_prepend_values %>%
    tab_cols(total(), ..[(var_names)]) %>%
    tab_cells(cyl) %>%
    tab_stat_cpct() %>%
    tab_pivot()

上面给出的输出为：（列 %）

                      #Total    vs          am          gear            carb                        
                                0     1     0     1     3     4   5     1   2    3   4    6    8 

  cyl             4    34.4   5.6  71.4  15.8  61.5   6.7  66.7  40  71.4  60                    
                  6    21.9  16.7  28.6  21.1  23.1  13.3  33.3  20  28.6           40  100      
                  8    43.8  77.8        63.2  15.4  80.0        40        40  100  60       100 
       #Total cases    32.0  18.0  14.0  19.0  13.0  15.0  12.0   5   7.0  10    3  10    1    1

但是，寻找一种创建如下表的方法：

 CYL    |  VS = 0   |  AM = 1   |   Gear = 4 or Gear = 5    |  Carb (All)
   4        5.56        61.54               58.82                34.38
   6        16.67       23.08               29.41                21.88
   8        77.78       15.38               11.76                43.75

Total(col%) 100.00      100.00              100.00               100.00

虽然我可以使用 dplyr 和 join 函数来实现这一点，但这太复杂了，以防我们必须在运行时或动态传递变量。

任何帮助都是有意义的。谢谢！！

你可以试试这个：

1）创建一个可以从总和中创建比例的函数。

myprop_tbl <- function(x){
    return(round(x*100/sum(x),2))
}

2）使用purrr的地图，将函数应用到数据框上，然后绑定结果。

library(tidyverse)
tab <- mtcars %>% 
    group_by(cyl) %>% 
    summarise(vs_sum = sum(vs==0), am_sum = sum(am==1), 
              gear_sum = sum(gear == 4|gear==5), carb_sum= n())

finaltab <- bind_cols(tab[,1],map_df(tab[,2:length(tab)], myprop_tbl))

Output:

# * cyl vs_sum am_sum gear_sum carb_sum
#  <dbl>  <dbl>  <dbl>    <dbl>    <dbl>
#1  4.00   5.56   61.5     58.8     34.4
#2  6.00  16.7    23.1     29.4     21.9
#3  8.00  77.8    15.4     11.8     43.8**

EDIT:

与OP讨论后，似乎他也想传递字符串函数，

我在这里使用一个包seplyr

tab <- mtcars %>% 
    group_by(cyl) %>% 
    summarise_se(c("vs_sum = sum(vs==0)",
              "am_sum = sum(am==1)",
              "gear_sum = sum(gear == 4|gear==5)", 
              "carb_sum = n()"))

它也有效，但你会得到奇怪的名字，要解决这个问题，你可以这样做：

这与我发布的原始答案完全一样：

tab <- mtcars %>% 
    group_by(cyl) %>% 
    summarise_se(c("vs_sum" := "sum(vs==0)",
              "am_sum" := "sum(am==1)",
              "gear_sum" := "sum(gear == 4|gear==5)", 
              "carb_sum" := "n()"))

你可以在这里阅读这篇文章@thislink https://www.r-bloggers.com/programming-with-dplyr-by-using-dplyr/

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dplyr

plyr

tidyr

expss

R 中的条件交叉表的相关文章

在 igraph 中为社区分配颜色

我在 igraph 中使用 fastgreedy community 检测算法在 R 中生成社区代码返回 12 个社区但是在绘图时很难识别它们因为它返回的图的颜色数量有限我怎样才能用十二种不同的颜色绘制这个图表 l2 lt layo
合并数据框而不重复行

我想合并两个数据框但如果有多个匹配项则不想重复行相反我想总结一下那天的观察结果来自合并提取两个数据框中与指定列匹配的行并将其连接在一起如果有多个匹配项则所有可能的匹配项各贡献一行这是一些示例代码 days lt as d
无法部署 ShinyApp：readTableHeader 在“raw”上发现不完整的最后一行（使用默认值：en_US）

我已经拼命尝试部署我的闪亮应用程序大约一周了但不幸的是我无法停止收到以下消息 Warning message Error detecting locale Error in read table file file header head
如何使用 xpath 检查某个对象在网页中是否可见？

我正在 R 中使用 RSelenium 包来进行网络抓取有时加载网页后需要检查某个对象在网页中是否可见例如 library RSelenium open a browser RSelenium startServer remDr lt
使用大矩阵操作

我必须使用 big matrix 对象并且无法计算某些函数让我们考虑以下大矩阵 create big matrix object x lt as big matrix matrix sample 1 10 20 replace TRUE
将第 N 行上的 NA 行插入 data.frames 列表，其中 N 来自列表

经过几个小时后我发现自己无法解决以下问题我有一个数据框列表我想分别向每个 DF 插入而不是替换一行或多行 NA 始终至少一行要插入的 NA 数量存储在单独的列表中为了说明这一点我有以下两个列表 list of datafra
如何在knitr和RStudio中为word和html设置不同的全局选项？

我正在使用 RStudio 0 98 932 和 knitr 1 6 想要为word和html设置不同的全局knitr选项例如想要将word的fig width和fig height设置为6 html的fig width和fig hei
一段 R 代码会影响 foreach 输出中的随机数吗？

我使用运行模拟foreach and doParallel并与随机数名为random在代码中简而言之我模拟一个足球联赛随机生成所有比赛的获胜者以及相应的结果在dt base没有比赛进行在dt ex1 and dt ex24场比赛
如何在 Caret 中绘制随机森林（护林员）树

我生成了如下所示的随机森林树并尝试绘制它但出现错误我在哪里犯了错误我怎样才能以正确的方式绘制它 Actmodel lt train Activity Section Author data CB1 method ranger trC
如何在 R 中合并同名列表中的数据框？

我有一个包含很多数据框的列表如果它们具有相同的名称我想合并它们即合并所有具有相同名称 a 和 b 的数据框像这样 a lt aaaaa b lt bbbbb c lt ccccc g lt list df1 lt data fram
将字符串列拆分为多个虚拟变量

作为 R 中 data table 包的相对缺乏经验的用户我一直在尝试将一个文本列处理为大量指示符列虚拟变量每列中的 1 表示特定的子字符串是在字符串列中找到例如我想处理这个 ID String 1 a b 2 b c 3 c 进入
将 ftransform 与折叠 R 包中的 fgroup_by 一起使用

我正在尝试重现以下输出dplyr代码与R包裹collapse dplyr Code library tidyverse starwars gt select name mass species gt group by species gt
R中的重叠矩阵

我有以下数据框 id channel 1 a 1 b 1 c 2 a 2 c 3 a 我想创建并重叠矩阵它基本上是一个方阵行和列标签为 a b c 表中的每个条目显示每个通道共有多少个 id 例如在上面的例子中矩阵看起来像 a b
R - 计算 bin 中特定值的数量

我有一个如下所示的数据框 df Value lt c 1 1 0 2 1 3 4 0 0 1 2 0 3 0 4 5 2 3 0 6 Sl lt c 1 20 df lt data frame Sl Value gt df Sl Value
列出 R 数据文件的内容而不加载

我有时用print load myDataFile RData 当我加载数据文件时列出它的内容有没有办法列出内容而不加载数据文件中包含的对象我认为如果不加载对象就无法做到这一点解决方案可能是使用包装器将 R 对象保存到save 该函数
purrr::可能函数可能无法与map2_chr函数一起使用

我怀疑这是 purrr 包中的错误但想先在 StackOverflow 中检查我的逻辑在我看来 possibly功能在内部不起作用map2 chr功能我正在使用 purrr 版本 0 2 5 考虑这个例子 library dplyr
使用officer R导出时如何提高ggplots的分辨率

我想将图表导出到 PPT 并使用Officer 包来实现相同的目的但是图表的默认分辨率较低我想更改它我目前正在使用以下电话 ph with gg p1 type chart res 1200 其中 p1 是 ggplot 对象运行
如何按时间间隔匹配数据帧？

这是我从数据记录器导入原始数据时经常出现的问题温度记录仪设置为每十分钟记录一次温度单独的气体记录仪设置为记录最后十分钟间隔内使用的气体我想将这两个记录器的数据合并到一个数据框中进行绘图和分析但时间并不完全一致我希望每十分钟的时间段
picker输入字体或背景颜色

我在闪亮的仪表板中使用 pickerInput 这很好除了一个问题背景颜色和字体颜色太相似使得过滤器选择难以阅读有什么办法可以改变背景或字体颜色吗如果可能的话我想继续使用 pickerInput 但如果有一个带有 selectI
如何按用户定义（例如非字母顺序）对数据框进行排序[重复]

这个问题在这里已经有答案了给定一个数据框dna gt dna chrom start chr2 39482 chr1 203918 chr1 198282 chrX 7839028 chr17 3874 以下代码重新排序dna by ch

随机推荐

PowerShell 代码整洁还是重新格式化？ [复制]

这个问题在这里已经有答案了可能的重复有 PowerShell 代码格式化程序漂亮的打印机吗 https stackoverflow com questions 2987176 is there a powershell code fo
如何在数据框中按名称删除列

我有一个很大的数据集我想阅读特定的列或删除所有其他列 data lt read dta file dta 我选择我不感兴趣的列 var out lt names data names data in c iden name x serv
反向填充猫鼬

我怎样才能反向填充 mongo 我有 2 个模式 User var user scheme new mongoose Schema name String age Number roles type mongoose Schema Type
GNU less 的 bash 循环每 2 分钟刷新一次

我有一台 Linux 机器其中有一个数据文件夹和一个脚本该脚本会生成一个报告 xlsx 电子表格文件显示正在运行的文件夹中不断变化的内容我使用 xlsx2tsv 脚本将其转换为 tsv 文本耗时不到一秒该脚本大约需要 1 分钟来
使用 Typescript 和 React 三纤维的着色器

我正在尝试将着色器与 React 三纤维和 Typescript 一起使用着色器文件 import ShaderMaterial from three import extend from react three fiber class
在类组件的方法中获取查询

Apollo 客户端 2 6 3 与反应是否可以在类组件的方法中获取数据我正在构建一个全局搜索组件并且我只想在键入第三个以及每个后续字符时才获取数据现在它是用 fetch api 实现的但我想切换到 apollo 客户端和
如何使用 gitignore 忽略非点文件（所有非隐藏目录，在我的存储库的根目录中）？

我想跟踪我的点文件我想要 gitignore 来忽略所有隐藏文件文件扩展名本质上与以下相反 Git 如何忽略隐藏目录 https stackoverflow com questions 8021441 git how to igno
如何使特定单词在文本中易于理解其含义？

我正在为 iPhone 开发一本散文书所以我将所有诗歌和文本存储在核心数据中一个名为story以及名为的属性details其中包含整个轶事但问题就在这里如果用户想要触摸特定的单词和诗歌来了解它们的含义和定义我应该如何处理这个任务
销毁 Backbone 集合中每个模型的最简洁方法？

第一次尝试时我写了 this collection each function element element destroy 这不起作用因为它类似于ConcurrentModificationException在 Java 中所有其他
java 1.7 中的无效标志参数

我的任务是使用 Java 7 创建 spring boot 应用程序因此像往常一样我在 start spring io 资源上创建了一个模板并通过以下方式打开他File gt New gt Project from Existing
未定义的预处理器变量“$(var.WixInstall.TargetPath)”。 WixInstaller D:work\Extractor\WixInstaller\Product.wxs

我在使用 wix 创建 Windows 安装程序时遇到以下错误未定义的预处理器变量 var WixInstall TargetPath WixInstaller D work Extractor WixInstaller Product
在mongo中执行优先级查询

样本文件 name John age 35 address join month 3 的员工优先级为 1 地址包含字符串 Avenue 的员工优先级为 2 地址包含字符串 Street 的员工优先级为 3 地址包含字符串 Road 的员工优
与 Swingworker 的对话是先有鸡还是先有蛋

我试图遵循 Java 最佳实践不在主线程 EDT 上执行长时间任务所以我计划使用带有模态对话框的 swingWorker 这样模式对话框会阻止用户执行任何操作直到该任务完成并且我可以在该过程发生时更新对话框上的状态现在的问题是
清理docker环境：devicemapper

我有一个包含 2 个容器的 docker 环境 Jenkins 和 Nexus 都有自己的命名卷我每天都有一个 cron 作业它会删除未使用的容器和图像这工作正常但问题出在我的 devicemapper 内部 du sh var l
MKMapView 注释更改/丢失顺序？

我有一个带有注释的地图视图这些注释显示标注单击标注的公开详细信息按钮时它会进入一个新视图我的 MKAnnotations 是一个自定义类它实现
iOS 9 / Xcode 7：SKSpriteNode spriteNodeWithImageNamed 在某些设备上不起作用

我在从 SKSpriteNode 的 xcassets 图像集中加载图像时遇到问题虽然它在 iOS 8 x 上运行良好 SKSpriteNode spriteNodeWithImageNamde 图像名称它不适用于某些运行 iOS 9
引用限定成员函数作为模板参数？

这在 clang 3 3 中编译得很好 template
如何重新搜索或重新匹配整个文件而不将其全部读入内存？

我希望能够对整个文件运行正则表达式但我希望不必立即将整个文件读入内存因为将来我可能会处理相当大的文件有没有办法做到这一点谢谢澄清我无法逐行阅读因为它可以跨越多行您可以使用 mmap 将文件映射到内存然后可以像普通字符串一样
Next.js 中传递动态路由的无效参数时如何返回 404 Not Found 页面和 HTTP 状态？

例如我有一条动态路线 blog article id 访问现有博客文章时 blog id that exist 它按预期工作现在我要处理这个案例 blog id that does not exist适当地代码在 blog id js
R 中的条件交叉表

寻找使用 expss 包实现以下任务的最快方法有了一个很棒的 expss 包我们可以轻松地进行交叉表它具有其他优点和交叉表的有用功能我们可以轻松地对多个变量进行交叉表如下所示 install packages expss libr

R 中的条件交叉表

EDIT:

R 中的条件交叉表 的相关文章

随机推荐

热门标签

R 中的条件交叉表的相关文章