用于可视化或过滤 P 值的整洁 chisq.test 输出的函数

2023-12-03

对于数据...

library(productplots) 
library(ggmosaic)

对于代码...

 library(tidyverse)
 library(broom)

我正在尝试创建整洁的 chisq.test 输出,以便我可以轻松过滤或可视化 p 值。

我正在使用“happy”数据集(包含在上面列出的任何一个包中)

对于这个例子,如果我想在所有其他变量上调节“快乐”变量,我会隔离分类变量(对于这个例子,我不会根据年龄、年份等创建因素分组),然后运行一个简单的函数。

df<-happy%>%select(-year,-age,-wtssall)
lapply(df,function(x)chisq.test(happy$happy,x)

但是,我想要“broom”包的整洁输出,以便我可以创建 p 值的数据框以进行过滤或可视化。

我尝试了类似于下面代码的各种组合,希望进一步管道到“整洁”的扫帚函数或“过滤器”中,在那里我可以缩小显着的 p 值,或者管道到 p- 的 ggplot 条形图值或 chi 统计数据。

df%>%summarise_if(is.factor,funs(chisq.test(.,df$happy)$p.value))

...但输出似乎不正确。如果我针对变量分别运行 invidual chisq.test ,答案会有所不同。

那么,有没有一种方法可以轻松比较分类变量(在本例中与所有其他列“快乐”),并返回一个整洁的数据框以供进一步操作和分析?

使用 dplyr::mutate、tidyr::nest 和 purrr::map 的 Purrr 解决方案会很棒,但我有一种感觉,嵌套列表列方法不适用于 chisq.test。


您可以在以下时间内完成这一切tidyverse工作流程,使用map代替lapply。没有必要nest除非您要对数据进行子集化以某种方式比较结果(例如年龄组)

df <- happy%>%
  select(-id, -year,-age,-wtssall) %>% 
  map(~chisq.test(.x, happy$happy)) %>% 
  tibble(names = names(.), data = .) %>% 
  mutate(stats = map(data, tidy))

unnest(df, stats)

# A tibble: 6 × 6
    names        data   statistic       p.value parameter                     method
    <chr>      <list>       <dbl>         <dbl>     <int>                     <fctr>
1   happy <S3: htest> 92606.00000  0.000000e+00         4 Pearson's Chi-squared test
2     sex <S3: htest>    11.46604  3.237288e-03         2 Pearson's Chi-squared test
3 marital <S3: htest>  2695.18474  0.000000e+00         8 Pearson's Chi-squared test
4  degree <S3: htest>   659.33013 4.057952e-137         8 Pearson's Chi-squared test
5 finrela <S3: htest>  2374.24165  0.000000e+00         8 Pearson's Chi-squared test
6  health <S3: htest>  2928.62829  0.000000e+00         6 Pearson's Chi-squared test
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

用于可视化或过滤 P 值的整洁 chisq.test 输出的函数 的相关文章

  • Shiny 中的模态对话框:可以调整宽度但不能调整高度

    在我的 Shiny 应用程序中 我有几个来自闪亮BS 包的模式窗口 我可以像这样调整这些模式窗口的宽度 tags head tags style HTML modal lg width 1200px abs 1 background col
  • 在 R 中读取 Stata 13 文件

    有没有办法在 R 中读取 Stata 版本 13 数据集文件 我尝试执行以下操作 gt library foreign gt data read dta TEAdataSTATA dta 但是 我收到一个错误 read dta TEAdat
  • R 中大型稀疏矩阵的聚类分析

    我有一个包含 250000 笔交易 行 和 2183 项 列 的交易数据集 我想将其转换为稀疏矩阵 然后对其进行分层聚类 我尝试了包 sparcl 但它似乎不适用于稀疏矩阵 关于如何解决这个问题有什么建议吗 或者我可以使用任何其他包对稀疏矩
  • R比例置信区间因子

    我正在尝试总结家庭调查的数据 因此我的大部分数据都是分类 因子 数据 我想用对某些问题的回答频率图来总结它 例如 回答某些问题的家庭百分比的条形图 误差线显示置信区间 我发现了这个很棒的教程 我认为它是我祈祷的答案 http www coo
  • 仅在具有重复块名称的另一个 Rmarkdown 文档中运行一个 Rmarkdown 文档中的代码

    我正在 Rmarkdown 中编写一系列相互补充的报告 我想将上一份报告的结果纳入我目前正在编写的报告中 我看到其他建议使用的问题purl从 Rmarkdown 文档中提取 R 代码然后运行它 所以我尝试了以下操作 r read previ
  • mclapply 用户时间大于已用时间

    我正在尝试使用mclapply的功能parallel封装在R 该函数通过计算对数似然距离将值分配给序列矩阵 这是一个 CPU 密集型操作 所结果的system time价值观令人困惑 gt system time mclapply work
  • R:使用管道将单个参数传递到函数中的多个位置

    我试图专门使用管道来重写以下代码 使用babynames包中的babynames数据 library babynames library dplyr myDF lt babynames gt group by year gt summari
  • 在ggplot2中创建部分虚线

    我正在 R 中创建一个图 并且需要创建一条线 其中某些值是投影 投影用虚线表示 这是代码 df data frame date c rep 2008 2013 by 1 value c 303 407 538 696 881 1094 gg
  • 在捕食者-被捕食者系统的生态建模中正确使用 deSolve

    我有一个捕食者 被捕食者模型 其中包含指定的参数和初始值 我在这里用两种方法求解微分方程 1 使用 for 循环 2 使用 deSolve 包 我相信 for 循环是正确的 并且应该给出如下图所示的输出 For loop attempt r
  • 我可以调整scale_color_brewer的下限吗?

    我已经订购了我想使用 color Brewer 的分类数据 但我很难看到非常低的值 有没有办法去掉这些较低的值或设置范围的下限 ggplot data frame x 1 6 y 10 15 w letters 1 6 aes x y co
  • 当子集长度为零时,如何简洁地处理子集?

    从向量中排除元素x x lt c 1 4 3 2 我们可以减去位置向量 excl lt c 2 3 x excl 1 1 2 这也是动态工作的 excl lt which x which max x gt quantile x 25 1 2
  • 分割单个 SpatialPolygons 对象的多边形部分

    在 R 中 我有一个SpatialPolygons包含数百个多边形的对象 即多个多边形 我想分割这个SpatialPolygons对象放入列表中Polygons 即孔应保持连接到父多边形 知道如何做到这一点吗 EDITED 使用以下提供的示
  • 使用亚毫秒日期时间从字符->POSIXct->字符准确转换

    我的文件中有一个字符日期时间列 我加载文件 到data table 并执行需要将列转换为的操作POSIXct 然后我需要写POSIXct值返回文件 但日期时间不会相同 因为打印不正确 这个打印 格式问题是众所周知的 并且已经被讨论过多次 我
  • 如何优化 R 中的 sapply 来计算数据帧上的运行总计

    我在 R 中编写了一个函数来按月份计算累积总数 但随着数据集变大 我的方法的执行时间呈指数增长 我是一名 R 程序员新手 你能帮我提高效率吗 该函数以及我调用该函数的方式 accumulate lt function recordnum d
  • 在 Linux 下更改 RStudio 用户界面(不是图形等)中的字体大小

    This is not关于更改使用 RStudio 生成的图表中的字体大小的问题 我已经知道该怎么做了 我在配备 视网膜 显示屏的 MacBook Pro 上的 Linux 下使用 RStudio 我使用 KDE 作为我的窗口管理器 我可以
  • 绘制带有颜色渐变的geom_segment线? (或者还有另一种方法来强调开始与结束吗?)

    我的数据框中有大量行 100 000 的两组纬度和经度变量 我正在尝试绘制一个连接这两组坐标的图 即 从纬度1 经度1 to 纬度2 经度2 使用 geom segment 使用非常低的 alpha 使线条透明 因为线条太多 我想强调这些线
  • 求解非线性方程组

    我正在尝试求解以下四个方程组 我尝试过使用 rootSolve 包 但似乎我无法通过这种方式找到解决方案 我正在使用的代码如下 model lt function x F1 lt sqrt x 1 2 x 3 2 1 F2 lt sqrt
  • 替换rmarkdown/knitr/pdf中字幕的自动编号

    我正在使用 Rmarkdown 生成 PDF 文档 我想在其中手动定义图号 下面是一个块的示例 r chunk26 fig cap Fig 5 3 My figure caption plot 1 1 我使用特殊的编号来遵循文档的章节 问题
  • 一次评论多个对象

    假设您有一个变量 a 到 j 的列表 for x in 1 10 assign letters x x 您将如何评论那些最近创建的对象 我尝试过类似的事情 for x in 1 10 comment get letters x lt pas
  • R Shiny - 使用 DataTable 移动列名称

    我有一个非常复杂的闪亮代码 其中有几个面板和这些面板内的几个表格 启动应用程序时 列名称与列值正确对齐 但是 一旦我更改应用程序表格下的页码 列名称就会移动到左侧 而值仍保留在中间 如何强制应用程序使列名称与列值对齐 一个可重现的例子 li

随机推荐

  • SQL INDEX 不用于 WHERE ABS(x-y) < k 条件,但用于 y - k < x < y + k 条件

    我有一个查询涉及时差小于 2 小时的几行 0 08333 天 SELECT mt1 mt2 FROM mytable mt1 mytable mt2 WHERE ABS JULIANDAY mt1 date JULIANDAY mt2 da
  • 如何测试未知的 Delphi RTTI TValue 是否反映任何类型的通用 TList<>(或至少 TEnumerable<>)的对象?

    在德尔福 如果我有一个TValue反映未知对象的实例 如何测试该对象是否是任何类型泛型的实例TEnumerable lt gt 或者甚至更好 也which它是特定通用枚举类型的实例 例如TList lt gt 注意 我已经知道如何轻松检查其
  • 在 scala 中重定向 stdin 和 stdout

    如何将 STDIN 和 STDOUT 重定向到文件 在 C 语言中 可以像这样完成 freopen file in r stdin 我正在寻找与 Scala 相当的东西 您可以使用 Java 系统 api 来完成此操作 Java 和 Sca
  • Java:实例双数组元素值修改问题

    我是 Java 新手 我有一个可以为其创建实例的类 在类中我定义了两个实例变量 double array1 double array2 数组的长度相等 在类中 我有一个首先填充的 method1array1然后是另一种方法2 我想在其中设置
  • 使用 KSOAP2 序列化要发送的整数数组

    我在尝试将整数数组发送到 NET Web 服务时遇到问题 该服务需要参数之一包含数组 至少这是我从 Web 服务上的 API 描述中了解到的
  • 颠倒的文字

    您将如何设计一个程序来接收一串小写字母并颠倒产生该字符串 所以如果我输入home i get o 倒挂 我尝试在书中寻找入门内容 但一无所获 试试这个 有点暴力的方法 但对于大写 小写和数字字符非常有效 所有其他字符都按原样显示 defin
  • SQL 将 2 个表连接到 1 个表

    我的任务是连接 3 个表 任务 单位和建筑物 任务表有一列表示单位 一列表示建筑物 任何单一任务仅分配给一座建筑物或一个单元 而不是两者 因此 每条记录中的一列始终为空 任务表中有6100条记录 当我使用这个连接时 select from
  • 如何使用dll?

    我知道如果我有一个 a 或 so 文件以及该库的头文件 例如 SystemC 我应该 1 包含头文件 2 链接适当的库 但我无法仅处理 dll 文件 因为我也可以链接它 但没有要包含和使用命令的侦听器文件 有人可以解释一下存在什么样的 dl
  • 结束 NSTableView 上的编辑(基于视图)

    当用户正在编辑表格视图上的文本字段并决定单击窗口的关闭按钮时 他 她所做的更改不会保存 如何强制表格视图 基于视图 结束编辑 而不是中止编辑 最简单的方法是为您的窗口分配一个委托并响应NSWindow s 窗口应该关闭 委托方法 在其中调用
  • 单击 UIBarButton 显示 toast 并双击返回操作需要执行

    我在导航栏中有一个 UIBarButton 当单击后退按钮 第一次点击 时 我需要显示 toast 如警告 双击时我需要快速退出页面 以下用于显示 toast 的代码 其工作正常 let toastLabel UILabel frame C
  • 以“MMMyyyy”为键对地图进行排序

    我有一张地图 其键采用 MMMyyyy 格式 我需要根据月份进行排序 输入 unsorted Dec2010 1 Apr2010 1 Feb2010 0 Nov2010 2 Mar2010 0 Jun2010 2 Sep2010 1 May
  • 在 Azure DevOps 中跨构建管道共享变量

    我的 azure devops 项目中有 2 个构建管道 一个用于构建源代码 另一个用于构建 进行设置 我希望将编译代码的第一个管道生成的内部版本号传递到创建安装文件的下一个管道 因为我希望安装文件采用相同的版本 所以我添加了一个变量组 其
  • 在android中创建给定形状的图像视图

    我需要在 Android 中创建这个特定形状的图像视图 如果可以以这种形状裁剪图像 那么也很好 请帮我解决一下 这将是完整的套装
  • Select 语句中的 PHP 变量

    我已经编写了这个正在运行的 PHP 脚本 现在我想将行名称更改为变量 不确定行是否正确 我的意思是来自select name 这容易多了不是吗 sql insert INSERT INTO customers name address em
  • 如何在 C++ 中杀死进程,只知道其名称的一部分

    前段时间我需要编写 C 代码来终止某些进程 在我的主程序中 我使用 system 运行大型 CAE 系统包 并在输入上使用不同的文件名字符串 CAE 软件创建许多进程 其中包含进程名称字符串filename 一些CAE过程worktime
  • 如何有效地将我的@KafkaListener绑定到ConcurrentKafkaListenerContainerFactory?

    我遇到了这个对我来说似乎很奇怪的场景 所以基本上我定义了两个 KafkaListener在一堂课中 KafkaListener id listener1 idIsGroup false topics data1 containerFacto
  • 如何在 Google 测量协议中使用广告 ID

    这个帖子很好地回答了 How to get Advertising ID in android 这个问题 but not how使用它 我想知道what is the 范围用于 Google 测量协议 将该广告 ID 传输到 Google
  • Python 的 argparse 选择限制打印

    目前我希望Python的argparse模块只打印出 1 65535 而不是 1 2 3 65535 但文档似乎没有提供任何方法 有什么建议么 您可以通过设置来更改默认格式的方式formatter class option 我会子类化帮助格
  • 未能在单元测试中包含 system.web.http?

    我目前正在尝试进行单元测试ApiController我创造了 我绊倒的是 由于某种原因我无法 使用 System Web Http 在我的主要项目中 虽然我可以使用using没有任何问题 因此使用IHttpActionResult 现在我不
  • 用于可视化或过滤 P 值的整洁 chisq.test 输出的函数

    对于数据 library productplots library ggmosaic 对于代码 library tidyverse library broom 我正在尝试创建整洁的 chisq test 输出 以便我可以轻松过滤或可视化 p