使用 R，将多个卡方列联表测试应用于分组数据框，并添加包含测试 p 值的新列

2024-05-07

我有一个类似于下面的示例的数据框（这是我的实际数据框的一小部分摘录）。

frequencies <- data.frame(sex=c("female", "female", "male", "male", "female", "female", "male", "male", "female", "female", "male", "male", "female", "female", "male", "male"),
                      ecotype=c("Crab", "Wave", "Crab", "Wave", "Crab", "Wave", "Crab", "Wave", "Crab", "Wave", "Crab", "Wave", "Crab", "Wave", "Crab", "Wave"),
                      contig_ID=c("Contig100169_2367", "Contig100169_2367", "Contig100169_2367", "Contig100169_2367", "Contig100169_2367", "Contig100169_2367", "Contig100169_2367", "Contig100169_2367", 
                                  "Contig100169_2481", "Contig100169_2481", "Contig100169_2481", "Contig100169_2481", "Contig100169_2481", "Contig100169_2481", "Contig100169_2481", "Contig100169_2481"),
                      allele=c("p", "p", "p", "p", "q", "q", "q", "q", "p", "p", "p", "p", "q", "q", "q", "q"),
                      frequency=c(157, 98, 140, 65, 29, 8, 26, 9, 182, 108, 147, 80, 46, 4, 49, 4))

我想对“contig_ID”和“ecotype”的每个组合进行单独的卡方应急测试，测试“性别”和“等位基因”之间的关联。然后，我想将这些结果总结在一个表中，其中包括“contig_ID”和“ecotype”每种组合的 p 值。例如，从给出的示例表中，我期望有 4 个 p 值的结果表，如下例所示。

results <- data.frame(ecotype=c("Crab", "Wave", "Crab", "Wave"),
                  contig_ID=c("Contig100169_2367", "Contig100169_2367", "Contig100169_2481", "Contig100169_2481"),
                  pvalue=c("pval", "pval", "pval", "pval"))

或者，仅向原始表添加 p 值列也可以，每个组合的 p 值仅在所有相关行中重复。

我一直在尝试使用诸如lapply() and summarise()结合chisq.test()实现这一目标，但到目前为止还没有运气。我也尝试过使用类似的方法：表中每一行的 R 卡方检验（3x2 列联表） https://stackoverflow.com/questions/34232869/r-chi-squared-test-3x2-contingency-table-for-each-row-in-a-table，但也无法完成这项工作。

我们可以将contig_ID and ecotype列并创建一个嵌套数据框，并将数据转换为矩阵，如下所示。

library(tidyverse)

frequencies2 <- frequencies %>%
  group_by(contig_ID, ecotype) %>%
  nest() %>%
  mutate(M = map(data, function(dat){
    dat2 <- dat %>% spread(sex, frequency)
    M <- as.matrix(dat2[, -1])
    row.names(M) <- dat2$allele
    return(M)
  }))

如果我们看一下第一个元素M列中，我们会发现每组的数据都转换为矩阵。

frequencies2$M[[1]]
#   female male
# p    157  140
# q     29   26

从这里，我们可以应用chisq.test到每个矩阵并提取 p 值。frequencies3是最终的输出。

frequencies3 <- frequencies2 %>%
  mutate(pvalue = map_dbl(M, ~chisq.test(.x)$p.value)) %>%
  select(-data, -M) %>%
  ungroup()
frequencies3
# # A tibble: 4 x 3
#   contig_ID         ecotype pvalue
#   <fct>             <fct>    <dbl>
# 1 Contig100169_2367 Crab     1.00 
# 2 Contig100169_2367 Wave     0.434
# 3 Contig100169_2481 Crab     0.284
# 4 Contig100169_2481 Wave     0.958

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 R，将多个卡方列联表测试应用于分组数据框，并添加包含测试 p 值的新列的相关文章

如何在knitr和RStudio中为word和html设置不同的全局选项？

我正在使用 RStudio 0 98 932 和 knitr 1 6 想要为word和html设置不同的全局knitr选项例如想要将word的fig width和fig height设置为6 html的fig width和fig hei
如何在 Caret 中绘制随机森林（护林员）树

我生成了如下所示的随机森林树并尝试绘制它但出现错误我在哪里犯了错误我怎样才能以正确的方式绘制它 Actmodel lt train Activity Section Author data CB1 method ranger trC
如何对数字进行四舍五入并使其显示零？

R 中将数字四舍五入到小数点后 2 位的常用代码是 gt a 14 1234 gt round a digits 2 gt a gt 14 12 但是如果该数字的前两位小数位为零则 R 会在显示中抑制零 gt a 14 0034 gt
将 ftransform 与折叠 R 包中的 fgroup_by 一起使用

我正在尝试重现以下输出dplyr代码与R包裹collapse dplyr Code library tidyverse starwars gt select name mass species gt group by species gt
在R中循环子文件夹

我正在 R 环境中包含多个子文件夹的文件夹中工作我想要循环遍历多个子文件夹然后在每个子文件夹中调用 R 脚本来执行我想出了下面的代码但我的代码似乎添加了到子文件夹列表我收到错误文件中的错误文件名 r 编码编码无效的描述
如何按用户定义（例如非字母顺序）对数据框进行排序[重复]

这个问题在这里已经有答案了给定一个数据框dna gt dna chrom start chr2 39482 chr1 203918 chr1 198282 chrX 7839028 chr17 3874 以下代码重新排序dna by ch
如何在 R 中执行近似（模糊）名称匹配

我有一个专门用于生物学期刊的大型数据集该数据集是由不同的人长时间编写的因此数据不采用单一格式例如在作者栏中我可以找到John Smith Smith John Smith J等但它们是同一个人我连最简单的动作都做不了例如
将列表中的每个元素转换为数据框中的一列

假设我有以下列表 d library combinat d permn c a b c 这看起来如下 1 1 a b c 2 1 a c b 3 1 c a b 4 1 c b a 5 1 b c a 6 1 b a c 是否可以将此列表的
R Shiny：如何将无功值从闪亮模块返回到主服务器功能？

我有一个简单的玩具示例它使用 add removeBtn 模块在第一个模块中添加和删除 UI 我需要跟踪单击添加删除的次数如果我不使用模块这很容易但我试图在嵌套模块的上下文中执行此操作代码如下但基本上我似乎无法访问主
如何声明包含 M 个元素的列表对象

我想声明一个包含 M 3 x 3 矩阵的列表如果我事先知道数字 M 那么我可以通过以下方式声明这样的列表 elm lt matrix NA 3 3 Say M 7 myList lt list elm elm elm elm elm el
在 Shiny 中显示反应式 htmlTable 表格

我正在制作我的第一个 Shiny 应用程序但找不到任何有关如何显示使用 htmlTable 包创建的表格的示例我基本上想在按下按钮时创建一个表格并显示它 Shiny 显示 html 代码而不是表格我不知道用什么替换服务器部分中的 re
R，使用具有两种以上可能性的二项式分布

我知道这可能是基本的但我似乎有一个心理障碍假设您想要计算在一个骰子上掷出 4 5 或 6 的概率在 R 中这很简单 sum 1 6 1 6 1 6 这给出了 1 2 这是正确答案然而我内心深处可能应该保留的地方认为我应该能够
在 RMarkdown 输出到 PDF 时缩进而不添加项目符号点或编号

之前有人问过如何在没有项目符号的情况下缩进文本 RMarkdown 中的点但这是针对 HTML 输出的在 RMarkdown 中缩进而不添加项目符号点或数字 https stackoverflow com questions 47087
在网格中制作一个矩形图例，并标记行和列

我有一个 ggplot 我将因子映射到填充和 alpha 如下所示 set seed 47 the data lt data frame value rpois 6 lambda 20 cat1 rep c A B each 3 cat2
data.table 抛出“找不到对象”错误[重复]

这个问题在这里已经有答案了我有一个数据表 library data table mydt lt data table index 1 10 当我在全局环境中尝试它时我可以让它工作但当我在调试器中或在包测试中使用它时却无法工作问题是我
在ggplot中设置y轴中断

我在代码中设置中断时遇到困难我尝试添加breaks seq 0 100 by 20 但似乎无法让它正常工作本质上我希望 Y 轴从 0 到 100 每 20 个刻度一次 YearlyCI lt read table header T te
从数据框中绘制多条平滑线

我对 R 比较陌生我正在尝试绘制从 csv 文件加载的数据框数据由 6 列组成如下所示 xval col1 col2 col3 col4 col5 第一列 xval 由一系列单调递增的正整数例如 10 40 60 等组成其他列
如何根据 ggplot2 中的汇总数据创建堆积条形图

我正在尝试使用 ggplot 2 创建堆积条形图我的宽格式数据如下所示每个单元格中的数字是响应的频率 activity yes no dontknow Social events 27 3 3 Academic skills works
当将遗传算法与 lme4 一起使用时，glmulti 无限期运行

我在 R 中使用 glmulti 进行模型平均我的模型中有大约 10 个变量使得详尽的筛选不切实际因此我需要使用遗传算法 GA 调用 method g 我需要包含随机效应因此我使用 glmulti 作为 lme4 的包装器此处提供
需要在R中跳过不同数量的行

我正在使用以下代码来处理我的数据但最近我意识到使用skip 27 在数据开始之前跳过存储在我的文件中的信息不是一个好的选择因为每个文件中要跳过的行数不同我的目标是读取存储在多个文件夹中的各种txt文件并非所有文件都有相同的列数列的

随机推荐

Firefox 渲染出错 - 看到一些非常奇怪的东西

我的以下情况真的很奇怪基本上当我查看页面的源代码时一切看起来都很好但页面看起来完全错误所以我决定使用 firebug 查看源代码而 firebug 显示了一个非常不同的故事但是如果我刷新页面页面看起来很好并且源和萤火虫匹
如何让 XSLT 在 Java 中返回 UTF-8

我正在尝试让我的 XSL 脚本使用 UTF 8 编码像和希腊字符这样的字符就像垃圾一样出现让它工作的唯一方法是将结果写入文件如果我将它写入输出流它只会返回垃圾 System out 有效但这可能是因为它被重定向到文件结果需要从
初始化顺序是否有保证

我正在使用类似以下代码段的内容来进行一些初始化我知道初始化p
使用 gatttool 或 bluepy BLE 订阅通知

我正在使用 bluepy 编写一个程序用于监听蓝牙设备发送的特征我还可以使用任何库或语言唯一的限制是在 Linux 上运行而不是在移动环境中运行似乎仅在移动设备中广泛使用没有人在桌面上使用 BLE 使用 bluepy 我注册了委
在 C/C++ 中调用 MATLAB API

我刚刚从某处听说对于数值计算 MATLAB 确实提供了一些用户友好的 API 如果你在 C C 代码中调用这些 API 你可以显着加快计算速度但我在MATLAB文档中没有找到这样的信息例如http www mathworks com
Rails 4/5 发送动态 ActionMailer::Base.mail 电子邮件，附件标记为 Noname

我看过类似的帖子主要涉及通过创建视图和控制器来发送附件例如电子邮件中的 PDF 附件称为 Noname https stackoverflow com questions 12816042 pdf attachment in emai
更新 Swagger code-gen 生成的代码

我在 spring 中使用 swagger codegen 从 swagger yaml 文件生成了代码现在我已经更新了 API 的 swagger yaml 文件并添加了更多 HTTP 操作是否可以更新之前自动生成的现有代码而无
C++标准API

我是一名学生也是 C 新手我正在寻找与 Java API 一样全面的标准 C API 到目前为止我一直在使用cplusplus com http www cplusplus com and cppreference com https
Django - render()、render_to_response() 和 direct_to_template() 之间有什么区别？

两者之间的视图有什么区别用 python django 新手可以理解的语言 render render to response and direct to template 例如从Nathan Borror 的基本应用程序示例 https
为什么 Webpack 忽略我的 CSS 文件？

我正在尝试让 webpack 将我的 CSS 文件使用 PostCSS 编译为单独的文件从文档来看这似乎正是 ExtractTextPlugin 应该做的但是我无法让 webpack 对我的 CSS 文件执行任何操作相关项目结构
改造上传图片

我正在使用 Retrofit v 2 2 0 将图片上传到我的服务器但服务器返回一个空值表示尚未上传图像日志显示图片已上传上传时文件名正确在邮递员中它仍然有效这可能是什么问题上传个人资料图片 java public class
如何让div垂直展开以将内容包裹在其中？

我有一个 div 其中包含许多动态生成的图像我不知道图像列表有多高我的问题是包含动态生成的图像的 div 的行为不像它容纳任何内容我希望它扩展到图像列表的高度每个图像本身都包含在一个 div 中这是包装 div block pad
更改 Android XML 中的形状颜色

我有 android 绘图我将应用到几个 TextView 的背景
如何从另一个 JSF 页面按下某个按钮返回到同一个 JSF 页面

我有两个 JSF 页面假设 A 和 B 从这两个页面 A 和 B 我可以导航到页面 C 现在页面 C 中有一个按钮确定按钮单击它应该导航回 A 或 B 具体取决于从哪里 A 或 B 调用页面 C 任何帮助将不胜感激利用视图参数的解决
从字符串开头过滤 ng-repeat 元素

我正在尝试 AngularJS 这是我的第一次尝试我正在尝试使用开头为而不是包含之类的内容来过滤对象数组但我不明白如何做到这一点假设我有一个elements像这样的数组 amount 50 amount 25 如果我想过滤5两
O(mn) 比 O((m+n)^2) 更好吗？

算法的输入是m and n 我的算法的时间复杂度是O mn 我有一个时间复杂度为的基准算法O m n 我的实现在时间复杂度方面是否优于基准许多评论者和回答者希望只考虑以下情况 m n或者至少当它们通过一个常数因子相关时这不是它的工作原理
Checkstyle 问题：创建格式化程序配置文件

我下载了大学的 checkstyle 插件以便像我的教授想要的那样检查代码我们得到了一个 xml 配置文件我用另一个 checkstyle 配置创建了首选项 gt Checkstyle gt 新建我还将其设置为默认值现在我们必须
通过对 XmlHttpRequest (REST) 的响应在 QML 中显示图像

我需要从 REST API 调用中获取 jpeg 图像我使用 XMLHttpRequest 因为请求需要身份验证标头即我不能只创建一个图像并将源设置为带有 user passwd url 的 URL 我认为我可以通过将 REST 数据设
Kohana URL 包括重定向和分页索引

当我使用重定向时 KO3 核心将 index php 插入我的 URL 时遇到问题请求 instance gt redirect 某事或 paginationStuffHere gt render 其中任何一个的结果都是http www
使用 R，将多个卡方列联表测试应用于分组数据框，并添加包含测试 p 值的新列

我有一个类似于下面的示例的数据框这是我的实际数据框的一小部分摘录 frequencies lt data frame sex c female female male male female female male male female

使用 R，将多个卡方列联表测试应用于分组数据框，并添加包含测试 p 值的新列

使用 R，将多个卡方列联表测试应用于分组数据框，并添加包含测试 p 值的新列 的相关文章

随机推荐

热门标签

使用 R，将多个卡方列联表测试应用于分组数据框，并添加包含测试 p 值的新列的相关文章