【统计模型】ToothGrowth数据集双因素方差分析

2023-10-31

目录

ToothGrowth数据集双因素方差分析

一、研究目的

二、数据来源和相关说明

三、描述性分析

3.1 样本描述

3.2 样本均值

3.3 箱线图

四、数学建模

五、结论与建议

5.1 结论

5.2 建议

六、代码


ToothGrowth数据集双因素方差分析

摘要 基于描述性统计分析与双因素方差分析,得出如下结论:药物种类与药物剂量对豚鼠牙齿长度存在显著性影响,且两者存在交互效应。组合水平supp=vc,dose=2.0下,豚鼠牙齿长度最长;在supp=OJ,dose=1.0组合水平下豚鼠牙齿长度平均长度为22.70。基于上述结论,本文提出了优先选择抗血酸,且适当增加剂量以促进豚鼠牙齿生长的建议。

一、研究目的

ToothGrowth为R内置数据集。它包含一项评估维生素C对豚鼠牙齿生长的影响的研究数据。实验在60只豚鼠上进行,其中每只豚鼠通过两种递送方法(橙汁,OJ,或抗坏血酸,VC)分别接受三种剂量水平的维生素C量(0.5、1和2 mg /天, VC)。实验者测量了牙齿生长的长度。牙齿生长数据集包含了研究维生素C对60只豚鼠牙齿生长影响的实验结果。每只动物通过两种给药方法(橙汁或抗坏血酸(一种维生素C,编码为VC)中的一种,接受三种剂量水平的维生素C(0.5、1和2 mg/天)。基于此背景,本文欲探究药物种类与剂量是否对豚鼠牙齿长度有显著影响。

二、数据来源和相关说明

数据来源于R语言内置数据集ToothGrowth,是60*3维数据。即包含60个观测数据和三个变量——len、supp和dos。这三个变量含义分别为牙齿长度、药物种类与药物剂量。

三、描述性分析

      为了获得对数据的整体了解, 本文首先进行了描述性统计分析。

3.1 样本描述

表 3-1  样本描述

变量名

最小值

中位数

最大值

平均值

len

4.2

19.25

33.9

18.81

supp

OJ/VC

dose

0.5/1.0/2.0

      由表3-1可以得出:豚鼠牙齿长度处于4.2-33.9之间,数据平均水平为19.25(中位数)与18.81(平均值)。药物种类有OJ和VC两种,剂量有0.5、1.0和2.0三种。

表 3-2  样本数量

supp/dose

0.5

1

2

OJ

10

10

10

VC

10

10

10

      六种处理下,每种处理的样本量均为10。

3.2 样本均值

图 3-1  各种处理下豚鼠牙齿长度均值图形

      通过交叉分析,获取各种处理下豚鼠牙齿长度均值,具体图形和数据如图3-1与表3-3所示。从图形和表格中可以得出:六种处理方式中,supp=vc,dose=2.0时,豚鼠牙齿长度均值最大;在supp=OJ,dose=1.0组合水平下豚鼠牙齿长度平均长度为22.70。

表 3-3  各种处理下豚鼠牙齿长度均值数据

supp

dose

长度均值

长度方差

OJ

0.5

13.23

4.460

VC

0.5

7.98

2.747

OJ

1.0

22.70

3.911

VC

1.0

16.77

2.515

OJ

2.0

26.06

2.655

VC

2.0

26.14

4.798

3.3 箱线图

图 3-2  各组合水平下豚鼠牙齿长度箱线图

      由图3-2可以得出:各组合水平下,豚鼠牙齿长度存在较大影响。如dose=0.5/1.0时,supp=OJ时牙齿长度均值明显比supp=VC高;各个剂量下,牙齿长度均值也存在较大差异,整体而言剂量越大,牙齿长度均值也越大。

四、数学建模

      本文基于双因素方差分析模型,分析药物种类与剂量是否对豚鼠牙齿长度是否有显著性影响。进行分析前,首先对数据进行正态性与方差齐性检验,本文采用了Shapiro与levene检验方法,检验P值如表4-1所示。检验P值均>0.05,即在显著性水平α=0.05 下接受原假设,即认为数据满足正态性与方差齐性。

表4-1  正态性与方差齐性检验

 

正态性检验

方差齐性检验

p-value

0.1091

0.1484

    不考虑交互效应,建立双因素方差分析模型。模型检验结果如表4-2所示。变量dose和supp的检验P值均<0.05,即认为药物种类和药物剂量均对牙齿长度有显著影响。

表 4-2  无交互效应的双因素方差分析模型结果

 

Df

Sum Sq

Mean Sq

F value

Pr(>F)

dose

1

2224.3

2224.3

123.99

6.31e-16***

supp

1

205.3

205.3

11.45

0.0013**

Residuals

57

1022.6

17.9

 

 

      考虑交互效应,建立双因素方差分析模型。模型检验结果如表4-4所示。变量dose、supp和交互项dose:supp的检验P值均<0.05,即认为两个变量之间存在交互效应,同时药物种类和药物剂量均对牙齿长度有显著影响。

表4-4  有交互效应的双因素方差分析模型结果

 

Df

Sum Sq

Mean Sq

F value

Pr(>F)

dose

1

2224.3

2224.3

133.415

<2e-16***

supp

1

205.3

205.3

12.317

0.000894***

dose:supp

1

88.9

88.9

5.333

0.024631*

Residuals

56

933.6

16.7

 

 

      对两个模型进行检验,进而分析是否去除交互效应。检验结果如表4-5所示。检验P值<0.05,即在显著性水平α=0.05 下拒绝原假设,认为存在两个模型之间存在差异性,即交互项不可剔除。

表 4-5  两种模型检验结果

 

Res.Df

RSS

Df

Sum of Sq

F

Pr(>F)

model 1

57

1022.56

 

 

 

 

model 2

56

933.63

1

88.92

5.3335

0.02463*

五、结论与建议

5.1 结论

      基于描述性统计分析与双因素方差分析,得出如下结论:药物种类与药物剂量对豚鼠牙齿长度存在显著性影响,且两者存在交互效应。组合水平supp=vc,dose=2.0下,豚鼠牙齿长度最长;在supp=OJ,dose=1.0组合水平下豚鼠牙齿长度平均长度为22.70。

5.2 建议

        在条件允许情况下,可以考虑优先选择药物抗血酸,且适当增加剂量,此时豚鼠牙齿长度较长。

六、代码

attach(ToothGrowth)
dose=factor(ToothGrowth$dose)
#方差齐性检验
#检验正态性和方差齐性
library(car)
shapiro.test(ToothGrowth$len)
leveneTest(len ~ dose*supp, data = ToothGrowth)

table(supp,dose)
summary(ToothGrowth)
dim(ToothGrowth)
str(ToothGrowth)
#查看各组样本量
table(supp, dose)

aggregate(len, by = list(supp,dose), FUN = mean) # 求各组均值
aggregate(len, by = list(supp,dose), FUN = sd) # 求各组方差
library(gplots)
plotmeans(len ~ interaction(supp, dose, sep = ' '),
          connect = list(c(1,3,5),c(2,4,6)),
          col = c('orange', 'pink'),
          main = 'interaction plot with 95% CI',
          xlab = 'treatment and dose combination')
## connect()参数  定义 X轴的位置


#绘制箱线图
library(ggplot2)
ggplot(ToothGrowth,aes(dose,len,color = supp)) +geom_boxplot()

#不考虑交互效应
aov1=aov(len~dose+supp,ToothGrowth)
summary(aov1)
#考虑交互效应
aov2=aov(len~dose*supp,ToothGrowth)
summary(aov2)
#检验两个模型之间是否存在差异
anova(aov1,aov2)

个人见解,还请各位读者批评指正。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【统计模型】ToothGrowth数据集双因素方差分析 的相关文章

随机推荐

  • AutoCAD 2021 for Mac(cad2021)中文版

    AutodeskAutoCAD 2021中文版目前已经正式发布了 CAD2021 全称为AutoCAD2021 这是目前Autodesk公司最新发布的一款非常好用且功能强大二维和三维CAD设计软件 同时该软件内置了专业强大的MEP MAP
  • Linux 之大数据定制篇-Shell 编程

    Linux 之大数据定制篇 Shell 编程 为什么要学习Shell 编程 Linux 运维工程师在进行服务器集群管理时 需要编写Shell 程序来进行服务器管理 对于JavaEE 和Python 程序员来说 工作的需要 你的老大会要求你编
  • 【音视频流媒体】1、图像YUV、视频编码H264、封装格式 FLV、网络协议RTSP 超详细介绍

    文章目录 一 从参数看视频图像 1 1 像素 1 2 分辨率 1 3 位深 1 4 stride 1 5 帧率 fps 帧 秒 1 6 码率 Kb s Mb s 二 颜色空间 YUV RGB YUV4 4 4 YUV4 2 2 YU16 或
  • Java jsp cannot be resolved to a type解决方法之一

    不要在一个文件夹下面建两个名字一样的包和类
  • 团队管理的四大挑战——招人篇

    团队管理的四大挑战 招人篇 招人篇 1 告诉 HR 你的团队需要什么样的人 2 尊重应聘者 3 你不需要套路 4 互补而不是趋同 5 如果犹豫 那么放弃 6 如何面试比你高阶的人 7 面试最重要的目的是识别风险 8 缺点易现 亮点难得 结语
  • 【chineseOCR】踩过的坑

    1 环境 ubuntu16 04 cuda10 tensorflow1 13 2 web py 0 40 dev0 这两个比较重要 不然会报好多奇怪的错 说明tensorflow必须1 13版本 低了不支持cudn10 高了chineseO
  • Android自定义轮播效果(优化)

    创作背景 本文是继上一篇 Android自定义轮播效果 优化问题而写 希望大家能有顺序的看 优化一 实现自动无线轮播 private class myPagerAdapter extends PagerAdapter Override pu
  • 【知识点】单片机USB转TTL模块的相关知识

    前言 USB转TTL模块的作用就是把电平转换到双方都能识别进行通信 单片机通信接口的电平逻辑和PC机通信接口的电平逻辑不同 PC机上的通信 接口有USB接口 相应电平逻辑遵照USB原则 还有DB9接口 九针口 相应电平逻辑遵照RS 232原
  • MFC的Brush与Pen的使用

    Brush的使用 void CMFCApplicationDlg OnBnClickedOk CDC pDC GetWindowDC CBrush brush1 Must initialize brush1 CreateSolidBrush
  • SonarQube代码质量检测的一点坑

    这里解决的问题有以下几点 1 之前用过sonarqube检测过代码的质量 因其自带的CFamily需要license 故在github上找到相关开源免费的C C 插件 针对特定的sonarqube版本都有相对应的sonar cxx c版本
  • 原生js实现导航条动画

    原生js实现毛毛虫导航 直接上代码
  • 计算机毕业设计选题推荐基于nodejs+Vue360学生宿舍系统

    管理员 首页 个人中心 宿舍信息管理 学生管理 宿舍报修管理 访客信息管理 水电费管理 管理员管理 交流论坛 系统管理 学生 首页 个人中心 宿舍报修管理 水电费管理 前台首页 首页 交流论坛 通知公告 个人中心 后台管理 在线沟通等 目
  • win 10 下cmd命令无法使用ssh命令

    在WIN 10 系统下出现cmd命令无法正常使用ssh命令 提示 ssh不是内部命令 出现这种情况要考虑到是环境变量出现问题 1 鼠标右键单击 我的电脑 进入 属性 2 点击 系统高级设置 选择 环境变量 3 找到 path 点击打开 4
  • Qt中使用QTextStream中文乱码的情况解决

    1 前言 今天在做一个文件编辑器 然后发现读取txt文件的时候 中文的显示乱码 然后在网上查了一些方法 没用 自己摸索了一下 找出了一个办法 2 解决办法 QTextStream in new QTextStream file in gt
  • Csharp:TinyMCE HTML Editor in .NET WindowsForms

  • STM32控制电机简易教程

    STM32控制电机简易教程 包教包会 近期 电赛临近 来补习一下电机的使用方式 使用起来非常的方便 首先是在CUBEMX里面配置一些基本内容 然后是使用PWM去调速 其他的时钟和调试配置就不多说了 然后就是初始化了 同样的 这里使用的是结构
  • 【华为OD机试真题 python】最大报酬【2022 Q4

    题目描述 最大报酬 小明每周上班都会拿到自己的工作清单 工作清单内包含 n 项工作 每项工作都有对应的耗时时间 单位 h 和报酬 工作的总报酬为所有已完成工作的报酬之和 那么请你帮小明安排一下工作 保证小明在指定的工作时间内工作收入最大化
  • 如何在SYSTEM权限下实现屏幕监控

    屏幕监控是远控软件的基本功能之一 现在很多远控程序的服务端通常为DLL形式 通过远程线程注入等方法插入到services svchost等SYSTEM权限的进程中去 而此时常规的屏幕监控就会失效 这是因为与SYSTEM权限进程关联的窗口站
  • Springboot 各种常用配置

    目录 数据库配置 常用 sql 数据源 spring 配置 druid 依赖 基础配置 统一错误处理 统一响应信息处理 Swagger 配置 Spring security 配置 抽象业务配置 实体类的父类 控制器父类 mybatis pl
  • 【统计模型】ToothGrowth数据集双因素方差分析

    目录 ToothGrowth数据集双因素方差分析 一 研究目的 二 数据来源和相关说明 三 描述性分析 3 1 样本描述 3 2 样本均值 3 3 箱线图 四 数学建模 五 结论与建议 5 1 结论 5 2 建议 六 代码 ToothGro