点击上方蓝字,轻松关注我们
以下内容转载自“医咖会”微信公众号(medieco-ykh),作者Jane。
上一期我们讨论了双因素方差分析,本期“科研加油站”栏目,我们一起来探讨三因素方差分析。
问题与数据
某研究者想研究某类新药降低胆固醇水平的效果。由于该类新药特殊的分子机制,该研究者假设该类新药对男女的影响不同,也对心脏病风险不同的人影响不同。该类新药有3种药物(药物A、药物B、药物C),该研究者不确定哪种药物更有效。
因此,该研究者招募72位受试者,包括36位男性和36位女性。每种性别中,受试者按心脏病风险分为低风险和高风险亚组。每一亚组均继续分为3组,分别接受A、B、C三种药物中的一种,用药一个月后,收集患者的胆固醇水平。
最终,研究者收集了受试者胆固醇水平(cholesterol)、性别(gender)、心脏病风险(risk)和所用药物(drug)的变量信息,部分数据如下:
对于gender、risk和drug各值对应的含义如下表所示:
对问题的分析
研究者已知两个自变量对因变量存在交互作用,想判断第三个自变量对这一交互作用是否存在影响。针对这种情况,我们可以使用三因素方差分析(Three-way ANOVA),但需要先满足6项假设:
假设1:因变量唯一,且是连续变量
假设2:存在三个自变量,且都是分类变量
假设3:具有相互独立的观测值
假设4:自变量的任一分类中因变量不存在显著异常值
假设5:自变量的任一分类中因变量需近似正态分布
假设6:自变量的任一分类中因变量都具有等方差性
对假设的判断
那么,用Three-way Anova分析时,如何考虑和处理这6个假设呢?
由于假设1-3都是对研究设计的假设,需要研究者根据研究设计进行判断。本例中因变量只有研究对象的胆固醇水平,是连续变量,符合假设1:因变量唯一,且为连续变量;
共有3个自变量:性别(gender)、心脏病风险(risk)和所用药物(drug),都是分类变量,符合假设2:存在三个自变量,且都是分类变量;
至于假设3,我们之前介绍过使用Durbin-Watson检验判断观测值是否相互独立的方法,这里不再赘述。同时,我们也认为观测值是否相互独立主要与研究设计有关,也需根据实际情况判断。
下面我们主要对数据的假设4-6进行判断。
(一) 检验假设4、5的操作
在检验假设4和假设5之前,我们还需要先拆分数据(即将数据根gender、risk和drug拆分成12类),运行检验操作,再合并数据。
1. 拆分数据
(1) 点击Data→Split File
出现下图:
(2) 点击Compare groups
(3) 将gender、risk和drug放入Groups Based on栏
(4) 点击OK
2. 针对每一分类,检验异常值(假设4)和正态性(假设5)
(1) 点击Analyze→Descriptive Statistics→Explore
出现下图:
(2) 将cholesterol放入Dependent List栏
(3) 点击Plots,弹出下图:
(4) 去掉点选Descriptive栏中的Stem-and-leaf,点选Normality plots with tests
(5) 点击Continue,回到Explore窗口
(6) 在Display栏中点击Plots
(7) 点击OK
(二) 检验假设4:自变量的任一分类中因变量不存在显著异常值
1. 异常值分析结果
与其他方差分析一样,三因素方差分析对异常值非常敏感。这些数据不仅会扭曲各分类之间的差异,还会影响结果的外推性。因此,我们必须充分重视分析中的异常值。
经上述SPSS操作,软件会自动输出本研究中每一分类的箱式图,共12个。以下面两个举例: