5.1 计算一个总体均值的置信区间(大样本)
> exercise5_1<-read.csv("D:/289250《统计学—基于R》(第4版)—例题和习题数据/《统计学—基于R》(第4版)—例题和习题数据(公开资源)/exercise/chap05/exercise5_1.csv") #导入exercise5_1文件
> library(lattice)
> library(BSDA)
> z.test(exercise5_1$上网时间,mu=0,sigma.x = sd(exercise5_1$上网时间),conf.level = 0.90) #平均上网时间的置信区间,置信水平为90%
One-sample z-Test
data: exercise5_1$上网时间
z = 12.365, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
90 percent confidence interval:
2.875476 3.757857
sample estimates:
mean of x
3.316667
> z.test(exercise5_1$上网时间,mu=0,sigma.x = sd(exercise5_1$上网时间),conf.level = 0.90)$conf.int #只输出置信区间的信息,置信水平为90%
[1] 2.875476 3.757857
attr(,"conf.level")
[1] 0.9
已知36个大学生每天上网时间,求其平均上网时间的置信区间,置信水平为90%
5.2 计算一个总体比例的置信区间(大样本)
某小区有500名住户,采取重复抽样方法随机抽取50户,其中32户赞成,18户反对,估计赞成户数比例的置信区间,置信水平95%
#赞成比例的95%的置信区间
> n<-50
> x<-32
> p<-x/n
> q<-qnorm(0.975)
> LCI<-p-q*sqrt(p*(1-p)/n)
> UCI<-p+q*sqrt(p*(1-p)/n)
> data.frame(LCI,UCI)
LCI UCI
1 0.5069532 0.7730468
5.3
两种方法排队所花费的时间
(1)计算一个总体均值的置信区间(小样本)
> exercise5_3<-read.csv("D:/289250《统计学—基于R》(第4版)—例题和习题数据/《统计学—基于R》(第4版)—例题和习题数据(公开资源)/exercise/chap05/exercise5_3.csv")
> t.test(exercise5_3$方式1,conf.level=0.95)
One Sample t-test
data: exercise5_3$方式1
t = 47.433, df = 9, p-value = 4.121e-12
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
6.809005 7.490995
sample estimates:
mean of x
7.15
(2)计算一个总体方差的置信区间
> library(TeachingDemos)
> sigma.test(exercise5_3$方式2,conf.level = 0.95)$conf.int
[1] 1.569961 11.059516
attr(,"conf.level")
[1] 0.95
(3)计算两个总体均值差的置信区间
> t.test(x=exercise5_3$方式1,y=exercise5_3$方式2,var.equal=TRUE)$conf.int #两种排队方式时间均值差值的95%的置信区间 方差不等
[1] -1.250985 1.250985
attr(,"conf.level")
[1] 0.95
> t.test(x=exercise5_3$方式1,y=exercise5_3$方式2,var.equal=FALSE)$conf.int #方差相等
[1] -1.322758 1.322758
attr(,"conf.level")
[1] 0.95
5.4
> exercise5_4<-read.csv("D:/289250《统计学—基于R》(第4版)—例题和习题数据/《统计学—基于R》(第4版)—例题和习题数据(公开资源)/exercise/chap05/exercise5_4.csv")
> t.test(exercise5_4$方法1,exercise5_4$方法2,paired=TRUE)$conf.int #配对样本 构建两种方法平均自信心得分之差95%的置信区间
[1] 6.327308 15.672692
attr(,"conf.level")
[1] 0.95
5.5
#置信区间90%
> p1<-0.4;p2<-0.3
> q<-qnorm(0.95)
> LCI<-p1-p2-q*sqrt(p1*(1-p1)/250+p2*(1-p2)/200)
> UCI<-p1-p2
> UCI<-p1-p2+q*sqrt(p1*(1-p1)/250+p2*(1-p2)/200)
> data.frame(LCI,UCI)
LCI UCI
1 0.02625624 0.1737438
#置信区间95%
> p1<-0.4;p2<-0.3
> q<-qnorm(0.975)
> LCI<-p1-p2-q*sqrt(p1*(1-p1)/250+p2*(1-p2)/200)
> UCI<-p1-p2+q*sqrt(p1*(1-p1)/250+p2*(1-p2)/200)
> data.frame(LCI,UCI)
LCI UCI
1 0.01212889 0.1878711
5.6
> exercise5_6<-read.csv("D:/289250《统计学—基于R》(第4版)—例题和习题数据/《统计学—基于R》(第4版)—例题和习题数据(公开资源)/exercise/chap05/exercise5_6.csv")
> var.test(exercise5_6$机器1,exercise5_6$机器2,alternative="two.sided")$conf.int
[1] 4.051926 24.610112
attr(,"conf.level")
[1] 0.95