我对 R 不太擅长。我运行了这个循环,得到了一个包含 11,303,044 行的巨大结果向量。我有另一个由维度为 1681 行的循环产生的向量。
我希望运行一个chisq.test
来比较它们的分布。但由于它们的长度不同,所以它不起作用。
我尝试从 11,303,044 大小的向量中获取 1681 大小的样本来匹配第二个向量的大小长度,但我得到了不同的结果chisq.test
每次我运行它的结果。
我正在考虑将两个向量分成相等数量的间隔。
比方说
vector1:
temp.mat<-matrix((rnorm(11303044))^2, ncol=1)
head(temp.mat)
dim(temp.mat)
vector2:
temp.mat<-matrix((rnorm(1681))^2, ncol=1)
head(temp.mat)
dim(temp.mat)
如何将它们以相等的间隔分割以产生相同长度的向量?
mat1<-matrix((rnorm(1130300))^2, ncol=1) # only one-tenth the size of your vector
smat=sample(mat1, 100000) #and take only one-tenth of that
mat2<-matrix((rnorm(1681))^2, ncol=1)
qqplot(smat,mat2) #and repeat the sampling a few times
从统计的角度来看,您所看到的似乎很有趣。在“偏离平均值”较高的水平下,大样本总是偏离“良好拟合”,这并不奇怪,因为它具有更多数量的真正极值。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)