1.对数据集的数据处理 1.1.通过Excel求每个家庭父母身高的平均值 求平均值的方法如下图 1.2.每个家庭保留一个子女的身高 勾选重复项 2.数据进行数据分析 将每对夫妇的平均身高作为自变量X,他们其中一个子女的身高作为因变量Y。 生成图标如下 添加趋势线 选择线性 最终图表如下 3.相关数据的解释 通过上面公式y=0.5702x+31.801,当父母身高每增加1个单位,其子女的身高平均增加0.5702个单位。 相关系数R平方计算的结果约为0.12,表面父母身高的平均值与子女身高的线性相关性较弱。P值远小于0.01,得到的回归方程是可靠的。
最终图表如下: 通过公式y=0.2962x+49.27,当父身高每增加1个单位,子女的身高平均增加0.2962个单位。 相关系数R平方计算的结果约为0.06,表面父母身高的平均值与子女身高的线性相关性较弱。P值远小于0.01,说明得到的回归方程是可靠的。
最终图表如下: 通过公式y=0.3545x+44.291,当母身高增加1个单位,子的平均身高增加0.3545, R²=0.056308,表面父母身高的平均值与子女身高的线性相关性较弱。P值远小于0.01,说明得到的回归方程是可靠的。
1.2.1 数据集一: 通过分析:测定系数 = 0.666542,残差平方和 = 13.76269,P 值 = 0.00217 回归方程:y = 0.5x + 3。该线性回归方程不成立,无法做回归分析。 2.1.2.数据集二: 通过分析:测定系数 = 0.666242,残差平方和 = 13.77629,P 值 = 0.002179,回归方程:y = 0.5x + 3,该线性回归方程不成立。 2.1.3.数据集三: 通过分析:测定系数 = 0.666324,残差平方和 = 13.75619,P 值 = 0.002179,回归方程:y = 0.5x + 3。该线性回归方程基本能够体现该数据集的一个变化情况。 2.1.4.数据集四: 通过分析:测定系数 = 0.666707,残差平方和 = 13.74249,P 值 = 0.002165,回归方程:y = 0.5x + 3。该线性回归方程不成立。