从统计学看线性回归(2)——一元线性回归方程的显著性检验

2023-05-16

目 录

1. σ的估计

2. 回归方程的显著性检验

  t 检验(回归系数的检验)

  F 检验(回归方程的检验)

  相关系数的显著性检验

  样本决定系数

  三种检验的关系

一、σ2 的估计

  因为假设检验以及构造与回归模型有关的区间估计都需要σ2的估计量,所以先对σ2作估计。

  通过残差平方和(误差平方和)

               1

 

(用到,其中

 

  ∵                                2

∴                                                        3

其中 为响应变量观测值的校正平方和。残差平方和有n-2 个自由度,因为两个自由度与得到的估计值相关。

                                         4

(公式(4)在《线性回归分析导论》附录C.3有证明)

∴  σ2的无偏估计量:

                                         5

为残差均方, 的平方根称为回归标准误差,与响应变量y 具有相同的单位。

因为σ2取决于残差平方和, 所以任何对模型误差假设的违背或对模型形式的误设都可能严重破坏σ2的估计值的实用性。因为由回归模型残差算得,称σ2的估计值是模型依赖的。

 

二、回归方程的显著性检验

  目的:检验 是否真正描述了变量 y x 之间的统计规律性

  假设:正态性假设 (方便检验计算)

  1. t 检验

  用t 检验来检验回归系数的显著性。采用的假设如下:

原假设     H0  β1 = 0   x y 不存在线性关系)

对立假设  H1  β1 ≠ 0

  回归系数的显著性检验就是要检验自变量 x 对因变量 y 的影响程度是否显著。下面我们分析接受和拒绝原假设的意义。

  (1)接受 H0  β1 = 0  x y 不存在线性关系)

  此时有两种情况,一种是无论 x 取值如何, y 都在一条水平线上下波动,即,如下图1,另一种情况为, x y 之间存在关系,但不是线性关系,如图2

 

 1

 

2

  (2)拒绝 H0  β1 = 0  x 对解释 y 的方差是有用的

  拒绝原假设也有两种情况,一种是直线模型就是合适的,如图 3,另一种情况为存在 x y 的线性影响,也可通过 x 的高阶多项式得到更好的结果,如图 4

 

3

 

4

  接下来对其检验。

∵                               6

  ∴ 当H0  β1 = 0 成立时,有:

                         7

   在零附近波动,构造 t 统计量:

                                8

  若原假设H0  β1 = 0 成立,则 ,计算|t|

|t| tα/2   拒绝 H0

|t| tα/2   接受 H0

  2.F 检验(方差分析)

  F检验用于检验回归方程的显著性。

  方差分析法检验回归显著性,方差分析以分割响应变量 y 的总变异性为基础。

∵   

∴   

∵  , 

∴  

∴                  9

  其中 称为观测值的校正平方和或总称为平方和(SST: sum of squares for total, , Lyy),其度量了观测值中总的变异性。刻画 y 的波动程度

  称为模型平方和(或回归平方和),记为SSR(R: regression),,。其刻画由 x 的波动引起的 y 波动的部分

   是残差平方和(误差平方和),记为SSE(E: error), , 。其刻画了未加控制的因素引起 y 波动的部分

∴                    10

  下来分析它们的自由度。因为 约束 使丢掉了一个自由度,所以个自由度;因为完全由一个参数确定,所以个自由度;因为估计β0与β1时对离差施加了两个约束,所以有n-2个自由度。

∵ 自由度有可加性

∴                    11

  因为总平方和反映因变量 y 的波动程度或称不确定性,在建立了 y x 的线性回归后,总平方和SST就分解成回归平方和SSR与残差平方和SSE这两部分,其中SSR是由回归方程确定的,也就是由自变量 x 的波动引起的,SSE是不能用自变量解释的波动,是由 x 之外的未加控制的因素引起的。这样,总平方和SST 中,能够由自变量解释的部分为SSR,不能由自变量解释的部分为SSE,从而,回归平方和SSR越大,回归的效果就越好,可以据此构造F 检验统计量为

                       (12)

  在正态假设下,原假设H0 : β1 = 0 成立时,,当时,拒绝原假设。

  3.相关系数的显著性检验

  因为一元线性回归方程讨论的是变量 x 与变量 y 之间的线性关系,所以变量 x y 之间的相关系数来检验回归方程的显著性。用相关系数来反应 x y 的线性关系的密切程度。

  x y 的简单相关系数(Pearson 相关系数):

               13

r的绝对值小于等于1|r| 1

  根据相关系数的检验表,通常当|r| 大于表中α=0.05相应的值时,认为 x y 有显著的线性关系。

  缺点:接近于1的程度与数据组数 n 有关(n 较小时,相关系数的波动较大,|r| 接近于1n 较大时,|r|易偏小,n 较小时,不能仅凭 r 判定 x 与 y 之间有密切的线性关系)

  另外补充一点,Pearson相关系数的适用范围:

  ① 两个变量之间是线性关系,都是连续数据;

  ② 两个变量的总体是正态分布,或接近正态分布;

  ③ 两个变量的观测值是成对的,每对观测值之间相互独立。

  4.样本决定系数

  由公式(10可知,越大,线性回归越好,所以定义样本决定系数r2: 回归平方和与总离差平方和之比。

                        14

∵   

(用到

∴                    15

  其中最右边的 r2 表示相关系数的平方。

  决定系数 r2 是一个回归直线与样本观测值拟合优度(Goodness of Fit, 指回归直线对观测值的拟合程度)的相对指标,反映了因变量的波动中能用自变量解释的比例。

  0 ≤  r2  1r2  越接近于 1 ,拟合优度越好。

  那么r2 的值比较小的时候反应了什么情况呢?

  r2 小的可能原因:

  ① 线性回归不成立,y x 是曲线关系,应用曲线回归;

  ② y x 之间符合线性模型,误差项方差σ2大,导致r2 小(n 很大时,线性回归显著)

  在对自变量有重复观测时可以通过检验正确区分以上两种不同情况,或者用残差分析的方法。

相关系数和样本决定系数:

相关系数是建立在相关分析的理论基础上,研究两个变量 x y 之间的线性相关关系;样本决定系数是建立在回归分析的理论基础之上,研究非随机变量 x y 的解释程度。样本决定系数除掉了相关系数为0或1(|r|=1 or 0)的情况.

  5.三种检验的关系

  对于一元线性回归来说,回归系数显著性的 t 检验,回归方程显著性的 F 检验,相关系数显著性的 t 检验,这三种检验是等价的。相关系数显著性的 t 检验与回归系数显著性的 t 检验是完全相等的,式(12F统计量则是这两个 t 统计量的平方。对于一元线性回归只需要做一种检验即可,而对于多元线性回归,这三种检验考虑的问题不同,是三种不同的检验,并不等价。

转载于:https://www.cnblogs.com/datamining-bio/p/9502033.html

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

从统计学看线性回归(2)——一元线性回归方程的显著性检验 的相关文章

  • mysql连接池

    文章出处 https www cnblogs com wupeiqi articles 8184686 html DBUtils是Python的一个用于实现数据库连接池的模块 此连接池有两种连接模式 xff1a 模式一 xff1a 为每个线
  • Python操作MySQL

    文章出处 https www cnblogs com wupeiqi articles 5713330 html 本篇对于Python操作MySQL主要使用两种方式 xff1a 原生模块 pymsqlORM框架 SQLAchemy pyms
  • 免费的天气API

    高德地图 的提供了免费查看天气预报API xff08 https lbs amap com api webservice guide api weatherinfo xff09 xff0c 每日限制调100000次 xff1b 1 和风天气
  • final link failed: Nonrepresentable section on output

    编译live555的时候遇到了这个问题 xff0c 前面的编译没有问题 xff0c 是在链接的时候出现的 xff0c 在网上搜索说是缺少 libstdc 43 43 库 于是 xff0c 安装之 sudo apt get install l
  • centos执行apt-get提示不存在

    在centos下用yum install xxx yum和apt get的区别 一般来说著名的linux系统基本上分两大类 xff1a 1 RedHat系列 xff1a Redhat Centos Fedora等 2 Debian系列 xf
  • C语言用指针实现两个数组值互换

    C语言用指针实现两数组的值互换 span class hljs preprocessor include lt stdio h gt span span class hljs preprocessor define N 10 span sp
  • onclick或者其他事件在部分移动端无效的问题

    最近开发碰到一个问题 xff0c 大多数手机都可以正常访问点击 xff0c 但是有部分手机onclick无效 xff0c 不知道可能是什么原因 xff1f 该如何解决 我遇到的这个问题 xff0c 实际不是onclick的原因 xff0c
  • Linux软件的安装和卸载

    Linux软件的安装和卸载一直是困扰许多新用户的难题 在Windows中 xff0c 我们可以使用软件自带的安装卸载程序或在控制面板中的 添加 删除程序 来实现 与其相类似 xff0c 在Linux下有一个功能强大的软件安装卸载工具 xff
  • 凝思linux系统显卡设置,TaiShan服务器安装凝思操作系统Linx6.0.90并设置独立显卡WX2100输出...

    TaiShan服务器安装凝思操作系统Linx6 0 90并设置独立显卡WX2100输出 环境准备 xff1a TaiShan 2280服务器 xff0c 凝思操作系统Linx6 0 90 arm64 xff0c WX2100显卡 xff0c
  • 华为TaiShan 2280 ARM 服务器

    华为TaiShan 2280 ARM 服务器 华为TaiShan 2280 ARM 服务器 https e huawei com cn products cloud computing dc servers arm based taisha
  • InfoQ推荐语:我的梦想

    大家好 非常高兴能在这一期的架构师和大家见面 本人工作了十余载 先后在洪恩软件和用友集团任职 目前任职于用友集团瑞友科技研究院 主要关注领域 企业应用软件平台研发 领域驱动设计 OSGi 动态语言应 用 云计算 移动互联和Mac OS平台相
  • python TKinter的主窗口运行程序完毕后,怎么让其自动关闭

    如题 xff1a 在pycharm 调试Tkinter程序的时候 xff0c 关闭右上角的X 实际上并未退出进程 xff0c 长期以往 再大的内存也会被耗尽 一般就是下面的代码 xff1a 34 34 34 from tkinter imp
  • Httpclient文件上传

    public static void upload String url File file String filename CloseableHttpClient httpclient 61 HttpClients createDefau
  • org.springframework.expression.spel.SpelEvaluationException: EL1030E

    问题与分析 在本地开发项目时发现报错如下 xff1a code org springframework expression spel SpelEvaluationException EL1030E The operator 39 ADD
  • Jetty - Unable to compile class for JSP

    问题与分析 在启动公司项目时发现报错如下 xff1a code jetty 2019 10 07 10 28 28 760 WARN org apache jasper compiler Compiler Error compiling f
  • ValueError: too many values to unpack (expected 2)

    循环一个字典时报错 xff1a 数据 xff1a 39 O DATA 39 39 ACCOUNT 39 39 A20001002 39 39 ZACTOSP 39 Decimal 39 21792635 96 39 39 ZBUDGET 3
  • 数据可视化的历史

    数据可视化是什么 xff1f The main goal of data visualization is its ability tovisualize data communicating information clearly and
  • 《编译原理》构造与正规式 (0|1)*01 等价的 DFA - 例题解析

    编译原理 构造与正规式 0 1 01 等价的 DFA 例题解析 解题步骤 xff1a NFA 状态转换图子集法DFA 的状态转换矩阵DFA 的状态转图 解 xff1a 已给正规式 xff1a 0 1 01 画出 NFA 状态转换图如下 xf
  • 根号及运算法则

    1 根号及运算法则 成立条件 xff1a a 0 xff0c n 2且n N 成立条件 xff1a a 0 n 2且n N 成立条件 xff1a a 0 xff0c b gt 0 xff0c n 2且n N 成立条件 xff1a a 0 x
  • 第14章 Linux开机详细流程

    计算机启动分为内核加载前 加载时和加载后3个大阶段 xff0c 这3个大阶段又可以分为很多小阶段 xff0c 本文将非常细化分析每一个重要的小阶段 内核加载前的阶段和操作系统无关 xff0c Linux或Windows在这部分的顺序是一样的

随机推荐

  • 个人日常训练计划

    日期 名称 2019 09 26 2018 2019 ACM ICPC Southeastern European Regional Programming Contest SEERC 2018 2019 09 27 浅学模拟退火 2019
  • RIA迷你书序言

    RIA Minibook Prologue RIA迷你书序言 Rich Internet Applications or RIAs have truly revolutionized user experiences online When
  • 异步请求CloseableHttpAsyncClient的使用

    1 前言 项目有个需求 xff0c 需要把一些没用影响业务逻辑的http请求改成异步请求 xff0c httpclient在4 0后提供新的api CloseableHttpAsyncClient可以使用 xff0c 记录下使用过程 2 网
  • Ubuntu 安装 uWSGI

    uWSGI官方网址 xff1a https pypi org project uWSGI 使用如下命令安装 xff1a pip install uWSGI 报如下错 xff1a Collecting uWSGI Using cached h
  • Adb分析及获取root权限

    Adb的全称为Android Debug Bridge xff0c 起到通过PC对Android系统的调试桥的作用 xff0c 是一个多用途的工具 xff0c 它能够执行多种命令 xff0c 还能提供一个shell 这儿简单介绍一下Adb的
  • Intel MPI 配置与基本使用

    安装 Document 系统配置 含NFS 编译环境 设置 加载 mpivars c sh 脚本 创建文本文件 mpd hosts xff0c 其中保存有集群的节点列表 xff0c 每行一个名字 只针对开发者 确保环境变量 PATH 中包含
  • win10+VS2019+NVIDIA CUDA10.1 安装失败解决方案

    win10 43 VS2019 43 NVIDIA CUDA10 1安装时 xff0c 提示 NVIDIA 安装程序失败 xff0c 几乎所有组件的状态都显示 未安装 百度了一下 xff0c 原因可能是我的电脑有VS xff0c 影响了cu
  • 【转载】阿里云域名解析将一个域名指向另一个域名

    在域名解析的环节 xff0c 有时候我们会遇到将一个域名解析到另一个域名的情况 xff0c 在阿里云的云解析DNS中可以通过添加解析记录来实现 xff0c 设置CNAME项的值设置为另一个域名 xff0c 即可实现该功能 下面以阿里云服务器
  • 机器学习算法-logistic回归算法

    Logistic回归算法调试 一 算法原理 Logistic回归算法是一种优化算法 xff0c 主要用用于只有两种标签的分类问题 其原理为对一些数据点用一条直线去拟合 xff0c 对数据集进行划分 从广义上来讲这也是一种多元线性回归方法 x
  • 词频统计项目的总结

    刚开始在做词频统计时只能在代码中更改统计的段落 xff0c 这样使代码看起来非常的乱而且容易出错 xff0c 随着老师的要求有变更 xff0c 我的代码也开始进行更新 xff0c 词频统计实现可以从控制台进行输入要统计文档的名字进行统计 x
  • taishan服务器修改为u盘启动,bios改成u盘启动

    怎么在BIOS界面设置U盘启动呢 这个对于很多想要U盘重装系统的朋友来说非常头疼的事情 xff0c 相对小白用户来说 xff0c BIOS界面的专业性比较强 xff0c 而且是英文状态 xff0c 很多朋友直接懵了 xff0c 那么如何设置
  • Flex的危局,还是HTML5的盛宴?

    为InfoQ的RIA迷你书写序 xff0c 似乎是我的宿命 由于工作原因把这个任务推迟了一段时间之后 xff0c 后果居然是不仅写了序 xff0c 还成为了另一篇序的译者 互联网10年 xff0c 始于2000年 对于互联网来说 xff0c
  • c语言错误c1021,C语言命语法错误大全

    C语言 语法错误大全 fatal error C1004 unexpected end of file found 未找到文件末尾 可能是括号匹配问题 fatal error C1021 invalid preprocessor comma
  • SQL Server 2012企业版和标准版的区别

    关于使用Microsoft SQL Server 数据库的公司一般会有疑问 xff0c 企业版数据库和标准版数据库的区别在哪 xff1f 如果采购企业版的价格和标准版的价格相差很大 xff0c 从多方资料查询发现 xff0c 我认为最主要的
  • 查询SQL SERVER 数据库版本号脚本语句

    数据库直接执行此语句即可 select 64 64 version 示例 xff1a Microsoft SQL Server 2014 12 0 2000 8 X64 Feb 20 2014 20 04 26 Copyright c Mi
  • SQL SERVER 还原误操作导致还原无法停止,处理办法

    昨天遇到运行库不知道单位哪个小伙子 xff0c 把数据库还原了 xff0c 导致单位业务全部瘫痪 xff0c 主数据库一直显示正在还原 xff0c 真的是不敢动 xff0c 经过多方寻找 xff0c 找到此脚本 数据库还原日志 xff0c
  • Docker安装及部署实例.Net Core

    1 什么是Docker Docker 是一个开源的应用容器引擎 xff0c 让开发者可以打包他们的应用以及依赖包到一个可移植的容器中 xff0c 然后发布到任何流行的 Linux 机器上 xff0c 也可以实现虚拟化 容器是完全使用沙箱机制
  • 将html格式的内容转换成纯文本格式

    最近做的一个东东 xff0c 想要去除掉保存的字符串内容的所有html格式 xff0c 也就是只取纯文本 xff0c 从网上查了些相关资料 xff0c 以及正则表达式的用法 xff0c 有一个方法向大家推荐 xff0c 基本去除了我想要去除
  • 待解决:PDF header signature not found

    转载于 https www cnblogs com ITGirl00 p 3531475 html
  • 从统计学看线性回归(2)——一元线性回归方程的显著性检验

    目 录 1 2 的估计 2 回归方程的显著性检验 t 检验 xff08 回归系数的检验 xff09 F 检验 xff08 回归方程的检验 xff09 相关系数的显著性检验 样本决定系数 三种检验的关系 一 2 的估计 因为假设检验以及构造与