STATA长面板数据分析

2023-11-18

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档


一、面板数据基本概念

面板数据,即Panel Data,也叫“平行数据”,是指在时间序列上取多个截面,在这些截面上同时选取样本观测值所构成的样本数据。或者说他是一个m*n的数据矩阵,记载的是n个时间节点上,m个对象的某一数据指标。

例如:我国31个省份1998-2020年的GDP就是一个面板数据。

面板数据分类
短面板和长面板(截面数大于时间数则为短面板,反之,则为长面板)

动态面板和静态面板(解释变量包含被解释变量的滞后值则为动态面板,反之,则为静态面板)

平衡面板和非平衡面板(每个个体在每个时间上都有观测值则为平衡面板,反之,则为非平衡面板)

二、STATA长面板数据分析步骤

1.数据导入与处理

面板数据可以在excel里整理好,直接粘贴到Stata

以北京上海和广州3个城市2010至2016年的商品房均价,人口和地区生成总值为例,在excel里将数据整理为下图所示形式:
在这里插入图片描述

在stata命令窗口输入edit则可以打开数据编辑窗口,将excel的数据连同表头直接粘贴到这个窗口,则会有如下提示:

在这里插入图片描述

选择变量名则可以直接将第一行作为变量名称,可以发现,在变量窗口有五个变量被导入了进去

在这里插入图片描述
由于城市变量是字符数据,因此在处理之前需要采用encode命令将其改为数值型数据

具体命令为:encode 城市,gen(city)

这个命令中 encode为命令的名字,其作用是将字符数据转换为数值型。而gen为生成的意思,实际上是生成一个新变量。如果你的城市是以数值如1,2,3,4来命名的,则可以省略这一步

紧接着,可以用xtset来声明面板模型的截面和时间

在stata里,x代表个体或截面(在计量中和paper里,个体一般用n或i来表示,面板的模型的公式角标一般是it或者nt),t代表时间,set便是设置的意思。在stata里,一般与面板相关的命令都会以xt开头

输入xtset city 年份

在这里插入图片描述

则会发现,stata提示我们的panel变量,也就是个体为city,而时间跨度为2010至2016,如果每个城市每个年份均有数据,则为strongly balanced,即平衡面板,如果缺失数据,则为非平衡面板

此处引用https://zhuanlan.zhihu.com/p/264904364

2.描述性统计

命令为:sum + 变量名
例如变量beertax,可以得到均值,最小值,最大值等信息
在这里插入图片描述

绘制核心解释变量和被解释变量的散点图并画出回归直线
命令为:twoway (scatter 被解释变量 核心变量)(lfit 被解释变量 核心变量)
例如被解释变量fatal 核心解释变量beertax

在这里插入图片描述

画出被解释变量的时间序列图
命令为:xtline 被解释变量
例如被解释变量fatal

在这里插入图片描述


3.单位根检验

长面板数据的单位根检验方法为: LLC检验、Breitung检验、IPS检验、Fisher式检验、HadriLM检验。(这里要注意,除了Hadri LM检验中,所提出的假设认为原假设H0是平稳数据,备择假设H1是非平稳数据以外,其他的单位根检验过程认为原假设是非平稳,备择假设是平稳。)

尽管上述面板单位根检验方法,除Breitung检验外,其余检验方法在理论推导上,并未考虑同期截面相关的情形, 但在Stata操作中,可以通过加入demean选项,缓解截面相关对单位根检验功效的影响。

检验原则:从一般到特殊开始,依次检验。
① 从最复杂的带截距项和时间趋势情形,开始检验
② 检验带截距项情形
③ 检验不带截距项、时间趋势项情形(注:有的检验方法没有此类情形,故无需考虑。)
④ 结合图形综合判断是哪种情形。

LLC检验命令为:
• xtunitroot llc lnq, trend demean lags(bic 12)
(对lnq进行面板单位根LLC检验,demean是为了减轻截面相关对检验的影响,lag(bic12)应用BIC准则选取最优滞后阶数,不同个体可以有不同的滞后阶数,aic、hqic12表示选个较大的滞后阶数,含个体固定效应和线性时间趋势项)

• xtunitroot llc lnq, demean lags(bic 12)
(仅含个体固定效应项)

• xtunitroot llc lnq, noconstant demean lags(bic 12)
(none的情形)

• xtline lnq, overlay
(画图)

其他检验方法类似,先考虑即有趋势项又有截距项,以此类推下来。

例如D_PGDP的LLC检验
在这里插入图片描述
p值=0.0007,显著拒绝原假设,说明不存在单位根。

差分:如果用单位根检验出来是非平稳的,则需要进行差分。
命令为:gen 新变量名=d.原变量名
例如:gen D_lnpgdp=d.lnpgdp

差分后再次进行LLC检验,判断结果是否平稳

确认变量的单整阶数:若水平变量Xit,是平稳的,则Xit是I(0),0阶単整。若Xit非平稳,一阶差分后是平稳的,则Xit是I(1),1阶単整。若Xit非平稳,一阶差分后仍非平稳的,二阶差分后才平稳, 则Xit是I(2),2阶単整。 以此类推

4.协整检验

面板单位根检验的结果有两种:面板数据平稳和(部分)面板数据不平稳。如果各变量都是平稳的,那么可以直接进行之后的程序,但是如果全部或部分变量不平稳,这个时候我们就需要进行面板协整分析,来考察变量间是否存在长期均衡关系。如果通过了协整检验,说明变量之间存在着长期稳定的均衡关系,其方程回归残差是平稳的,因此可以在此基础上直接对原方程进行回归,此时的回归结果是较精确的。

对于有单位根的变量,传统的处理方法是进行一阶差分而得到平稳序列。 但一阶差分后变量的经济含义与原序列并不相同,而有时我们仍然希望使用原序列进行回归。 如果多个单位根变量之间由于某种经济力量而存在“长期均衡关系”,则有可能使用原序列进行回归。

协整的前提是同阶单整。但也有如下的宽限说法:如果变量个数多于两个,即解释变量个数多于一个,被解释变量的单整阶数不能高于任何一个解释变量的单整阶数。另当解释变量的单整阶数高于被解释变量的单整阶数时,则必须至少有两个解释变量的单整阶数高于被解释变量的单整阶数。如果只含有两个解释变量,则两个变量的单整阶数应该相同。
也就是说,单整阶数不同的两个或以上的非平稳序列如果一起进行协整检验,必然有某些低阶单整的,即波动相对高阶序列的波动甚微弱(有可能波动幅度也不同)的序列,对协整结果的影响不大,因此包不包含的重要性不大。而相对处于最高阶序列,由于其波动较大,对回归残差的平稳性带来极大的影响,所以如果协整是包含有某些高阶单整序列的话(但如果所有变量都是阶数相同的高阶,此时也被称作同阶单整,这样的话另当别论),一定不能将其纳入协整检验。

面板数据协整检验主要有三种方法:Kao 检验、 Pedroni 检验、Westerlund 检验。其使用情景如下:
在这里插入图片描述
1、Kao 检验
命令为:xtcointtest kao y x1 x2 x3, demean

在这里插入图片描述
上表汇报了 5 种不同的检验统计量,我们主要关注前三种:MDF、DF、ADF,其对应的 p 值均小于 0.05,故可在 5% 水平上拒绝 “不存在协整关系” 的原假设,认为存在协整关系。

2、 Pedroni 检验(推荐)
命令为:xtcointtest pedroni y x1 x2 x3, trend demean ar(panels)
xtcointtest pedroni y x1 x2 x3, demean ar(panels)
xtcointtest pedroni y x1 x2 x3, noconstant demean ar(panels)

(三个方程:含个体固定效应项和时间趋势项、仅含个体固定效应项和两者均不含的检验。ar(panels)意为该检验在异质面板数据的情况下进行;ar(same)意为该检验在同质面板数据的情况下进行)

在这里插入图片描述
上表所汇报的三种检验统计量,其对应的 p 值均为 0.0000,故依然强烈拒绝 “不存在协整关系” 的原假设。

此处引用https://zhuanlan.zhihu.com/p/165062834
https://zhuanlan.zhihu.com/p/508813246


5.模型的筛选

1.检验个体效应(混合效应还是固定效应)(原假设:使用OLS混合模型)

命令为:xtreg y x1 x2 x3,fe

例如:xtreg lngdp lnfdi lnie lnex lnim lnci lngp,fe
在这里插入图片描述
在这里插入图片描述
对于固定效应模型而言,回归结果中最后一行汇报的F统计量便在于检验所有的个体效应整体上显著。在我们这个例子中发现F统计量的概率为0.0000,检验结果表明固定效应模型优于混合OLS模型。

2、检验时间效应(混合效应还是随机效应)(检验方法:LM统计量) (原假设:使用OLS混合模型)

命令为:qui xtreg y x1 x2 x3,re (加上“qui”之后第一幅图将不会呈现)
xttest0

例如:qui xtreg lngdp lnfdi lnie lnex lnim lnci lngp,re
xttest0
在这里插入图片描述
可以看出,LM检验得到的P值为0.0000,表明随机效应非常显著。可见,随机效应模型也优于混合OLS模型。

3、检验固定效应模型or随机效应模型 (检验方法:Hausman检验)(原假设:使用随机效应模型(个体效应与解释变量无关))

通过上面分析,可以发现当模型加入了个体效应的时候,将显著优于截距项为常数假设条件下的混合OLS模型。但是无法明确区分FE or RE的优劣,这需要进行接下来的检验,如下:

Step1:估计固定效应模型,存储估计结果
Step2:估计随机效应模型,存储估计结果
Step3:进行Hausman检验

命令为:xtreg y x1 x2 x3,re
est store re
xtreg y x1 x2 x3,fe
est store fe
hausman fe re

例如:xtreg lngdp lnfdi lnie lnex lnim lnci lngp,re

est store re

xtreg lngdp lnfdi lnie lnex lnim lnci lngp,fe

est store fe

hausman fe re

在这里插入图片描述
可以看出,hausman检验的P值为0.0139,拒绝了原假设,认为随机效应模型的基本假设得不到满足。此时,需要采用工具变量法或者使用固定效应模型。

6.模型的检验

1.序列相关检验
对于T较大的面板而言,往往无法完全反映时序相关性,此时便可能存在序列相关,在多数情况下被设定为AR(1)过程。

原假设:序列不存在相关性。

(1) FE模型的序列相关检验

对于固定效应模型,可以采用Wooldridge检验法,命令为:xtserial y x1 x2 x3

例如:xtserial lngdp lnfdi lnie lnex lnim lnci lngp
在这里插入图片描述

(2) RE模型的序列相关检验

对于RE模型,可以采用xttest1命令来执行检验:

qui xtreg lngdp lnfdi lnie lnex lnim lnci lngpdumt*,re

xttest1
在这里插入图片描述
在这里插入图片描述
这里汇报了4个统计量,分别用于检验RE模型中随机效应(单尾和双尾)、序列相关以及二者的联合显著性,检验结果表明存在随机效应和序列相关,而且对随机效应和序列相关的联合检验也非常显著。

2.截面相关检验

原假设:截面之间不存在着相关性

(1)FE模型检验

对于FE模型,可以利用xttest2命令来检验截面相关性:

qui xtreg lngdp lnfdi lnie lnex lnim lnci lngp,fe
xttest2
(该命令主要针对的是大T小N类型的面板数据,在本例中无法使用,故图标略去。)

(2)RE模型检验

对于RE模型,可以利用xtcsd命令来检验截面相关性:

qui xtreg lngdp lnfdi lnie lnex lnim lnci lngp,re
xtcsd,pesaran (下面命令是另一个检验指标)
xtcsd,frees
在这里插入图片描述
可以看出,两种不同的检验方法均显示面板数据存在着截面相关性。

3.异方差检验 (组间异方差)

原假设:同方差,检验模型中是否存在组间异方差,需要使用xttest3命令。

qui xtreg lngdp lnfdi lnie lnex lnim lnci lngp ,fe

xttest3

在这里插入图片描述
显然,原假设被拒绝,存在异方差。

此处引用https://www.sohu.com/a/394518462_698752

7.模型的估计

长面板数据模型的估计方法
第一种:使用OLS估计这个特殊的双向固定效应模型,并对误差项的自相关、异方差和截面相关的问题只提供面板校正的标准误(使用命令xtscc或xtpcse命令实现),这种估计方法最为稳健。
第二种:如果存在自相关、异方差和截面相关的问题,则使用FGLS估计这个特殊的双向固定效应模型,这种方法只是解决了误差项自相关的问题,而并未考虑异方差或截面相关的问题,对于误差项的异方差和截面相关的问题仍然只是提供面板校正的标准误(使用命令xtpcse实现),这种估计方法介于稳健和效率之间。
第三种:使用FGLS估计这个特殊的双向固定效应模型,对误差项的自相关、异方差和截面相关的问题一并加以处理(使用命令xtgls实现),这种估计方法最有效率。

1.xtpcse
xtpcse depvar indepvars,options
A. 自相关的设定(一阶自相关)
a.corr(ar1),使用的估计方法为FGLS【误差项存在自相关时使用该选项;当T不比n大很多时使用该选项,因为此时T可能无法提供足够多的信息去估计每个个体的自相关系数,所以约束了每个个体的自相关系数都相等】
b.corr(psar1) ,使用的估计方法为FGLS【误差项存在自相关时使用该选项;当T比n大很多时使用该选择项,当T比n大很多时每个个体的自相关系数可以不同,就可以使用选项】
c.corr(independent)或corr(ind),使用的估计方法为OLS【误差项不存在自相关】

B.异方差与截面的设定
a.independent【误差项不存在异方差和截面相关问题,使用该选项】
b.hetonly(提供考虑异方差的面板校正标准误)【误差项存在异方差但不存在截面相关问题,则使用该选项】
c.不加选项即可(提供既考虑异方差又考虑截面相关的面板校正标准误)【误差项存在异方差和截面相关问题时,不加任何选项】
选项:corr(ind)+independent等价于LSDV

2.xtgls
xtgls depvar indepvars,options
A.对异方差和截面相关的设定

a.panels(iid)【误差项不存在异方差和截面相关】
b.panles(heteroskedastic)【误差项存在异方差+截面不相关】
c.panels(correlated)只适用于长面板数据【误差项存在异方差+截面相关】
选项:corr(ind)+panels(iid)等价于LSDV

B.自相关的设定
a.corr(ar1),使用的估计方法为FGLS
#误差项存在自相关时使用该选项;当T不比n大很多时使用该选项,因为此时T可能无法提供足够多的信息去估计每个个体的自相关系数,所以约束了每个个体的自相关系数都相等
b.corr(psar1),使用的估计方法为FGLS。
#误差项存在自相关时使用该选项;当T比n大很多时使用该选择项,当T比n大很多时每个个体的自相关系数可以不同,就可以使用选项
c.corr(independent)或corr(ind),使用的估计方法为OLS。
#误差项不存在自相关时,使用该选项

3.xtscc
xtscc depvar indepvars,options

此处引用https://blog.csdn.net/weixin_42927719/article/details/107550326

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

STATA长面板数据分析 的相关文章

  • 基于状态机的单个按键长按,短按实现复用

    开博第一文 希望再次记录学习的过程 按键扫描 单片机里面再基础不过的程序了 但对于初学者来说 用好按键也不是一件简单的事情 在毛老师的介绍下 第一次知道了状态机的思想也可以用于单片机的程序设计 感觉很是新奇 看了老师给发的几个文档后对状态机
  • 毕业设计 嵌入式 MP3音乐播放器设计与实现

    文章目录 1 简介 2 绪论 2 1 课题背景与目的 3 系统设计 3 1 系统架构 3 2 软件部分设计 3 3 实现效果 3 4 部分相关代码 4 最后 1 简介 Hi 大家好 学长今天向大家介绍一个 单片机项目 基于单片机的MP3音乐

随机推荐

  • 数据结构---HashSet存值和取值

    HashSet存值和取值 存 取 HashMap实现了Map接口 而HashSet实现了Set接口 HashMap用于存储键值对 而HashSet用于存储对象 HashMap不允许有重复的键 可以允许有重复的值 HashSet不允许有重复元
  • 【一千个论文合集】计算机科学的26个细分领域近年必读论文集合

    文章目录 1 机器学习 2 计算机视觉 3 自然语言处理 4 数据挖掘 5 机器人 6 知识工程 7 模式识别 8 信息检索与推荐 9 数据库 10 人机交互 11 计算机图形学 12 多媒体 13 可视化 14 数据科学 15 安全与隐私
  • vue利用 sortable 完成表格拖拽

    先讲一下vue2 使用sortable完成表格拖拽 不只是表格 div也可以实现 但我项目中是表格拖拽 github地址 安装 npm install sortablejs save 使用 我的项目中是拖拽一个小按钮移动 而不是整行
  • umi:配置式路由

    场景描述 很多时候 我们需要做到简单的路由拦截 比如用户未登录的时候 我们需要跳转到登录页面 等到用户登录后在重新跳转到之前的页面 而很多情况下这些是约定式路由无法完成的 就需要我们配置式路由 论述 umi自带的约定式路由 可以自动的生成路
  • element-ui的table表格实现跨页多选及回显效果

    效果图 安装 Element ui 和 egrid 基于 Element UI Table 组件封装的高阶表格组件 可无缝支持 element 的 table 组件 npm i element ui S npm i egrid S 引入 E
  • kubectl常用命令

    alias k kubectl alias kc k create f alias kgp k get pods alias kdp k describe pods alias kdep k delete pods alias kl k l
  • mysql 判断字符串相等_「8」掌握MySQL比较运算符是很有必要的

    本文要的主题就是MySQL比较运算符 也就是通过各类案例来看看其运行得到的结果是什么 以及掌握其规则 首先 我们看看比较运算符有哪些种类 接下来我们就通过案例的案例的方式来逐一学习 1 等于运算符 是用来判断数字 字符串和表达式是否相等 如
  • 面向对象编程中composition、aggregation、association的区别

    在面向对象程序设计中 对象的关系主要有三种 composition aggregation association composition 组合 复合 对象x的生命期由唯一拥有者owner控制 owner析构时会把x同步析构 例如Engin
  • uni-app css尺寸单位rpx介绍

    一 前言 1 在使用uni app开发小程序时支持的尺寸单位如下 1 基础单位 px rpx 2 h5单位 rem vm vh 2 rpx是微信小程序提出的一种响应式px 二 rpx介绍 1 现实情况下 ui设计师只提供一个分辨率的图 严格
  • css层叠样式表——css基础介绍

    css层叠样式表第一天 css层叠样式表01 css层叠样式表第一天 css介绍 css语法 html标签全局属性 引入css样式的方式 知识点应用 css介绍 css是Cascading Style Sheet的缩写 中文 层叠样式表 是
  • M1 Pro 安卓模拟器+Xposed环境

    吐槽 最近换了台mac 发现mac对程序员真的太友好了 一些环境配置起来很方便 借助brew几乎都是一行命令的事 但是有一些环境还不是那么好配 在这做一下记录 这次要说的是安卓模拟器 我本人是有一台Google Pixel真机的 插上数据线
  • Python-Tensorflow猫狗数据集分类,96%的准确率

    import tensorflow as tf from tensorflow import keras from tensorflow keras import layers curl O https download microsoft
  • 多环境配置

    Mybatis plus 需要添加一个依赖 这个是baomidou官方的动态数据源包
  • 机器学习 | 图像检索开源项目合集

    1 Trace moe 图像反向搜索动漫场景 使用动漫截图搜索该场景的拍摄地 它告诉你该动画在日本动漫中出现的是哪个动画 哪个情节以及确切的时间 https github com soruly trace moe 2 Awesome Cbi
  • 【数字图像处理系列五】图像滤波之空间滤波:图像平滑降噪和图像锐化

    本系列python版本 python3 5 4 本系列opencv python版本 opencv python3 4 2 17 本系列使用的开发环境是jupyter notebook 是一个python的交互式开发环境 测试十分方便 并集
  • Flutter 学习笔记 《二》 编辑器设置

    1 编辑器设置 open a Simulator 2 运行 Flutter 项目 运行 flutter run启动您的应 一 iOS 设置 安装 Xcode 安装到iOS设备 要将您的Flutter应用安装到iOS真机设备 您需要一些额外的
  • pip install安装路径介绍

    本文转载自 https www python100 com html 7749O60EJDFE html 更新 2023 05 26 10 55 pip是Python语言中的一个包管理工具 通过pip我们可以安装 升级 卸载Python包
  • linux 文件转utf 8,在Linux系统下把文件转换为UTF-8编码

    转换环境Linux系统 整个项目要转换为多语言版本 所有文件储存格式由原来GB2312转换为UTF 8编码 为了方便 借助iconv命令写了下面脚本 bin bash if z 1 then echo Please input a dire
  • Json_c++ json api 的个人总结

    http hi baidu com it ibear item 936f9644f0569f9f833ae12d json object的格式 注意 一个json对象内可以包含多个json对象 latitude 116 4009189605
  • STATA长面板数据分析

    提示 文章写完后 目录可以自动生成 如何生成可参考右边的帮助文档 文章目录 一 面板数据基本概念 二 STATA长面板数据分析步骤 1 数据导入与处理 2 描述性统计 3 单位根检验 4 协整检验 5 模型的筛选 6 模型的检验 7 模型的