浙江大学【面板数据分析与STATA应用】——第一讲短面板数据分析

2023-11-14

基本概念

面板数据及分类在这里插入图片描述

面板数据分类:

  • 短面板和长面板
  • 动态面板和静态面板
  • 平衡面板和非平衡面板

截面数大于时间数就是短面板,反之,则为长面板
解释变量包含被解释变量的滞后值则为动态面板,反之,则为静态面板
平衡面板:每个个体在想他的时间内都有观测值记录,For any I, there are T observations. 反之,则为非平衡面板

面板数据的优点:
1. 可以处理有不可观测的个体异质性所导致的内生性问题
2. 提供更多个体动态行为的信息
不足之处:
1. 大多数面板数据分析技术都是针对短面板
2. 寻找面板数据结构的工具变量不是很容易

面板数据模型

非观测效应模型
a.固定效应模型
在这里插入图片描述
在这里插入图片描述

b.随机效应模型
在这里插入图片描述
混合回归模型
在这里插入图片描述

面板数据模型的估计和修正方法

  1. 固定效应模型的估计
    对固定效应模型的估计有两种方法:
    固定效应变换(组内变换)与LSDV(最小二乘虚拟变量法)
    a. 固定效应变换(组内变换)
    在这里插入图片描述
    在这里插入图片描述

固定效应变换的优缺点
优点:即使个体效应与解释变量相关也可以得到一致估计;
缺点:无法估计不随时间而变的变量的影响。

固定效应的STATA命令

xtreg y x,fe
xi:xtreg y x i.year,fe
tab year,gen(year)

b. LSDV思想
在这里插入图片描述
STATA命令:

  • 不存在时间效应: xi:reg y x i.code
  • 存在时间效应:xi:reg y x i.code i.year
  1. 随机效应模型
    对随机效应模型的估计方法是广义最小二乘法
    在这里插入图片描述
    STATA命令:
  • 不存在时间效应:xtreg y x ,re
  • 存在时间效应:xi: reg y x i.year,re

第一讲案例

  1. 导入数据及查看数据描述
. use "D:\traffic.dta" # 导入数据
. des #查看数据描述

显示:

 obs:           336                          
 vars:            54                          30 Nov 2008 15:45
--------------------------------------------------------------------------------
              storage   display    value
variable name   type    format     label      variable label
--------------------------------------------------------------------------------
state           float   %9.0g      sid        State ID (FIPS) Code
year            int     %9.0g                 Year
spircons        float   %9.0g                 Spirits Consumption
unrate          float   %9.0g                 Unemployment Rate
perinc          float   %9.0g                 Per Capita Personal Income
emppop          float   %9.0g                 Employment/Population Ratio
beertax         float   %9.0g                 Tax on Case of Beer
sobapt          float   %9.0g                 % Southern Baptist
mormon          float   %9.0g                 % Mormon
....等等
  1. 描述性统计
    格式: sum + 变量名
. sum beertax

    Variable |        Obs        Mean    Std. Dev.       Min        Max
-------------+---------------------------------------------------------
     beertax |        336     .513256    .4778442   .0433109   2.720764

twoway (scatter fatal beertax)(lfit fatal beertax) # 核心变量和被解释变量的散点图并画出回归直线

在这里插入图片描述

xtline fatal # 画出核心变量的时间序列图

在这里插入图片描述
3. 模型选择
选择PLS 还是 FE?

. tab year, gen(year)
. xtreg fatal beertax spircons unrate perinck year2-year7, fe

Fixed-effects (within) regression               Number of obs     =        336
Group variable: state                           Number of groups  =         48

R-sq:                                           Obs per group:
    within  = 0.4528                                         min =          7
    between = 0.1090                                         avg =        7.0
    overall = 0.0770                                         max =          7

                                               F(10,278)         =      23.00
corr(u_i, Xb)  = -0.8728                        Prob > F          =     0.0000

------------------------------------------------------------------------------
      fatal |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
    beertax |     -0.435      0.154    -2.82   0.005       -0.738      -0.132
   spircons |      0.806      0.113     7.15   0.000        0.584       1.028
     unrate |     -0.055      0.010    -5.31   0.000       -0.075      -0.035
    perinck |      0.088      0.020     4.41   0.000        0.049       0.128
      year2 |     -0.053      0.030    -1.77   0.078       -0.113       0.006
      year3 |     -0.165      0.037    -4.40   0.000       -0.239      -0.091
      year4 |     -0.200      0.042    -4.80   0.000       -0.282      -0.118
      year5 |     -0.051      0.052    -0.99   0.325       -0.152       0.051
      year6 |     -0.100      0.059    -1.69   0.091       -0.216       0.016
      year7 |     -0.134      0.068    -1.98   0.049       -0.267      -0.001
      _cons |      0.129      0.431     0.30   0.765       -0.720       0.978
-------------+----------------------------------------------------------------
    sigma_u |  1.0987683
    sigma_e |  .14570531
        rho |  .98271904   (fraction of variance due to u_i)
------------------------------------------------------------------------------
F test that all u_i=0: F(47, 278) = 64.52                    Prob > F = 0.0000

  1. 模型检验
    截面相关检验
. xtcsd, pes
Pesaran's test of cross sectional independence =    -1.716, Pr = 1.9138

如果截面相关
在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

浙江大学【面板数据分析与STATA应用】——第一讲短面板数据分析 的相关文章

  • dnorm 是如何工作的?

    我对统计和 R 很陌生 也许这是一个非常微不足道的问题 但我不太明白这是如何工作的 假设我使用dnorm 5 0 2 5 这意味着什么 我看到一些资源 他们告诉我这个函数计算密度曲线中点的高度 现在我再次读到 在连续分布中 数字的确切概率为
  • 如何获取完整的子目录列表(包括子目录的子目录)?

    我有数千个城市文件夹 例如city1 city2等等 但实际上命名为NewYork Boston ETC 每个文件夹还包含两个子文件夹 land and house 所以目录结构是这样的 current dictionary city1 h
  • 寻找优秀、可靠玩家的算法

    我有以下玩家 每个值对应于给定游戏中正确答案百分比的结果 players array A gt array 0 0 0 0 B gt array 50 50 0 0 C gt array 50 50 50 50 D gt array 75
  • R 中的线性插值

    我有一个真实数据的数据集 例如如下所示 Dataset 1 with known data known lt data frame x c 0 6 y c 0 10 20 23 41 39 61 plot known x known y t
  • Seaborn 用直方图绘制分布图,其中 stat = 密度或概率?

    我知道 默认情况下 直方图方法是计算出现次数 相反 我们可以用密度或概率来可视化分布 sns displot data stat density or sns displot data stat probability 我的问题是我应该使用
  • 在 Sublime Text 3 中,我可以将 do 文件的选择发送到 Stata 吗?

    This SO question https stackoverflow com questions 18361667 is there a command line editor that highlights the stata syn
  • 为 Microsoft SQL Server 创建统计信息时,列顺序重要吗?

    数据库引擎优化顾问建议为我们的几个查询创建一些统计信息 事实证明 其中一些是相同的 只是 CREATE STATISTICS 命令中的列顺序不同 例如 CREATE STATISTICS StatName1 ON dbo table1 co
  • R 中卡方的事后测试

    我有一张看起来像这样的桌子 gt dput theft loc structure c 13704L 14059L 14263L 14450L 14057L 15503L 14230L 16758L 15289L 15499L 16066L
  • 哪些类型的语言允许以编程方式创建变量名称?

    这个问题纯粹出于求知欲 在相对频繁地浏览 Python 部分后 我看到了许多类似的问题this https stackoverflow com questions 1429814 how to programmatically set a
  • 如何编写循环来运行数据框的 t 检验?

    我遇到了对数据框中存储的某些数据运行 t 检验的问题 我知道如何一一做 但效率很低 请问如何写一个循环来实现呢 例如 我在testData中获取了数据 testData lt dput testData structure list Lab
  • 解释为什么没有船的空 scenekit 场景只有一个节点和 2.73K 多边形

    为什么移除船舶后的空 scenekit 场景只有一个节点和 2 73K 多边形数 如果我展开统计视图 会看到两个节点和 5 46K 个多边形 它必须与统计视图有关 但为什么有这么多多边形 为什么这个视图会出现在场景内部 一个空的 Scene
  • Python statsmodel.api 逻辑回归 (Logit)

    所以我尝试使用 python 的 statsmodels api 对二进制结果进行逻辑回归进行预测 我按照教程使用 Logit 当我尝试对测试数据集进行预测时 每个记录的输出都是 0 到 1 之间的小数 它不应该给我零和一吗 或者我是否必须
  • 来自多元 t 分布的样本 python

    我想知道Python中是否有一个从多元学生t分布中采样的函数 我有包含 14 个元素的均值向量 14x14 协方差矩阵和自由度 我想从这个 t 分布中采样一个向量 对于一维情况 我使用 stats t rvs df loc scale 并且
  • 高级描述熊猫

    有没有像 pandas 那样更高级的功能 通常我会继续这样 r pd DataFrame np random randn 1000 columns A r describe 我会得到一份很好的总结 就像这样 A count 1000 000
  • 如何求真实数据的概率分布和参数? (Python 3)

    我有一个数据集来自sklearn我绘制了分布load diabetes target数据 即回归值load diabetes data用于预测 我使用它是因为它的回归变量 属性数量最少sklearn datasets 使用Python 3
  • 在 R 中读取 Stata 13 文件

    有没有办法在 R 中读取 Stata 版本 13 数据集文件 我尝试执行以下操作 gt library foreign gt data read dta TEAdataSTATA dta 但是 我收到一个错误 read dta TEAdat
  • MySQL 将表的校验和存储在另一个表中

    语境 我们有包含大量表的大型数据库 他们中的大多数 99 都使用innodb 我们希望有一个日常流程来监视哪个表已被修改 当他们使用 innodb 的值时Update time from SHOW table STATUS from inf
  • python 中的 Johansen 协整检验

    我找不到任何有关在处理统计和时间序列分析 pandas 和 statsmodel 的 Python 模块中执行 Johansen 协整检验的功能的参考 有谁知道是否有一些代码可以执行时间序列之间的协整测试 现在 这已在 Python 的 s
  • Google Analytics 和哈希/锚点不起作用

    我希望你可以帮助我 我有一个 Javascript 画廊 每张图片都有一个特定的哈希值 www example com gallery html title 1 我的统计数据位于 Google Analytics 上 但即使我在相应的代码中
  • 模行为背后的数学

    Preamble 这个问题与 P RNG 的行为无关rand 它是关于使用均匀分布的两个值的幂对模 介绍 我知道不应该使用模数 将一个值从一个范围转换为另一个范围 例如从 0 到 5 之间的值rand 功能 会有偏差 这里解释了https

随机推荐

  • 将图像旋转的方法

    import cv2 import numpy as np img cv2 imread 1 png 1 rows cols img shape 2 参数一 旋转中心 参数二 旋转角度 参数三 缩放因子 正数为逆时针旋转 负数为顺时针旋转
  • 《Flexible Image Denoising with Multi-layer Conditional Feature Modulation》阅读笔记

    摘要 为了实现灵活的非盲图像降噪 现有的深层网络通常将嘈杂的图像和噪声级别图作为输入 以使用一个模型来处理各种噪声级别 然而 在这种解决方案中 噪声方差 即 噪声水 平 仅被部署为利用通道方向的移位来调制卷积特征的第一层 这在平衡噪声去除和
  • Kafka消费组(consumer group)详解

    一直以来都想写一点关于kafka consumer的东西 特别是关于新版consumer的中文资料很少 最近Kafka社区邮件组已经在讨论是否应该正式使用新版本consumer替换老版本 笔者也觉得时机成熟了 于是写下这篇文章讨论并总结一下
  • Js中Object方法

    1 Object assign Object assign 是通过复制一个或多个对象 创建一个新对象 var source1 a 1 var source2 b 2 Object assign source1 source2 a 1 b 2
  • Android 如何引用库工程Library的资源

    一 如何在工程A中直接引用库工程B的资源 方法一 直接将工程B的资源拷贝到工程A中 方法二 在工程A的java 代码中引用B的资源R 注意R需要带上包名 例如 imageView setImage com B pkgname R drawa
  • Linux小技巧4--如何屏蔽某个特定的网站

    Linux小技巧4 如何屏蔽某个特定的网 对于网站的屏蔽 可以下载软件来屏蔽 也可以用系统里面的hosts文件来屏蔽 下面说说比较简单的 用hosts来屏蔽网站 1 在windows下面 进入C盘windows system32 drive
  • 有向图的邻接矩阵与邻接表详细实现

    有向图的邻接矩阵 通过邻接矩阵来表示有向图 如下如所示 上面的有向图G2包含了 A B C D E F G 共7个顶点 而且包含了
  • maven依赖范围之import

    maven依赖范围之import import依赖范围 该依赖范围不会test compile runtime的 classpath 产生实际的影响 它的作用是将其他模块定义好的 dependencyManagement 导入当前 Mave
  • 解决问题win10“.dll(或者,ocx)控件已加载,但对DllregisterServer的调用失败,错误代码为0x80070005”

    重构机房的过程需要参考用VB生成的 机房收费系统 安装后需要执行的步骤 第一 需要配置文件DSN 文件名称 charge 服务器 local 用户名 sa 密码 123456 数据库 charge sys 第二 附加数据库 第三 需要注册文
  • PCL Harris3D关键点提取

    目录 一 算法原理 1 原理概述 2 实现流程 2 1 2d Harris 算法 2 2 3d Harris 算法 3 注意事项 4 参考文献 二 代码实现 三 结果展示 四 参数解析 一 算法原理 1 原理概述
  • 关于PCB走线,铜厚与允许的最大电流之间的关系

    最近在看西安电子科技大学庄奕琪教授的 电子设计可靠性工程 这本书对于电子专业的工程师 学生来说 真的特别实用 其中他并没有提到关于EMC EMI之类的词语 但是关于电磁兼容 电磁屏蔽之类的一些操作都写的非常详细 做笔记做笔记 关于PCB走线
  • 孟德尔随机化推断暴露因素与健康结局的因果关系

    学习视频 应用孟德尔随机化方法推断暴露因素与健康结局的因果关系 王友信教授 梅斯医学 哔哩哔哩 bilibili http chinaepi icdc cn zhlxbx ch reader create pdf aspx file no
  • 应用计算机测定线性电阻电路图和实物图,PC817中文数据摘要_PC817引脚图和功能_工作原理_特性参数及典型应用电路...

    首先 PC817中文数据摘要 PC817简介 PC817光耦合器广泛用于计算机终端 晶闸管系统设备 测量仪器 复印机 自动售票 家用电器 如风扇 加热器 和其他在前端和负载之间进行信号传输的电路 目的是提高安全性 减少电路干扰并简化电路设计
  • Cookie实现简化登录

    写在前面 以下只用于自己复习 仅供参考 有不到位或错误的地方欢迎指出 非常感谢 目录 一 Cookie介绍 1 Cookie概念 2 Cookie作用 3 Cookie的使用原则 二 相关操作 1 客户端页面 2 后台数据处理 一 Cook
  • java中==与equals的区别

    String a hello String b hello String c new String hello System out println a b System out println a equals b System out
  • SD卡引脚 电路图及工作原理介绍

    对于SD卡的硬件结构 在官方的文档上有很详细的介绍 如SD卡内的存储器结构 存储单元组织方式等内容 要实现对它的读写 最核心的是它的时序 笔者在经过了实际的测试后 使用51单片机成功实现了对SD卡的扇区读写 并对其读写速度进行了评估 下面先
  • android log处理

    今天是新年上班的第一天 好高兴啊 感觉公司好亲切 可不是 开门红包抽中最高的啦 今天计划实现把导致软件崩溃的bug发送到服务器端 好让我根据bug 调试程序 通过查阅资料 遇到以下几个问题 1 把log文件发送到服务器 这个log是使程序崩
  • LINUX学习--页面认识和常用命令

    目录 前言 一 LINUX界面 1 Linux图形界面 2 Linux文本界面 3 界面切换 4 终端 判断自己是否有网 二 LINUX目录介绍 1 设计思想 2 常用目录 三 LINUX基本命令 1 LINUX命令格式 2 LINUX命令
  • AI绘图MidJourney提示词详解——美女画法(1)

    AI绘图MidJourney提示词详解 美女画法 1 前言 提示词基本公式 1 1 公式参数说明 编写提示词 Prompt 2 1 题目 2 2 提示词描述 2 3 生成提示词 获取更多信息 前言 Midjourney Prompt即提示词
  • 浙江大学【面板数据分析与STATA应用】——第一讲短面板数据分析

    基本概念 面板数据及分类 面板数据分类 短面板和长面板 动态面板和静态面板 平衡面板和非平衡面板 截面数大于时间数就是短面板 反之 则为长面板 解释变量包含被解释变量的滞后值则为动态面板 反之 则为静态面板 平衡面板 每个个体在想他的时间内