重点内容:空间计量概念 空间权重矩阵 空间面板计量全套代码
前言:最近因为要写一篇关于环境规制的论文,需要用到空间计量的方法,于是开始从零学习这个模块的内容,在耗费大量精力以及微薄的财力之后,最终也是在实际操作方面能够得以初窥门径。不过回顾这个历程,总觉得太过费时费力,这一方面是因为网络上没有足够详细的全套实证教程和相应解读,导致大问题没有而小问题却层出不穷,解决这些细枝末节问题极其耗费能量;当然,另一方面就是可能作者本身比较愚笨。不过好在天道酬勤,总算是把东西做出来了。今日这篇文章,主要是针对空间计量小白而言的,首先解释一些实证过程中必须要理解的概念,其次总结回顾一些经常遇到的问题和解决办法,再次是考虑一些朋友的需要分享和售卖一些数据和资料。以下是正文,以问题形式和简明扼要的语言解开空间计量的面纱。
一、筑基篇
空间计量是什么,与常见的计量方法的主要区别是什么?——空间计量即是从空间上考察事物之间关系的一种计量方法,它假定一个单元的某种要素会受到周边单元的影响,而普通计量则不考虑周边单元对本单元的影响。举例来讲,就是爸妈对你的满意程度可能受到隔壁家王大婶家儿子的影响,你上厕所的频率可能受到同桌上厕所频率的影响...可见,空间关系无处不在,如果在回归中忽略了这种空间关系,认为本地区因变量只受到本地区自变量的影响,就会导致估计的偏差。
怎么考察空间关系?——正如前面提到,本地区的某要素可能受到周边地区的影响,如果要研究这种影响,首先就是要定义“哪些地区算周边地区?”,这也就是我们常说的空间权重矩阵。那么什么是空间权重矩阵?为了方便理解还是以常见的同侪压力作为例子,假设你是一个有点中二的普通人,周边住着王大婶家和张大婶家,王大婶家的儿子虽然在卖猪肉,但一表人才说话又好听赚的还多,张大婶家的儿子几年工作不顺后躲在家爆起了金币。所以每每你父母看到你犯二,总想起隔壁王大婶家那个风度翩翩的猪肉佬,对你便颇有微词;而每每这个时候,他们也会想起爆金币哥,就不免庆幸:“至少这兔崽子还没在家爆金币”,事情也就不了了之。不过,你时常心底也在庆幸,还好李大婶家离我家十万八千里,因为他们家的儿子乃当之无愧的“别人家的孩子”。所以,空间权重矩阵就是事物空间关系的数学化表达。更具体地讲,就是将现实的事物符号化为纸上的内容,如同下图一般,你、王大婶家、李大婶家、张大婶家即一个个空间单元,0代表没关系,1代表相邻。
空间权重矩阵有哪些类型?——常用的矩阵主要包括邻接矩阵、地理距离矩阵、经济距离矩阵、地理经济距离嵌套矩阵,此外还有一些基于研究需要而设计的权重矩阵,比如Parent and Lesage(2008)设计了一种同时考虑技术和空间邻近关系的非对称矩阵.
SING THE VARIANCE STRUCTURE OF THE CONDITIONALAUTOREGRESSIVE SPATIAL SPECIFICATION TO MODELKNOWLEDGE SPILLOVERS.pdf
362.7K·百度网盘
通常来讲,如果要进行实证研究,上述各类矩阵你都可以试着跑一次,最终采用哪一个取决哪一个最适合你的数据(最显著x),甚至对于矩阵的含义都不必过于关注。不过为了内容的完整,还是简单介绍一下:
长三角地区创新型人力资本对...基于空间杜宾模型的实证分析_张桅.pdf
2.1M·百度网盘
此外,为了满足一部分想一步到位的朋友,直接贴上中国31省(无港澳台)的邻接矩阵、地理距离矩阵(公路、铁路均有,质心距离的参考下面)、经济距离矩阵。
授人以鱼不如授人以渔,继续贴出各省的shp文件,可以通过Geoda或者ArcGis软件打开编辑,具体操作方法不难,参考连老师的教程或直接CSDN搜Geoda地理距离权重矩阵。
二、开光篇
本篇主要总结一些实证过程的可能存在的问题和需要注意的点,具体的实证代码会在第三篇提供。只要有了空间权重矩阵,恭喜你,完成了空间计量实证中最重要的一步。下一步则是利用空间权重矩阵进行空间关系的检验,空间关系检验首先需要计算Moran's I指数,如果莫兰指数各系数均显著且方向符合预期,则可以进行具体的回归(以stata软件的SDM模型为例)。在这个过程中,你可能需要注意以下细节以及遇到以下问题...
1.数据为面板数据,而空间权重矩阵为截面,能否做空间计量?——可以。面板数据也是采用截面的空间权重矩阵进行回归,使用的命令为xsmle,当然你必须先使用xtset命令告诉stata你的数据为面板数据。
2.需要注意的细节:将你每个截面的数据排序调整为与空间权重矩阵一致,故而我更倾向于你自己制作空间权重矩阵。
3.数据要求:数据最好不要有缺失值且如果是面板数据最好为平衡面板,空间权重矩阵也不能有缺失值,理由是作为一个小白你不懂模型的内部算法,很难应对更加复杂的情况,所以最好的应对方法就是保证理想的实验条件。
4.报错:Spatial weights in matrix w are not binary.To compute Getis and Ord's G you must use a non-standardized binary weights matrix.
解决办法,在定义空间权重矩阵的语句后面加上standardize
5.如何计算面板数据的莫兰指数?——连玉君老师的xtmoran 命令编写借鉴了 Maurizio Pisati 教授的 spatgsa 和 spatlsa 两个命令。在此基础上,将关于莫兰指数的部分命令整合在一起,同时根据莫兰指数的计算公式,实现面板数据的莫兰指数的计算,并对其中绘制莫兰散点图命令做了更新,感兴趣的小伙伴可以看一下 ado 文件。具体链接: https://www.lianxh.cn/news/811bbd3446fa2.html
6.做空间面板回归时报错convergence not achieved Warning: e(V) matrix is not positive definite. Spatial effects Std. Err. will be computed using a modified positive definite matrix (Rebonato and Jackel, 2000). estimates post: matrix has missing values. r(504);
解决办法:在xsmle语句后面,不要加effects,但这样会导致无法对空间效应做进一步分解,作者也暂时没找到更好的办法。
7.为什么已经有了回归结果,还要对空间效应进行进一步分解?——在Lesage J P , Pace R K (2009)“ Introduction to Spatial Econometrics. ”一文中,作者提出当空间自回归系数“rho”系数显著不为零,SDM模型的估计结果将会产生系统性偏差,故而需要进一步对空间效应进行微分分解,很多文章报告的也是经过分解后的结果。
8.为什么我的回归结果中某个变量会显示omitted?——这可能是多重共线性导致的,也可能是你空间权重矩阵的问题,建议你可以检查一下空间权重矩阵,以及对变量之间的关系做对应的检查。
9.待补充....
三、结丹篇
最后贴上个人使用的程序代码供各位看官参考,该代码注释、结果导出一应俱全....
最后,如何对结果进行解释?——直接效应乃是本地区自变量对于因变量的影响,间接效应乃是周边地区自变量对于本地区因变量的影响(反过来可以看作本地区自变量对于周边地区因变量的影响,故而有些文章老是写的什么溢出效应就是这个)。如果做了动态SDM(分解了长短期效应),我个人理解有短期效应就是在短期内有影响,有长期效应就是长期内仍有效。