【空间面板计量专题，举一反三，学通学透】

2023-11-17

重点内容：空间计量概念空间权重矩阵空间面板计量全套代码

前言：最近因为要写一篇关于环境规制的论文，需要用到空间计量的方法，于是开始从零学习这个模块的内容，在耗费大量精力以及微薄的财力之后，最终也是在实际操作方面能够得以初窥门径。不过回顾这个历程，总觉得太过费时费力，这一方面是因为网络上没有足够详细的全套实证教程和相应解读，导致大问题没有而小问题却层出不穷，解决这些细枝末节问题极其耗费能量；当然，另一方面就是可能作者本身比较愚笨。不过好在天道酬勤，总算是把东西做出来了。今日这篇文章，主要是针对空间计量小白而言的，首先解释一些实证过程中必须要理解的概念，其次总结回顾一些经常遇到的问题和解决办法，再次是考虑一些朋友的需要分享和售卖一些数据和资料。以下是正文，以问题形式和简明扼要的语言解开空间计量的面纱。

一、筑基篇

空间计量是什么，与常见的计量方法的主要区别是什么？——空间计量即是从空间上考察事物之间关系的一种计量方法，它假定一个单元的某种要素会受到周边单元的影响，而普通计量则不考虑周边单元对本单元的影响。举例来讲，就是爸妈对你的满意程度可能受到隔壁家王大婶家儿子的影响，你上厕所的频率可能受到同桌上厕所频率的影响...可见，空间关系无处不在，如果在回归中忽略了这种空间关系，认为本地区因变量只受到本地区自变量的影响，就会导致估计的偏差。

怎么考察空间关系？——正如前面提到，本地区的某要素可能受到周边地区的影响，如果要研究这种影响，首先就是要定义“哪些地区算周边地区？”，这也就是我们常说的空间权重矩阵。那么什么是空间权重矩阵？为了方便理解还是以常见的同侪压力作为例子，假设你是一个有点中二的普通人，周边住着王大婶家和张大婶家，王大婶家的儿子虽然在卖猪肉，但一表人才说话又好听赚的还多，张大婶家的儿子几年工作不顺后躲在家爆起了金币。所以每每你父母看到你犯二，总想起隔壁王大婶家那个风度翩翩的猪肉佬，对你便颇有微词；而每每这个时候，他们也会想起爆金币哥，就不免庆幸：“至少这兔崽子还没在家爆金币”，事情也就不了了之。不过，你时常心底也在庆幸，还好李大婶家离我家十万八千里，因为他们家的儿子乃当之无愧的“别人家的孩子”。所以，空间权重矩阵就是事物空间关系的数学化表达。更具体地讲，就是将现实的事物符号化为纸上的内容，如同下图一般，你、王大婶家、李大婶家、张大婶家即一个个空间单元，0代表没关系，1代表相邻。

空间权重矩阵有哪些类型？——常用的矩阵主要包括邻接矩阵、地理距离矩阵、经济距离矩阵、地理经济距离嵌套矩阵，此外还有一些基于研究需要而设计的权重矩阵，比如Parent and Lesage(2008)设计了一种同时考虑技术和空间邻近关系的非对称矩阵.

SING THE VARIANCE STRUCTURE OF THE CONDITIONALAUTOREGRESSIVE SPATIAL SPECIFICATION TO MODELKNOWLEDGE SPILLOVERS.pdf

362.7K·百度网盘

通常来讲，如果要进行实证研究，上述各类矩阵你都可以试着跑一次，最终采用哪一个取决哪一个最适合你的数据（最显著x），甚至对于矩阵的含义都不必过于关注。不过为了内容的完整，还是简单介绍一下：

邻接矩阵：邻接矩阵正如其名，通过一个单位和另一个单位是否接壤来判定是否为邻居，如果接壤就赋值为1，不接壤就赋值为0，如前文“隔壁爆金币哥们救了我”的例子；

地理距离矩阵：通过计算各个单元之间的距离来判定关系的远近，一般常用的是反地理距离矩阵（距离的倒数，结果就是距离越远权重值就越小），可以有地理质心距离、公路距离、铁路距离等等；

经济距离矩阵：以经济变量的差异来反映关系的远近，常用的指标为人均GDP，两地人均GDP越近则关系越近，应赋予更高的权重；

地理经济距离嵌套矩阵：同时考虑了经济发展程度和地理距离远近的权重矩阵，可参考：

长三角地区创新型人力资本对...基于空间杜宾模型的实证分析_张桅.pdf

2.1M·百度网盘

此外，为了满足一部分想一步到位的朋友，直接贴上中国31省（无港澳台）的邻接矩阵、地理距离矩阵（公路、铁路均有，质心距离的参考下面）、经济距离矩阵。

授人以鱼不如授人以渔，继续贴出各省的shp文件，可以通过Geoda或者ArcGis软件打开编辑，具体操作方法不难，参考连老师的教程或直接CSDN搜Geoda地理距离权重矩阵。

二、开光篇

本篇主要总结一些实证过程的可能存在的问题和需要注意的点，具体的实证代码会在第三篇提供。只要有了空间权重矩阵，恭喜你，完成了空间计量实证中最重要的一步。下一步则是利用空间权重矩阵进行空间关系的检验，空间关系检验首先需要计算Moran's I指数，如果莫兰指数各系数均显著且方向符合预期，则可以进行具体的回归（以stata软件的SDM模型为例）。在这个过程中，你可能需要注意以下细节以及遇到以下问题...

1.数据为面板数据，而空间权重矩阵为截面，能否做空间计量？——可以。面板数据也是采用截面的空间权重矩阵进行回归，使用的命令为xsmle，当然你必须先使用xtset命令告诉stata你的数据为面板数据。

2.需要注意的细节：将你每个截面的数据排序调整为与空间权重矩阵一致，故而我更倾向于你自己制作空间权重矩阵。

3.数据要求：数据最好不要有缺失值且如果是面板数据最好为平衡面板，空间权重矩阵也不能有缺失值，理由是作为一个小白你不懂模型的内部算法，很难应对更加复杂的情况，所以最好的应对方法就是保证理想的实验条件。

4.报错：Spatial weights in matrix w are not binary.To compute Getis and Ord's G you must use a non-standardized binary weights matrix.

解决办法，在定义空间权重矩阵的语句后面加上standardize

5.如何计算面板数据的莫兰指数？——连玉君老师的xtmoran 命令编写借鉴了 Maurizio Pisati 教授的 spatgsa 和 spatlsa 两个命令。在此基础上，将关于莫兰指数的部分命令整合在一起，同时根据莫兰指数的计算公式，实现面板数据的莫兰指数的计算，并对其中绘制莫兰散点图命令做了更新，感兴趣的小伙伴可以看一下 ado 文件。具体链接： https://www.lianxh.cn/news/811bbd3446fa2.html

6.做空间面板回归时报错convergence not achieved Warning: e(V) matrix is not positive definite. Spatial effects Std. Err. will be computed using a modified positive definite matrix (Rebonato and Jackel, 2000). estimates post: matrix has missing values. r(504);

解决办法：在xsmle语句后面，不要加effects，但这样会导致无法对空间效应做进一步分解，作者也暂时没找到更好的办法。

7.为什么已经有了回归结果，还要对空间效应进行进一步分解？——在Lesage J P , Pace R K （2009）“ Introduction to Spatial Econometrics. ”一文中，作者提出当空间自回归系数“rho”系数显著不为零，SDM模型的估计结果将会产生系统性偏差，故而需要进一步对空间效应进行微分分解，很多文章报告的也是经过分解后的结果。

8.为什么我的回归结果中某个变量会显示omitted？——这可能是多重共线性导致的，也可能是你空间权重矩阵的问题，建议你可以检查一下空间权重矩阵，以及对变量之间的关系做对应的检查。

9.待补充....

三、结丹篇

最后贴上个人使用的程序代码供各位看官参考，该代码注释、结果导出一应俱全....

最后，如何对结果进行解释？——直接效应乃是本地区自变量对于因变量的影响，间接效应乃是周边地区自变量对于本地区因变量的影响（反过来可以看作本地区自变量对于周边地区因变量的影响，故而有些文章老是写的什么溢出效应就是这个）。如果做了动态SDM（分解了长短期效应），我个人理解有短期效应就是在短期内有影响，有长期效应就是长期内仍有效。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

经验分享

Powered by 金山文档