查看原文
其他

空间回归模型选择的反思

本文转自统计与信息论坛

作者:姜磊,浙江财经大学经济学院


空间计量经济学存在两种最基本的模型:空间滞后模型和空间误差模型,这里旨在重新思考和探讨这两种空间回归模型的选择,结论为:Moran’s I指数可以用来判断回归模型后的残差是否存在空间依赖性;在实证分析中,采用拉格朗日乘子检验判断两种模型优劣是最常见的做法。然而,该检验仅仅是基于统计推断而忽略了理论基础,因此,可能导致选择错误的模型;在实证分析中,空间误差模型经常被选择性遗忘,而该模型的适用性较空间滞后模型更为广泛;实证分析大多缺乏空间回归模型设定的探讨,Anselin提出三个统计量,并且,如果模型设定正确,应该遵从Wald统计量>Log likelihood统计量>LM统计量的排列顺序。


一、前言


空间计量经济学(Spatial Econometrics)是近年来学术界较为关注的一门学科。空间计量经济学这一术语最早是由Paelinck和Klaassen提出[1] 。Cliff和Ord在这个领域进行了开拓性的工作[2] 。由此,引出了空间计量经济学模型的开端。Anselin在1988年出版的《空间计量经济学:方法与模型》一书是这个领域中的一座里程碑[3] 。该书对空间计量经济学理论做了系统地整理和深入地探索。随后,很多学者被吸引到该领域进行更为深入地研究,这其中包括Cressie、Kelejian、Anselin、Florex、LeSage、Elhorst等[4-8] 。 空间计量经济学模型在国内外的各个学科应用非常广泛,已经得到了学术界的认可。在空间计量经济学发展的近40年中,出现了多种空间计量经济学模型。其中,应用最为广泛的有两个模型:空间滞后模型和空间误差模型。近年来,这两个基本的空间计量模型在实证分析中应用十分广泛,尤其是空间滞后模型及其衍生模型,是大多数实证分析文章所经常采用的模型,空间误差模型则通常被选择性忽视。那么,空间滞后模型是否存在适用范围?


Anselin提出的拉格朗日乘子检验是否是判断空间计量模型选择的唯一依据呢?空间误差模型为什么被忽略?该模型有什么样的优点?这些将是本文探讨的主要问题。



二、数据来源与建模流程


(一)数据来源


本文实证分析数据集采用的是Anselin用到的著名案例:Columbus犯罪数据。该数据集包含49个观察值,本文主要涉及到3个变量,即因变量CRIME和两个自变量INC和HOVAL。其中,CRIME表示每千户中的入室抢劫和盗窃车辆的案件数量;INC表示家庭收入,单位为1 000美元;HOVAL表示房屋价格,单位为1 000美元。




(二)空间滞后模型与空间误差模型 


常来说,在进行空间计量经济学模型分析时,需要一个基准模型用以对比参考。普通最小二乘模型是最常见的基准模型,如公式(1)所示: 



式(1)中,α表示常数项,β为待估计的参数,ε表示随机误差项。


相应地,空间滞后模型如式(2)所示:


式(2)中,ρ表示因变量空间滞后项的待估计参数,也被称为空间自回归系数。W表示空间权重矩阵。其他同公式(1)。 


空间误差模型如式(3)所示: 



其中,λ为空间自相关误差项的待估计系数,也被称为空间自相关系数。μ为误差项。其他同式(1)。



(三)空间计量经济学建模一般流程


Anselin针对空间计量经济学建模给出了实证分析的流程图(图1)。 


图1 空间计量模型决策流程图 


由图1可知,空间计量经济学建模首先要从OLS模型开始,用OLS回归后的残差进行拉格朗日乘子检验(Lagrange Multiplier Test,LM)。该检验包含两个统计量:即LM-Error和LM-Lag。如果这两个统计量均不显著,则选择OLS模型作为最终模型;若只有一个统计量显著,那么LM-Error统计量显著则指向空间误差模型,而LM-Lag统计量显著则指向空间滞后模型。如果两个统计量均显著,Anselin提出了稳健性(Robust)的拉格朗日乘子检验(Robust LM test),相应地该检验也包含两个统计量,即Robust LM-Error和Robust LM-Lag。其中,若Robust LM-Error统计量显著则指向空间误差模型,而Robust LM-Lag统计量显著则指向空间滞后模型。



三、实证分析



(一)空间滞后模型和空间误差模型结果


在空间计量模型回归之前,很多实证分析的论文通常做法是对因变量进行全域空间自相关分析,用来描述空间单元的某个要素的观察值与相邻空间单元元素的观察值是否相近。全域空间自相关分析一般采用的测度指标是Moran’s I指数。其公式如下所示[9] :



式(4)中,Yi和Yj为空间单元i和j的观察值; 表示Y观察值的平均值;n表示空间单元的个数;W为空间权重矩阵,通常采用行标准化进行处理。I取值范围在[-1,1]之间。Moran’s I显著为正时,表示存在正向的空间自相关;Moran’s I显著为负时,表示存在负向的空间自相关[10] 。 


在对本例数据进行空间计量经济学模型回归之前,先对CRIME变量进行全域空间自相关进行分析。计算结果显示:CRIME变量的Moran’s I指数为0.500 2,其概率值为0.001,也就是说,CRIME变量存在显著的正向空间自相关现象。 


在空间计量建模之前对因变量进行空间自相关检验是很多中文文献的通常做法。需要指出的是:因变量是否存在空间自相关现象与是否在模型右边添加因变量的空间滞后项并非必要条件,尽管有时候因变量存在显著的空间自相关现象。 


在拉格朗日乘子检验发表之前,空间自相关检验应用在检验模型回归后的残差是否存在空间自相关现象[11] 。


如果残差存在空间自相关现象,那么应该通过添加因变量的空间滞后项(即建立空间滞后模型)或者添加空间自相关误差项(即建立空间误差模型)来消除残差中的空间自相关现象。 


接下来,对模型进行回归分析。首先对模型(1)采用OLS进行回归,然后计算OLS模型残差的Moran’s I指数。结果显示,残差的Moran’s I指数为0.222 1,其概率值为0.006 0(见表2),表明了在1%的显著性水平下拒绝了“无空间自相关”的原假设,即残差存在显著的空间自相关现象。换言之,空间单元的残差值与相邻空间单元的残差值相近。因此,需要处理OLS模型残差存在的空间自相关问题。


表2 6种模型回归后的残差Moran’s I指数



尽管Moran’s I检验显示残差存在显著的空间自相关,但是该检验并不能判断是否应该选择空间滞后模型还是空间误差模型。因此,需要通过拉格朗日乘子检验来进行判断,检验结果见表3。


表3 拉格朗日乘子检验结果


首先,分析OLS回归的结果。由表3可知,两个自变量INC和HOVAL均显著为负,说明提高家庭收入和房屋价格有助于降低入室抢劫和盗窃车辆案件发生的数量。再来分析拉格朗日乘子检验的结果。LM-Lag和LM-Error两个统计量均在1%水平下显著,根据图1来看,需要通过稳健性的拉格朗日乘子检验来进一步判断:即Robust LM-Lag和Robust LM-Error统计量来进行判断。


由表3可知,Robust LM-Lag统计量在5%的水平下拒绝了原假设,因此,应该选择空间滞后模型。 接下来对模型(2)也就是空间滞后模型进行极大似然估计,回归结果如表4所示。


表4 空间滞后模型和空间滞后模型估计结果



先来分析空间滞后模型回归结果。由表4可知,两个自变量INC和HOVAL均显著为负,说明提高家庭收入和房屋价格有助于降低入室抢劫和盗窃车辆案件发生的数量。因变量空间滞后项W*CRIME显著为正,说明周围邻居地区入室抢劫和盗窃车辆案件发生的数量越多,那么核心地区入室抢劫和盗窃车辆案件发生的数量也会增多。


再来比较OLS模型和空间滞后模型。由于空间滞后模型的拟合优度R2与OLS拟合优度R2不同,因此二者之间不可通过大小来进行比较[3] 。Anselin给出了3个统计量来进行模型的比较,分别是Log Likelihood(对数似然值),Akaike Info Criterion(赤池信息准则)和Schwarz Criterion(施瓦茨信息准则)[3] 。其中,Log Likelihood统计量越大说明模型越好,而Akaike Info Criterion和Schwarz Criterion统计量越小说明模型越好。通过比较表3和表4可知,空间滞后模型的Log Likelihood(-182.674)大于OLS模型的Log Likelihood(-187.38),而Akaike Info Criterion(373.348)和Schwarz Criterion(380.915)均分别小于OLS模型的Akaike Info Criterion(380.75)和Schwarz Criterion(386.43)。通过这3个统计量可知,空间滞后模型的确优于OLS模型。


那么,空间滞后模型是否消除了残差中的空间自相关呢?可以通过Moran’s I检验来进行判断。结果显示(见表2),空间滞后模型残差的Moran’s I指数为0.033 1,其概率值为0.264 0,表明了空间滞后模型的残差不存在空间自相关。


实际上,Moran’s I检验只是一种简单的判别残差是否存在空间自相关的方法,与因变量的空间滞后项(W*CRIME)和空间滞后误差项(Wε)在模型中是否显著并无关系。Anselin给出了3种统计量检验空间滞后项是否显著[3] ,即Wald统计量、Likelihood Ratio统计量(LR)和拉格朗日乘子统计量(LM),这三个统计量大小排列应遵从Wald>LR>LM。在有限样本情况下,若这3个统计量排列不遵从这个顺序,则模型设定可能有误。从空间滞后模型结果来看,完全遵从这种排序,即Wald(12.546 9)>LR(9.406 5)>LM(8.898 0),并且,这3个统计量均在1%显著性水平下强烈地拒绝了原假设,说明空间滞后模型是合适的。


尽管拉格朗日乘子检验结果指向了空间滞后模型,表4也给出了空间误差模型的回归结果。2个自变量INC和HOVAL同样显著为负,而空间自相关系数λ也显著为正,说明残差存在空间依赖性。


那么,空间误差模型是否也能消除残差中的空间依赖性呢?可以通过Moran’s I指数来进行判断,检验结果显示(见表2):空间误差模型回归后残差(式(3)中的μ)的Moran’s I指数为0.012 2,其概率值为0.352 0,表明了空间误差模型的残差也不存在空间依赖性。而空间误差模型中的空间自相关误差项的显著性检验结果显示:3个统计量也遵从Anselin提出的排列顺序,即Wald(15.685 7)>LR(7.255 6)>LM(5.206 2)。说明空间误差模型至少从统计检验上来说也是合适的。


(二)空间回归模型的讨论 


首先,空间滞后模型和空间误差模型各自的空间滞后项在统计上非常显著,并且Wald、LR和LM这3个统计量排列顺序也显示出这2个空间回归模型分别也都是合适的。接下来,通过前述介绍的Log Likelihood、Akaike Info Criterion和Schwarz Criterion这3个统计量来横向比较这2个空间回归模型。由表4可知,两个空间回归模型的3个统计量在大小上都极为接近,尽管空间滞后模型中这3个统计量每一个都略微优于空间误差模型的,即Log likelihood-Lag(-182.674)>Log likelihoodError(-183.750);Akaike Info Criterion-Lag(373.348)<Akaike Info Criterion-Error(373.499);Schwarz Criterion-Lag(380.915)<Schwarz Criterion-Error(379.174)。


唯一能判别出这2个空间回归模型优劣的就是稳健性的拉格朗日乘子检验,检验结果显示Robust LM-Lag>Robust LM-Error。


接下来,通过理论基础来进一步判断空间滞后模型是否合适。 


本例实证分析采用空间滞后模型是合适的,这不仅仅是因为统计检验的结果支持这一结论,更重要的是从理论基础上也支持空间滞后模型的设定。因变量空间滞后项W*CRIME显著为正,表明了周围邻近地区的入室抢劫和盗窃辆案件会严重影响中心地区的相同犯罪现象的发生。这不仅可以从犯罪学上很容易得知,而且从常识的角度也容易理解。当一个地区发生犯罪事件后,犯罪嫌疑人往往可能会流窜到其他邻近地区作案,存在非常明显的空间溢出效应。这种地理空间之间的交互效应通过空间滞后项表达出来。 由此可见,空间效应的合理性应该是空间计量经济学建模的理论基础,而不仅仅是通过拉格朗日乘子检验来进行判断,两者的结合才是有效的空间计量模型设定的基础。实际上,空间滞后模型的应用是非常受限的,在使用上不如空间误差模型广泛[3] 。这是因为,若要在回归方程中添加因变量的空间滞后项,即估计空间滞后模型,不仅仅需要拉格朗日乘子检验结果的支持,更重要的是需要合理的理论基础来支持模型。而空间误差模型则不同,不需要任何的前提假设,并且在数据收集过程中,误差极有可能存在空间依赖性。


(三)空间误差模型案例的讨论 


因变量的空间滞后项并非在所有的模型中都是有意义的。例如,Jiang等检验中国省域能源强度是否存在二次曲线,其研究的因变量为能源强度,尽管拉格朗日乘子检验结果支持空间滞后模型,但是Jiang等仍然选择空间误差模型[12] 。 


这是由于没有任何理论可以证明邻近地区的能源强度可以“直接”作用或者影响中心地区的能源强度。尽管有文献支持技术扩散这一说法,也就是说某一地区的技术可以扩散到其他地区。然而,这种简单地阐述能源强度存在技术溢出绝对不是添加因变量空间滞后项的理由。若技术溢出效应存在,那么也应该是通过外生技术变量的空间滞后项表示出来。 


另外,技术溢出也不是唯一能决定能源强度的外生因素。实际上,能源强度强烈地受到能源禀赋等强外生因素影响。具体举例来说,山西是著名的煤炭富集大省。因此,山西省的工业体系跟煤炭的生产与加工紧密联系,工业用能基本完全来自于低效的煤炭。在山西省的能源消费结构中,煤炭占据了绝对的主导地位。基于煤炭为主的能源资源禀赋决定了在山西省这种以重工业为主的工业体系,因此山西省的能源强度极高。


山西省直接邻近省份有内蒙古、河北、河南和陕西,这些相邻省份的技术水平很难说就一定比山西水平高。 假若能源强度指标能够反映出一定的技术水平,那么河南和陕西的能源强度也处于全国的中间水平,而内蒙古和河北的能源强度也仅仅比山西省略好(根据2014年统计数据,作者自己整理)。可以承认省域之间存在技术差异,那么这种并非十分明显的技术差异是否能通过空间技术溢出决定山西省的能源强度改善,也未可知。尽管有可能较远并且技术先进的地区可以进行技术溢出,但是很难在较短的时间内从整体上较快改善山西省的能源强度。这还是由于山西省的工业体系很难更改以煤炭为主的基本事实。另一个典型的煤炭大省贵州也是如此。 再回到空间计量经济学模型本身。尽管忽略因变量的空间滞后项,会得到有偏的估计;而忽略误差的空间滞后项,会得到无偏但是缺乏效率的估计[3,6] 。但是,忽略残差中的空间自相关的风险有时候是相当高的[13] 。


并且,在很多实证分析情况下,尽管因变量的空间自相关可能显著,但是缺乏基本的理论基础,所以在这种情况下,应该转而考虑由非系统性联系所产生的空间依赖性,也就是考虑误差中的空间依赖性。这是由于在误差项中有极大的可能性包含着空间依赖性[3] 。


(四)空间计量模型的扩展 


尽管在某些情况下,添加因变量空间滞后项可能缺乏理论基础,但是因变量的部分空间依赖性可以通过某些外生变量的空间效应来弥补。例如,在上例中介绍的能源强度变量。


技术溢出和扩散也是技术进步的重要来源之一,换言之,从地区外部获取先进的技术是本地区技术进步的重要来源之一。而技术进步又是促使能源强度降低的有效方法之一,所以外界先进的技术通过技术溢出和扩散有助于降低能源强度,而并非邻近地区的能源强度可以“直接”影响本地区的能源强度,因为这个解释缺乏理论基础。


因此,添加外生变量的空间滞后项可以产生另一种空间计量经济学模型,即自变量空间滞后模型(Spatial Lag of X model,SLX)[7] ,如式(5)所示:


其中W*INC和W*HOVAL分别表示自变量INC和HOVAL的空间滞后项。其他同式(1)。


对模型(5)进行OLS回归估计,并进行拉格朗日乘子检验,结果见表5。 


表5 自变量空间滞后模型拉格朗日乘子检验结果



由表5可知,自变量INC和HOVAL显著为负。


INC的空间滞后项W*INC也显著为负,说明邻近地区收入提高也可以降低中心地区犯罪数量的发生。但是HOVAL的空间滞后项W*HOVAL估计后的系数为正,但是并不显著。 


再看表5下方的拉格朗日乘子检验结果,LM-Lag和LM-Error两个统计量均十分显著,但是Robust LM-Lag和Robust LM-Error两个统计量均不显著,在这种情况下,图1中的分析流程图不再适用。但是可以看到,统计量LM-Lag大于LM-Error,说明拉格朗日乘子检验结果倾向建议在模型中添加因变量的空间滞后项。 


由此,又产生了另一种空间计量经济学模型,即空间杜宾模型(Spatial Durbin Model,SDM)。这种模型是LeSage和Pace极力推荐的,如式(6)所示:



同理,可以在空间误差模型中添加自变量的空间滞后项,则产生了另外一种空间计量经济学模型,即空间杜宾误差模型(Spatial Durbin Error Model,SDEM),如式(7)所示:

对空间杜宾模型(6)和空间杜宾误差模型(7)进行极大似然估计,结果见表6。 


表6 空间杜宾模型和空间杜宾误差模型估计结果


先分析空间杜宾模型的估计结果。自变量INC和HOVAL与空间滞后模型的系数一样显著为负,但是这两个自变量的空间滞后项W*INC和W*HOVAL均不显著。因变量空间滞后项W*CRIME显著为正。剔除这2个不显著的自变量空间滞后项则退回到了空间滞后模型。


再来看空间杜宾误差模型。自变量INC和HOVAL同空间误差模型的系数一样显著为负,但是W*HOVAL不显著,而W*INC则显著为负。空间自回归系数λ在统计上也非常显著。 


接下来对比空间杜宾模型和空间杜宾误差模型的Log Likelihood,Akaike Info Criterion和Schwarz Criterion这3个统计量,由表6可知,这2个空间回归模型相对应的3个统计量也都极为接近。 最后来看Wald统计量,Likelihood Ratio统计量(LR)和LM统计量。其中,空间杜宾模型这3个统计量并没有遵从Wald(6.254 0)>LR(4.662 7)>LM(4.827 3)的顺序。同理,空间杜宾误差模型这3个统计量也没有遵从Wald(6.091 4)>LR(4.383 2)>LM(4.455 1)。说明这2个空间回归模型设定有误,导致了极大似然估计和检验的统计量的渐进性不再有效。解决的方法是考虑更改模型,例如引入新的自变量或者采用不同的空间权重矩阵[10] 。


换言之,这并不意味着空间杜宾误差模型没有意义,通过引入新的自变量或者采用不同的空间权重矩阵,空间杜宾误差模型完全有可能成为合适的模型。 LeSage和Pace极力推荐空间杜宾模型,这是由于不仅仅因变量的空间滞后项和外生变量会影响因变量,同样,外生变量的空间溢出效应也是影响因变量的重要因素。因此,综合考虑,若实证分析采用了空间滞后模型,则最好扩展为空间杜宾模型。但是,空间杜宾模型也并非没有缺点。经验表明:通常需要大量的样本才能得到显著的自变量空间滞后项,以及相应的间接效用(有关空间杜宾模型的直接效应和间接效应,可以参考LeSage和Pace出版的著作[7] 。这也是实证分析中阻碍空间杜宾模型应用的重要障碍之一。


在实证分析中,空间杜宾误差模型极少得到应用[14] 。但是,这并非意味着该模型没有应用价值。实际上,空间误差模型应用范围比空间滞后模型要广泛[3] 。同理,空间杜宾误差模型在实证分析上也极为有应用价值。这是因为,空间杜宾误差模型不仅可以囊括想要检验感兴趣的外生变量的空间效应的显著性,同时也考虑到了误差中的空间依赖性。 


另外,空间杜宾误差模型在应用上较空间杜宾模型有一个明显的优点,那就是空间杜宾误差模型的系数可以像OLS回归后的系数一样直接解释,而空间杜宾模型的系数不可以直接解释。这是由于空间杜宾模型包含因变量的空间滞后项,因此外生变量的系数和其空间滞后项的系数不能直接解释,而是需要计算直接效用和间接效应。然而,空间杜宾误差模型的回归系数则可以直接解释。以表6最右侧的空间杜宾误差模型回归结果为例,自变量INC系数为-1.052 3,该系数为直接效应,而空间滞后项W*INC系数为-1.204 9,该系数为间接效应(也叫做累积邻近效应)。


由上述例子可知,在分析某因变量的解释因素及其相应的空间效应时,空间杜宾误差模型有着天然的优势,尤其在因变量的空间滞后项缺乏理论基础的时候尤甚。综上所述,在实证分析研究时,需要反复斟酌因变量的空间滞后项是否有理论依据,尽管Moran’s I检验结果显示因变量存在空间自相关。若没有强有力的理论基础,则需要考虑空间杜宾误差模型。



四、结论



通过上文分析,本文主要有以下四点结论。


第一,Moran’s I指数可以用来判断回归模型后的残差是否存在空间自相关现象,若存在,则需要剔除残差中的空间自相关。 


第二,在实证分析中,拉格朗日乘子检验结果是判断两种模型优劣的标准检验。但是,该检验仅仅是基于统计推断,而忽略了经济学的基本理论基础,也就是说该检验并不负责因变量空间滞后项是否有理论基础。因此,仅仅依据拉格朗日乘子检验结果可能导致错误的模型设定。在判断空间计量经济学模型时,不应该仅仅依据拉格朗日乘子检验结果,而是结合实际的经济学意义进行建模。 


第三,在实证分析中,有关空间回归模型设定的探讨,Anselin提出三个统计量,并且若模型设定正确,应该遵从Wald统计量>Log likelihood统计量>LM统计量。


因此,在空间回归模型的结果中,应该报告出这3个统计量的数值大小。 


最后,在实证分析中,空间误差模型作为一种空间回归模型经常被选择性的遗忘,而该模型的适用性较空间滞后模型要广泛。在因变量的空间溢出效应缺乏理论基础时,应当首先考虑误差可能存在的空间依赖性。而在选择空间误差模型时,也应该要考虑到外生变量的空间交互效应,即考虑空间杜宾误差模型。



参考文献


[1]Paelinck J,Klaassen L.Spatial Econometrics[M].Farnborough:Saxon House,1979. 

[2]Cliff A D,Ord J K.Spatial Autocorrelation[M].London:Pion,1973. 

[3]Anselin L.Spatial Econometrics:Methods and Models[M].Dordrecht:Kluwer Academic,1988. 

[4]Cressie N.Statistics for Spatial Data[M].Toronto:Wiley,1993. [5]Kelejian H H,Robinson D P.A Suggested Method of Estimation for Spatial Interdependent Models with Autocorrelated Errors and An Application to A County Expenditure Model[J].Papers in Regional Science,1993,72(3). 

[6]Anselin L,Florax R,Rey S J.Advances in Spatial Econometrics[M].Berlin:Springer,2004. 

[7]LeSage J,Pace R K.Introduction to Spatial Econometrics[M].Boca Raton:CRC Press,2009. 

[8]Elhorst J P.Spatial Econometrics:From Cross-sectional Data to Spatial Panels[M].Berlin:Springer,2014. 

[9]Anselin L,Bera A K,Florax R,et al.Simple Diagnostic Tests for Spatial Dependence[J].Regional Science&Urban Economics,1996,26(1). 

[10]Moran P A P.Notes on Continuous StochasticPhenomena[J].Biometrika,1950,37(1/2). 

[11]Cliff A D,Ord J K.Spatial Processes:Models and Applications[M].London:Pion,1981. 

[12]Jiang L,Folmer H,Ji M.The Drivers of Energy Intensity in China:A Spatial Panel Data Approach[J].China Economic Review,2014,31. 

[13]Oberst C,Oelgemller J.Economic Growth and Regional Labor Market Development in German Regions[R].Institute for Future Energy Consumer Needs and Behavior(FCN),RWTH Aachen University,Working Paper,2014. 

[14]Elhorst J P.Applied Spatial Econometrics:Raising the Bar[J].Spatial Economic Analysis,2010,5(1).

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存