查看原文
其他

【原创·大秦学术·第二期】学术论文写作方法——基于实证研究的视角

2016-06-05 青山 计量经济学服务中心


学术论文写作方法——基于实证研究的视角



                                     NO·大秦学术·第二期


来源:计量经济学服务中心原创(ID:jingjixue100)    编辑:微梦想俱乐部

本文为计量经济学服务中心原创,媒体未经授权不得转载。如希望转载,请后台联系。未经授权转载的,我们将按照《微信公众平台关于抄袭行为处罚规则》进行侵权申诉。欢迎各位学粉分享到朋友圈。


无统计,不科研,经济学家需要数据分析能力,而学习计量经济学的最后目的是为进行实证研究。对初学计量经济学(外行/理论基础不扎实)的人而言,从理论研究到实证研究的应用,由于对软件宏观把握以及数据分析、数据处理、模型建立、相关分析等知识的局限,常常将不同的模型知识混在一起,以至于要写一篇有实证研究的论文,在建模以及分析方面,时常有不知如何着手的感觉,为此中心相关成员结合自身经历,对实证研究论文的写作提出了一些粗浅的建议。


学术准备


1、广泛收集参考文献,决定研究方法、内容、思路、框架等

为何需要收集参考文献呢?无非就是为了博采众长,将前人理论为自己所用,为自己写作提供理论准备。对相关参考文献进行回顾,一方面体现了自己学术态度,能够对前人研究成果进行学习,另一方面,对建立自己模型奠定基础。

广泛收集参考文献,不局限于相关题目、研究方向的期刊、文献、博硕士论文、会议资料等,阅读后,能够对自己研究课题有更深入的了解。

读文献,主要目的为:

* 决定所要研究的背景、意义? 
* 决定所要建立模型的理论基础、模型是什么? 
* 决定所要用的主体方法是什么? 
* 广泛阅读,做出笔记(不仅是为了站在前人研究基础上,也是为了创新,扬长避短)


在写论文前,要广泛阅读国内外相关文献,对文献中的理论框架、研究对象的综述(主要是方法以及思路)文章等,具体把握;对核心参考文章要多读,对其研究方法、研究思路要进行对比,然后选取自己可行的研究思路;另外,把文章的研究目的、研究问题、研究方法和研究结果都记录下来,养成做笔记的习惯。

推荐阅读如何写学术论文,朝这里看国内学术大牛推荐:文献管理软件NoteExpress

做笔记,对阅读文章的研究方法、思路等进行对比分析,也就完成了论文写作思路(论文雏形)这一阶段。


2、建模(实证分析)

为什么是建模,没有直接提数据呢?作者认为,研究课题以及模型局限了自己需要选取的数据,很多初学者只想着自己需要建模,但是与中心交流的时候,他们并不知道自己需要建立什么模型,所以数据也没有。

为什么大家喜欢建模呢,推荐阅读不统计,无科研,建模就等同于用泡菜坛子泡制不同的蔬菜


* 除研读相关经济理论之外,应比较相关核心期刊或者硕士、博士论文,对实证分析之文献中的实证计量模型进行归纳、汇总,选取适合的模型,这里需要考虑自己的软件技能、数据搜集能力,结合自己的题目;

* 确认计量模型中解释变量和被解释变量,往往研究题目,已经局限了自己需要选取的Y和X,但是一般影响因素有很多,这里就需要你自己宏观把握,在数据可得性以及数据分析要求、模型研究需要基础上,搜集相关数据;
* 在数据整理基础上,需要自己根据数据类别,季度数据、年份数据、月度数据等数据类型,前期整理搜集,初步调查是否有相关的数据资料等,若无则实证模型设计的再好也无用。例如GDP没有月度数据,若是需要这一指标,很多论文采用相关分析方法做出来或者用工业生产总值等代替指标,所以在建立模型前,需要搞清楚很多问题;

对于数据方面服务,推荐阅读原创:本科硕博科研论文常去的网站常用的9+个学术搜索引擎写论文常去的网站和数据库(续集)毕业论文写作资料搜索数据库大全,这些图文详细了一般本科博硕士论文写作常去的网站以及学术搜索引擎;


*理清各模型的异同及优缺点,思考改进文献中现存模型的可能,只有将相关理论模型以及数据搞清楚,你才可能创新,才能形成自己的模型;

最后决定实证计量模型雏形;

拓展阅读EKC曲线中环境质量如何选取指标等。具体总结来说,如何确定模型,根据研究题目+参考文献+理论基础模型+数据+软件方法等确定。


3、收集相关数据、资料

* 对数据的精确性一定要严格查核,对错假漏(缺)数据要仔细修正;推荐阅读【学术之声·第一期】严谨负责,学术研究从数据源头做好


* 使用统计软件(eviews、spss、excel、stata、sas、R等)对数据列表绘图,以验证数据的逻辑合理性,对不合理的数值要有所处理;例如使用SPSS软件对数据进行描述性分析等,检查自己前期整理的数据是否存在缺失等;是否有极值出现,需要剔除;举个例子:会计类实证分析里面,经常出现股票类数据,那么对于ST类型的数据,一般需要剔除;对于数据不全、缺失的数据变量,也是需要剔除;注意:那么问题来了,此类剔除的数据,可能会有很多变量,而这些数据+变量是从数据库里下载而来,但是这些数据+变量并不是一个sheet表格里面,所以剔除后,需要重新整合,那么你就需要公司名等对应,不能出现错行等失误;

* 掌握时间数列,横截面数据、面板数据(Panel Data)的区别,掌握不同数据类别需要整理的数据差异,一般数据数目越多越好;

*根据自己研究题目的层次区别时间数据还是面板数据(Panel Data),若是全国不同省份数据+不同变量+不同年份,一般是面板数据,那么问题来了,面板数据一般采用eviews+stata等软件处理;所以不同数据类型局限了自己需要采用的软件类型,这些都是需要自己提前考虑的,千万不要高估自己的实力,选取的数据类型+自己的题目,局限了自己需要选取的分析方法,不同的方法,局限了自己将使用的软件类型……,这些都是密切联系的;

如果样本数据是时间序列数据,大样本和平稳性就是基本的要求。因为时间序列需要进行平稳检验,平稳序列才可以适用基于截面数据的统计推断方法,建立时间序列模型。


*对资料数值作一些整理,各种基本统计量(样本描述性分析、平均值、最大值、最小值、变量间的样本相关系数等)、做一些初步图解分析。


实证分析/计量方法的执行

1、计量方法不应太简单(例如只做到最简单的 OLS),但也不必过于复杂,应针对问题采用恰到好处的计量方法。例如经典的柯布道格拉斯函数,建立生产函数,那么引入的变量,最后变形也是相关回归分析,但是因为有理论基础,所以简单的 OLS也是OK的。推荐阅读那些一直被使用的柯布道格拉斯函数


采用哪种计量方法,需要自己考虑现在核心主流的相关题目研究方法,若采用了比较复杂的计量方法,则要说明为什么简单的方法不适合。方法与模型相通,根据研究题目+参考文献+理论基础模型+数据+软件方法等确定。

计量方法的好坏不在其复杂程度,而在于它是否能够帮我们得到正确的估计值,以了解数据中所包含的真正信息。

好的计量方法,是与研究题目+参考文献+理论基础模型+数据+软件方法等相对应的。


2、除了估计值以及对应的 t 检验,也可做一些F检验之对多个系数的假设检定。一般对于简单计量经济学,大家可能都知道什么经济意义检验、t检验(即t统计量)、回归系数、样本容量、R2、F统计量、DW值、P值等,这些对于常规统计分析,做这些就可以了。


但如果用其他计量方法,则可能还要汇报其他的统计量或检验结果。比如,使用工具变量法,则一般需要汇报弱工具变量检验(第一阶段回归的F统计量)与过度识别检验(如果过度识别)(引)


相关统计量是与软件相对应的,具体这些F统计量+R2、F统计量、DW值、P值等,都可以反映背后所用的软件名称以及使用方法,这也就是为什么之前中心QQ群里有人咨询如何使用因子分析方法做出相关结果,中心根据图表立即判断此部分分析为另一章节,使用的是方差分析。


3、回归模型的设定,尤其是解释变量的取舍,可在估计过程中不断的修正。对于自己本来想选取的解释变量,若是数据缺失等,也没办法使用;


对应变量和解释变量均可尝试诸如对数、指数、幂函数等不同的转换。这些转换方式的决定,以经济理论上的考虑最为重要,不能单只为了提高模型的配适,而盲目的做一些不合理的变量转换。最为常见的取对数问题,推荐阅读

【原创·高能推荐】涵盖ADF+E-G+Johansen+Granger+VAR建模知识【高能推荐】放大招总结的eviews命令,ls+scat+plot+genr你造吗】 【学术小组】99%的人都不知道伪回归的问题,这里有解释,还有协整+格兰杰问题总结【学习记·第5期】24个为什么?玩转eviews必须知道的问题,快快一起使用该软件打怪兽升级吧


4、选取解释变量时,应有如下的考虑:

* 解释变量和被解释变量(自变量与因变量)之间的因果关系一定要正确,也就是说,解释变量是原因在先,被解释变量是结果在后,有一定的先后顺序。一般研究A对B的影响,将A看做是解释变量,B的影响因素有很多,这时候就需要在相关理论基础上,添加解释变量或者控制变量;

* 要注意多重共线性问题,若是不分青红皂白的将一大堆彼此相关性很高的变量放进回归式内,造成严重的线性重合问题;这时候就需要自己考虑模型基础,在相关理论基础上,寻找变量,例如包括相同变量的不同转换、或是几个变数间的各种交乘项,这些都是需要考虑的;

* 经济理论所牵涉到的变量常常是无法观察到的,因此在做实证研究时必须采用替代变量,研究者要对所选用之替代变数的合理性详加说明。例如上述所说的GDP问题;


5、横截面数据要注意异方差(Heteroscedasticity)的问题,时间数列的数据则要注意自相关(Autocorrelation)的问题;但是一定要注意自己理论模型的主要研究方法,不同模型,在这两个注意问题上,有所取舍,但是要注意;


要确定时间数列的稳定性(Stationarity),若有季节变动也要加以处理。季节调整,一定要注意是对有存在季节、季度、天气、气候等季节因素影响的变量进行相关季节调整,不要盲目。



论文框架/主体内容

1、首页:论文题目,作者名字等信息,具体信息根据自己论文用处来定,不同期刊等有具体要求;

2、摘要:对全文做出描述,说明论文主要研究内容,对经济结构的分析,还是对未来趋势的预测,还是对政策的评估;然后简单介绍使用的模型以及所估计的模型,所采用的计量方法,选取的变量以及指标体系,最后介绍模型分析得出的实证结果,或者加上相关政策建议;


3、绪论:说明研究的性质、范围、背景和目的,并从不同角度,包括理论、实践等角度来说明课题研究的重要性;理工科等学科局限,对于论文整体框架稍有不同,例如理工科直接写在,绪论就将全部文献综述、研究背景意义等介绍完,然后直接章节就是模型基础、模型分析、结论、对策等。


4、国内外研究现状或者文献综述或回顾:对和主题有直接和间接关系的文献做一个简单清楚有系统的回顾,和主题有直接关系但有不同结果的文献,更是要有比较完整的解释。

此部分一般分为国内外研究现状,需要对相关研究进行归纳整理最好,最好分好层次,对相关研究进行区别,这样对于提出自己的模型,具有意义;


如何写文献回顾

首先,论文题目主要研究领域使用的方法。每个研究议题都有一个核心使用方法,文献回顾者首先需要定位自己的研究原点,即目前该课题主流研究思路方法,然后对这些相关的文献进行回归分析;

其次,以研究方法、思路等穿针引线,分层次进行归纳总结,将文献以条理化的方式组织起来,展现作者的逻辑推演过程。也就是尽量将文献综述能够概括总结,此处设计参考文献引用规范,例如很多文章如此写作,作者(XX年)在《》一文中,通过“XX认为”、“XX说”,得出XX结论,这样将文献罗列出来。或者部分直接要求右上角标注引入,所以尽量能够对文献能够总结。

第三,要对文献进行准确概括。为了要精准和恰当地概括,需要反复阅读,一般摘要里面有全文主体内容,但是更核心的还需要自己阅读全文。以偏概全等都是存在缺陷的;

第四,阅读文献,能够对参考文献有一个深入了解,这样便于对方法总结、批判、创新。


5、模型设定:

模型有理论模型和实证模型两类。

一个完整的计量经济学模型研究框架包括两大步骤:设定模型和检验模型。“关

于经济活动的观察——关于经济理论的抽象——建立总体回归模型”属于设定模型的内容;“获取样本观测数据——估计模型——检验模型——应用模型”属于检验模型的内容;

理论模型是从经济理论中直接导出,而实证模型则是从理论模型变形出来。对于部分实证研究,还需要提出假设,假设则需要根据题目研究内容,做出适当的假设。

实证模型通常是以回归模型的形式表示,对模型中所涉及的变量均须给与明确的定义,对解释变量和应变量之间的关系要详尽的说明,也要解释对模型中主要系数(或由这些系数所导出之弹性、乘数等)可能数值的大小及符号有怎样的理论预期。


关于数据分析或者实证分析,记住,关于调查问卷数据处理,请一定要结合相关领域问卷设计,因为很多问卷需要量表处理,所以你的问卷若是选项等处理错误,等于所有的数据都是没用的;


做预研究。对小样本(小样本有多小不同学科不同、不同研究主题也不同)收集数据,并按照之前的想法进行数据预分析。如果趋势和假设一致,继续进行正式研究。如果没趋势或者趋势和假设反了,或者重新找文献,看是不是有自己漏了的因素没考虑;或者改善研究方法(数据收集方法)。


正式研究,收集数据。在过程中或许也可以进行阶段性的数据分析。


6、数据来源以及变量选取+资料说明:对数据的种类,性质,来源出处,数据处理方式,数据中可能有的错误和缺失,都要有详细的说明,最好也能将资料的基本统计量表列出来,一般列表包括变量定义、符号、字母、意义等;


7、计量方法的描述:对所用到的每一个符号都要有清楚的定义。

8、实证分析:
* 系数估计的主要结果均须以表列出,三线表或者全部线的,根据具体根据要求,每一系数估计值旁均须伴随标准差(s、e、)或 t 统计量,也可加列p值,对于显著的估计值也可附加诸如星号之特殊标记以提醒读者。显示模型整体表现的统计量,诸如 R2(线性回归模型),F检定统计量也可选择性的列于表内。


对于部分回归分析模型 Durbin-Watson 检定统计量等也可以列出;

在表的备注中,必须说明表中所有的特殊符号和简称,表中变量名称的选取,应尽量采用有意义的中文简称,少用无意义的英文字母组合。制表的基本原则就是要让读者便捷、完整而清楚的了解估计的结果;最简单的SPSS等软件分析中,对于不同※代表的水平需要说明。


(众所周知,计量经济学以概率论作为其数理基础,具体而言,计量研究的结果只能表明,是否可以在一定的统计显著性水平上接受待检验假说(更确切地说,是否可以在一定的统计显著性水平上拒绝原假设,即待检验假说不成立的假设),而统计显著性水平是人为武断选取的,通常是5%或1%、10%,计量结果通过了统计检验并不能确保待检验假说100%成立,因为还有5%或1%、10%“弃真”(错误地拒绝了原假设)的可能性。具体原假设成立的可能性大小,但是也存在反向概率的发生,因此计量经济学模型,是一个辩证的过程)(引)


* 对主要回归系数(或由回归系数所导出之弹性、乘数等)估计值的大小、符号及显著与否要详加讨论,对于显著的估计值更要和理论预期值比较,若有明显的矛盾,则要探讨原因;


数据分析。先用设想的方法来分析,如果比较容易得出符合假设或者部分符合假设的结果,就可以开始写。如果没啥结果,就慢慢数据挖掘吧。试用各种各样方法来分析,有可能有新发现,也有可能没有。关于这里,一般也就是统计意义和经济意义等方面的检验,以及数据结果与自己假设是否一致,在这里,就需要自己宏观把握,提出假设,进行论文,另外,对于与实际结果不一致的,就需要自己进行修正,不管是模型,还是数据分析过程,都需要检验;


9、结论:对所有重要结果做一个完整的总结,并经由理论或数据中不尽完美处的讨论,指明未来研究的方向。支出实证分析结论以及研究不足以及展望,需要抱着严谨的态度,不要为了一味追求好的结果,不能得出的结论不要写,需要实事求是;

* 所有具有政策意义的重要论点都要经过假设检定的严谨统计程序探讨其显著性;
* 若要根据估计模型对数据外的时期或状况进行预测,则态度必须保守谨慎,尽可能设想预测可能不准的原因;


10、参考文献。 


参考文章


1、钟经樊:计量经济学论文的写作方法——基于实证研究的视角,台湾中央研究院经济研究所;

2、李子奈:《计量经济学模型方法论的若干问题》,《经济学动态》,2007年第10期;

3、李子奈:《计量经济学应用研究的总体回归模型设定》,《经济研究》,2008年第8期;

4、山东大学经济学院陈强(计量经济学、经济史)在线访谈中对于R2值等统计数据汇报问答;


由于作者水平有限,全文虽几易其稿,但文中难免有所缺点,还望读者不吝斧正。


学术神器,一个只有学霸才会关注的微信公众号

不懂为什么

就是突然想学习

计量经济学服务中心

打造中国最大的人文社科+经管类学术交流学习平台

学术问题,一对一专家解决

论文指导、软件操作、学术技能、数据分析等服务

说明:我和楼下那位是一家


我也不懂为什么

见楼上在学习,我也想学习

我们是一家内容生产商

我们坚信“知识是有价值的”

见证学术力量

让知识更有价值

让学术更有价值

关注知识,发现价值

补充:我和楼上是一家


学术小组QQ群:219246913(500人大群)

打造中国最好的Eviews/SPSS/STATA/SAS/R咨询群,做最好的学术交流群!

征集公告

计量经济学服务中心、计量大神eviews和spss和stata微信公开征集啦!现面向网友征集投稿,内容可涉及大学生、青年、学术、科研、逸闻趣事、读书笔记、生活随感等(可附图片资料),要求原创、真实、积极健康。欢迎网友关注支持!投稿请发至924156647@qq.com,并附个人基本情况介绍。也可以加群直接联系。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存