r语言 面板数据回归_面板数据OLS回归的无脑操作记录

引言

     这是一个非常不专业的技术贴(也许不配叫技术贴哈哈哈哈),本弟弟没有任何计量经济学基础,在做实证之前唯一知道的我要实现的是OLS回归,在经过导师的指导和自己的资料查阅下做出了一堆东西,记录记录让自己高兴一下。

实证目的

    参考Foucault and Fresard*的研究,引用中国上市公司A股数据(预设数据区间1990-2019,实际数据区间2007-2019)验证“股价信息对公司投资决策的影响及其同行效应研究”。同行效应至今还未开始(〃'▽'〃)!

     目前实证与课题的关联逻辑暂且不表,在这儿主要想记录一点点面板数据OLS回归

      实际上完整的回归需要"分析数据的平稳性(单位根检验)"→“协整检验或模型修正”→“面板模型的选择与回归”,但是参考了我的文献加之我真的不会,这里主要记录的是2.(2)面板数据的回归。

 *FOUCAULT T, FRESA RD L. Learning from peers' stock prices and corporate investment [J].Journal of financial economics & 2014,111(3) :554 — 577.

什么是面板数据

      面板数据,包括截面样本数据(i)和时间序列(t),具体图形化而言如下图↓,在我的实证情境下,i代表上市公司股票代码,t以年为单位。

       值得一提,在面板数据中,每一个面板的t是唯一的(这一原则直接导致我的样本数从109,485缩水到32,490)

4b48f96749c06a502bbc3616c22b13ff.png

面板数据的拟合效果:

66f50a9927169ce6eae39f5623652b99.png

构造面板数据(面板数据截面与时间序列的声明)

Stata代码:xtset i t

     在需要进行面板数据回归时,一般会对应一个模型,这个模型中包含解释变量,被解释变量和控制变量。被解释变量又叫做y,它可以受多个解释变量(x1,x2……)影响;无关变量又叫做控制变量,在模型中需要控制它不影响y。在解释变量之前又带有系数衡量它对解释变量的效应。在y=kx+b中,常数项包含两个:误差项及常数项。

OLS回归

faa1c7cc2cc8a314d76620b94da7032e.png

Stata代码 xtreg y x1 x2…,fe

      对于面板数据,reg与xtreg都可以使用,并且可以使用聚类稳健标准误,但是结果可能不一样,根据实际问题需要选取即可。

5c5e354a06b184a6143021058b07db64.png

9c1c10756076072725dfdfd95d40fd49.png

结语

     虽然对于面板数据的完整回归及模型构造我还不清楚,这篇技术贴也写的烂烂的,但是捋顺了一下截至目前我的工作,花费最长时间的还是数据的merge及筛选。我现在的数据处理习惯是用R进行数据的清洗和筛选,再用R进行描述性统计和回归。接下来要进行的工作是在多个维度下(除了时间序列,还有行业分类啊其他的啥的)多次回归。

     又要开始了

     我走了

    有了一个成功的回归!!第二个还远吗!(好…远…)

主要参考教程

知乎-连玉君-Stata - 面板数据模型-一文读懂

CSDN-面板数据分析步骤及流程-R语言

CSDN-随机效应与固定效应&面板数据回归

Dawdler -3 years old-

4bf3a069ab7ecb401cefa59881be22f4.png

微信号|Dawdler

邮箱|dddawdler@yeah.net


版权声明:本文为weixin_35565325原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。