引言
这是一个非常不专业的技术贴(也许不配叫技术贴哈哈哈哈),本弟弟没有任何计量经济学基础,在做实证之前唯一知道的我要实现的是OLS回归,在经过导师的指导和自己的资料查阅下做出了一堆东西,记录记录让自己高兴一下。
实证目的
参考Foucault and Fresard*的研究,引用中国上市公司A股数据(预设数据区间1990-2019,实际数据区间2007-2019)验证“股价信息对公司投资决策的影响及其同行效应研究”。同行效应至今还未开始(〃'▽'〃)!
目前实证与课题的关联逻辑暂且不表,在这儿主要想记录一点点面板数据OLS回归
实际上完整的回归需要"分析数据的平稳性(单位根检验)"→“协整检验或模型修正”→“面板模型的选择与回归”,但是参考了我的文献加之我真的不会,这里主要记录的是2.(2)面板数据的回归。
*FOUCAULT T, FRESA RD L. Learning from peers' stock prices and corporate investment [J].Journal of financial economics & 2014,111(3) :554 — 577.
什么是面板数据
面板数据,包括截面样本数据(i)和时间序列(t),具体图形化而言如下图↓,在我的实证情境下,i代表上市公司股票代码,t以年为单位。
值得一提,在面板数据中,每一个面板的t是唯一的(这一原则直接导致我的样本数从109,485缩水到32,490)

面板数据的拟合效果:

构造面板数据(面板数据截面与时间序列的声明)
Stata代码:xtset i t
在需要进行面板数据回归时,一般会对应一个模型,这个模型中包含解释变量,被解释变量和控制变量。被解释变量又叫做y,它可以受多个解释变量(x1,x2……)影响;无关变量又叫做控制变量,在模型中需要控制它不影响y。在解释变量之前又带有系数衡量它对解释变量的效应。在y=kx+b中,常数项包含两个:误差项及常数项。
OLS回归

Stata代码 xtreg y x1 x2…,fe
对于面板数据,reg与xtreg都可以使用,并且可以使用聚类稳健标准误,但是结果可能不一样,根据实际问题需要选取即可。


结语
虽然对于面板数据的完整回归及模型构造我还不清楚,这篇技术贴也写的烂烂的,但是捋顺了一下截至目前我的工作,花费最长时间的还是数据的merge及筛选。我现在的数据处理习惯是用R进行数据的清洗和筛选,再用R进行描述性统计和回归。接下来要进行的工作是在多个维度下(除了时间序列,还有行业分类啊其他的啥的)多次回归。
又要开始了
我走了
有了一个成功的回归!!第二个还远吗!(好…远…)
主要参考教程
知乎-连玉君-Stata - 面板数据模型-一文读懂
CSDN-面板数据分析步骤及流程-R语言
CSDN-随机效应与固定效应&面板数据回归
Dawdler -3 years old-

微信号|Dawdler
邮箱|dddawdler@yeah.net