描述性统计
一,计算各个变量的最大值,最小值,均值,方差,偏度,峰度等统计量
使用工具:SPSS
步骤一:将数据导入SPSS
步骤二:点击分析-描述统计-描述-导入各个变量-点击选项并勾选统计量
样图:

计算皮尔逊相关系数
重点!!!
1,皮尔逊相关系数的作用:衡量两个变量之间的相关性的大小!!
2,皮尔逊相关系数的误区如图:

二,绘制各个变量之间的散点图
使用工具:SPSS
步骤一:点击图形旧对话框 ‐ 散点图/点图 ‐ 矩阵散点图
样图:

三,观察具有线性相关性的变量,并计算皮尔逊系数
使用工具:Matlab
步骤一:修改数据文件的格式为mat或m文件。
步骤二:加载数据到Matlab
步骤三:使用corrcoef函数计算出相关系数矩阵R,R = corrcoef(Test);
样图:

四,将相关系数矩阵导出并美化
使用工具:Excel
步骤一:在开始‐格式中调整每个单元格的格式为正方形
步骤二:在对齐方式中设置两个居中
步骤三:选中相关系数表,开始‐条件格式‐色阶‐选中红‐白‐蓝
步骤四:选中相关系数表,选择条件格式‐管理规则‐编辑规则
样图:

皮尔逊相关系数的显著性假设检验
一,皮尔逊相关系数假设检验的条件
条件一:实验数据成对来自于正态分布的总体
条件二:实验数据不能差距过大
条件三:每组样本之间是独立抽样
二,针对样本数据进行正态检验
1,正态分布JB检验(大样本,n>30)
使用软件:Matlab
步骤一:计算随机变量的偏度和峰度

步骤二:JB检验的语法:[h,p] = jbtest(x,alpha)
当输出h等于1时,表示拒绝原假设;h等于0则代表不能拒绝原假设。
alpha就是显著性水平,一般取0.05,此时置信水平为1‐0.05=0.95
x就是我们要检验的随机变量,注意这里的x只能是向量。
步骤三:写循环,依次检验各个随机变量

2,正态分布Shapiro‐wilk夏皮洛‐威尔克检验(小样本,0
使用软件:SPSS
步骤如下图:

3,通过绘制QQ图,进行随机变量的正态性检验
使用软件:Matlab
步骤一:

图形解释:只需观察Q‐Q图上的点,是否近似地在一条直线附近!(大样本)
三,当样本数据满足正态分布,则进行皮尔逊相关系数检验
使用软件:Matlab
步骤一:提出原假设和备择假设
步骤二:在原假设成立前提下,构建统计量及其分布

步骤三:根据统计量,计算检验值

步骤四:计算P值

步骤五:判断P值和显著性水平α

注意:0.5、0.5* 、0.5**、0.5***的含义为显著性标记
注意:步骤四和步骤五可用下图代码代替

样图展示:

后续还有各种模型的操作和总结!建模软件采用matlab,Stata,SPSS!大量截图来自于清风老师的手稿和讲义。后续不定期更新。