python进行JB正态性检验

Jarque-Bera检验:检验序列是否符合正态分布

背景

Jarque-Bera检验是一种总体分布的正态性检验。
当序列服从正态分布时,JB统计量:

JB=n(S26+(K3)224) J B = n ( S 2 6 + ( K − 3 ) 2 24 )

渐近服从 χ2(2) χ 2 ( 2 )分布。
其中: n n为样本规模,SK分别为随机变量的偏度和峰度,计算公式如下:
M2=i(xix¯¯¯)2n M 2 = ∑ i ( x i − x ¯ ) 2 n

S=i(xix¯¯¯)3nM21.5 S = ∑ i ( x i − x ¯ ) 3 n M 2 1.5

K=i(xix¯¯¯)4nM22 K = ∑ i ( x i − x ¯ ) 4 n M 2 2

python的sicipy.stats中偏度和峰度的调用的函数为 stats.skew(y)stats.kurtosis(y),其中峰度的公式为
K=i(xix¯¯¯)4nM223 K = ∑ i ( x i − x ¯ ) 4 n M 2 2 − 3

excel中,偏度和峰度的计算公式如下:

S=n(n1)(n2)i(xix¯¯¯std)3 S = n ( n − 1 ) ( n − 2 ) ∑ i ( x i − x ¯ s t d ) 3

K=n(n+1)(n1)(n2)(n3)i(xix¯¯¯std)43(n1)2(n2)(n3) K = n ( n + 1 ) ( n − 1 ) ( n − 2 ) ( n − 3 ) ∑ i ( x i − x ¯ s t d ) 4 − 3 ( n − 1 ) 2 ( n − 2 ) ( n − 3 )

代码

实现一遍python的scipy库中计算偏度和斜的公式及建立正态分布检验。

import numpy as np
import scipy.stats as stats

def self_JBtest(y):
    # 样本规模n
    n = y.size
    y_ = y - y.mean()
    """
    M2:二阶中心钜
    skew 偏度 = 三阶中心矩 与 M2^1.5的比
    krut 峰值 = 四阶中心钜 与 M2^2 的比
    """
    M2 = np.mean(y_**2)
    skew =  np.mean(y_**3)/M2**1.5
    krut = np.mean(y_**4)/M2**2

    """
    计算JB统计量,以及建立假设检验
    """
    JB = n*(skew**2/6 + (krut-3 )**2/24)
    pvalue = 1 - stats.chi2.cdf(JB,df=2)
    print("偏度:",stats.skew(y),skew)
    print("峰值:",stats.kurtosis(y)+3,krut)
    print("JB检验:",stats.jarque_bera(y))
    return np.array([JB,pvalue])

y1 = stats.norm.rvs(size=10)

y2 = stats.t.rvs(size=1000,df=4)

print(self_JBtest(y1))

print(self_JBtest(y2))

结果

=============== RESTART: C:\Users\tinysoft\Desktop\JB正态性检验.py ===============
偏度: 0.5383125387398069 0.53831253874
峰值: 2.9948926317585918 2.99489263176
JB检验: (0.48297818444514068, 0.78545737133644544)
[ 0.48297818 0.78545737]
偏度: -1.0488825341925703 -1.04888253419
峰值: 13.40804986639119 13.4080498664
JB检验: (4697.0050126426095, 0.0)
[ 4697.00501264 0. ]


版权声明:本文为u011702002原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。