1. 正态分布,也叫高斯分布。 Gaussian distributions = Normal distributions 需要明确的是,通常情况下,我们检验一组数据的正态性,并不是说检验的这组数据是不是服从正态分布,而是指的这组数据是不是来自于正态分布的总体, 单纯的这组数据是不存在正态不正态一说的,正态针对的是总体 。 举个简单的例子,总体是基本不可能获得的,所以总体的分布情况只能通过从中抽取的样本来检验。 2. 哪种正态性检验方法比较好? 这个问题我们在推文如何利用GraphPad软件做正态性检验中已有提到,GraphPad官方推荐使用 D'Agostino-Pearson omnibus test,不推荐使用Kolmogorov-Smirnov test (with Dallal-Wilkinson-Lilliefor P value),对于Shapiro-Wilk normality test,当数据集中的数据无重复值时,该方法的检验效果比较好,但是当数据集中有些数据不是独一无二的,即有些数据的数值是相同的,那么该方法的检验效果就不是很好。 3. 为什么不同的检验方法得到的结果不同? 这个问题其实很好理解,因为不同的方法检验正态性的原理不一样,但是都是计算其与理想的高斯分布之间的距离。至于想弄清楚各种方法的检验原理,GraphPad官方也说了,非数学家真的很难搞懂,所以我们会用就行了。 4. 需要多少个数据才可以做正态性检验? Kolmogorov-Smirnov test (with Dallal-Wilkinson-Lilliefor P value)需要至少5个数据,Shapiro-Wilk normality test需要至少3个数据,D'Agostino-Pearson omnibus test需要至少8个数据。 5. 如何判断正态分布还是非正态分布? 原始假设是这组数据来自于正态分布的总体,然后通过计算P值来确定其到底符不符合正态分布。 P值的默认临界值为0.05,小于0.05,则认为不服从正态分布,大于0.05,则认为服从正态分布。当然,P值的临界值可以自己调整。 此外,输出结果中三种正态性方法会给出KS(Kolmogorov-Smirnov test), K2(D'Agostino-Pearson omnibus test)和W(Shapiro-Wilk normality test)值,不过无法直接通过这些值来判断正态性, 所以还是直接看P值就可以了 。