当我们应用统计方法对数据进行分析时,会发现许多计量资料的分析方法,例如常用的T检验、方差分析、相关分析以及线性回归等等,都要求数据服从正态分布或者近似正态分布,但这一前提条件往往被使用者所忽略。因此为了保证数据满足上述统计方法的应用条件,对原始数据进行正态性检验是十分必要的,这一节内容我们主要向大家介绍如何对数据资料进行正态性检验。

一、正态性检验:偏度和峰度

1、偏度(Skewness):描述数据分布不对称的方向及其程度(见图1)

  1. 当偏度≈0时,可认为分布是对称的,服从正态分布;
  2. 当偏度>0时,分布为右偏,即拖尾在右边,峰尖在左边,也称为正偏态;
  3. 当偏度<0时,分布为左偏,即拖尾在左边,峰尖在右边,也称为负偏态;

注意:数据分布的左偏或右偏,指的是数值拖尾的方向,而不是峰的位置,容易引起误解。

2、峰度(Kurtosis):描述数据分布形态的陡缓程度(图2)

  1. 当峰度≈0时,可认为分布的峰态合适,服从正态分布(不胖不瘦);
  2. 当峰度>0时,分布的峰态陡峭(高尖);
  3. 当峰度<0时,分布的峰态平缓(矮胖);

利用偏度和峰度进行正态性检验时,可以同时计算其相应的Z评分(Z-score),即:偏度Z-score=偏度值/标准误,峰度Z-score=峰度值/标准误。在α=0.05的检验水平下,若Z-score在±1.96之间,则可认为资料服从正态分布。

了解偏度和峰度这两个统计量的含义很重要,在对数据进行正态转换时,需要将其作为参考,选择合适的转换方法。

3、SPSS操作方法

方法1:打开数据源,点击「分析」中的「描述统计」,在点击「频率」;把需要分析的变数放置「变数(V)」,点击「统计」,勾选「偏度」和「峰度」;

方法2:在若上步骤中点击「描述」选择菜单页中的「偏度」和「峰度」;

4、结果解读

从如上结果来看x2数据偏向于服从正态分布。

二、正态性检验:图形判断

1、直方图:表示连续性变数的频数分布,可以用来考察是否服从正态分布

(1)选择「图形」下拉菜单中的「旧对话框」,选择「旧对话框」中的「直方图」;

(2)把变数「x2」放入变数框中,勾选「显示正态曲线」;生成的图像如下

2、P-P图和Q-Q图

(1)P-P图反映了变数的实际累积概率与理论累积概率的符合程度,Q-Q图反映了变数的实际分布与理论分布的符合程度,两者意义相似,都可以用来考察数据资料是否服从某种分布类型。若数据服从正态分布,则数据点应与理论直线(即对角线)基本重合。

(2)SPSS操作:

  1. 选择「分析」下来菜单中的「描述统计」,及「描述统计」下的「P-P图」;
  2. 选择变数,及勾选正态分布;生成如下图形

使用Q-Q图生成的图像如下:

三、正态性检验:非参数检验方法

1、正态性检验属于非参数检验,原假设为「样本来自的总体与正态分布无显著性差异,即符合正态分布」,也就是说P>0.05才能说明资料符合正态分布。

通常正态分布的检验方法有两种,一种是Shapiro-Wilk检验,适用于小样本资料(SPSS规定样本量≤5000),另一种是Kolmogorov–Smirnov检验,适用于大样本资料(SPSS规定样本量>5000);

2、


推荐阅读:
相关文章