Posts 第十章 方差分析
Post
Cancel

第十章 方差分析

1. 简述方差分析的结构并对其进行解释。

答:方差分析,又称“变异数分析”或“F检验”,用于两个及两个以上样本均值差别的显著性检验。它是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。方差分析的结构如下:
(1)组内误差是来自各水平下样本内部的数据误差。它反映了一个样本内部数据的离散程度,只含有随机误差,用组内平方和来表示。组内平方和(SSE)是指反映组内误差大小的平方和,也称为误差平方和或残差平方和,它反映了每个样本内各观测值的总离散状况。
(2)组间误差是来自不同水平下样本之间的数据误差。这种差异可能是由于抽样本身形成的随机误差,也可能是由于总体本身的系统性因素造成的系统误差。因此,组间误差是随机误差和系统误差的总和,它反映了不同水平下样本之间数据的离散程度,用组间平方和来表示。组间平方和(SSA)是指反映组间误差大小的平方和,也称为因素平方和,它反映了样本均值之间的差异程度。
(3)全部数据误差包含了随机误差和系统误差在内的所有误差。反映全部数据误差大小的平方和称为总平方和,记为SST。总平方和(SST)=组内平方和(SSE)+组间平方和(SSA),它反映全部观测值的离散状况。

2. 方差分析的基本思想是什么?

答:方差分析是通过对数据误差来源的分析来判断不同总体的均值是否相等,进而判断分类型自变量对数值型因变量是否有显著影响。其基本思想如下所述:
(1)误差分解
在方差分析中,数据的误差是用平方和来表示的,总平方和可以分解为组间平方和与组内平方和。组内误差只包含随机误差,而组间误差既包括随机误差,也包括系统误差。
(2)误差分析
如果组间误差中只包含随机误差,而没有系统误差。这时,组间误差与组内误差经过平均后的数值就应该很接近,它们的比值就会接近1;反之,如果在组间误差中除了包含随机误差外还包含系统误差的话,这时组间误差平均后的数值就会大于组内误差平均后的数值,它们之间的比值就会大于1。当这个比值大到某种程度时,就认为因素的不同水平之间存在着显著差异,即分类型自变量对数值型因变量有影响。

3. 什么是方差分析?它与总体均值的t检验或z检验有什么不同?其优势是什么?

答:(1)方差分析就是通过检验多个总体均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。
(2)差异:总体均值的t检验或z检验,一次只能研究两个样本,如果要检验多个总体的均值是否相等,那么作这样的两两比较将十分烦琐,共需进行Cn2次不同的检验。如果α=0.05,每次检验犯第Ⅰ类错误的概率都是0.05,作多次检验会使犯第Ⅰ类错误的概率相应增加,而方差分析方法则是同时考虑所有的样本,因此排除了错误累积的概率,从而犯第Ⅰ类错误的概率就会小很多。
(3)优势:方差分析不仅可以提高检验的效率,同时由于它是将所有的样本信息结合在一起,也增加了分析的可靠性。

4. 方差分析的目的以及基本假定。important

答:(1)方差分析的目的:
方差分析用于两个及两个以上样本均值差别的显著性检验。它是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。方差分析的目的是通过数据分析找出对该事物有显著影响的因素,各因素之间的交互作用,以及显著影响因素的最佳水平等。
(2)方差分析的基本假定:
① 每个总体都服从正态分布。即对于因素的每一个水平,假定其观测值是来自正态分布总体的简单随机样本;
② 各个总体的方差σ2必须相同。即假定各组观察数据是从具有相同方差的正态总体中抽取的;
③ 各观测值之间相互独立。

5. 单因素方差分析的实质是什么?并说明单因素方差分析的步骤。

答:(1)单因素方差分析的实质是研究一个分类型自变量对一个数值型因变量的影响。
(2)单因素方差分析的步骤为:
① 按要求检验k个水平的均值是否相等,提出原假设和备择假设;
② 构造检验统计量,计算各样本均值$\bar x_i$,样本总均值,误差平方和SST、SSE和SSA;
③ 计算样本统计量
  $F=\dfrac{SSA/(k-1)}{SSE/(n-k)}$
④ 统计决策。比较统计量F和Fα(k-1,n-k)的值。若F>Fα,拒绝原假设;反之,不能拒绝原假设。

This post is licensed under CC BY 4.0 by the author.

第十一章 一元线性回归

第九章 分类数据分析

Comments powered by Disqus.