离差平方和
离差平方和(Sum of Squares of Deviations)指各数据点与平均值之间差异的平方总和。具体定义为:若 x 是一个随机变量,令 η = x - Ex,则 η 称为 x 的离差,体现了 x 与其数学期望 Ex 的偏离程度。
基本定义
设 x 为一随机变量,令 η = x - Ex,则 η 是 x 的离差。该数值直接反映出 x 相对于其数学期望 Ex 的波动范围。
与方差的关系
离差平方和与方差密切相关
由于离差的数学期望始终为0,实际应用中常使用离差平方的期望,即方差,来衡量数据分布的离散程度,记作 Dx。
包括总体方差与样本方差两种形式
样本计算
离差平方和的样本计算方法
通常借助计算机完成。例如在Microsoft Excel中:可先用 Varp 函数计算总体方差,进而推导出离差平方和。
分解
借助对离差平方和的分解,可执行方差分析。统计学实践表明,某一特征量的多次观测结果往往存在差异,这种差异由多种因素导致。离差平方和可用于衡量这些因素所引致的变异。为解决多因素影响分析,英国统计学家 Fisher 提出方差分析方法,核心思想是将总离差平方和拆分为若干组成部分,每一部分对应一种变异来源,并利用 F 分布进行假设检验。
离差平方和的分解方式类似于物理学中的平行轴定理
SSE 表示误差平方和,SST 为总离差平方和,SSA 则是处理因素 A 不同水平之间的离差平方和
计算时先使用 Varp 求总体方差,
若因素 A 有 k 个水平,对每一水平组计算离差平方和,得到组内误差:
加总各组误差,即得总误差平方和:
再根据公式求因素 A 的处理平方和
这是完成方差分析的首要步骤。
如果各组样本量相等,也可采用如下方法:
计算每组平均值,再对这些均值求方差,并乘以总样本数 N,即得
特别地,若每组仅有一个观测值,则无组内平方和,此时分组均值的离差平方和即为
对于两因素无交互作用的方差分析(假设总样本量为 N)
与单因素分析类似,先计算
按因素 A 分组,计算每组均值,对该组均值求方差后乘以 N,得到
同理可得因素 B 的离差平方和
最后通过公式计算误差平方和
后续 F 检验请参见方差分析。
实际分析可借助 EXCEL、SPSS 或 SAS 等工具完成。
参考资料 >
还木有评论哦,快来抢沙发吧~