离差平方和的核心概念与应用解析

mysmile 百科 26
离差平方和的核心概念与应用解析

离差平方和

离差平方和(Sum of Squares of Deviations)指各数据点与平均值之间差异的平方总和。具体定义为:若 x 是一个随机变量,令 η = x - Ex,则 η 称为 x 的离差,体现了 x 与其数学期望 Ex 的偏离程度。

基本定义

设 x 为一随机变量,令 η = x - Ex,则 η 是 x 的离差。该数值直接反映出 x 相对于其数学期望 Ex 的波动范围。

与方差的关系

离差平方和与方差密切相关

由于离差的数学期望始终为0,实际应用中常使用离差平方的期望,即方差,来衡量数据分布的离散程度,记作 Dx。

包括总体方差与样本方差两种形式

样本计算

离差平方和的样本计算方法

通常借助计算机完成。例如在Microsoft Excel中:可先用 Varp 函数计算总体方差,进而推导出离差平方和。

分解

借助对离差平方和的分解,可执行方差分析统计学实践表明,某一特征量的多次观测结果往往存在差异,这种差异由多种因素导致。离差平方和可用于衡量这些因素所引致的变异。为解决多因素影响分析,英国统计学家 Fisher 提出方差分析方法,核心思想是将总离差平方和拆分为若干组成部分,每一部分对应一种变异来源,并利用 F 分布进行假设检验。

离差平方和的分解方式类似于物理学中的平行轴定理

以单因素方差分析为例,离差平方和分解为:

SSE 表示误差平方和,SST 为总离差平方和,SSA 则是处理因素 A 不同水平之间的离差平方和

计算时先使用 Varp 求总体方差,

若因素 A 有 k 个水平,对每一水平组计算离差平方和,得到组内误差:

加总各组误差,即得总误差平方和:

再根据公式求因素 A 的处理平方和

这是完成方差分析的首要步骤。

如果各组样本量相等,也可采用如下方法:

计算每组平均值,再对这些均值求方差,并乘以总样本数 N,即得

特别地,若每组仅有一个观测值,则无组内平方和,此时分组均值的离差平方和即为

对于两因素无交互作用的方差分析(假设总样本量为 N)

与单因素分析类似,先计算

按因素 A 分组,计算每组均值,对该组均值求方差后乘以 N,得到

同理可得因素 B 的离差平方和

最后通过公式计算误差平方和

后续 F 检验请参见方差分析

实际分析可借助 EXCEL、SPSS 或 SAS 等工具完成。

参考资料 >

标签: 平方和分解的意义 平方和的分解思想 平方和公式解析

发布评论 0条评论)

  • Refresh code

还木有评论哦,快来抢沙发吧~