研究生

研究生概率与统计统计推断


假设检验


假设检验是统计学中的一个基本概念,用于对总体特征进行判断。它是一种方法,允许我们使用样本数据在关于总体参数的两个竞争假设之间做出决定。

假设检验简介

基本上,假设检验是一个过程,我们通过它来检查关于总体参数的陈述(假设)是否在我们拥有的样本数据基础上是合理的。假设检验的主要元素包括零假设、备择假设、检验统计量、拒绝域和结论。

零假设和备择假设

零假设(记作H 0)是我们要检验的关于总体参数的陈述。它通常是无效或无差异的陈述。相反,备择假设(记作H 1H a)是假设零假设被拒绝时认为成立的假设。它代表某种效应或差异。

零假设 (H 0 ): μ = μ 0 备择假设 (H a ): μ ≠ μ 0 (双尾) 备择假设 (H a ): μ > μ 0 (右尾) 备择假设 (H a ): μ < μ 0 (左尾)

检验统计量

检验统计量是从样本数据中计算出的用于评估零假设概率的数值。检验统计量的选择取决于数据类型和所检验的假设。常见的例子包括z-scoret-scoreF统计量

例如,如果我们想检验关于均值的假设,可以计算样本均值的z-score

z = (x̄ - μ 0 ) / (σ/√n)
Test statistic: z

拒绝域

拒绝域由显著性水平确定,记作α,它是当零假设实际上为真时拒绝零假设的概率。常见的α选择是0.05、0.01和0.10。

如果检验统计量落入拒绝域,则我们拒绝零假设,支持备择假设。

Left tail Right tail

结论

根据检验统计量和拒绝域,我们做出结论。如果检验统计量落在拒绝域内,我们拒绝零假设,表明有足够证据支持备择假设。如果它不落在拒绝域内,我们不能拒绝零假设

假设检验的类型

假设检验可以根据感兴趣的总体参数和可用的数据类型进行分类。

单样本z检验

单样本z检验用于比较样本均值与已知总体均值。该检验假设总体呈正态分布且已知总体方差。

单样本t检验

如果未知总体方差,则我们使用单样本t检验代替z检验。当样本量较小且假设总体呈正态分布时适用。

双样本t检验

双样本t检验比较两个独立样本的均值。它检验两组的均值是否相等。如果假设方差相等,则使用合并标准差;如果方差不等,则使用各自的方差。

示例:均值的假设检验

假设某公司制造的灯泡平均寿命为1000小时。一名研究人员认为真正的平均寿命小于1000小时,并希望通过随机抽取的30个灯泡的样本来检验这一假设。

让我们定义我们的假设:

H 0 : μ = 1000 H a : μ < 1000

显著性水平:α = 0.05

假设总体的标准差为100,检验统计量可以计算如下:

z = (x̄ - μ 0 ) / (σ/√n) x̄ = 样本均值 n = 样本大小 σ = 总体标准差 μ 0 = 在H 0下的总体均值

如果计算出的z值落在正态分布曲线的临界值左边(在z表中找到),我们将拒绝零假设。

假设检验的实际应用

  • 医学研究:比较新药与安慰剂的效果。
  • 制造业:比较不同生产工艺的均值以确定哪种工艺更高效。
  • 营销:评估新广告活动对客户销售或参与度与旧策略相比的影响。
  • 教育:确定新教学方法是否优于传统方法。

假设检验中的常见错误

I型错误和II型错误

假设检验中的两个常见错误是I型错误和II型错误:

  • I型错误:当零假设为真时拒绝零假设。I型错误发生的概率是显著性水平α
  • II型错误:在备择假设为真时,未能拒绝零假设。犯II型错误的概率记作β

假设检验错误示例:医学检测

在对某疾病的医学测试中,零假设可能是该人没有疾病(H 0:该人没有疾病)。备择假设可能是该人有疾病(H a:该人有疾病)。

  • I型错误:测试显示该人患病,实际上没有。这会导致不必要的压力和治疗。
  • II型错误:测试未能识别患病,而实际上该人确实患病。这导致疾病未被治疗。

检验的功效

检验的功效是正确拒绝错误零假设的概率(1 - β)。更高的功效意味着在存在效应时发现效应的概率更大,从而减少II型错误。

可以通过以下方式提高功效:

  • 增加样本量。
  • 选择更高的显著性水平(这会增加I型错误的概率)。
  • 这就是我们期望发现的效应大小的增加。

临界值和p值

临界值

临界值是定义拒绝域边界的阈值。对于z检验,临界值对应于在正态分布中在临界值之外的尾部落在预定义显著性水平(α)内的z分数。

p值

p值是达到观察到的检验统计量或更极端值的概率,假设零假设为真。小的p值(通常≤0.05)表明强烈反对零假设的证据,因此我们拒绝H 0 大的p值(>0.05)表明反对H 0的证据较弱,因此我们未能拒绝它。

p值的使用示例

在关于学生平均睡眠时间的研究中,零假设指出学生平均每晚睡7小时。样本数据提供了平均6.6小时,计算的p值0.03

结论:由于0.03 < 0.05,我们拒绝零假设,并得出结论平均睡眠时间与7小时不同。

结论

假设检验提供了一种使用数据做出决策的系统方法。虽然它不提供决定性的证据,但它有助于我们通过评估关于总体的概率陈述来评估证据。理解这一过程、类型、错误,以及如何有效应用这些概念,能显著影响医学、商业和社会科学等领域的结果。

材料和参考书目

  • 《社会、行为和健康科学中的统计使用和解释》,作者:William R. Nugent
  • 《实验者的统计学:设计、创新与发现》,作者:George E. P. Box, J. Stuart Hunter 和 William G. Hunter
  • 《统计学原理》,作者:M.G. Bulmer

研究生 → 5.2.1


U
username
0%
完成于 研究生


评论