统计推断
统计推断是一种根据从总体中取出的样本数据对总体做出判断或预测的方法。它是统计学的一个基本方面,涉及通过检查较小的子群体来推断更大群体的特征或参数。该过程涉及假设检验、估计和置信区间的计算。
统计推断的关键概念
要了解统计推断,首先需要了解一些基本概念:
总体和样本
总体包括我们感兴趣研究的所有数据点或项目,而样本是我们实际观察和分析的总体的一个子集。例如,如果一家汽车制造商想要测试新车型的平均燃油效率,总体将包括所有生产的单位,样本可能是测试燃油效率的100辆车。
参数和统计量
参数是描述总体特征的一个量度,如均值或标准差。相反,统计量是描述样本特征的一个量度。例如,如果100名随机人的样本的平均身高是5'7",那么这个平均值就是一个统计量。
样本分布
抽样分布是基于随机样本的给定统计量的分布。它是一个重要的概念,因为它使我们能够了解统计量如何在不同样本间变化,帮助我们对总体参数进行推断。
该图显示了用红色圆圈指示的随机样本数据点的总体分布。
统计推断中的程序
统计推断通常涉及几个步骤:
点估计
点估计涉及使用样本数据来计算单个值(称为点估计),作为未知总体参数的“最佳猜测”或估计值。常用的点估计量包括样本均值、样本方差和样本比例。
例如,如果我们想估计一个城市中所有成年男性的平均身高,我们可以使用该城市中100名成年男性的样本平均身高。如果样本的平均身高是70英寸,那么我们对总体平均身高的点估计也是70英寸。
区间估计
与点估计不同,区间估计提供一个范围(区间)和一个关联的置信水平,表示参数位于该区间之内。这称为置信区间。
[ text{置信区间} = left( bar{x} - Z cdot frac{sigma}{sqrt{n}}, bar{x} + Z cdot frac{sigma}{sqrt{n}} right) ]
其中,( bar{x} ) 是样本均值,( Z ) 是基于期望置信水平的标准正态分布的Z分数,( sigma ) 是总体标准差,( n ) 是样本量。
假设检验
假设检验是一种使用数据进行决策的方法,不论是来自对照实验还是观察性研究。假设是关于总体参数的假定或声明。假设检验定义了是否拒绝或接受这些假定的框架。
H_0: mu = mu_0 \ H_a: mu neq mu_0
这里,( H_0 )表示零假设,即无效或者没有差异,( H_a )表示备择假设,即有些影响或差异。
该过程涉及确定p值,即在零假设为真时获得至少与观察结果一样极端的测试结果的概率。
统计推断中常用的方法
统计推断中使用多种方法来从数据中得出结论:
贝叶斯推断
贝叶斯推断涉及在更多证据或信息可用时更新假设的概率。它在很大程度上依赖于贝叶斯定理:
[ P(H|E) = frac{P(E|H) cdot P(H)}{P(E)} ]
其中 ( P(H|E) ) 是后验概率,( P(E|H) ) 是似然度,( P(H) ) 是先验概率,( P(E) ) 是边际概率。
频率估计
频率推断通过强调数据的频率或比例来从样本数据中得出结论。频率学派在不使用先验概率的情况下设计假设检验和计算置信区间。
最大似然估计
最大似然估计(MLE)用于估计统计模型的参数。MLE的方法涉及找到使观察数据发生概率最大的参数值。
如果我们有一个样本数据集和一个统计模型,似然函数衡量模型解释观察数据的好程度。它表示为:
L(theta | x) = prod_{i=1}^{n} f(x_i | theta)
其中 ( theta ) 是参数,( X ) 是数据,( f(x_i | theta) ) 是在给定 ( theta ) 的情况下观察数据点 ( x_i ) 的概率。
统计推断示例
让我们看一些例子来更好地理解这些概念:
示例1:估计平均身高
假设我们想确定一所大学所有学生的平均身高。我们决定选取100名学生的样本,而不是测量每个学生。
样本数据: [68, 70, 65, 72, 69, 71, 66, 73, 67, 70, ...] // 继续到100个条目
该样本的平均值(均值)提供了针对该总人群平均身高的点估计。计算样本均值将使我们能够得出一个结论:
样本均值 = (68 + 70 + 65 + 72 + 69 + 71 + 66 + 73 + 67 + 70 + ...) / 100 = 69.5 英寸
因此,我们估计所有大学生的平均身高将约为69.5英寸。
示例2:药物有效性的假设检验
一家制药公司认为他们的新药可以降低血压。为了测试这一点,他们在200名患者中进行了试验,其中一半人服用了药物,另一半人服用了安慰剂。公司假设:
H_0: Delta = 0 ,(text{药物无效}) \ H_a: Delta neq 0 ,(text{药物有效})
根据测试数据,公司计算出p值,以确定假设零假设为真时,观察到的结果同样极端的结果的概率。常见的阈值p值为0.05:
如果p值< 0.05,拒绝( H_0 ); 否则,不拒绝( H_0 )。
当p值小于0.05时,公司可以得出结论:该药物在降低血压方面有效。
结论
统计推断是研究和数据分析中的一个重要工具,跨越描述性统计和现实世界之间的差距。它提供了允许我们使用样本数据对总体做出明智结论和预测的工具和方法。掌握统计推断技术对于依赖数据驱动决策的数据科学家、研究人员、经济学家和许多其他专业人士来说至关重要。