连续随机变量

在概率和统计的世界中，随机变量是描述不确定性的一种方法。它们分为两种主要类型：离散型和连续型。离散随机变量具有可数的不同值，而连续随机变量可以在一个连续范围内取值。在这里，我们深入了解连续随机变量，重点介绍它们的理论和实际应用。

什么是连续随机变量？

连续随机变量是一种可以取无数可能值的随机变量。与受限于特定结果的离散随机变量不同，连续随机变量可以在给定范围内取任何值。这个范围通常是连续随机变量在数轴上的一个区间，例如在两个数字之间，甚至整个实数轴。连续随机变量用于对诸如时间、温度、身高或任何可以在连续范围内测量的数量进行建模。它们在范围内可以轻松变化。

概率密度函数 (PDF)

为了了解连续随机变量的概率如何工作，我们需要讨论概率密度函数 (PDF) 的概念。PDF 描述了随机变量取某个值的概率。与离散随机变量不同，连续随机变量取任何特定确切值的概率为零。相反，概率是在区间上确定的。

数学上，如果X是一个连续随机变量，而f(x)是其 PDF，则X位于区间[a, b]的概率由f(x)从a到b的积分给出：

 P(a < X < b) = ∫[a to b] f(x) dx

pdf f(x)必须满足两个条件：

f(x) ≥ 0 对于所有 x （非负）
在整个空间上的积分为 1： ∫[−∞ to ∞] f(x) dx = 1 （总概率为 1）

累积分布函数 (CDF)

除了 PDF，另一个重要概念是累积分布函数 (CDF)。CDF 表示随机变量 X 取小于或等于 x 值的概率。它用F(x)表示，定义如下：

 F(x) = P(X ≤ x) = ∫[−∞ to x] f(t) dt

CDF 是一个非递减函数，范围从 0 到 1。当 x 为负无穷大时，它从 0 开始，并且当 x 接近正无穷大时趋近于 1。

示例：均匀分布

连续随机变量的一个简单示例是均匀分布。如果一个连续随机变量X在区间[a, b]上具有均匀分布，则其 PDF 在该区间上是常数。

均匀分布的 PDF 由以下公式给出：

 f(x) = 1 / (b - a)，其中 a ≤ x ≤ b f(x) = 0，其他情况

此分布意味着区间[a, b]中的每个数字同样可能。均匀分布的 CDF 为：

 F(x) = (x - a) / (b - a)，其中 a ≤ x ≤ b F(x) = 0，其中 x < a F(x) = 1，其中 x > b

示例：正态分布

最重要的连续随机变量之一是正态分布，通常称为高斯分布。这种分布以其对称的钟形曲线为特征，均匀分布于其均值两侧。

均值μ和标准差σ的正态分布的 PDF 为：

 f(x) = (1 / (σ√(2π))) * exp(-0.5 * ((x - μ) / σ)^2)

正态分布因中心极限定理而广泛使用，该定理指出，大量独立同分布变量之和将近似服从正态分布。