離散確率変数
確率と統計の世界では、確率変数は不確実性に対処しデータを理解するために重要な役割を果たします。確率変数は、ランダムなイベントの結果に応じて異なる値をとる変数です。確率変数は主に2つのカテゴリーに分類されます: 離散確率変数と連続確率変数です。ここでは、特に離散確率変数に焦点を当てます。
離散確率変数とは何ですか?
離散確率変数とは、取ることができる値の数が可算であるタイプの確率変数です。つまり、離散確率変数の値はリスト化でき、たとえそのリストが無限であってもです。離散値の例には、0, 1, 2, 3 などの整数が含まれます。
離散確率変数の重要な特徴は、それぞれの可能な値の間に明確な間隔があることです。これは、連続確率変数(与えられた範囲内の任意の値を取ることができ、間に間隔がない場合)とは対照的です。
離散確率変数の例
離散確率変数をよりよく理解するために、いくつかの例を見てみましょう:
例 1: 6面サイコロを振る
公正な6面サイコロを振る状況を考えてみてください。可能な結果は1, 2, 3, 4, 5, 6です。この場合、サイコロの目の結果は離散確率変数として扱われます。なぜなら、それはこれら6つのいずれかの値しか取らないからです。それぞれの数字は上向きのサイコロの面を表しています。
Xの可能な値(サイコロの目の値): 1, 2, 3, 4, 5, 6
このシナリオでは、ランダム変数Xはサイコロに表示される値を表す離散確率変数です。
例 2: コインの表が出る回数
公正なコインを3回投げ、表が出る回数を数える状況を考えましょう。表が出る回数の可能な結果は0, 1, 2, 3です。この場合、表の出る回数を表すランダム変数Yは離散です。
Yの可能な値(表が出る回数): 0, 1, 2, 3
この例では、ランダム変数Yはコイン投げのシーケンスで表が出る回数を表す離散確率変数です。
例 3: クラス内の学生を数える
教室内の学生の数を数える状況を想像してください。学生数の可能な値は自然数、0, 1, 2, 3 などです。この数字は実際に可算であり、離散確率変数を表しています。
Zの可能な値(学生数): 0, 1, 2, 3, ...
この場合、ランダム変数Zは室内の学生数を数える離散確率変数です。
確率質量関数 (PMF)
離散確率変数をよりよく理解するために、確率質量関数(通常PMFと略される)という概念を紹介します。PMFは離散確率変数のそれぞれの可能な値の確率を示す関数です。
PMFは通常P(X = x)
と表され、これは確率変数Xが特定の値xと等しい確率を示します。PMFとして成立するためには、次の特性が成立する必要があります:
- それぞれの可能な結果の確率は0と1の間にあります:
0 ≤ P(X = x) ≤ 1
- すべての可能な値に対する確率の合計が1と等しい:
∑ P(X = x) = 1
例: 6面サイコロを振る場合のPMF
サイコロを振る例のPMFは次のように表されます:
p(X = 1) = 1/6 p(X = 2) = 1/6 p(X = 3) = 1/6 p(X = 4) = 1/6 p(X = 5) = 1/6 p(X = 6) = 1/6
各可能な値(1から6まで)の確率は1/6です。これはサイコロが公正であり、各面が等しい確率で出るからです。
離散確率変数の可視化
離散確率変数の視覚的な表現を考えてみましょう。6面サイコロを振る例を見ると、棒グラフは離散確率変数のPMFを視覚的に表現する一般的な方法です。
このグラフは6面サイコロのPMFを示し、各バーは1/6の確率を持つ値1から6を表しています。
累積分布関数 (CDF)
離散確率変数に関連するもう1つの重要な概念は、累積分布関数(CDFと略される)です。CDFはランダム変数Xが特定の値x以下となる確率を示し、P(X ≤ x)
と表現されます。
例: 6面サイコロを振る場合のCDF
サイコロを振る例のCDFを考えてみましょう:
p(X ≤ 1) = 1/6 p(X ≤ 2) = 2/6 p(X ≤ 3) = 3/6 p(X ≤ 4) = 4/6 p(X ≤ 5) = 5/6 P(X ≤ 6) = 6/6 = 1
この階段関数は、次の値に移動するごとに確率を累積します。
離散確率変数の期待値と分散
期待値(平均)
離散確率変数の期待値または平均はその中心傾向を測る指標です。これは、可能な値の重み付き平均値であり、その重みはそれぞれの確率です。期待値はE(X)
またはμ
で表されます。
離散確率変数Xの期待値を計算する式は次の通りです:
E(X) = ∑ [x * p(X = x)]
例: 6面サイコロを振る場合の期待値
サイコロを振る例での期待値は次のように計算されます:
E(X) = 1 * (1/6) + 2 * (1/6) + 3 * (1/6) + 4 * (1/6) + 5 * (1/6) + 6 * (1/6) = 21/6 = 3.5
サイコロが何度も振られた場合、期待値は3.5であり、平均の結果です。
分散
離散確率変数の分散はその可能な値の分散または広がりを測定します。これは、平均からの平方偏差の期待値です。分散はVar(X)
またはσ2
で表されます。
分散の公式は次の通りです:
Var(X) = E[(X - μ)2 ] = ∑ [(x - μ)2 * P(X = x)]
例: 6面サイコロを振る場合の分散
サイコロを振る例でμ = 3.5
とした場合、分散は次のように計算されます:
Var(X) = [(1 - 3.5)2 * (1/6)] + [(2 - 3.5)2 * (1/6)] + [(3 – 3.5)2 * (1/6)] + [(4 – 3.5)2 * (1/6)] + [(5 – 3.5)2 * (1/6)] + [(6 – 3.5)2 * (1/6)] = [(-2.5)2 * (1/6)] + [(-1.5)2 * (1/6)] + [(-0.5)2 * (1/6)] + [(0.5)2 * (1/6)] + [(1.5)2 * (1/6)] + [(2.5)2 * (1/6)] = 2.92
分散2.92は、サイコロの結果が期待値からどれだけ逸脱するかの平均平方偏差を示します。
結論
離散確率変数は確率と統計の基本であり、結果が可算である多くの実際の状況をモデル化するのに使用されます。確率質量関数、累積分布関数、期待値、分散を計算する際の離散確率変数の扱い方を理解することで、ランダムイベントを分析し不確実性を測定する基盤を提供します。
これらの概念を理解することで、ゲームの設計から確率評価を伴う意思決定プロセスに至るまで、さまざまな分野に適用することができます。