マルコフ連鎖
マルコフ連鎖は、確率過程の研究において重要な概念であり、確率論と統計の一分野です。ロシアの数学者アンドレイ・マルコフにちなんで名付けられたマルコフ連鎖は、ある状態から別の状態へ確率的に移行するシステムを説明するために使用されます。
確率過程の紹介
マルコフ連鎖を詳しく説明する前に、確率過程とは何かを簡単に説明します。確率過程は、時間を示すパラメータによってインデックス付けされたランダム変数の集合です。これらの過程は、時間の経過とともに確率的に進化するシステムをモデル化するために使用されます。システムの各値や状態は、既知の方程式によって完全には決定されず、確率的に決定されます。
マルコフ連鎖の理解
マルコフ連鎖は、プロセスの将来の状態が現在の状態のみに依存し、それ以前の出来事のシーケンスには依存しない特定の種類の確率過程です。この特性は「記憶なし」特性と呼ばれ、正式にはマルコフ性と呼ばれます。簡単に言うと、プロセスには以前どこにいたかの記憶がないことを意味します。
離散時間マルコフ連鎖
最も一般的な形態のマルコフ連鎖は、離散時間マルコフ連鎖です。これらのシステムは、固定された離散的な時間間隔で状態を移ります。各ステップで、システムは同じ状態にとどまるか、一定の確率で別の状態に移行することができます。
状態の場所
マルコフ連鎖のすべての可能な状態の集合を「状態空間」と呼びます。例えば、天候を状態としてモデル化する場合、可能な状態は「晴れ」、「雨」、「曇り」となるかもしれません。
遷移行列
ある状態から別の状態への移行確率は、「遷移行列」と呼ばれる行列で表現されます。状態空間にn
個の状態があるとき、遷移行列はn × n
の行列であり、i
行j
列の要素は、状態i
から状態j
への移行確率を表します。3つの状態を持つ簡単な天気モデルの遷移行列の例は次のようになります:
P = [ [0.7, 0.2, 0.1], [0.3, 0.4, 0.3], [0.2, 0.1, 0.7] ]
遷移行列の各行は合計が1になるようにする必要があります。これは、現在の状態からシステムが移行できる可能なすべての状態の集合を表すためです。
例: 天気モデル
天気の変化を説明する簡単なマルコフ連鎖を考えてみましょう:
- 条件: 「晴れ」、「曇り」、「雨」
- 遷移行列:
P = [ [0.6, 0.3, 0.1], [0.2, 0.5, 0.3], [0.3, 0.3, 0.4] ]
この行列は、今日が晴れの場合、明日も晴れる確率が60%、曇る確率が30%、雨が降る確率が10%であることを示しています。
マルコフ連鎖の特性
マルコフ連鎖のダイナミクスを理解するためのいくつかの重要な特性があります:
不可逆性
マルコフ連鎖は、任意の状態から任意の状態へ移動できる場合、不可逆であると言われます。これは、ある状態から他の状態へ直接または他の状態を経て移行する非ゼロの確率があることを意味します。
周期性
マルコフ連鎖のある状態は有限のステップでその状態に戻る場合、周期を持つと言われます。周期は、その状態が自身に戻るステップの最大公約数です。
再発性と一過性
プロセスが最終的に同じ状態に戻る確率が1である場合、その状態は再帰的と呼ばれます。確率が1未満の場合、その状態は一過的と呼ばれます。
安定分布
定常分布とは、プロセスが進展するにつれて変わらない確率分布です。遷移行列P
を持つマルコフ連鎖の場合、ベクトルπ
は次の場合に定常分布です:
πP = π
与えられた遷移行列を使用して、より多くの計算を行うことで、確率過程の定常分布を見つけることができます。
連続時間マルコフ連鎖
離散的な時間の各瞬間でシステムが移行する離散時間マルコフ連鎖に焦点を当ててきましたが、時間は連続することもあります。連続時間マルコフ連鎖では、移行は任意の連続的な瞬間で発生する可能性があります。
遷移速度メトリクス
遷移行列の代わりに、連続時間マルコフ連鎖は遷移速度行列を使用し、通常Q
で表されます。各エントリqij
は、状態i
から状態j
への移行速度を表します。
結論
マルコフ連鎖は、時間とともに状態間で移行するシステムをモデル化し、分析するための強力なフレームワークを提供します。経済学、遺伝学、ゲーム理論などのさまざまな分野で幅広く応用されているマルコフ連鎖は、確率論と統計の基本的なトピックとなっています。