1. はじめに
確率論は、ランダムな現象を数理的に扱うための強力な手法で、日常生活の多くの場面で使われています。特に、確率分布と確率変数という概念は、確率論の基礎を理解するための重要な要素です。
この記事では、確率分布と確率変数について、その基本的な定義から数式を交えた科学的理論までを解説します。初心者にもわかりやすく、確率論の基礎を築くための手助けとなることを目指します。
2. 確率変数とは
2.1 確率変数の定義
確率変数(random variable)とは、ある確率実験の結果に応じて値が決まる変数のことです。確率変数は、実験や試行の結果を数値で表すために使用されます。具体的には、サイコロを振った結果を表す整数や、気温の測定結果を表す実数などが確率変数です。
確率変数には2種類があります。
- 離散型確率変数: 取り得る値が有限または数え上げ可能な場合の確率変数。
- 連続型確率変数: 取り得る値が無限で、ある範囲内のすべての値を取り得る場合の確率変数。
2.2 確率変数の表記
通常、確率変数は$X$や$Y$といった大文字で表されます。例えば、サイコロの目を表す確率変数を$X$とすると、$X$は1から6の値を取ります。
- $P(X = x)$: 確率変数$X$が値$x$を取る確率。
- $P(a \leq X \leq b)$: 確率変数$X$が区間$[a, b]$に入る確率。
3. 確率分布とは
3.1 確率分布の定義
確率分布(probability distribution)は、確率変数が取り得る値と、それに対応する確率を表したものです。確率分布は、確率変数がどの値をどのくらいの頻度で取るのかを記述します。
確率分布には、離散型と連続型があります。
- 離散型確率分布: 確率変数が離散的な値を取る場合の分布。
- 連続型確率分布: 確率変数が連続的な値を取る場合の分布。
3.2 離散型確率分布
離散型確率変数の場合、確率分布は確率質量関数(PMF: Probability Mass Function)で定義されます。PMFは、確率変数が特定の値を取る確率を表します。
例えば、サイコロを振る試行では、確率変数$X$が取り得る値は1から6で、それぞれの確率は等しいため、次のように表されます。
$$
P(X = x) = \frac{1}{6} \quad (x = 1, 2, 3, 4, 5, 6)
$$
ここで、$P(X = x)$は確率変数$X$が値$x$を取る確率を示します。
3.2.1 離散型確率分布の例
ベルヌーイ分布は、結果が「成功」または「失敗」の二値である試行に関する確率分布です。ベルヌーイ分布の確率質量関数は次のように定義されます。
$$
P(X = x) = p^x (1 – p)^{1-x} \quad (x = 0, 1)
$$
ここで、$p$は成功する確率、$1 – p$は失敗する確率です。
3.3 連続型確率分布
連続型確率変数の場合、確率分布は確率密度関数(PDF: Probability Density Function)で定義されます。PDFは、特定の範囲内で確率変数が値を取る確率を表します。
連続型確率分布において、特定の値を取る確率は常に0ですが、ある区間に属する確率は次のように積分で求められます。
$$
P(a \leq X \leq b) = \int_a^b f(x) \, dx
$$
ここで、$f(x)$は確率密度関数です。
3.3.1 連続型確率分布の例
正規分布は、連続型確率分布の中でも最もよく知られている分布です。正規分布の確率密度関数は次のように定義されます。
$$
f(x) = \frac{1}{\sqrt{2\pi \sigma^2}} \exp\left(-\frac{(x – \mu)^2}{2\sigma^2}\right)
$$
ここで、$\mu$は平均、$\sigma^2$は分散を表します。正規分布は、データが平均を中心に左右対称に分布することを示し、自然界の多くの現象に適用されます。
4. 確率分布の特徴
4.1 期待値
期待値(mean, expected value)とは、確率変数が取る値の平均を表します。期待値は、確率分布全体の中心的な傾向を示します。
離散型確率変数の期待値$E[X]$は次の式で定義されます。
$$
E[X] = \sum_x x P(X = x)
$$
連続型確率変数の場合、期待値は次のように積分で表されます。
$$
E[X] = \int_{-\infty}^{\infty} x f(x) \, dx
$$
4.2 分散と標準偏差
分散(variance)とは、確率変数が平均からどれだけ散らばっているかを示す指標です。分散が大きいほど、データのばらつきが大きいことを意味します。
離散型確率変数の分散$Var(X)$は次の式で定義されます。
$$
Var(X) = E[(X – E[X])^2] = \sum_x (x – E[X])^2 P(X = x)
$$
連続型確率変数の分散は次のように定義されます。
$$
Var(X) = \int_{-\infty}^{\infty} (x – E[X])^2 f(x) \, dx
$$
標準偏差は、分散の平方根を取ったもので、単位を揃えるために用いられます。
$$
\sigma = \sqrt{Var(X)}
$$
5. 主な確率分布
5.1 離散型確率分布
5.1.1 二項分布
二項分布は、独立したベルヌーイ試行を$n$回繰り返した結果に基づく確率分布です。二項分布の確率質量関数は次のように定義されます。
$$
P(X = k) = \binom{n}{k} p^k (1 – p)^{n – k}
$$
ここで、$n$は試行回数、$p$は成功の確率、$k$は成功回数です。
5.1.2 ポアソン分布
ポアソン分布は、一定の時間や空間における稀な事象の発生回数をモデル化するために用いられます。ポアソン分布の確率質量関数は次のように定義されます。
$$
P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}
$$
ここで、$\lambda$は一定期間内の平均発生回数、$k$は発生回数です。
5.2 連続型確率
分布
5.2.1 一様分布
一様分布は、ある区間内のすべての値が等しい確率で現れる分布です。区間$[a, b]$での一様分布の確率密度関数は次のように定義されます。
$$
f(x) = \frac{1}{b – a} \quad (a \leq x \leq b)
$$
5.2.2 指数分布
指数分布は、無記憶性を持つ事象の待ち時間をモデル化するために用いられます。指数分布の確率密度関数は次のように定義されます。
$$
f(x) = \lambda e^{-\lambda x} \quad (x \geq 0)
$$
ここで、$\lambda$は事象の発生率です。
6. まとめ
確率変数と確率分布は、確率論における重要な概念であり、ランダムな現象を数学的に記述するための基礎となります。確率変数はランダムな現象の結果を数値で表し、確率分布はその結果がどのように分布するかを示します。