定義:geometric distribution
幾何分布の確率質量関数は,\[P(X = k) = (1-p)^{k-1}p, \quad k = 1, 2, 3, \ldots\]となる.ここで,$X$ は初めての成功が起こるまでの試行回数, $Y$ は初めての成功が起こるまでの失敗回数 $(Y = X - 1)$, $p$ は各試行での成功確率 $(0 < p \leq 1)$ ,$k$ は試行回数, $y$ は失敗回数である.
また,累積分布関数は,\[F(k) = P(X \leq k) = 1 - (1-p)^k, \quad k = 1, 2, 3, \ldots\]となる.
幾何分布は復元抽出,超幾何分布は非復元抽出を前提としている.これが両分布の本質的な違いとなっている.また,幾何分布では各試行が独立である.一方,超幾何分布では試行ごとに母集団が変化するため,試行は独立ではない.
超幾何分布は,特定の条件下で二項分布に近似でき,さらに特殊な場合 $(n=1)$ でベルヌーイ分布となる.一方,幾何分布は,このベルヌーイ試行を成功まで繰り返す分布と見なせる.
幾何分布は,初めての成功までの試行回数をモデル化したものであり,超幾何分布は固定サイズのサンプルにおける成功の数をモデル化したものと言える.
幾何分布は,初めて成功するまでの試行回数 $X$ の確率分布である.成功確率を $p$ とすると,確率質量関数は以下のようになる.\[P(X = k) = (1-p)^{k-1}p, \quad k = 1, 2, 3, \ldots\]これを利用して期待値 $E[X]$ を求めると,\[\begin{eqnarray}E[X] &=& \sum_{k=1}^{\infty} k P(X=k) \\&=& \sum_{k=1}^{\infty} k (1-p)^{k-1}p \\&=& p \sum_{k=1}^{\infty} k (1-p)^{k-1}\end{eqnarray}\]ここで,級数 $\sum_{k=1}^{\infty} kx^{k-1} = \frac{1}{(1-x)^2}$($|x| < 1$) を用いる. $x = 1-p$ とすると,\[\begin{eqnarray}E[X] &=& p \cdot \frac{1}{(1-(1-p))^2} \\&=& p \cdot \frac{1}{p^2} \\&=& \frac{1}{p}\end{eqnarray}\]したがって,幾何分布の期待値は $E[X] = \frac{1}{p}$ となる◻︎
Mathematics is the language with which God has written the universe.