幾何分布

定義：geometric distribution

幾何分布とは,独立な試行を成功するまで繰り返す場合の試行回数[または失敗回数]をモデル化したものである.例えば,コイン投げで初めて表が出るまでの投げる回数などが幾何分布に従る.なお,各試行の結果が独立で,成功確率が一定であることが前提条件となる.

幾何分布の確率質量関数は,\[P(X = k) = (1-p)^{k-1}p, \quad k = 1, 2, 3, \ldots\]となる.ここで,$X$ は初めての成功が起こるまでの試行回数, $Y$ は初めての成功が起こるまでの失敗回数 $(Y = X - 1)$, $p$ は各試行での成功確率 $(0 < p \leq 1)$ ,$k$ は試行回数, $y$ は失敗回数である.

また,累積分布関数は,\[F(k) = P(X \leq k) = 1 - (1-p)^k, \quad k = 1, 2, 3, \ldots\]となる.

幾何分布は復元抽出,超幾何分布は非復元抽出を前提としている.これが両分布の本質的な違いとなっている.また,幾何分布では各試行が独立である.一方,超幾何分布では試行ごとに母集団が変化するため,試行は独立ではない.

超幾何分布は,特定の条件下で二項分布に近似でき,さらに特殊な場合 $(n=1)$ でベルヌーイ分布となる.一方,幾何分布は,このベルヌーイ試行を成功まで繰り返す分布と見なせる.

幾何分布は,初めての成功までの試行回数をモデル化したものであり,超幾何分布は固定サイズのサンプルにおける成功の数をモデル化したものと言える.

幾何分布の特性

期待値

\[E[X] = \frac{1}{p}\]

幾何分布は,初めて成功するまでの試行回数 $X$ の確率分布である.成功確率を $p$ とすると,確率質量関数は以下のようになる.\[P(X = k) = (1-p)^{k-1}p, \quad k = 1, 2, 3, \ldots\]これを利用して期待値 $E[X]$ を求めると,\[\begin{eqnarray}E[X] &=& \sum_{k=1}^{\infty} k P(X=k) \\&=& \sum_{k=1}^{\infty} k (1-p)^{k-1}p \\&=& p \sum_{k=1}^{\infty} k (1-p)^{k-1}\end{eqnarray}\]ここで,級数 $\sum_{k=1}^{\infty} kx^{k-1} = \frac{1}{(1-x)^2}$（$|x| < 1$）を用いる. $x = 1-p$ とすると,\[\begin{eqnarray}E[X] &=& p \cdot \frac{1}{(1-(1-p))^2} \\&=& p \cdot \frac{1}{p^2} \\&=& \frac{1}{p}\end{eqnarray}\]したがって,幾何分布の期待値は $E[X] = \frac{1}{p}$ となる◻︎

分散

\[Var(X) = \frac{1-p}{p^2}\]分散の定義 $Var(X) = E[X^2] - (E[X])^2$ を用いる.まず,$E[X^2]$ を計算する.\[\begin{eqnarray}E[X^2] &=& \sum_{k=1}^{\infty} k^2 P(X=k) \\&=& \sum_{k=1}^{\infty} k^2 (1-p)^{k-1}p \\&=& p \sum_{k=1}^{\infty} k^2 (1-p)^{k-1}\end{eqnarray}\]ここで,級数 $\sum_{k=1}^{\infty} k^2x^{k-1} = \frac{1+x}{(1-x)^3}$（$|x| < 1$）を用いる. $x = 1-p$ とすると,\[\begin{eqnarray}E[X^2] &=& p \cdot \frac{1+(1-p)}{(1-(1-p))^3} \\&=& p \cdot \frac{2-p}{p^3} \\&=& \frac{2-p}{p^2}\end{eqnarray}\]次に,分散を計算する.\[\begin{eqnarray}Var(X) &=& E[X^2] - (E[X])^2 \\&=& \frac{2-p}{p^2} - \left(\frac{1}{p}\right)^2 \\&=& \frac{2-p}{p^2} - \frac{1}{p^2} \\&=& \frac{1-p}{p^2}\end{eqnarray}\]したがって,幾何分布の分散は $Var(X) = \frac{1-p}{p^2}$ となる◻︎

分布の性質を理解する上で重要な関数

モーメント母関数

\[M_X(t) = \frac{pe^t}{1-(1-p)e^t}, \quad t < -\ln(1-p)\]

確率母関数

\[G_X(s) = \frac{ps}{1-(1-p)s}, \quad |s| < \frac{1}{1-p}\]

特性関数

\[\phi_X(t) = \frac{pe^{it}}{1-(1-p)e^{it}}\]

Mathematics is the language with which God has written the universe.

マルチプレクサポアソン分布超幾何分布の二項分布への収束組み合わせの公式超幾何分布二項分布の再生性