負の二項分布
定義:negative binomial distribution
負の二項分布とは,成功確率 $p$ のベルヌーイ試行を繰り返し,成功が $r$ 回目に出るまでの失敗の回数を表す分布である.
確率変数 $X$ が負の二項分布に従う場合,$r$ を成功の回数,$k$ を失敗の回数,$p$ を成功の確率として,その確率質量関数は次のようになる:\[P(X = k) = \binom{k + r - 1}{r - 1} p^r (1 - p)^k \quad \text{for} \quad k = 0, 1, 2, \ldots\]
負の二項分布の確率質量関数は、$r$ 回目の成功が $k$ 回の失敗の後に起こる確率を示している.具体的には、$r$ 回目の成功が起こるまでに $k$ 回失敗し,その後に成功する必要がある.まず, $k$ 回の失敗と $r-1$ 回の成功が任意の順序で発生する確率を考ええる.これは二項係数を用いて次のように表される.\[\binom{k + r - 1}{r - 1} (1 - p)^k p^{r-1}\]次に,最後の試行が成功である確率は $p$ である.これらを組み合わせると,負の二項分布の確率質量関数は次のようになる.\[P(X = k) = \binom{k + r - 1}{r - 1} (1 - p)^k p^{r-1} \cdot p\]\[P(X = k) = \binom{k + r - 1}{r - 1} p^r (1 - p)^k\]ここで,$r$ は成功の回数,$k$ は失敗の回数,$p$ は成功の確率である.
負の二項分布の特性
期待値
\[E[X] = \frac{r (1 - p)}{p}\]期待値 $E[X]$ は次のように定義される.\[E[X] = \sum_{k=0}^{\infty} k \cdot P(X = k)\]ここで,
確率質量関数を代入する.\[E[X] = \sum_{k=0}^{\infty} k \cdot \binom{k + r - 1}{r - 1} p^r (1 - p)^k\]この期待値を直接求めるのは困難であるので,
負の二項分布の特性を利用する.
負の二項分布 $X$ は,$r$ 回の成功が得られるまでの失敗の回数としても解釈できる.すなわち,
負の二項分布は
幾何分布の合計としても表現できる.具体的には,成功確率 $p$ の
幾何分布に従う $r$ 個の独立な確率変数の合計と見なすことができる.従って,
幾何分布の期待値 $E[Y] = \frac{1 - p}{p}$ を用いて次のように求める.\[E[X] = r \cdot E[Y] = r \cdot \frac{1 - p}{p}\]
分散
負の二項分布の
分散 $\text{Var}(X)$ は次のようになる.\[\text{Var}(X) = \frac{r (1 - p)}{p^2}\]
分散の定義は,\[\text{Var}(X) = E[X^2] - (E[X])^2\]である.ここで,期待値 $E[X]$ は既に求めたので,次に $E[X^2]$ を求める.
負の二項分布の特性を利用し,次のように表現する.\[E[X^2] = \sum_{k=0}^{\infty} k^2 \cdot P(X = k)\]
期待値を導出した場合と同じように,
負の二項分布は
幾何分布の合計として表現できることを用いると以下のように変形できる.\[E[X^2] = r \cdot E[Y^2] + r(r-1) \cdot (E[Y])^2\]ここで,
幾何分布の
分散 $\text{Var}(Y) = \frac{1 - p}{p^2}$ を用いると,\[\begin{eqnarray}E[Y^2] &=& \text{Var}(Y) + (E[Y])^2 = \frac{1 - p}{p^2} + \left( \frac{1 - p}{p} \right)^2\\&=& \frac{1 - p}{p^2} + \frac{(1 - p)^2}{p^2}\\&=& \frac{1 - p + (1 - p)^2}{p^2}\\&=& \frac{1 - p + 1 - 2p + p^2}{p^2}\\&=& \frac{2 - 3p + p^2}{p^2}\end{eqnarray}\]これを代入し,\[E[X^2] = r \cdot \frac{2 - 3p + p^2}{p^2} + r(r-1) \cdot \left( \frac{1 - p}{p} \right)^2\]ここで, $(E[X])^2$ は,\[(E[X])^2 = \left( \frac{r (1 - p)}{p} \right)^2 = \frac{r^2 (1 - p)^2}{p^2}\]以上をこれをまとめると,\[\text{Var}(X) = E[X^2] - (E[X])^2 = \frac{r (1 - p)}{p^2}\]
分布の性質を理解する上で重要な関数
モーメント母関数
\[M_X(t) = \left( \frac{p}{1 - e^t(1 - p)} \right)^r\]以下に
負の二項分布のモーメント母関数の導出を示す.まず,モーメント母関数 \$M_X(t)$ は次のように定義される.\[M_X(t) = E[e^{tX}] = \sum_{k=0}^{\infty} e^{tk} P(X = k)\]ここに,確率質量関数を代入する.\[M_X(t) = \sum_{k=0}^{\infty} e^{tk} \binom{k + r - 1}{r - 1} p^r (1 - p)^k\]この和は次のように変形できる.\[M_X(t) = p^r \sum_{k=0}^{\infty} \binom{k + r - 1}{r - 1} (e^t(1 - p))^k\]
二項定理を用いると,この和は次のようになる.\[M_X(t) = p^r (1 - e^t(1 - p))^{-r}\]
確率母関数
\[G_X(t) = \left( \frac{p}{1 - t(1 - p)} \right)^r\]以下に
負の二項分布の特性関数の導出を示す.まず,確率母関数 $G_X(t)$ は次のように定義される.\[G_X(t) = E[t^X] = \sum_{k=0}^{\infty} t^k P(X = k)\]ここで,確率質量関数を代入する.\[G_X(t) = \sum_{k=0}^{\infty} t^k \binom{k + r - 1}{r - 1} p^r (1 - p)^k\]この和は次のように変形できる.\[G_X(t) = p^r \sum_{k=0}^{\infty} \binom{k + r - 1}{r - 1} (t(1 - p))^k\]
二項定理を用いると,この和は次のようになる.\[G_X(t) = p^r (1 - t(1 - p))^{-r}\]
特性関数
\[\phi_X(t) = \left( \frac{p}{1 - e^{it}(1 - p)} \right)^r\]以下に
負の二項分布の特性関数の導出を示す.まず,特性関数の定義は以下の通り.\[\phi_X(t) = E[e^{itX}] = \sum_{k=0}^{\infty} e^{itk} P(X = k)\]ここで,確率質量関数を代入する.\[\phi_X(t) = \sum_{k=0}^{\infty} e^{itk} \binom{k + r - 1}{r - 1} p^r (1 - p)^k\]この和は次のように変形できる.\[\phi_X(t) = p^r \sum_{k=0}^{\infty} \binom{k + r - 1}{r - 1} (e^{it}(1 - p))^k\]
二項定理を用いると,この和は次のようになる.\[\phi_X(t) = p^r (1 - e^{it}(1 - p))^{-r}\]
Mathematics is the language with which God has written the universe.