多項分布

定義:multinomial distribution

多項分布は, $k$個の互いに排他的なカテゴリがあり,それぞれの出現確率が $p_1, p_2, ..., p_k$ である試行を $n$ 回繰り返す場合の結果の分布である.$k=2$ の場合,多項分布二項分布と一致する.すなわち,多項分布二項分布の一般化と考えることができる.

多項分布確率質量関数は,$n$ を試行回数,$k$ をカテゴリ数,$x_i$ は $i$ 番目のカテゴリが出現する回数 ($i = 1, \ldots, k$),$p_i$ は $i$ 番目のカテゴリが出現する確率($\sum_{i=1}^k p_i = 1$)として,以下のように表すことが出来る.\[P(X_1 = x_1, \ldots, X_k = x_k) = \frac{n!}{x_1! \cdots x_k!} p_1^{x_1} \cdots p_k^{x_k}\]

多項分布の特性

期待値

多項分布期待値は次のように表される.\[E[X_i] = np_i\]

何故ならば,$X_i$ の期待値を考えると,\[E[X_i] = \sum_{x_i=0}^n x_i P(X_i = x_i)\]であるが,$X_i$ は二項分布 $Bin(n, p_i)$ に従うので,\[E[X_i] = np_i\]となるからである.

分散

多項分布分散は次のように表される.\[Var(X_i) = np_i(1-p_i)\]

以下,多項分布の分散を導出する.まず,分散の定義式は,\[Var(X_i) = E[X_i^2] - (E[X_i])^2\]となる.ここで,$E[X_i]$ はすでに $np_i$ であることを上で示した.次に $E[X_i^2]$ を計算する.$X_i$ は二項分布 $Bin(n, p_i)$ に従うので,二項分布の性質を利用する.二項分布の2次モーメントは以下のようになる.\[E[X_i^2] = np_i(1-p_i) + (np_i)^2\]これを分散の定義式に代入すると,\[\begin{eqnarray}Var(X_i) &=& E[X_i^2] - (E[X_i])^2 \\&=& [np_i(1-p_i) + (np_i)^2] - (np_i)^2 \\&=& np_i(1-p_i) + (np_i)^2 - (np_i)^2 \\&=& np_i(1-p_i)\end{eqnarray}\]が得られる◻︎

分布の性質を理解する上で重要な関数

モーメント母関数

$t = (t_1, t_2, \ldots, t_k)'$ を $k$ 次元ベクトルとして,\[M_X(t) = E[e^{t'X}] = (p_1e^{t_1} + p_2e^{t_2} + \cdots + p_ke^{t_k})^n\]

確率母関数

$s = (s_1, s_2, \ldots, s_k)'$ を $k$ 次元ベクトルとして,\[G_X(s) = E[s_1^{X_1}s_2^{X_2}\cdots s_k^{X_k}] = (p_1s_1 + p_2s_2 + \cdots + p_ks_k)^n\]

特性関数

$i$ を虚数単位,$t = (t_1, t_2, \ldots, t_k)'$ を $k$ 次元ベクトルとして,\[\phi_X(t) = E[e^{it'X}] = (p_1e^{it_1} + p_2e^{it_2} + \cdots + p_ke^{it_k})^n\]

Mathematics is the language with which God has written the universe.





















情報エントロピー 二項分布と負の二項分布 負の二項係数 負の二項分布 幾何分布の無記憶性 幾何分布