二項分布と正規分布
二項分布と正規分布の関係
二項分布 は,試行回数 n が大きくなるにつれて正規分布 N(np, np(1-p)) に近づく.すなわち,二項分布を標準化した確率変数は標準正規分布に近づく.
ベルヌーイ試行をn回繰り返す二項分布を考える.
成功確率をpとし,成功回数をXとすると,
ここで,中心極限定理を適用するため,以下の変数変換を行う.
このとき,n \to \inftyにおいて,Zは標準正規分布に従う.
なぜならば,まず、二項分布の特性関数\phi_X(t)を考えると,
一般に,確率変数 Y が線形変換 Y = aX + b (a, b は定数)の場合,特性関数は以下の関係を満たす
標準化変数 Z の変換を上記の形に合わせると,
従って,
これを特性関数の変換公式に適用すると,
指数部分を整理すると,
以上より,標準化された変数Zの特性関数\phi_Z(t)は,
\log(1+x)のテイラー展開を用いて,
e^{ix}のテイラー展開を適用し,n \to \inftyの極限をとると,
従って,
これは標準正規分布の特性関数に他ならない.
別の導出法
二項分布の確率質量関数[PMF] は次のように与えられる.ここで,X は成功回数,n は試行回数,p は成功確率である.対数を取ると次のようになる.スターリングの近似を用いると,二項係数の対数は次のように近似できる.次に,k を次のように変換する.ここで z は標準化された変数である.この変換により,k は np の周りで変動するようになる.次に,k \ln k を展開する.まず,k を np + z\sqrt{np(1-p)} に置き換える.この式をテイラー展開する.まず,\ln(np + z \sqrt{np(1-p)}) を np の周りで展開する.z が小さいと仮定すると,これを整理すると次のようになる.次に,この展開を k \ln k に代入する.分配法則を使って展開すると,整理すると,次に,k \ln p と (n-k) \ln (1-p) を展開する.z に関する項は一次の影響しかないため,無視することができる.最終的には定数項 np \ln p だけが残る.また,こちらも一次項は無視できる.全ての項を合わせると,最終的な対数確率質量関数は次のようになる.指数関数に戻すと,次のように近似される.
この結果,二項分布は n が大きい場合に次の正規分布で近似されることが示される.
留意点
正規分布のように指数関数を使い,それを全区間で積分して正規化する場合には,ガウス積分の関係から確率密度関数に\piが出てくる.
Mathematics is the language with which God has written the universe.