定義:
ここでP値は,観測されたデータが,設定したモデル[二項分布の正規分布近似]のもとでどれくらい稀な事象であるかを表す指標である.
P値が小さい,例えば2.5%ということは,観測されたデータが,設定したモデル[二項分布の正規分布近似]のもとでは起こりにくい事象であることを意味している.これは、モデルとデータの相性が良くない可能性を示唆している.
言い換えると,P値は,モデルの仮定[この場合は二項分布モデルとその正規分布近似,そしてp=0.5という成功確率)]のもとで,観測されたデータがどれくらい「あり得ない」かを測る尺度となる.つまり,P値は[1]データの数値,[2]モデル,[3]パラメータの値の設定の相性の良さの程度を示すものと言える.
二項分布 $B(n, p)$ は,$n$ が十分大きく,$p$ が 0 から 1 に近すぎない場合,正規分布 $N(\mu, \sigma^2)$ で近似できる.ここで、,$\mu = np$,$\sigma^2 = np(1-p)$ である.この場合,$n=20$、$p=0.5$ であるので,$\mu = 10$,$\sigma^2 = 5$ となる.
観測値 $k=5$ を標準化すると, $z = (k - \mu) / \sigma = (5 - 10) / \sqrt{5} = -2.24$ となる.
標準正規分布表を用いて,$z = -2.24$ よりも小さい値をとる確率を求める.これは $P(Z < -2.24) \approx 0.0125$ となる.今回は,成功確率が 0.5 より大きいか小さいか,両側で評価するため,P値を2倍するので,$0.0125 \times 2 = 0.025 = 2.5%$ となる.
したがって,P値は約2.5%となり,これは観測されたデータが,設定したモデルのもとでは比較的稀な事象であることを示唆している.
なお,P値はモデルの適合度を完全に示すものではない.P値が小さいからといって,モデルが絶対に間違っているとは言えない.他のモデルの方がより適合する可能性も考えうる.また,パラメータの値の設定の $p=0.5$ に関しても,データの取得法とモデルの組合せの妥当性や仮説 $p=0.5$ の事前のもっともらしさ[事前確率]についても考慮する必要がある.
また,P値は帰無仮説が正しい確率ではない.P値は帰無仮説が正しいという前提の下で,観測されたデータ以上の極端な結果が得られる確率を示すものである.
つまり,P値はあくまでも指標の一つであることに留意すべきである.逆にいうと,P値<5%であるだけでは帰無仮説を否定することはできないということになる.
Mathematics is the language with which God has written the universe.