Box-Cox変換

定義:Box-Cox transformation

Box-Cox変換は,データの正規性を改善し,分散を安定化させるために使用される.変数 $X > 0$ に対して,Box-Cox変換 $Y(\lambda)$ は以下のように定義される.\[Y(\lambda) = \begin{cases} \frac{X^\lambda - 1}{\lambda} & \text{if } \lambda \neq 0 \\\ln(X) & \text{if } \lambda = 0\end{cases}\]ここで,$X$ は元のデータ, $Y(\lambda)$ は変換後のデータ,$\lambda$ は変換パラメータである.

$\lambda = 0$ の場合の定義は, $\lambda \to 0$ の極限として導出される.すなわち,\[\lim_{\lambda \to 0} \frac{X^\lambda - 1}{\lambda} = \ln(X)\]一般化されたBox-Cox変換では, $X$ が非正の値を取る場合に対応するため,以下のように定義されることもある.\[ Y(\lambda) = \begin{cases} \frac{(X + c)^\lambda - 1}{\lambda} & \text{if } \lambda \neq 0 \\ \ln(X + c) & \text{if } \lambda = 0 \end{cases}\]ここで, $c$ は $X + c > 0$ となるような定数である.

主な特殊ケース

最適な $\lambda$ は通常,変換後のデータが正規分布に近づくように,最尤法や残差の分析によって決定される.

逆変換

\[X = \begin{cases} (Y\lambda + 1)^{1/\lambda} & \text{if } \lambda \neq 0 \\ e^Y & \text{if } \lambda = 0 \end{cases}\]

由来

この変換は,イギリスの統計学者であるボックス[George E. P. Box ;1919/2013]とコックス[David Cox ;1924/2022]によって,"An analysis of transformations",Journal of the Royal Statistical Society, Series B (Methodological),Vol. 26, No. 2 (1964), pp. 211-252 で発表された.

Mathematics is the language with which God has written the universe.





















情報エントロピー 逆関数の微分公式 変数変換と確率密度関数の変化 ヤコビアン ヤコビ行列 算術平均・幾何平均・調和平均の関係式