Box-Cox変換

定義：Box-Cox transformation

Box-Cox変換は,データの正規性を改善し,分散を安定化させるために使用される.変数 $X > 0$ に対して,Box-Cox変換 $Y(\lambda)$ は以下のように定義される.\[Y(\lambda) = \begin{cases} \frac{X^\lambda - 1}{\lambda} & \text{if } \lambda \neq 0 \\\ln(X) & \text{if } \lambda = 0\end{cases}\]ここで,$X$ は元のデータ, $Y(\lambda)$ は変換後のデータ,$\lambda$ は変換パラメータである.

$\lambda = 0$ の場合の定義は, $\lambda \to 0$ の極限として導出される.すなわち,\[\lim_{\lambda \to 0} \frac{X^\lambda - 1}{\lambda} = \ln(X)\]一般化されたBox-Cox変換では, $X$ が非正の値を取る場合に対応するため,以下のように定義されることもある.\[ Y(\lambda) = \begin{cases} \frac{(X + c)^\lambda - 1}{\lambda} & \text{if } \lambda \neq 0 \\ \ln(X + c) & \text{if } \lambda = 0 \end{cases}\]ここで, $c$ は $X + c > 0$ となるような定数である.

主な特殊ケース

$\lambda = 1$ : 線形変換[変換なし]
$\lambda = 0$ : 対数変換
$\lambda = 0.5$ : 平方根変換
$\lambda = -1$: 逆数変換

最適な $\lambda$ は通常,変換後のデータが正規分布に近づくように,最尤法や残差の分析によって決定される.

逆変換

\[X = \begin{cases} (Y\lambda + 1)^{1/\lambda} & \text{if } \lambda \neq 0 \\ e^Y & \text{if } \lambda = 0 \end{cases}\]

由来

この変換は,イギリスの統計学者であるボックス[George E. P. Box ;1919/2013]とコックス[David Cox ;1924/2022]によって,"An analysis of transformations",Journal of the Royal Statistical Society, Series B (Methodological),Vol. 26, No. 2 (1964), pp. 211-252 で発表された.

Mathematics is the language with which God has written the universe.

MindsDB 逆関数の微分公式変数変換と確率密度関数の変化ヤコビアンヤコビ行列算術平均・幾何平均・調和平均の関係式