定義:
まず,線形回帰モデルを考える.\[\mathbf{Y} = \mathbf{X}\boldsymbol{\beta} + \boldsymbol{\varepsilon}\]最小二乗法により $\boldsymbol{\beta}$ の推定値を求める.\[\hat{\boldsymbol{\beta}} = (\mathbf{X}^T\mathbf{X})^{-1}\mathbf{X}^T\mathbf{Y}\]残差ベクトル $\mathbf{e}$ が以下のように表すことができる.\[\mathbf{e} = \mathbf{Y} - \mathbf{X}\hat{\boldsymbol{\beta}}\]$\mathbf{e}$ を展開する.\[\begin{eqnarray}\mathbf{e} &=& \mathbf{Y} - \mathbf{X}(\mathbf{X}^T\mathbf{X})^{-1}\mathbf{X}^T\mathbf{Y} \\ &=& (\mathbf{I} - \mathbf{X}(\mathbf{X}^T\mathbf{X})^{-1}\mathbf{X}^T)\mathbf{Y} \\ &=& (\mathbf{I} - \mathbf{P}_X)\mathbf{Y}\end{eqnarray}\]次に残差平方和[RSS]を計算する.\[\begin{eqnarray}RSS &=& \mathbf{e}^T\mathbf{e} \\ &=& [\mathbf{Y}^T(\mathbf{I} - \mathbf{P}_X)^T][(\mathbf{I} - \mathbf{P}_X)\mathbf{Y}] \\ &=& \mathbf{Y}^T(\mathbf{I} - \mathbf{P}_X)^T(\mathbf{I} - \mathbf{P}_X)\mathbf{Y} \\ &=& \mathbf{Y}^T(\mathbf{I} - \mathbf{P}_X)\mathbf{Y} \end{eqnarray}\]ここで, \[(\mathbf{I} - \mathbf{P}_X)^T = (\mathbf{I} - \mathbf{P}_X) \text{と} (\mathbf{I} - \mathbf{P}_X)(\mathbf{I} - \mathbf{P}_X) = (\mathbf{I} - \mathbf{P}_X)\] を使用した.
射影行列 $\mathbf{P}_X$ の性質として,
ここで, $(n-r)$ は自由度と呼ばれ,射影行列 $\mathbf{P}_X$ の階数 $r$ と関係している.すなわち,これは, $n$ 個の観測値から $r$ 個のパラメータを推定することによる制約を反映しており,モデルの複雑さと残差の自由度のバランスを表している.
Mathematics is the language with which God has written the universe.