周辺分布
定義:marginal distribution
離散型確率変数の場合:$X$ と $Y$ を離散型確率変数とし, $P(X=x, Y=y)$ をその同時確率関数とする.このとき,$X$ の周辺分布関数 $F_X(x)$ は以下のように定義される:\[F_X(x) = P(X \leq x) = \sum_{x_i \leq x} \sum_y P(X=x_i, Y=y)\]同様にして,$Y$ の周辺分布関数 $F_Y(y)$ は:\[F_Y(y) = P(Y \leq y) = \sum_{y_j \leq y} \sum_x P(X=x, Y=y_j)\]と表される.
連続型確率変数の場合:$X$ と $Y$ を連続型確率変数とし, $f(x,y)$ をその同時確率密度関数とする.このとき, $X$ の周辺分布関数 $F_X(x)$ は以下のように定義される:\[F_X(x) = P(X \leq x) = \int_{-\infty}^x \int_{-\infty}^{\infty} f(u,y) \, dy \, du\]同様にして,$Y$ の周辺分布関数 $F_Y(y)$ は:\[F_Y(y) = P(Y \leq y) = \int_{-\infty}^y \int_{-\infty}^{\infty} f(x,v) \, dx \, dv\]となる.
周辺分布関数は,例えば,$X$ と $Y$ を確率変数としたとき,$Y$ の値を無視して $X$ を1次元の確率変数としてみた場合の $X$ の分布ということができる.
なお,周辺分布関数は以下の性質を有する:
- $0 \leq F_X(x) \leq 1$, $0 \leq F_Y(y) \leq 1$ (すべての $x, y$ について)
- $\lim_{x \to -\infty} F_X(x) = 0$, $\lim_{y \to -\infty} F_Y(y) = 0$
- $\lim_{x \to \infty} F_X(x) = 1$, $\lim_{y \to \infty} F_Y(y) = 1$
- $F_X(x)$ と $F_Y(y)$ は単調非減少関数
なお周辺分布は,多次元の確率分布から1つの変数に着目し,他の変数の影響を考慮しつつその変数の累積分布を表現したものとなっている.これにより,特定の変数の振る舞いを他の変数とは独立に分析することが可能となる.
Mathematics is the language with which God has written the universe.