表現学習

Definition:

表現学習[feature learning]とは,データの表現方法と,その表現への変換方法を獲得する学習のことをいう.

表現学習[feature learning]の主な目的は,入力データを有用な表現空間[Representation Space]に変換することにある.

表現学習のプロセスを通じて,表現空間が形成される.この空間は,学習アルゴリズムによって発見された特徴や構造を反映したものとなる.

すなわち,$\mathcal{X}$ を入力空間, $Z$ を表現空間[特徴空間]とすると,表現学習は,\[f_{\theta}: \mathcal{X} \to \mathcal{Z}\]と表すことができる.

あらためて,ここで,

とする.

以上を用いて表現学習[feature learning]のフレームワークを考える.まず,入力空間から特徴空間への写像を考える.これは,すなわち,表現関数 $f_{\theta}$ によって,入力空間 $\mathcal{X}$ の要素を特徴空間 $\mathcal{Z}$ の要素に変換するということである.つまり,$\forall x \in \mathcal{X}, f_{\theta}(x) \in \mathcal{Z}$ .

目的関数 $\mathcal{L}(\theta)$ は,表現関数 $f_{\theta}$ によって生成された特徴の質を評価するものである.この評価は,タスク固有の損失 $\ell$ を通じて行われる.

最適化問題は,目的関数 $\mathcal{L}(\theta)$ を最小化するパラメータ $\theta$ を見つけることを目的とする.これにより,最適な表現関数 $f_{\theta}$ を得ることができる.

目的関数は,データ分布 $p(x,y)$ に関する期待値として定義される.これにより,学習された特徴が全データセットに対して一般化されることが期待される.

正則化項 $R(\theta)$ は,過学習を防ぎ,より汎化性能の高い表現を学習することが可能となる.

以上は,表現学習[feature learning]の一般的なフレームワークである.


INDEX





















無作為抽出 - 表現学習 - 表現空間 - Map-Reduce - Refine Chain