定義:
ルートヴィヒ・ボルツマン[Ludwig Boltzmann]は19世紀の物理学者であり,統計力学の基礎を築いた人物.ボルツマンは,気体分子の運動やエネルギーの分布を説明するため,個々の粒子の運動を統計的に扱う方法を提案した.ボルツマンモデルは,この考え方を基にした数学的な枠組みである.
なお,可視変数[Visible Variables]は,モデルが直接観測可能な変数を指す.これらはデータとして提供され,モデルが学習や予測を行う際の入力となる.ボルツマンマシンにおいては,可視層に対応するノードが可視変数を表している.また,隠れ変数[Hidden Variablesは,モデル内部で推定される変数を指す.これらは直接観測されず,モデル内部での潜在的な特徴や構造を表す.隠れ変数は,可視変数の背後にあるパターンや関係性を表現するために利用される.
ボルツマンマシンのエネルギー関数 $E(\mathbf{v}, \mathbf{h})$ を可視変数 $\mathbf{v} = (v_1, v_2, \dots, v_m)$ と隠れ変数 $\mathbf{h} = (h_1, h_2, \dots, h_n)$ を明示する形で表現すると以下のようになる.\[E(\mathbf{v}, \mathbf{h}) = - \sum_{i,j} W_{ij} v_i h_j - \sum_{i} b_i v_i - \sum_{j} c_j h_j\]
ここで,$b_i$ は可視変数 $v_i$ のバイアス,$c_j$ は隠れ変数 $h_i$ のバイアスを示している.
ボルツマンマシンは,2024年にジェフリー・ヒントン[Geoffrey Everest Hinton,1947-12-06/]とともにノーベル物理学賞を受賞したJ.J.ホップフィールド[John Joseph Hopfield,1933-07-15/]によるポップフィールドネットワーク[Hopfield network]が元になっている.
ポップフィールドネットワークは,物理学におけるイジングモデルのスピンをノードに,スピン間相互作用をシナプス結合として解釈しなおしたものである.イジングモデルは隣接スピンの相互作用をエネルギー最小化の観点から記述することによって,磁性体の相転移現象を説明することに成功.これを連想記憶モデルへと拡張したのがホップフィールドネットワークである.
ヒントンは1983年にホップフィールドネットワークを確率的に拡張したモデルとしてボルツマンマシンを提案した.
これは,確率的な学習則を導入するものであった.
特性 | ボルツマンモデル | ニューラルネットワーク |
---|---|---|
数学的基盤 | エネルギーベースモデル 確率分布: $P(\mathbf{x}) = \frac{e^{-E(\mathbf{x})}}{Z} $ | 関数近似モデル 出力: $\mathbf{y} = f(\mathbf{x}; \theta)$ |
学習目的 | データの確率分布の学習 | 入力と出力の関係の学習 |
トレーニング方法 | コントラストダイバージェンス モンテカルロ法 | 誤差逆伝播法 勾配降下法 |
構造 | グラフィカルモデル 完全結合型(可視層と隠れ層) | 層構造 入力層、隠れ層、出力層 |
Mathematics is the language with which God has written the universe.