ハートビート管理

summary:

ハートビート管理[Heartbeat]とは,クラスタシステムや高可用性[HA]構成において,ノード同士がお互いの生存状態を監視するための通信機構である.具体的には,クラスタを構成する各ノードが定期的に短いメッセージ[ハートビート信号]を送受信することで,システム内の各ノードの稼働状態をリアルタイムに把握する仕組みである.

ハートビート管理は以下の要素から構成される.

ハートビート管理は,1980年代後半から1990年代初頭にかけて,エンタープライズシステムにおける可用性要件の高まりとともに発展した.初期のハートビート機構は単純なシリアル通信やUDP/IPパケットベースの実装が主流であった.1990年代中盤には,IBM ClusterやDigital Equipment Corporation[後のHP]のTruClusterなどの商用クラスタソリューションに組み込まれ,標準的な高可用性技術として確立された.

2000年代に入ると,オープンソースの領域でもHeartbeat[後のLinux-HA]プロジェクトやPacemakerなどのクラスタリングソフトウェアが登場し,ハートビート管理技術は広く普及した.最近のクラウドネイティブ環境では,Kubernetes等のコンテナオーケストレーションシステムにおいても,コンテナの健全性チェックや管理のために類似の技術が採用されている.

ハートビート管理の実装方式は,単一のネットワーク経路でのUDPパケット交換から,冗長化された複数経路[ネットワーク・シリアル通信・共有ディスク等]を併用するものまで多様である.また,障害検知の精度向上のために,単純なタイムアウト方式だけでなく,適応型のタイムアウト値調整やGossipプロトコルのような高度な障害検知アルゴリズムが採用されることもある.

Mathematics is the language with which God has written the universe.





















KubeDB Operator GDDR SRAM フリップフロップ L4Sアーキテクチャ レジスタ