summary:
GPUは複数のSMを備え,それぞれが独立して並列に計算を実行することで,高いスループットを実現する.SMは,CUDAコア,テンソルコア,特殊演算ユニットなどの計算リソースを内包し,スレッドブロック単位で割り当てられたワークロードを効率的に処理する役割を担う.
SMは,NVIDIA GPUアーキテクチャの中核をなす構造であり,CUDA[Compute Unified Device Architecture]プログラミングモデルにおいては,スレッドブロックが実行される物理的な単位となる.各SMは,独自のスケジューラ,レジスタファイル,命令キャッシュ,データキャッシュ,共有メモリを備えており,これらのリソースを活用することで,複数のスレッドワープを同時に管理・実行する.SMの設計はアーキテクチャの進化に伴い改良され,より多くのCUDAコアやテンソルコア,高速メモリを統合することで,演算性能とエネルギー効率の向上が図られている.
なお,GPUのSMはCPUのALU[Arithmetic Logic Unit, 算術論理演算装置]に相当するものではなく,CPUのコアに近い概念である.
Mathematics is the language with which God has written the universe.