Python 2025.12.05 0 BF16に対応したOptimizerを用いてFSDPを用いた並列学習を高速化する 以前見かけたこちらのリポジトリ (tascj/offload_adam)を、huggingface/transformersに実装されているTrainerを用いたFSDPと併用してみる話です。リポジトリ作者様による解説はこちらのリンクを参照ください。本記事のまとめtascj/of