Qwen3をvllmでserveしたいのにできなかったときに確認すること
最初に以下のエラーが発生しましたValueError: The checkpoint you are trying to load has model type qwen3 but Transformers does not recognize this architecture. Thi
最初に以下のエラーが発生しましたValueError: The checkpoint you are trying to load has model type qwen3 but Transformers does not recognize this architecture. Thi
以前見かけたこちらのリポジトリ (tascj/offload_adam)を、huggingface/transformersに実装されているTrainerを用いたFSDPと併用してみる話です。リポジトリ作者様による解説はこちらのリンクを参照ください。本記事のまとめtascj/of