Qwen3をvllmでserveしたいのにできなかったときに確認すること
最初に以下のエラーが発生しましたValueError: The checkpoint you are trying to load has model type qwen3 but Transformers does not recognize this architecture. Thi
最初に以下のエラーが発生しましたValueError: The checkpoint you are trying to load has model type qwen3 but Transformers does not recognize this architecture. Thi
以前見かけたこちらのリポジトリ (tascj/offload_adam)を、huggingface/transformersに実装されているTrainerを用いたFSDPと併用してみる話です。リポジトリ作者様による解説はこちらのリンクを参照ください。本記事のまとめtascj/of
大きな桁数の多倍長整数同士の乗算速度は、高速フーリエ変換を用いた畳み込みの速度に大きく依存します。今回は、高速フーリエ変換(FFT)を用いた乗算について、アルゴリズムや実装の工夫による実行速度の改善度合いを検証してまとめてみることにしました。本記事は個人的な記録であり、決して高速な実装ではない点に
大きなJSONファイルの読み書きをする必要があったので、Pythonから使える高速なJSONライブラリのベンチマークを行いました。比較対象のライブラリはChatGPT 4oを使って調査しました。この記事の結論書き込みを高速化したい→orjson読み込みを高速化したい→py
installなどで手間取った時にいちいち検索するのが面倒なので、自分用の備忘録として参考にした or 実際に行った解決方法をまとめようと思います。poetry installが全然終わらないときkeyringを読まないようにすればいい参考:https://qiita.co
量子コンピューターを用いた最適化アルゴリズムの一つに、Quantum Approximation Optimization Algorithm (QAOA) があります。このアルゴリズムは主にゲート型の量子コンピューターで動作するアルゴリズムであり、実行するには量子回路のシミュレーターもしくは本物
TL;DRtkinter >= 8.6を使えばpng画像を表示することができる手元環境がtkinter < 8.5の場合はbrew install tcl-tkの後Pythonを再インストールすることでtkinterのバージョンを更新できる前提計算機環境
raspberry piをクラスタ計算機として使ってみるために円周率計算のプログラムを作成していたところ、数学に現れる定数の計算速度を競うコンテストサイト(?)Constantを発見しました。 せっかくだし任意精度計算のためのプログラムから作ってみるか、ということで色々やってみたことを書きます。と
TL;DRXcodeをインストールし、コマンドラインツールの参照先を変更する。発生したエラーについて私の環境では、cargo run初回実行時に以下のようなエラーが発生し、rugのインストールが失敗しました。 checking for sysctlbyname..
今回はMPIを用いてChudnovskyの公式による円周率計算をマルチノード並列化できるようにしていきます。今回使用するのはMPI bindings for Rustです。(rustネイティブな分散並列用のクレートを知らないので、馴染みのあるMPIを選択しました。)実行環境は以下のとおりです。