【サーベイ編】深層強化学習を使ってTSPを解く
深層強化学習を用いたTSP・VRPの解法について調査する機会があったのでまとめます。TSP(巡回セールスマン問題)やVRP(配送経路問題)がどういう問題か、ということは知っている前提で話を進めます。対象とする手法・問題対象の問題今回対象となる問題は、2次元のユークリッドTS
深層強化学習を用いたTSP・VRPの解法について調査する機会があったのでまとめます。TSP(巡回セールスマン問題)やVRP(配送経路問題)がどういう問題か、ということは知っている前提で話を進めます。対象とする手法・問題対象の問題今回対象となる問題は、2次元のユークリッドTS
NP困難な最適化問題として知られる巡回セールスマン問題を、複数の近似解法と厳密解法を使って解いてみました。使用した解法は以下の4個です。整数計画問題(MTZ制約を使用、厳密解法)遺伝的アルゴリズム(近似解法)焼きなまし法(近似解法)2-opt(山登り法として実装、近似解法)実装はp
概要この記事では、焼きなまし法を支える理論について数学的な側面から解説することを目指します。焼きなまし法をマルコフ過程としてモデリングすることにより、アルゴリズムが大域的最適解に収束するための条件について調べよう、と言うのが全体的な流れです。連続と離散のギャップにより、ここで紹介する最適解
キーワード:最適化・近似解法・マルコフ過程Simulated Annealingってなに?日本語では擬似焼きなまし法とも呼ばれる、最適化問題に対する近似解法の一つで物性物理学における焼きなましからのアナロジーによって設計されています。温度パラメーターによって状態遷移を管理し