ゼロから作るDeep Learning ❹ ―強化学習編
本書は人気シリーズの第4弾で、強化学習をテーマにしています。外部ライブラリに頼らず、基本的な技術やアイデアをゼロから実装しながら学ぶスタイルを採用しています。理論と実践の両面から、強化学習の構成要素を丁寧に解説し、数式だけでなくコードを通じて理解を深めることができます。目次にはバンディット問題やマルコフ決定過程、ベルマン方程式などが含まれています。著者は人工知能の研究開発に従事する斎藤康毅氏です。
強化学習のイメージを掴むのに最適な本です。難しい理論や細かい実装テクニックなどは端折って、"強化学習って何をしているの?"を誤魔化すことなく0から説明しています。取り扱っているトピックの範囲は狭いですが、強化学習の基礎的なトピックに対して深く堅い普遍的な理解が得られます。 著者は他分野でもゼロつくシリーズとして高品質な書籍を量産していますが、こんなに広い分野に対して正しい解釈と体系を構築できることに畏怖の念を抱いてしまいます。
強化学習のイメージを掴むのに最適な本です。難しい理論や細かい実装テクニックなどは端折って、"強化学習って何をしているの?"を誤魔化すことなく0から説明しています。取り扱っているトピックの範囲は狭いですが、強化学習の基礎的なトピックに対して深く堅い普遍的な理解が得られます。 著者は他分野でもゼロつくシリーズとして高品質な書籍を量産していますが、こんなに広い分野に対して正しい解釈と体系を構築できることに畏怖の念を抱いてしまいます。