ゼロから作るDeep Learning ❹ ―強化学習編

斎藤康毅

オライリージャパン

商品プロモーションを含む場合があります

音声合成 cnn ai 自然言語処理ディープラーニング directx bert 強化学習 opencv rnn 人工知能深層学習音声認識オートエンコーダ iq gan pytorch

本書は人気シリーズの第4弾で、強化学習をテーマにしています。外部ライブラリに頼らず、基本的な技術やアイデアをゼロから実装しながら学ぶスタイルを採用しています。理論と実践の両面から、強化学習の構成要素を丁寧に解説し、数式だけでなくコードを通じて理解を深めることができます。目次にはバンディット問題やマルコフ決定過程、ベルマン方程式などが含まれています。著者は人工知能の研究開発に従事する斎藤康毅氏です。

みんなのレビュー

けにけに

2024年9月6日19:57

★

強化学習のイメージを掴むのに最適な本です。難しい理論や細かい実装テクニックなどは端折って、"強化学習って何をしているの？"を誤魔化すことなく0から説明しています。取り扱っているトピックの範囲は狭いですが、強化学習の基礎的なトピックに対して深く堅い普遍的な理解が得られます。著者は他分野でもゼロつくシリーズとして高品質な書籍を量産していますが、こんなに広い分野に対して正しい解釈と体系を構築できることに畏怖の念を抱いてしまいます。

名無し

2024年9月6日19:53

★

ゼロから作るDeep Learning ❹ ―強化学習編

検索