ＩＴエンジニアのための強化学習理論入門―Ｐｙｔｈｏｎで学ぶアルゴリズムの動作原理

個数：

ＩＴエンジニアのための強化学習理論入門―Ｐｙｔｈｏｎで学ぶアルゴリズムの動作原理

中井悦司【著】
価格 ¥3,278（本体¥2,980）
技術評論社（2020/07発売）
ポイント 29pt

提携先に3冊在庫がございます。（2024年05月07日 00時11分現在）
通常、5～7日程度で出荷されます。
※納期遅延や、在庫切れで解約させていただく場合もございます。
※1回のご注文は10冊までとなります
出荷予定日とご注意事項
※上記を必ずご確認ください

【出荷予定日】
通常、5～7日程度で出荷されます。

【ご注意事項】 ※必ずお読みください
◆在庫数は刻々と変動しており、ご注文手続き中に減ることもございます。
◆在庫数以上の数量をご注文の場合には、超過した分はお取り寄せとなり日数がかかります。入手できないこともございます。
◆事情により出荷が遅れる場合がございます。
◆お届け日のご指定は承っておりません。
◆「帯」はお付けできない場合がございます。
◆画像の表紙や帯等は実物とは異なる場合があります。
◆特に表記のない限り特典はありません。
◆別冊解答などの付属品はお付けできない場合がございます。
●店舗受取サービス（送料無料）もご利用いただけます。
ご注文ステップ「お届け先情報設定」にてお受け取り店をご指定ください。尚、受取店舗限定の特典はお付けできません。詳細はこちら

サイズ A5判／ページ数 296p／高さ 22cm
商品コード 9784297115159
NDC分類 007.1
Cコード C3055

出版社内容情報

前作の『ITエンジニアのための機械学習理論入門』から、5年経過しましたが、AI（人工知能）や機械学習に対しての期待と関心はまったく衰えません。むしろ機械学習の利用はIT業界で当然のものとなり、さらなる活用がさまざまな場所で行われています。前作では一般的な機械学習について解説しましたが、試行錯誤しながら1つの解をもとめていく「強化学習理論」についてくわしく・やさしく解説します。理論を表現するいろいろな数式とそれらをプログラミングするためのPythonコードを並列しながらその理論の神髄にせまり、強化学習の基礎となるさまざまなアルゴリズムを体系的に学びます。

内容説明

強化学習の基礎となるアルゴリズムを体系的に学ぶ。

１　強化学習のゴールと課題（強化学習の考え方；実行環境のセットアップ；バンディットアルゴリズム（基本編）
バンディットアルゴリズム（応用編））
２　環境モデルを用いた強化学習の枠組み（マルコフ決定過程による環境のモデル化；エージェントの行動ポリシーと状態価値関数；動的計画法による状態価値関数の決定）
３　行動ポリシーの改善アルゴリズム（ポリシー反復法；価値反復法；より実践的な実装例）
４　サンプリングデータを用いた学習法（モンテカルロ法；ＴＤ（Ｔｅｍｐｏｒａｌ‐Ｄｉｆｆｅｒｅｎｃｅ）法）
５　ニューラルネットワークによる関数近似（ニューラルネットワークによる状態価値関数の計算；ニューラルネットワークを用いたＱ‐Ｌｅａｒｎｉｎｇ）

感想・レビュー

※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。

M_Study

最初は難解に感じるかもしれないが、数式とコードを照らし合わせて地道に一つずつ追いかけて行けば、強化学習の基礎は理解できる。Q学習は知っているけど、なぜあの数式の形になるか理解できない人におすすめ。Pythonに関する説明はあまり無いので、あらかじめ学習しておくことを推奨。2021/02/19

レビューを書く、レビューをもっと見る

外部のウェブサイトに移動します

よろしければ下記URLをクリックしてください。

https://bookmeter.com/books/16131973

ご注意事項

ご注意
リンク先のウェブサイトは、株式会社ブックウォーカーの提供する「読書メーター」のページで、紀伊國屋書店のウェブサイトではなく、紀伊國屋書店の管理下にはないものです。
この告知で掲載しているウェブサイトのアドレスについては、当ページ作成時点のものです。ウェブサイトのアドレスについては廃止や変更されることがあります。
最新のアドレスについては、お客様ご自身でご確認ください。
リンク先のウェブサイトについては、「株式会社ブックウォーカー」にご確認ください。

閉じる