これからの強化学習

個数:
電子版価格
¥4,620
  • 電書あり

これからの強化学習

  • ウェブストアに1冊在庫がございます。(2024年03月29日 07時14分現在)
    通常、ご注文翌日~2日後に出荷されます。
  • 出荷予定日とご注意事項
    ※上記を必ずご確認ください

    【ご注意事項】 ※必ずお読みください
    ◆在庫数は刻々と変動しており、ご注文手続き中に減ることもございます。
    ◆在庫数以上の数量をご注文の場合には、超過した分はお取り寄せとなり日数がかかります。入手できないこともございます。
    ◆事情により出荷が遅れる場合がございます。
    ◆お届け日のご指定は承っておりません。
    ◆「帯」はお付けできない場合がございます。
    ◆画像の表紙や帯等は実物とは異なる場合があります。
    ◆特に表記のない限り特典はありません。
    ◆別冊解答などの付属品はお付けできない場合がございます。
  • ●店舗受取サービス(送料無料)もご利用いただけます。
    ご注文ステップ「お届け先情報設定」にてお受け取り店をご指定ください。尚、受取店舗限定の特典はお付けできません。詳細はこちら
  • サイズ A5判/ページ数 313p/高さ 22cm
  • 商品コード 9784627880313
  • NDC分類 007.1
  • Cコード C3004

出版社内容情報

強化学習の「いま」を知り,「これから」を切り拓くための1冊.◆強化学習は「ポストビッグデータ」の技術である!
人工知能,金融工学,ロボット制御,言語処理,生産現場やサービスの最適化,あらゆる分野に応用が広がる強化学習.十分なデータが与えられることが前提とされる他の機械学習法と異なり,「足りないデータを集めながら最適化すること」に力点を置く強化学習は,ビッグデータの先を行くための重要な技術となることが期待されます.

◆強化学習の「いま」を知り,「これから」を切り拓くための1冊.
本書では,この分野を代表する執筆陣が集い,強化学習の基礎・発展・応用を多面的に解説します.
・基礎:強化学習の動作原理と基本アルゴリズムを,初学者でも分かるように導入.
・発展:より複雑な問題に対処し,高度な研究に進むための,さまざまな発展的手法を解説.
・応用:マルチロボットシステムの制御,対話処理,医療データ分析,囲碁の対局など広範な応用例・研究事例を通して,強化学習の活用法を紹介.人間の行動や脳の動作を説明するモデルとしての理論・実験も解説.

――強化学習の基礎を学びたい方,発展的手法に触れたい方,応用可能性を一望したい方に最適な1冊!

第1章 強化学習の基礎的理論
強化学習とは/強化学習の構成要素/価値関数に基づくアルゴリズム/改善に基づくアルゴリズム/部分観測マルコフ決定過程と強化学習

第2章 強化学習の発展的理論
統計学習の観点から見たTD学習/強化学習アルゴリズムの理論性能解析とベイズ統計による強化学習のモデル化/逆強化学習/試行錯誤回数の低減を指向した手法:経験強化型学習XoL/群強化学習法/リスク考慮型強化学習/複利型強化学習

第3章 強化学習の工学応用
高次元・実環境における強化学習/連続的な状態・行動空間への拡張:マルチロボットシステムへの適用/対話処理における強化学習/マルチエージェント系の報酬設計/自然言語処理における逆強化学習・模倣学習の適用/医療臨床データ分析への応用/深層学習を用いたQ関数の学習:Atariと囲碁への応用

第4章 知能のモデルとしての強化学習
脳の意思決定機構と強化学習/内発的動機付けによるエージェントの学習と発達

牧野 貴樹[マキノタカキ]
グーグル株式会社   博(理)

澁谷 長史[シブヤタケシ]
筑波大学 助教 博(工)

白川 真一[シラカワシンイチ]
横浜国立大学 講師 博(工)

浅田 稔[アサダミノル]
大阪大学 教授 工博

麻生 英樹[アソウヒデキ]
産業技術総合研究所

荒井 幸代[アライサチヨ]
千葉大学 教授 博士(工学)

飯間 等[イイマヒトシ]
京都工芸繊維大学 准教授 博(工)

伊藤 真[イトウマコト]
沖縄科学技術大学院大学 博(情報科学)

大倉 和博[オオクラカズヒロ]
広島大学 教授 博(工)

黒江 康明[クロエヤスアキ]
京都工芸繊維大学 教授 学術博士

杉本 徳和[スギモトノリカズ]
情報通信研究機構 博(工)

坪井 祐太[ツボイユウタ]
日本IBM東京基礎研究所 博(工)

銅谷 賢治[ドウヤケンジ]
沖縄科学技術大学院大学 教授 博(工)

前田 新一[マエダシンイチ]
京都大学 助教 博(理)

松井 藤五郎[マツイトウゴロウ]
中部大学 准教授 博(工)

南 泰浩[ミナミヤスヒロ]
電気通信大学 教授 工博

宮崎 和光[ミヤザキカズテル]
独立行政法人大学改革支援・学位授与機構 准教授 博(工)

目黒 豊美[メグロトヨミ]
NTTコミュニケーション科学基礎研究所

森村 哲郎[モリムラテツロウ]
日本IBM東京基礎研究所 博(工)

森本 淳[モリモトジュン]
ATR脳情報研究所 博(工)

保田 俊行[ヤスダトシユキ]
広島大学 助教 博(工)

吉本 潤一郎[ヨシモトジュンイチロウ]
奈良先端科学技術大学院大学 准教授 博(工)

内容説明

ロボット制御、金融工学、言語処理、生産現場やサービスの最適化、最強の囲碁AIまで、あらゆる分野で威力を発揮しつつある強化学習。分野を代表する執筆陣が集い、その基礎・発展・応用を多面的に解説する。

目次

第1章 強化学習の基礎的理論(強化学習とは;強化学習の構成要素 ほか)
第2章 強化学習の発展的理論(統計学習の観点から見たTD学習;強化学習アルゴリズムの理論性能解析とベイズ統計による強化学習のモデル化 ほか)
第3章 強化学習の工学応用(高次元・実環境における強化学習;連続的な状態・行動空間への拡張:マルチロボットシステムへの適用 ほか)
第4章 知能のモデルとしての強化学習(脳の意思決定機構と強化学習;内発的動機付けによるエージェントの学習と発達)

感想・レビュー

※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。

カラクリ

3
強化学習と機械学習とかがどのような関係にあるのかあまり理解できなかったため読んだ本。そのため、途中の計算式はけっこう読み飛ばした。それぞれの目的は、機械学習は「知識」、強化学習は「経験」を得ることだと理解した。機械学習だけでは、過去のデータから学んだ最良の手を打つことしかできないが、強化学習をすることで、学んだ以上の手を打つことができる。そんなイメージ。2017/03/18

おしるこ

1
1章まで読了 著者が複数いるため、内容に矛盾が起きていたら、同じ内容が書かれたりしていることがある。 また、内容に関しては初学者には少し難しいような気がする。深層学習のところでは変数名の意味が書かれていなかったり図表が少なかったりしてWebで公開されている記事よりも劣るように感じる。2018/03/15

Hikaru Yakushiji

0
最近、本でないものばっかり読んでた。ひさひざに全部読んだ本。2018/04/16

yorip

0
不確かなときは楽観的に。わかりそうなところから読む方がいいかも。初めから貪欲に行くよりは、εグリーディな読み方が良い。本の読み方さえもこの本の中に書いてあったとは。ロボットインテリジェンスを読んで強化学習わかった気になってたが、本書を読むとまだまだ浅瀬にしか入ってなかったんだなと思った。だいたいの本はQ学習だけやって終わりのものが多いが、この本は違う。強化学習マニアになりたい人向けだ。2018/01/23

外部のウェブサイトに移動します

よろしければ下記URLをクリックしてください。

https://bookmeter.com/books/11175721
  • ご注意事項

    ご注意
    リンク先のウェブサイトは、株式会社ブックウォーカーの提供する「読書メーター」のページで、紀伊國屋書店のウェブサイトではなく、紀伊國屋書店の管理下にはないものです。
    この告知で掲載しているウェブサイトのアドレスについては、当ページ作成時点のものです。ウェブサイトのアドレスについては廃止や変更されることがあります。
    最新のアドレスについては、お客様ご自身でご確認ください。
    リンク先のウェブサイトについては、「株式会社ブックウォーカー」にご確認ください。