入門 逆強化学習による報酬関数推定

49,680 円(税込)

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込

このセミナーの申込みは終了しました。


よくある質問はこちら

このセミナーについて質問する
開催日 10:30 ~ 16:30 
締めきりました
主催者 株式会社トリケップス
キーワード 機械学習・ディープラーニング
開催エリア 東京都
開催場所 オームビル

■セミナーポイント

 強化学習は,a) システムに対する要求が明確である一方,b) それを満足するシステムの挙動の設計が困難な問題に対して有効なアプローチの1つです.ここで,a)のシステムに対する要求は,学習者の意思決定に対する評価である報酬関数によって表現されます.しかし,報酬関数は学習の安定性や効率などにも影響を与えるため,その設計は煩雑になりがちです.また,そもそもシステムに対する要求を報酬関数として書き下すことが困難な問題も存在します.
 このような背景から,手動で報酬関数を設計する代わりに他者の振る舞いを観測し,その振る舞いを説明する報酬関数を推定する,逆強化学習と呼ばれるアプローチが考案されました.本セミナーでは,強化学習の原理と特徴を俯瞰した上で,逆強化学習の基本的な考え方を解説します.また,代表的な逆強化学習手法及び関連する研究事例についても紹介します.受講者がご自身で逆強化学習を実装し,試していただくためのサポートとなるよう,基礎的な内容に重きを置いたセミナーを目指します.

■受講後、習得できること

  • 逆強化学習の基本的な原理
  • 代表的な逆強化学習手法の概要
  • 報酬関数推定を介した強化学習の有用性と課題

【講師】

増山 岳人 氏  名城大学 理工学部 電気電子工学科准教授 博士(工学)

< 講師紹介 >

■主経歴

 2013年 中央大学理工学部精密機械工学科 助教  2016年 名城大学理工学部電気電子工学科 准教授 現在に至る

■専門・得意分野

 知能ロボティクス・強化学習

■本テーマ関連の学会・協会・団体等

 ロボット学会、人工知能学会 

【プログラム】

1 はじめに
2 強化学習
  2.1 概要
  2.2 問題設定
  2.3 ベルマン方程式
  2.4 離散系における強化学習
  2.5 連続系における強化学習
3 逆強化学習
  3.1 概要
  3.2 強化学習と逆強化学習
  3.3 問題設定
  3.4 基本的な考え方
  3.5 線形モデル
  3.6 非線形モデル
4 研究事例の紹介
5 まとめ

【受講料】

・お1人受講の場合 46,000円[税別]/1名
・1口でお申込の場合 57,000円[税別]/1口(3名まで受講可能)

 受講申込ページで2~3名を同時に申し込んだ場合、自動的に1口申し込みと致します。