入門逆強化学習による報酬関数推定

49,680 円（税込）

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込

このセミナーの申込みは終了しました。

よくある質問はこちら

このセミナーについて質問する

開催日	2019/03/29（金）10:30 ～ 2019/03/29（金）16:30　締めきりました
主催者	株式会社トリケップス
キーワード	機械学習・ディープラーニング
開催エリア	東京都
開催場所	オームビル

■セミナーポイント

　強化学習は，a) システムに対する要求が明確である一方，b) それを満足するシステムの挙動の設計が困難な問題に対して有効なアプローチの1つです．ここで，a)のシステムに対する要求は，学習者の意思決定に対する評価である報酬関数によって表現されます．しかし，報酬関数は学習の安定性や効率などにも影響を与えるため，その設計は煩雑になりがちです．また，そもそもシステムに対する要求を報酬関数として書き下すことが困難な問題も存在します．

　このような背景から，手動で報酬関数を設計する代わりに他者の振る舞いを観測し，その振る舞いを説明する報酬関数を推定する，逆強化学習と呼ばれるアプローチが考案されました．本セミナーでは，強化学習の原理と特徴を俯瞰した上で，逆強化学習の基本的な考え方を解説します．また，代表的な逆強化学習手法及び関連する研究事例についても紹介します．受講者がご自身で逆強化学習を実装し，試していただくためのサポートとなるよう，基礎的な内容に重きを置いたセミナーを目指します．

■受講後、習得できること

逆強化学習の基本的な原理
代表的な逆強化学習手法の概要
報酬関数推定を介した強化学習の有用性と課題

【講師】

増山岳人　氏　名城大学　理工学部　電気電子工学科准教授　博士(工学)

< 講師紹介 >

■主経歴

　2013年　中央大学理工学部精密機械工学科　助教　2016年　名城大学理工学部電気電子工学科　准教授　現在に至る

■専門・得意分野

　知能ロボティクス・強化学習

■本テーマ関連の学会・協会・団体等

　ロボット学会、人工知能学会

【プログラム】

1 はじめに

2 強化学習
　　2.1 概要
　　2.2 問題設定
　　2.3 ベルマン方程式
　　2.4 離散系における強化学習
　　2.5 連続系における強化学習

3 逆強化学習
　　3.1 概要
　　3.2 強化学習と逆強化学習
　　3.3 問題設定
　　3.4 基本的な考え方
　　3.5 線形モデル
　　3.6 非線形モデル

4 研究事例の紹介

5 まとめ

【受講料】

・お1人受講の場合　46,000円[税別]／1名
・1口でお申込の場合　57,000円[税別]／1口（3名まで受講可能）

　受講申込ページで2～3名を同時に申し込んだ場合、自動的に1口申し込みと致します。　

小規模データに対する機械学習の効果的適用法

Pythonではじめる機械学習入門講座

ベイズ統計から学ぶ統計的機械学習

AIプログラミングができない要素技術者自身で開発できる人工知能技術 ～深層学習とMTシステムの基礎・学習データ最小化・開発実務応用入門～【AI構築デモ付き（希望者にAI構築・計算方法Excel資料提供）】

機械学習によるデータ分析の基礎知識と勘所

■AI活用人材育成講座■『機械学習（ディープラーニング）の基礎・活用・実践<全3回>』

世界初の深層学習法：浸透学習法（PLM:Percolative Learning Method）の原理と応用

機械学習を用いた画像認識技術の基礎とその応用

入門 逆強化学習による報酬関数推定