逆強化学習入門～報酬関数推定を介した強化学習～【Web配信】

50,600 円（税込）

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込

このセミナーの申込みは終了しました。

よくある質問はこちら

このセミナーについて質問する

開催日	2020/10/28（水）10:30 ～ 2020/10/28（水）16:30　締めきりました
主催者	株式会社トリケップス
キーワード	機械学習・ディープラーニング AI（人工知能）
開催エリア	全国
開催場所	お好きな場所で受講が可能

強化学習の原理と特徴を俯瞰し、
逆強化学習の基本的な考え方を解説！
代表的な逆強化学習手法、関連する研究事例も紹介

受講者がご自身で逆強化学習を実装し、試していただくためのサポートとなるよう、
基礎的な内容に重きを置いたセミナーを目指します。

セミナー講師

増山岳人　氏
名城大学　理工学部　電気電子工学科　准教授　博士(工学)

■主経歴
　　2013年　中央大学理工学部精密機械工学科　助教
　　2016年　名城大学理工学部電気電子工学科　准教授　現在に至る
■専門・得意分野
　　知能ロボティクス・強化学習
■本テーマ関連の学会・協会・団体等
　　ロボット学会、人工知能学会

セミナー受講料

お1人様受講の場合　50,600円[税込]／1名
1口でお申込の場合　62,700円[税込]／1口（3名まで受講可能）

受講申込ページで2～3名を同時に申し込んだ場合、自動的に1口申し込みと致します。

受講について

本セミナーの受講にあたっての推奨環境は「Zoom」に依存しますので、ご自分の環境が対応しているか、お申込み前にZoomのテストミーティング（http://zoom.us/test）にアクセスできることをご確認下さい。
インターネット経由でのライブ中継ため、回線状態などにより、画像や音声が乱れる場合があります。講義の中断、さらには、再接続後の再開もありますが、予めご了承ください。
受講中の録音・撮影等は固くお断りいたします。

セミナー趣旨

　強化学習は、a) システムに対する要求が明確である一方、b) それを満足するシステムの挙動の設計が困難な問題に対して有効なアプローチの1つです。ここで、a)のシステムに対する要求は、学習者の意思決定に対する評価である報酬関数によって表現されます。しかし、報酬関数は学習の安定性や効率などにも影響を与えるため、その設計は煩雑になりがちです。また、そもそもシステムに対する要求を報酬関数として書き下すことが困難な問題も存在します。
　このような背景から、手動で報酬関数を設計する代わりに他者の振る舞いを観測し、その振る舞いを説明する報酬関数を推定する、逆強化学習と呼ばれるアプローチが考案されました。本セミナーでは、強化学習の原理と特徴を俯瞰した上で、逆強化学習の基本的な考え方を解説します。また、代表的な逆強化学習手法及び関連する研究事例についても紹介します。受講者がご自身で逆強化学習を実装し、試していただくためのサポートとなるよう、基礎的な内容に重きを置いたセミナーを目指します。

習得できる知識

・強化学習及び逆強化学習の基本的な原理
・代表的な逆強化学習手法の概要
・報酬関数推定を介した強化学習の有用性と課題

セミナープログラム

　　1 はじめに

　　2 強化学習
　　　　2.1 概要
　　　　2.2 問題設定
　　　　2.3 ベルマン方程式
　　　　2.4 離散系における強化学習
　　　　2.5 連続系における強化学習

　　3 逆強化学習
　　　　3.1 概要
　　　　3.2 強化学習と逆強化学習の関係
　　　　3.3 問題設定
　　　　3.4 基本的な考え方
　　　　3.5 線形モデル
　　　　3.6 非線形モデル

　　4 応用的な手法に関する研究事例の紹介

　　5 まとめ

小規模データに対する機械学習の効果的適用法

AIプログラミングができない要素技術者自身で開発できる人工知能技術 ～深層学習とMTシステムの基礎・学習データ最小化・開発実務応用入門～【AI構築デモ付き（希望者にAI構築・計算方法Excel資料提供）】

Pythonではじめる機械学習入門講座

ベイズ統計から学ぶ統計的機械学習

機械学習/AIによる特許調査の高度化で実践するスマート特許戦略

■AI活用人材育成講座■『機械学習（ディープラーニング）の基礎・活用・実践<全3回>』

世界初の深層学習法：浸透学習法（PLM:Percolative Learning Method）の原理と応用

機械学習によるデータ分析の基礎知識と勘所