逆強化学習・模倣学習の基礎と応用【Web配信】

51,700 円（税込）

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込

このセミナーの申込みは終了しました。

よくある質問はこちら

このセミナーについて質問する

開催日	2021/08/26（木）10:30 ～ 2021/08/26（木）16:30　締めきりました
主催者	株式会社トリケップス
キーワード	機械学習・ディープラーニング AI（人工知能）
開催エリア	全国
開催場所	お好きな場所で受講が可能

逆強化学習の基盤となる数理的な問題設定の基本を説明、アルゴリズムの実装方法や適用方法に焦点をあて解説！

応用事例も幅広く紹介する予定です

セミナー講師

下坂正倫（しもさかまさみち）　氏　
東京工業大学　情報理工学院　情報工学系　准教授（博士（情報理工学））

セミナー受講料

お1人様受講の場合　51,700円[税込]／1名
1口でお申込の場合　62,700円[税込]／1口（3名まで受講可能）

受講申込ページで2～3名を同時に申し込んだ場合、自動的に1口申し込みと致します。

受講について

本セミナーの受講にあたっての推奨環境は「Zoom」に依存しますので、ご自分の環境が対応しているか、お申込み前にZoomのテストミーティング（http://zoom.us/test）にアクセスできることをご確認下さい。
インターネット経由でのライブ中継ため、回線状態などにより、画像や音声が乱れる場合があります。講義の中断、さらには、再接続後の再開もありますが、予めご了承ください。
受講中の録音・撮影等は固くお断りいたします。

セミナー趣旨

逆強化学習は統計を基盤とした機械学習と最適制御の学際領域を担う、近年発達著しい研究領域である。強化学習が「成功」と「失敗」の繰り返しの経験から、ロボットに最適な動作を自律獲得させる学習の仕組みであるのに対し、逆強化学習は、明文化が難しい熟練者の巧みなスキルを機械に自律獲得させる、見まねを通じた学習の枠組みになっている。熟練者のうまみ＝「報酬」を、観察に基づき推定する枠組みとみなせるため、逆強化学習は、強化学習の逆問題に相当するものである。そのため逆強化学習は模倣学習と呼ばれるほか、逆最適制御とも呼ばれる。

本セミナーでは、逆強化学習の基盤となる数理的な問題設定の基本を説明するとともに、講師の研究室での経験を踏まえ、初学者が陥りがちな課題を整理し、逆強化学習アルゴリズムの実装方法やどのように適用するかに焦点をあて、説明を進めていく。その次に逆強化学習の応用事例を幅広く紹介する予定である。特に強化学習の実応用で問題となる報酬関数の設計など、明文化が難しいスキルの「コツ」といったものをモデル化することに適した技術であり、人行動のモデル化を中心とした話題を提供したいと考えている。例えば状況に応じた運転経路・目的地予測、人と人とのインタラクション行動の予測、運転の好みに応じた追い越し運転予測といった応用などを紹介する予定である。最後に、逆強化学習が抱える課題を共有し、この分野の発展につながればと考えている。　　　

習得できる知識

逆強化学習の問題設定が理解できる。
マルコフ決定過程・ベルマン方程式といった基礎が理解できる。
例題を通じて逆強化学習の実装方法が理解できる。
制御分野と機械学習の共通部分を理解できる。
逆強化学習の事例を知るとともに応用範囲のイメージが理解できる。

セミナープログラム

機械学習・制御における逆強化学習の位置づけ
1. 機械学習における位置づけ
2. 最適制御との接点
3. 逆強化学習の応用分野・従来の時系列データ解析との違い
機械学習の基礎 (概要)
1. 識別的な機械学習の一般的な定式化
2. 正則化付き経験損失最小化
3. 典型的な識別問題(分類・回帰)の例
4. 逆強化学習における問題設定
時系列データのモデリング : マルコフ決定過程と最適制御
1. 時系列データモデリング
  1. マルコフ過程・動的システム
2. 報酬と紐付く時系列データモデリング
  1. マルコフ決定過程
3. 報酬関数最大化問題 : 最適制御・最適政策
4. ベルマン方程式・価値反復法
逆強化学習
1. 逆強化学習の定式化
2. 逆強化学習の損失関数の設計
3. 逆強化学習のパラメータ最適化
逆強化学習の適用
1. 逆強化学習の実装
2. 研究事例から学ぶ逆強化学習の適用事例
  1. マルコフ決定過程(状態空間・行動)の設計の実例
  2. 報酬関数設計の実例
逆強化学習の最近の話題
1. 逆強化学習の高速化・高次元化・文脈の活用・
2. マルチエージェント問題・深層学習との融合・落穂拾い
まとめ

小規模データに対する機械学習の効果的適用法

ベイズ統計から学ぶ統計的機械学習

■AI活用人材育成講座■『機械学習（ディープラーニング）の基礎・活用・実践<全3回>』

Pythonではじめる機械学習入門講座

機械学習を用いた画像認識技術の基礎とその応用

機械学習によるデータ分析の基礎知識と勘所

機械学習/AIによる特許調査の高度化で実践するスマート特許戦略

世界初の深層学習法：浸透学習法（PLM:Percolative Learning Method）の原理と応用