逆強化学習・模倣学習の基礎と応用

【講師】


下坂 正倫 氏 : 東京工業大学 情報理工学院 情報工学系 准教授 博士(情報理工学)  


【プログラム】


  1. 機械学習・制御における逆強化学習の位置づけ
   1.1 機械学習における位置づけ
   1.2 最適制御との接点
   1.3 逆強化学習の応用分野・従来の時系列データ解析との違い

  2. 機械学習の基礎 (概要)
   2.1 識別的な機械学習の一般的な定式化
   2.2 正則化付き経験損失最小化
   2.3 典型的な識別問題(分類・回帰)の例
   2.4 逆強化学習における問題設定

  3. 時系列データのモデリング : マルコフ決定過程と最適制御
   3.1 時系列データモデリング
    3.1.1. マルコフ過程・動的システム
   3.2 報酬と紐付く時系列データモデリング
    3.2.1 マルコフ決定過程
   3.3 報酬関数最大化問題 : 最適制御・最適政策
   3.4 ベルマン方程式・価値反復法

  4. 逆強化学習
   4.1 逆強化学習の定式化
   4.2 逆強化学習の損失関数の設計
   4.3 逆強化学習のパラメータ最適化

  5. 逆強化学習の適用
   5.1 逆強化学習の実装
   5.2 研究事例から学ぶ逆強化学習の適用事例
    5.2.1 マルコフ決定過程(状態空間・行動)の設計の実例
    5.2.2 報酬関数設計の実例

  6. 逆強化学習の最近の話題
   逆強化学習の高速化・高次元化・文脈の活用・
   マルチエージェント問題・深層学習との融合・落穂拾い

  7. まとめ


【受講料】


・お1人受講の場合 46,000円[税別]/1名
・1口でお申込の場合 57,000円[税別]/1口(3名まで受講可能)


 


        


※セミナーに申し込むにはものづくりドットコム会員登録が必要です

開催日時


10:30

受講料

49,680円(税込)/人

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込

開催場所

東京都

主催者

キーワード

機械学習・ディープラーニング

※セミナーに申し込むにはものづくりドットコム会員登録が必要です

開催日時


10:30

受講料

49,680円(税込)/人

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込

開催場所

東京都

主催者

キーワード

機械学習・ディープラーニング

関連記事

もっと見る