逆強化学習・模倣学習の基礎と応用

【講師】

下坂正倫　氏　：東京工業大学　情報理工学院　情報工学系　准教授　博士(情報理工学) 　

【プログラム】

　　1. 機械学習・制御における逆強化学習の位置づけ
　　　1.1　機械学習における位置づけ
　　　1.2　最適制御との接点
　　　1.3　逆強化学習の応用分野・従来の時系列データ解析との違い

　　2. 機械学習の基礎 (概要)
　　　2.1　識別的な機械学習の一般的な定式化
　　　2.2　正則化付き経験損失最小化
　　　2.3　典型的な識別問題(分類・回帰)の例
　　　2.4　逆強化学習における問題設定

　　3. 時系列データのモデリング : マルコフ決定過程と最適制御
　　　3.1　時系列データモデリング
　　　　3.1.1.　マルコフ過程・動的システム
　　　3.2　報酬と紐付く時系列データモデリング
　　　　3.2.1　マルコフ決定過程
　　　3.3　報酬関数最大化問題 : 最適制御・最適政策
　　　3.4　ベルマン方程式・価値反復法

　　4. 逆強化学習
　　　4.1　逆強化学習の定式化
　　　4.2　逆強化学習の損失関数の設計
　　　4.3　逆強化学習のパラメータ最適化

　　5. 逆強化学習の適用
　　　5.1　逆強化学習の実装
　　　5.2　研究事例から学ぶ逆強化学習の適用事例
　　　　5.2.1　マルコフ決定過程(状態空間・行動)の設計の実例
　　　　5.2.2　報酬関数設計の実例

　　6. 逆強化学習の最近の話題
　　　逆強化学習の高速化・高次元化・文脈の活用・
　　　マルチエージェント問題・深層学習との融合・落穂拾い

　　7. まとめ

【受講料】

・お1人受講の場合　46,000円[税別]／1名
・1口でお申込の場合　57,000円[税別]／1口（3名まで受講可能）

※セミナーに申し込むにはものづくりドットコム会員登録が必要です

開催日時

2019/08/27（火）
10:30 ～ 16:30　
締めきりました

受講料

49,680円（税込）/人

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込

開催場所

東京都

主催者

株式会社トリケップス

キーワード

機械学習・ディープラーニング

このセミナーについて質問する

※セミナーに申し込むにはものづくりドットコム会員登録が必要です

開催日時

2019/08/27（火）
10:30 ～ 16:30　
締めきりました

受講料

49,680円（税込）/人

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込

開催場所

東京都

主催者

株式会社トリケップス

キーワード

機械学習・ディープラーニング

このセミナーについて質問する

普通の組織をイノベーティブにする処方箋 (その174)イノベーション創出
- 解説記事
【目次】　　【この連載の前回：普通の組織をイノベーティブにする処方箋 (その173)へのリンク】前回まで自分が生物...
シリカ、シリコン、シリコーンの違いをわかりやすく解説
- 解説記事
シリカ、シリコン、シリコーンこの単語、みなさんの生活の中で聞いたことがあるかと思います。みなさんは、この３つの違いがわかりますか？実は...
構造因子　面心立方格子:金属材料基礎講座(その134)
- 解説記事
◆ 構造因子　面心立方格子面心立方格子の構造因子を見てみます。面心立方格子の場合、立方格子の頂点の000と各面の中心1/2,1/2...
リフレーミングとは、メンタルモデルを変え、新しい視点や理解を生む
- 解説記事
清掃でメンタルモデルを変えると、職場清掃が意識改革と生産性向上をもたらします。清掃時間を通じたリフレーミングと、メンタルモデル変革を目...

■AI活用人材育成講座■『機械学習（ディープラーニング）の基礎・活用・実践<全3回>』

機械学習を用いた画像認識技術の基礎とその応用

小規模データに対する機械学習の効果的適用法

ベイズ統計から学ぶ統計的機械学習

Pythonではじめる機械学習入門講座

第一原理計算と機械学習を用いた材料設計～基礎原理から機械学習力場活用の最新動向まで～

機械学習によるデータ分析の基礎知識と勘所

機械学習による適応的実験計画～ベイズ最適化の基礎と応用～

逆強化学習・模倣学習の基礎と応用

【講師】

【プログラム】

【受講料】

■AI活用人材育成講座■『機械学習（ディープラーニング）の基礎・活用・実践<全3回>』

機械学習を用いた画像認識技術の基礎とその応用

小規模データに対する機械学習の効果的適用法

ベイズ統計から学ぶ統計的機械学習

品質問題をなくす設計と設計審査の考え方　”ＦＭＥＡ辞書”

徹底的に成功事例に学ぶ！「５Ｓの導入と強化」

「５Ｓ」の効果的活用と継続方法

新ビジネス・新商品開発　目からウロコのアイディア発想法　～異分野こそアイディアの宝庫～

品質問題の未然防止は難しくない！－品質工学の基本的な考え方－

ＱＦＤセミナー（基礎編）－その原点を考える

普通の組織をイノベーティブにする処方箋 (その174)イノベーション創出

シリカ、シリコン、シリコーンの違いをわかりやすく解説

構造因子　面心立方格子:金属材料基礎講座(その134)

リフレーミングとは、メンタルモデルを変え、新しい視点や理解を生む

ものづくりセミナーサーチ

日本最大級の技術・生産セミナーポータルサイト

■AI活用人材育成講座■『機械学習（ディープラーニング）の基礎・活用・実践<全3回>』

機械学習を用いた画像認識技術の基礎とその応用

小規模データに対する機械学習の効果的適用法

ベイズ統計から学ぶ統計的機械学習

Pythonではじめる機械学習入門講座

第一原理計算と機械学習を用いた材料設計 ～基礎原理から機械学習力場活用の最新動向まで～

機械学習によるデータ分析の基礎知識と勘所

機械学習による適応的実験計画 ～ベイズ最適化の基礎と応用～

逆強化学習・模倣学習の基礎と応用

【講師】

【プログラム】

【受講料】

関連セミナー

■AI活用人材育成講座■『機械学習（ディープラーニング）の基礎・活用・実践<全3回>』

機械学習を用いた画像認識技術の基礎とその応用

小規模データに対する機械学習の効果的適用法

ベイズ統計から学ぶ統計的機械学習

関連教材

品質問題をなくす設計と設計審査の考え方 ”ＦＭＥＡ辞書”

徹底的に成功事例に学ぶ！「５Ｓの導入と強化」

「５Ｓ」の効果的活用と継続方法

新ビジネス・新商品開発 目からウロコのアイディア発想法 ～異分野こそアイディアの宝庫～

品質問題の未然防止は難しくない！－品質工学の基本的な考え方－

ＱＦＤセミナー（基礎編）－その原点を考える

関連記事

普通の組織をイノベーティブにする処方箋 (その174)イノベーション創出

シリカ、シリコン、シリコーンの違いをわかりやすく解説

構造因子 面心立方格子:金属材料基礎講座(その134)

リフレーミングとは、メンタルモデルを変え、新しい視点や理解を生む

ものづくりセミナーサーチ

日本最大級の技術・生産セミナーポータルサイト

第一原理計算と機械学習を用いた材料設計～基礎原理から機械学習力場活用の最新動向まで～

機械学習による適応的実験計画～ベイズ最適化の基礎と応用～

品質問題をなくす設計と設計審査の考え方　”ＦＭＥＡ辞書”

新ビジネス・新商品開発　目からウロコのアイディア発想法　～異分野こそアイディアの宝庫～

構造因子　面心立方格子:金属材料基礎講座(その134)