このセミナーへの申込みは終了しています。
以下の類似セミナーへのお申込みをご検討ください。
以下の類似セミナーへのお申込みをご検討ください。
小規模データに対する機械学習の効果的適用法
全国
55,000
2024-06-24
ベイズ統計から学ぶ統計的機械学習
全国
53,900
2024-05-23
■AI活用人材育成講座■『機械学習(ディープラーニング)の基礎・活用・実践<全3回>』
全国
165,000
2024-06-10
Pythonではじめる機械学習入門講座
全国
55,000
2024-06-18
機械学習を用いた画像認識技術の基礎とその応用
全国
57,200
2024-06-19
機械学習によるデータ分析の基礎知識と勘所
全国
25,300
機械学習/AIによる特許調査の高度化で実践するスマート特許戦略
全国
55,000
2024-06-18
世界初の深層学習法:浸透学習法(PLM:Percolative Learning Method)の原理と応用
全国
51,700
2024-05-16
逆強化学習・模倣学習の基礎と応用
開催日 |
10:30 ~ 16:30 締めきりました |
---|---|
主催者 | 株式会社トリケップス |
キーワード | 機械学習・ディープラーニング AI(人工知能) 情報技術 |
開催エリア | 全国 |
開催場所 | お好きな場所で受講が可能 |
機械学習・制御における逆強化学習の位置づけから、
逆強化学習の最近の話題までお話しします!
セミナー講師
下坂 正倫(しもさかまさみち)氏
セミナー受講料
お1人様受講の場合 51,700円[税込]/1名
1口でお申込の場合 62,700円[税込]/1口(3名まで受講可能)
受講申込ページで2~3名を同時に申し込んだ場合、自動的に1口申し込みと致します。
受講について
- 本セミナーの受講にあたっての推奨環境は「Zoom」に依存しますので、ご自分の環境が対応しているか、お申込み前にZoomのテストミーティング(http://zoom.us/test)にアクセスできることをご確認下さい。
- インターネット経由でのライブ中継ため、回線状態などにより、画像や音声が乱れる場合があります。講義の中断、さらには、再接続後の再開もありますが、予めご了承ください。
- 受講中の録音・撮影等は固くお断りいたします。
セミナープログラム
1 機械学習・制御における逆強化学習の位置づけ
1.1 機械学習における位置づけ
1.2 最適制御との接点
1.3 逆強化学習の応用分野・従来の時系列データ解析との違い
2 機械学習の基礎(概要)
2.1 識別的な機械学習の一般的な定式化
2.2 正則化付き経験損失最小化
2.3 典型的な識別問題(分類・回帰)の例
2.4 逆強化学習における問題設定
3 時系列データのモデリング:マルコフ決定過程と最適制御
3.1 時系列データモデリング
3.1.1 マルコフ過程・動的システム
3.2 報酬と紐付く時系列データモデリング
3.2.1 マルコフ決定過程
3.3 報酬関数最大化問題:最適制御・最適政策
3.4 ベルマン方程式・価値反復法
4 逆強化学習
4.1 逆強化学習の定式化
4.2 逆強化学習の損失関数の設計
4.3 逆強化学習のパラメータ最適化
5 逆強化学習の適用
5.1 逆強化学習の実装
5.2 研究事例から学ぶ逆強化学習の適用事例
5.2.1 マルコフ決定過程(状態空間・行動)の設計の実例
5.2.2 報酬関数設計の実例
6 逆強化学習の最近の話題
6.1 逆強化学習の高速化・高次元化・文脈の活用・
6.2 マルチエージェント問題・深層学習との融合・落穂拾い
7 まとめ
関連セミナー
小規模データに対する機械学習の効果的適用法
全国
55,000
2024-06-24
ベイズ統計から学ぶ統計的機械学習
全国
53,900
2024-05-23
■AI活用人材育成講座■『機械学習(ディープラーニング)の基礎・活用・実践<全3回>』
全国
165,000
2024-06-10
Pythonではじめる機械学習入門講座
全国
55,000
2024-06-18
機械学習を用いた画像認識技術の基礎とその応用
全国
57,200
2024-06-19
機械学習によるデータ分析の基礎知識と勘所
全国
25,300
機械学習/AIによる特許調査の高度化で実践するスマート特許戦略
全国
55,000
2024-06-18
世界初の深層学習法:浸透学習法(PLM:Percolative Learning Method)の原理と応用
全国
51,700
2024-05-16