
★強化学習法の基礎、応用に向けた報酬の設計指針や対処法について解説
【Live配信】2025年11月11日(火) 10:30~16:30
【アーカイブ(録画)配信】 2025年11月20日まで受付(視聴期間:11月20日~11月30日まで)
セミナー趣旨
これまでのAIは用意された膨大なデータセットからデータ間に潜む関係性を見出すことが中心的な役割でした.これに対して,最近はロボットやゲームAIなどのエージェントが自ら試行錯誤して得た経験データに基づいて学習して,目的を達成できる行動のルール(方策)を獲得する強化学習への注目が高まっています.これは明示的な正解データを用意せずとも,望ましい結果を定量的に表すことでユーザーが思いもしない優れた方策を見出す事例が数多く報告され,家電からロボットまで幅広い分野で期待が高まっています.
本講座では,このような期待の技術である強化学習について,これまでのAIとは異なる学習方法が何故必要なのか?という根幹から,学習法の基礎を概説します.また,ロボットなどの機械制御への応用が特に期待される最新の強化学習アルゴリズムについてや,応用の際に悩みの種となりやすい報酬の設計指針や対処法についても、実際の応用事例と合わせて紹介します.
セミナープログラム
1.強化学習とは
1.1 強化学習の目的
1.2 マルコフ決定過程
1.3 学習すべき要素
2.学習アルゴリズムの基礎
2.1 価値関数の学習
2.2 方策関数の学習
2.3 深層強化学習でのテクニック
3.最新のActor-Criticアルゴリズム
3.1 改善へのエッセンス
3.2 方策更新の制限:TRPO/PPO
3.3 直接的な方策勾配の計算:DDPG/TD3
3.4 方策エントロピーの最大化:SQL/SAC
4.モデルベース強化学習
4.1 世界モデルの学習
4.2 世界モデルの活用法
4.3 既存モデルの活用法
5.報酬設計の課題と対策
5.1 疎な報酬
5.2 多目的性
5.3 エキスパートの模倣
5.4 学習難易度の調整
【質疑応答】
セミナー講師
国立情報学研究所 情報学プリンシプル研究系 助教 博士(工学) 小林 泰介 氏
セミナー受講料
1名につき55,000円(消費税込・資料付き)
〔1社2名以上同時申込の場合1名につき49,500円(税込)〕
受講について
セミナーの接続確認・受講手順はこちらをご確認下さい。
受講料
55,000円(税込)/人
※セミナーに申し込むにはものづくりドットコム会員登録が必要です
開催日時
10:30 ~
受講料
55,000円(税込)/人
※本文中に提示された主催者の割引は申込後に適用されます
※銀行振込
開催場所
全国
主催者
キーワード
機械学習・ディープラーニング
※セミナーに申し込むにはものづくりドットコム会員登録が必要です
開催日時
10:30 ~
受講料
55,000円(税込)/人
※本文中に提示された主催者の割引は申込後に適用されます
※銀行振込
開催場所
全国
主催者
キーワード
機械学習・ディープラーニング関連セミナー
もっと見る関連教材
もっと見る関連記事
もっと見る-
リスク管理におけるCRMとは?3つのCRMに学ぶ未来志向のリスク管理術
【目次】 【この記事で分かること】 リスク管理の鍵を握る3つの「CRM」の正体 顧客情報を守るCRM(Customer Rela... -
危険予知活動とは?AI時代の危険予知活動、人と技術が織りなす安全の未来
【目次】 【この記事で分かること】 なぜ今、危険予知(KY)活動が重要なのか? KY活動の基本原則と「4ラウンド... -
DfE(環境配慮設計)とは?メリットや手法、企業の取り組み事例まで徹底解説
【目次】 【この記事で分かること】 地球規模の環境問題の深刻化とDfEの関係 DfEの具体的な手法とプロセス DfEがなぜ... -
【比較解説】CNFとCNTの違いとは?次世代素材カーボンナノファイバーの特性・作り方・将来性を解説
【目次】 【この記事で分かること】 CNFの基本的な構造、汎用性の高さ、CNFの応用範囲 CNFはなぜ単位質量あたりの表面積...