★強化学習法の基礎、応用に向けた報酬の設計指針や対処法について解説
【Live配信】2025年11月11日(火) 10:30~16:30
【アーカイブ(録画)配信】 2025年11月20日まで受付(視聴期間:11月20日~11月30日まで)
セミナー趣旨
これまでのAIは用意された膨大なデータセットからデータ間に潜む関係性を見出すことが中心的な役割でした.これに対して,最近はロボットやゲームAIなどのエージェントが自ら試行錯誤して得た経験データに基づいて学習して,目的を達成できる行動のルール(方策)を獲得する強化学習への注目が高まっています.これは明示的な正解データを用意せずとも,望ましい結果を定量的に表すことでユーザーが思いもしない優れた方策を見出す事例が数多く報告され,家電からロボットまで幅広い分野で期待が高まっています.
本講座では,このような期待の技術である強化学習について,これまでのAIとは異なる学習方法が何故必要なのか?という根幹から,学習法の基礎を概説します.また,ロボットなどの機械制御への応用が特に期待される最新の強化学習アルゴリズムについてや,応用の際に悩みの種となりやすい報酬の設計指針や対処法についても、実際の応用事例と合わせて紹介します.
セミナープログラム
1.強化学習とは
1.1 強化学習の目的
1.2 マルコフ決定過程
1.3 学習すべき要素
2.学習アルゴリズムの基礎
2.1 価値関数の学習
2.2 方策関数の学習
2.3 深層強化学習でのテクニック
3.最新のActor-Criticアルゴリズム
3.1 改善へのエッセンス
3.2 方策更新の制限:TRPO/PPO
3.3 直接的な方策勾配の計算:DDPG/TD3
3.4 方策エントロピーの最大化:SQL/SAC
4.モデルベース強化学習
4.1 世界モデルの学習
4.2 世界モデルの活用法
4.3 既存モデルの活用法
5.報酬設計の課題と対策
5.1 疎な報酬
5.2 多目的性
5.3 エキスパートの模倣
5.4 学習難易度の調整
【質疑応答】
セミナー講師
国立情報学研究所 情報学プリンシプル研究系 助教 博士(工学) 小林 泰介 氏
セミナー受講料
1名につき55,000円(消費税込・資料付き)
〔1社2名以上同時申込の場合1名につき49,500円(税込)〕
受講について
セミナーの接続確認・受講手順はこちらをご確認下さい。
受講料
55,000円(税込)/人
※セミナーに申し込むにはものづくりドットコム会員登録が必要です
開催日時
10:30 ~
受講料
55,000円(税込)/人
※本文中に提示された主催者の割引は申込後に適用されます
※銀行振込
開催場所
全国
主催者
キーワード
機械学習・ディープラーニング
※セミナーに申し込むにはものづくりドットコム会員登録が必要です
開催日時
10:30 ~
受講料
55,000円(税込)/人
※本文中に提示された主催者の割引は申込後に適用されます
※銀行振込
開催場所
全国
主催者
キーワード
機械学習・ディープラーニング類似セミナー
関連セミナー
もっと見る関連教材
もっと見る関連記事
もっと見る-
CRA法(サイバーレジリエンス法)が求めるセキュリティ基準と罰則リスク、日本企業が取るべき防御と義務の全貌
【目次】 IoT機器から産業用システムに至るまで、あらゆるデジタル製品がネットワークに接続される現代において、サイバーセキュリティは... -
データパイプラインの設計と活用ガイド、収集・統合・分析・意思決定への道のりを解説
【目次】 現代社会は、情報技術の進化とデジタルトランスフォーメーション(DX)の波により、未曾有の「データ駆動型社会」へと変貌を遂げ... -
中小企業における調達購買の現実~兼務と属人化のリスク~
【目次】 昨今、原材料価格の高騰や急激な円安の進行、サプライチェーンの不安定化など、企業を取り巻く経営環境は厳しさを増しています。特... -
EVバスが街の電力基地に!EVバスのバッテリー活用術、V2Xが拓くスマートグリッドを解説
EVバス(いすゞエルガEV:東京都交通局):都庁総合ホームページより引用 【目次】 地球温暖化対策が待ったなしとされる現代において...





