入門逆強化学習による報酬関数推定

■セミナーポイント

　強化学習は，a) システムに対する要求が明確である一方，b) それを満足するシステムの挙動の設計が困難な問題に対して有効なアプローチの1つです．ここで，a)のシステムに対する要求は，学習者の意思決定に対する評価である報酬関数によって表現されます．しかし，報酬関数は学習の安定性や効率などにも影響を与えるため，その設計は煩雑になりがちです．また，そもそもシステムに対する要求を報酬関数として書き下すことが困難な問題も存在します．

　このような背景から，手動で報酬関数を設計する代わりに他者の振る舞いを観測し，その振る舞いを説明する報酬関数を推定する，逆強化学習と呼ばれるアプローチが考案されました．本セミナーでは，強化学習の原理と特徴を俯瞰した上で，逆強化学習の基本的な考え方を解説します．また，代表的な逆強化学習手法及び関連する研究事例についても紹介します．受講者がご自身で逆強化学習を実装し，試していただくためのサポートとなるよう，基礎的な内容に重きを置いたセミナーを目指します．

■受講後、習得できること

逆強化学習の基本的な原理

代表的な逆強化学習手法の概要

報酬関数推定を介した強化学習の有用性と課題

【講師】

増山岳人　氏　名城大学　理工学部　電気電子工学科准教授　博士(工学)

< 講師紹介 >

■主経歴

　2013年　中央大学理工学部精密機械工学科　助教　2016年　名城大学理工学部電気電子工学科　准教授　現在に至る

■専門・得意分野

　知能ロボティクス・強化学習

■本テーマ関連の学会・協会・団体等

　ロボット学会、人工知能学会

【プログラム】

1 はじめに

2 強化学習
　　2.1 概要
　　2.2 問題設定
　　2.3 ベルマン方程式
　　2.4 離散系における強化学習
　　2.5 連続系における強化学習

3 逆強化学習
　　3.1 概要
　　3.2 強化学習と逆強化学習
　　3.3 問題設定
　　3.4 基本的な考え方
　　3.5 線形モデル
　　3.6 非線形モデル

4 研究事例の紹介

5 まとめ

【受講料】

・お1人受講の場合　46,000円[税別]／1名
・1口でお申込の場合　57,000円[税別]／1口（3名まで受講可能）

　受講申込ページで2～3名を同時に申し込んだ場合、自動的に1口申し込みと致します。　

※セミナーに申し込むにはものづくりドットコム会員登録が必要です

開催日時

2019/03/29（金）
10:30 ～ 16:30　
締めきりました

受講料

49,680円（税込）/人

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込

開催場所

東京都

主催者

株式会社トリケップス

キーワード

機械学習・ディープラーニング

このセミナーについて質問する

※セミナーに申し込むにはものづくりドットコム会員登録が必要です

開催日時

2019/03/29（金）
10:30 ～ 16:30　
締めきりました

受講料

49,680円（税込）/人

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込

開催場所

東京都

主催者

株式会社トリケップス

キーワード

機械学習・ディープラーニング

このセミナーについて質問する

自動化、ＤＸ化で注意すべき点、原理原則の理解とは
- 解説記事
自動作成ソフトや、DX技術の進化により、業務の効率化や工数削減が進んでいます。しかし全てを自動化し、人の判断や知識を排除することには疑...
プロダクト・データサイエンス：データ分析講座（その323）3つのDS
- 解説記事
企業内のデータサイエンス組織の1つの役割として、データサイエンス技術を、より良い商品の開発やより良いCX（カスタマー・エクスペリエンス...
【快年童子の豆鉄砲】（その１２８）定年熟練者の採用体制
- 解説記事
【目次】 1. はじめに中小企業が抱える喫緊の課題の最後は「熟練社員退職で技術知識の喪失」に対する解決手段です。一般的には、定年...
XRDの相対強度、構造因子:金属材料基礎講座(その132)
- 解説記事
【目次】 1. XRDの相対強度 XRDにおいて回折パターンの相対強度におよぼす影響は、次の6項目があります。 ...

小規模データに対する機械学習の効果的適用法

Pythonではじめる機械学習入門講座

ベイズ統計から学ぶ統計的機械学習

AIプログラミングができない要素技術者自身で開発できる人工知能技術～深層学習とMTシステムの基礎・学習データ最小化・開発実務応用入門～【AI構築デモ付き（希望者にAI構築・計算方法Excel資料提供）】

機械学習によるデータ分析の基礎知識と勘所

■AI活用人材育成講座■『機械学習（ディープラーニング）の基礎・活用・実践<全3回>』

機械学習を用いた画像認識技術の基礎とその応用

機械学習による適応的実験計画～ベイズ最適化の基礎と応用～

入門逆強化学習による報酬関数推定

■セミナーポイント

■受講後、習得できること

【講師】

< 講師紹介 >

【プログラム】

【受講料】

小規模データに対する機械学習の効果的適用法

Pythonではじめる機械学習入門講座

ベイズ統計から学ぶ統計的機械学習

AIプログラミングができない要素技術者自身で開発できる人工知能技術～深層学習とMTシステムの基礎・学習データ最小化・開発実務応用入門～【AI構築デモ付き（希望者にAI構築・計算方法Excel資料提供）】

品質問題をなくす設計と設計審査の考え方　”ＦＭＥＡ辞書”

徹底的に成功事例に学ぶ！「５Ｓの導入と強化」

「５Ｓ」の効果的活用と継続方法

新ビジネス・新商品開発　目からウロコのアイディア発想法　～異分野こそアイディアの宝庫～

品質問題の未然防止は難しくない！－品質工学の基本的な考え方－

ＱＦＤセミナー（基礎編）－その原点を考える

自動化、ＤＸ化で注意すべき点、原理原則の理解とは

プロダクト・データサイエンス：データ分析講座（その323）3つのDS

【快年童子の豆鉄砲】（その１２８）定年熟練者の採用体制

XRDの相対強度、構造因子:金属材料基礎講座(その132)

ものづくりセミナーサーチ

日本最大級の技術・生産セミナーポータルサイト

小規模データに対する機械学習の効果的適用法

Pythonではじめる機械学習入門講座

ベイズ統計から学ぶ統計的機械学習

AIプログラミングができない要素技術者自身で開発できる人工知能技術 ～深層学習とMTシステムの基礎・学習データ最小化・開発実務応用入門～【AI構築デモ付き（希望者にAI構築・計算方法Excel資料提供）】

機械学習によるデータ分析の基礎知識と勘所

■AI活用人材育成講座■『機械学習（ディープラーニング）の基礎・活用・実践<全3回>』

機械学習を用いた画像認識技術の基礎とその応用

機械学習による適応的実験計画 ～ベイズ最適化の基礎と応用～

入門 逆強化学習による報酬関数推定

■セミナーポイント

■受講後、習得できること

【講師】

< 講師紹介 >

【プログラム】

【受講料】

関連セミナー

小規模データに対する機械学習の効果的適用法

Pythonではじめる機械学習入門講座

ベイズ統計から学ぶ統計的機械学習

AIプログラミングができない要素技術者自身で開発できる人工知能技術 ～深層学習とMTシステムの基礎・学習データ最小化・開発実務応用入門～【AI構築デモ付き（希望者にAI構築・計算方法Excel資料提供）】

関連教材

品質問題をなくす設計と設計審査の考え方 ”ＦＭＥＡ辞書”

徹底的に成功事例に学ぶ！「５Ｓの導入と強化」

「５Ｓ」の効果的活用と継続方法

新ビジネス・新商品開発 目からウロコのアイディア発想法 ～異分野こそアイディアの宝庫～

品質問題の未然防止は難しくない！－品質工学の基本的な考え方－

ＱＦＤセミナー（基礎編）－その原点を考える

関連記事

自動化、ＤＸ化で注意すべき点、原理原則の理解とは

プロダクト・データサイエンス：データ分析講座（その323）3つのDS

【快年童子の豆鉄砲】（その１２８）定年熟練者の採用体制

XRDの相対強度、構造因子:金属材料基礎講座(その132)

ものづくりセミナーサーチ

日本最大級の技術・生産セミナーポータルサイト

AIプログラミングができない要素技術者自身で開発できる人工知能技術～深層学習とMTシステムの基礎・学習データ最小化・開発実務応用入門～【AI構築デモ付き（希望者にAI構築・計算方法Excel資料提供）】

機械学習による適応的実験計画～ベイズ最適化の基礎と応用～

入門逆強化学習による報酬関数推定

AIプログラミングができない要素技術者自身で開発できる人工知能技術～深層学習とMTシステムの基礎・学習データ最小化・開発実務応用入門～【AI構築デモ付き（希望者にAI構築・計算方法Excel資料提供）】

品質問題をなくす設計と設計審査の考え方　”ＦＭＥＡ辞書”

新ビジネス・新商品開発　目からウロコのアイディア発想法　～異分野こそアイディアの宝庫～