強化学習の基礎と実践

～基本アルゴリズム等の理解から実環境への適用、応用事例まで～

★ 機械学習の中でも注目を集める「強化学習」の基礎知識習得・パラメーターのチューニングから深層強化学習まで！

★ 最近の研究・応用動向をふまえ解説します！

講師

中部大学生命健康科学部臨床工学科／工学部情報工学科
准教授博士（工学）松井藤五郎先生

受講料

1名41,040円(税込（消費税8％）、資料付)
＊1社2名以上同時申込の場合、1名につき30,240円
＊学校法人割引；学生、教員のご参加は受講料50％割引。

セミナーポイント

　Googleの子会社のDeepMindが開発したコンピューター囲碁プログラムAlpha Goが囲碁の世界チャンピオンに勝利して話題となった。このAlpha Goの学習に用いられていたのがDeep Q-Network (DQN)と呼ばれる深層強化学習アルゴリズムである。
　本セミナーでは、強化学習の基礎的な知識を解説し、その実際のパラメーターのチューニング法から実環境への適用、深層強化学習等の最近の研究動向、最新の応用事例等について紹介する。

○受講対象：
・強化学習に関心がある方
・ロボット制御に携わっている方
・強化学習の導入にお困りの方
など

○受講後、習得できること：
・強化学習の基礎知識
・強化学習の適用方法
・強化学習パラメーターのチューニング方法
・深層強化学習・ロボット制御等、最近の研究・応用動向
など

セミナー内容

1.はじめに
　(ア) 強化学習研究の歴史
　(イ) 強化学習研究の最新動向

2.強化学習の基礎
　(ア) 強化学習の枠組み
　　① 学習エージェント
　　② 環境
　　③ エージェントと環境の相互作用
　(イ) 強化学習の環境
　　① マルコフ決定過程 (MDPs)
　　② 決定的環境
　　③ 確率的環境
　　④ 例：n本腕バンディット問題
　　⑤ 例：迷路問題
　(ウ) 学習エージェントの行動選択法
　　① 一様ランダム選択
　　② グリーディー選択
　　③ ε-グリーディー選択
　　④ ソフトマックス選択

3.基本的な強化学習アルゴリズム
　(ア) Q学習
　(イ) Sarsa
　(ウ) Profit Sharing (PS)
　(エ) OnPS

4.強化学習パラメーターのチューニング
　(ア) ステップサイズα
　(イ) 割引率γ
　(ウ) ε-グリーディー選択のε
　(エ) ソフトマックス選択の温度T

5.実環境への応用
　(ア) 関数近似：連続値で表される状態
　(イ) 例題：車の山登り問題
　(ウ) 部分観測マルコフ決定過程 (POMDPs)
　(エ) マルチエージェント強化学習
　(オ) どの手法を選択・適用したら良いか？その考え方

6.最新の強化学習
　(ア) 複利型強化学習：金融市場で用いる強化学習
　　① 例：マネーホイール選択問題
　　② 利益率の複利効果
　　③ 投資比率
　　④ 複利型Q学習
　　⑤ 投資比率の最適化
　(イ) 深層強化学習：最強のコンピューター囲碁プログラムで用いられた学習
　　① 深層学習（ディープラーニング）
　　② Deep Q-Network (DQN)アルゴリズム
　　③ 深層強化学習のポイント
　(ウ) 多目的強化学習：複数の目的を同時に最適化
　(エ) 安全な強化学習：失敗できない環境での学習

7.応用事例
　(ア) ロボットの制御
　　① センサー情報（状態）とモーター制御（行動）
　　② ロボットの危険回避行動
　　③ LEGOロボット制御の実例
　(イ) ブラックジャック
　(ウ) 株（国債、外国為替）の銘柄選択、株（国債）の自動取引
　(エ) その他、考えられる応用分野

8.まとめ

＜質疑応答＞

＊小項目については変更する可能性があります。

※セミナーに申し込むにはものづくりドットコム会員登録が必要です

開催日時

2018/01/29（月）
12:30 ～ 16:30　
締めきりました

受講料

41,040円（税込）/人

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込

開催場所

東京都

MAP

【北区】北とぴあ

【JR・地下鉄】王子駅【都電】王子駅前

主催者

株式会社情報機構

キーワード

機械学習・ディープラーニング

このセミナーについて質問する

※セミナーに申し込むにはものづくりドットコム会員登録が必要です

開催日時

2018/01/29（月）
12:30 ～ 16:30　
締めきりました

受講料

41,040円（税込）/人

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込

開催場所

東京都

MAP

【北区】北とぴあ

【JR・地下鉄】王子駅【都電】王子駅前

主催者

株式会社情報機構

キーワード

機械学習・ディープラーニング

このセミナーについて質問する

シリカとタイヤ、添加剤ホワイトカーボンとは、わかりやすく解説
- 解説記事
【目次】 1. タイヤとシリカタイヤは、自動車はもとより自転車、バイク、飛行機、鉄道にも使われていて、みなさんの生活には無くては...
新規事業創出、カスタマイズされたコンサルティングで目指す成功への道
- 解説記事
◆ 新規事業の生み出し方新規事業のコンサルティングサービスは、大手コンサルティング会社のものとは異なり、そ...
多重度因子、かたより因子:金属材料基礎講座(その135)
- 解説記事
【目次】 1. 多重度因子回折が例えば(100)で起こる時、同じ面間隔を持つ(010)、(001)などの面も同様に回折を起こしま...
情報の関係性を意識した話し方とは、学習効果を最大化する伝え方
- 解説記事
【目次】 1. 学習効果を最大化する伝え方とにかくつまらない。話がダラダラ続く。テキストに書いてあることを読み続ける...

■AI活用人材育成講座■『機械学習（ディープラーニング）の基礎・活用・実践<全3回>』

Pythonではじめる機械学習入門講座

機械学習を用いた画像認識技術の基礎とその応用

機械学習によるデータ分析の基礎知識と勘所

ベイズ統計から学ぶ統計的機械学習

小規模データに対する機械学習の効果的適用法

第一原理計算と機械学習を用いた材料設計～基礎原理から機械学習力場活用の最新動向まで～

■AI活用人材育成講座<第1回>■『Python基礎と機械学習基礎』

強化学習の基礎と実践

～基本アルゴリズム等の理解から実環境への適用、応用事例まで～

講師

受講料

セミナーポイント

セミナー内容

■AI活用人材育成講座■『機械学習（ディープラーニング）の基礎・活用・実践<全3回>』

Pythonではじめる機械学習入門講座

機械学習を用いた画像認識技術の基礎とその応用

機械学習によるデータ分析の基礎知識と勘所

品質問題をなくす設計と設計審査の考え方　”ＦＭＥＡ辞書”

徹底的に成功事例に学ぶ！「５Ｓの導入と強化」

「５Ｓ」の効果的活用と継続方法

新ビジネス・新商品開発　目からウロコのアイディア発想法　～異分野こそアイディアの宝庫～

品質問題の未然防止は難しくない！－品質工学の基本的な考え方－

ＱＦＤセミナー（基礎編）－その原点を考える

シリカとタイヤ、添加剤ホワイトカーボンとは、わかりやすく解説

新規事業創出、カスタマイズされたコンサルティングで目指す成功への道

多重度因子、かたより因子:金属材料基礎講座(その135)

情報の関係性を意識した話し方とは、学習効果を最大化する伝え方

ものづくりセミナーサーチ

日本最大級の技術・生産セミナーポータルサイト

■AI活用人材育成講座■『機械学習（ディープラーニング）の基礎・活用・実践<全3回>』

Pythonではじめる機械学習入門講座

機械学習を用いた画像認識技術の基礎とその応用

機械学習によるデータ分析の基礎知識と勘所

ベイズ統計から学ぶ統計的機械学習

小規模データに対する機械学習の効果的適用法

第一原理計算と機械学習を用いた材料設計 ～基礎原理から機械学習力場活用の最新動向まで～

■AI活用人材育成講座<第1回>■『Python基礎と機械学習基礎』

強化学習の基礎と実践

～ 基本アルゴリズム等の理解から実環境への適用、応用事例まで ～

講師

受講料

セミナーポイント

セミナー内容

関連セミナー

■AI活用人材育成講座■『機械学習（ディープラーニング）の基礎・活用・実践<全3回>』

Pythonではじめる機械学習入門講座

機械学習を用いた画像認識技術の基礎とその応用

機械学習によるデータ分析の基礎知識と勘所

関連教材

品質問題をなくす設計と設計審査の考え方 ”ＦＭＥＡ辞書”

徹底的に成功事例に学ぶ！「５Ｓの導入と強化」

「５Ｓ」の効果的活用と継続方法

新ビジネス・新商品開発 目からウロコのアイディア発想法 ～異分野こそアイディアの宝庫～

品質問題の未然防止は難しくない！－品質工学の基本的な考え方－

ＱＦＤセミナー（基礎編）－その原点を考える

関連記事

シリカとタイヤ、添加剤ホワイトカーボンとは、わかりやすく解説

新規事業創出、カスタマイズされたコンサルティングで目指す成功への道

多重度因子、かたより因子:金属材料基礎講座(その135)

情報の関係性を意識した話し方とは、学習効果を最大化する伝え方

ものづくりセミナーサーチ

日本最大級の技術・生産セミナーポータルサイト

第一原理計算と機械学習を用いた材料設計～基礎原理から機械学習力場活用の最新動向まで～

～基本アルゴリズム等の理解から実環境への適用、応用事例まで～

品質問題をなくす設計と設計審査の考え方　”ＦＭＥＡ辞書”

新ビジネス・新商品開発　目からウロコのアイディア発想法　～異分野こそアイディアの宝庫～