よくわかる!強化学習の基礎とPythonによるアルゴリズム実装

49,500 円(税込)

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込 または、当日現金でのお支払い

このセミナーの申込みは終了しました。


よくある質問はこちら

このセミナーについて質問する
開催日 10:30 ~ 16:30 
締めきりました
主催者 サイエンス&テクノロジー株式会社
キーワード 機械学習・ディープラーニング   情報技術
開催エリア 東京都
開催場所 【港区】ビジョンセンター田町
交通 【JR】田町駅 【地下鉄】三田駅

例題やPythonを用いたプログラミング演習を通し、
強化学習がうまく働く仕組みや応用例を学ぶ!


人工知能が人間エキスパートを超える時代に! 
強化学習を使えば何でもできるのか? 苦手な応用分野はあるのか?
基本原理を理解し、Pythonによる強化学習アルゴリズムの実装を学ぶ!
 
このセミナーは【会場での受講】の他に、【WEBセミナー(アーカイブ:撮影した動画)】でのご受講が可能です。
※WEBセミナーは、セミナー終了10日後を目途に、10日間・動画をご視聴いただけます。

セミナー講師

奈良先端科学技術大学院大学 先端科学技術研究科 情報科学領域 准教授 吉本 潤一郎 氏
【経歴・研究、活動】
2002年 奈良先端科学技術大学院大学 情報科学研究科 博士後期課程修了、博士(工学)
機械学習、ニューロコンピューティング、計算神経科学などの研究に従事。
電子情報通信学会和文論文誌D編集副委員長、情報処理学会バイオ情報学研究会幹事、IEEE Computational Intelligence Society JAPAN CHAPTER Secretaryなどを担当。

セミナー受講料

49,500円( S&T会員受講料47,020円 )
(まだS&T会員未登録の方は、申込みフォームの通信欄に「会員登録情報希望」と記入してください。
詳しい情報を送付します。ご登録いただくと、今回から会員受講料が適用可能です。)
S&T会員なら、2名同時申込みで1名分無料
2名で 49,500円 (2名ともS&T会員登録必須/1名あたり定価半額24,750円)

【1名分無料適用条件】
※2名様ともS&T会員登録が必須です。
※同一法人内(グループ会社でも可)による2名同時申込みのみ適用いたします。
※3名様以上のお申込みの場合、1名あたり定価半額で追加受講できます。
※受講券、請求書は、代表者に郵送いたします。
※請求書および領収証は1名様ごとに発行可能です。
 (申込みフォームの通信欄に「請求書1名ごと発行」と記入ください。)
※他の割引は併用できません。

※テレワーク応援キャンペーン(1名受講)【Live配信/WEBセミナー受講限定】
1名申込みの場合:35,200円 ( S&T会員受講料 33,440円 ) 
※1名様でLive配信/WEBセミナーを受講する場合、上記特別価格になります。
※備考欄に【テレワーク応援キャンペーン】とご記入のうえお申込みください。
※他の割引は併用できません。

WEBセミナー:アーカイブ受講対応セミナー

※申込の際、備考欄に「会場受講」「WEBセミナー」のいずれかをご記入ください。
※【WEBセミナー】の申込み受付の締切日も、会場受講のセミナー開催日までです。ご注意ください。​

【WEBセミナー】をご選択の場合、以下の流れ・受講内容となります。
※会場で受講の場合、このサービスは付与されませんのでご注意ください。
・当日のセミナーを、後日にお手元のPCやスマホ・タブレッドなどからご視聴・学習することができます。
・後日(開催終了後から10日以内を目途)に、メールにてご連絡申し上げます。
・S&T会員マイページ(無料)にログインいただき、ご視聴ください。
・視聴期間は10日間です。ご視聴いただけなかった場合でも期間延長いたしませんのでご注意ください。
・セミナー資料は印刷・郵送いたします。
・このセミナーに関する質問に限り、後日に講師にメールで質問可能です。(テキストに講師の連絡先を掲載)

【WEBセミナー】をご希望の方は、下記受講条件をご確認ください。
(1)S&T会員登録が必須になります(マイページ機能を利用するため)
  映像視聴、各種データのダウンロードなどにS&T会員マイページ機能(無料)を利用します。
(2)動画視聴・インターネット環境をご確認ください
  セキュリティの設定や、動作環境によってはご視聴いただけない場合がございます。
  以下のサンプル動画が閲覧できるかを事前にご確認いただいたうえで、お申し込みください。 
   ≫ テスト視聴サイト【ストリーミング(HLS)を確認】  ≫ 視聴環境

セミナー趣旨

 強化学習とは環境とのインタラクションを通して試行錯誤的に最適な戦略や行動選択則を獲得する機械学習法の枠組みです。囲碁や将棋の世界では、人工知能が人間エキスパートを超えるようになり世の中を驚かせましたが、それには強化学習が大きな貢献を果たしました。では、強化学習を使えば何でもできるのでしょうか?それとも、強化学習にも苦手な応用分野はあるのでしょうか?それを知るには強化学習の基本原理を理解する必要があります。
 本講演では、簡単な例題やPythonを用いたプログラミング演習を通して、強化学習がうまく働く仕組みや応用例を解説するとともに、脳の情報処理との相同性や相違性をご紹介したいと思います。

習得できる知識

・強化学習を用いた研究開発に必要な最低限の基礎知識
・Python(Jupyter Notebook)を用いて強化学習アルゴリズムの実装する方法
・強化学習モデルを利用したヒトや動物の行動解析法
などの習得が期待されます。

セミナープログラム

1.はじめに
 1.1 例題から学ぶ機械学習と強化学習の位置づけ
 1.2 強化学習の歴史

2.強化学習の基礎理論
 2.1 マルコフ決定過程による問題の定式化とその解法
  2.1.1 マルコフ決定過程
  2.1.2 価値反復法
  2.1.3 方策反復法
 2.2 代表的な強化学習アルゴリズム
  2.2.1 モンテカルロ法
  2.2.2 TD学習法
  2.2.3 Q学習法
  2.2.4 SARSA法
  2.2.5 モデル同定型強化学習法
 2.3 アルゴリズム実装時に生じる諸問題とその解決法
  2.3.1 探索と知識利用のジレンマ
  2.3.2 メタ学習
  2.3.3 連続空間・高次元空間への対応とDQN

3.プログラミング演習:Pythonによる強化学習アルゴリズムの実装
  (※各項目の合間に演習も織り交ぜます)

4.強化学習の応用例
 4.1 ロボットの自動制御
 4.2 脳の意思決定モデルと行動解析

  □質疑応答・名刺交換□