
深層学習によるVisionandLanguageの最前線 ~Transformerの基本的な仕組みから画像認識やVisionandLanguage分野における最新の研究動向について~
Transformerの基本的な仕組みから始まり、画像認識やVision and Language分野における最新の研究動向について解説!
セミナー趣旨
Transformerの登場以来、画像認識と自然言語処理の融合領域(Vision and Language)の研究が急速に進んでおり、様々な応用がなされている。本講座では、Transformerの基本的な仕組みから始まり、画像認識やVision and Language分野における最新の研究動向について解説する。
受講対象・レベル
・深層学習による画像認識の最新動向を把握したい方
・画像と言語の融合領域の最新動向を把握したい方
・Transformerの基礎を知りたい方
必要な予備知識
深層学習、機械学習に関する最低限の知識
習得できる知識
・Transformerの基本的な知識
・画像認識、Vision and Language分野における最新の研究動向
セミナープログラム
1. Vision and Languageにおける深層学習の現在
1.1 画像付き質問応答でヒトの性能を超えた
1.2 非常に高精細な画像生成も可能に
1.3 そのほか最新の研究紹介
2. Transformerの基礎
2.1 基本構成
2.2 注意機構(attention)
2.3 Encoder/Decoder
2.4 BERTによる革新
① BERTの基礎
② BERTの学習方法
③ BERTの応用
2.5 GPT-3の衝撃
① 言語モデルの基礎
② GPT-1/2/3の学習方法
③ GPT-1/2/3の応用(zero/few-shot learning)
2.6 Vision Transformerの基礎
① 基本構成
② DeiT
③ Swin Transformer
④ そのほか最新の研究紹介
3. Vision and Languageの基礎
3.1 問題設定
3,2 よく扱われるタスクの紹介(VQA, Image captioning, Text to image generationなど)
3.3 画像特徴量の抽出(Grid/Region feature)
3.4 事前学習(Masked Language modeling, Image-Text matching)
3.3 最新の研究動向
① CLIPによるパラダイムシフト
② 大量のimage/textデータを用いた事前学習
③ 言語情報を利用した画像認識
④ 最新手法の紹介
4. より現実的な応用へ~外部知識を必要とする画像付き質問応答~
4.1 問題設定(ベンチマークの紹介)
4.2 知識グラフを用いた方法
4.3 言語モデルを用いた方法
4.4 明示的な知識を用いた方法
4.5 最新の研究紹介
5. Vision and Languageの今後
5.1 現状の課題
5.2 今後の展望
■ご講演中のキーワード
Vision and Language
Transformer
言語モデル(Language model)
基盤モデル(Foundation model)
セミナー講師
菅沼 雅徳 先生 東北大学 大学院情報科学研究科 助教
セミナー受講料
【オンラインセミナー(見逃し視聴なし)】:1名41,800円(税込(消費税10%)、資料付)
*1社2名以上同時申込の場合、1名につき30,800円
【オンラインセミナー(見逃し視聴あり)】:1名47,300円(税込(消費税10%)、資料付)
*1社2名以上同時申込の場合、1名につき36,300円
受講について
※本講座は、お手許のPCやタブレット等で受講できるオンラインセミナーです。
配布資料・講師への質問等について
- 配布資料はPDF等のデータで送付予定です。受取方法はメールでご案内致します。
(開催1週前~前日までには送付致します)。
※準備の都合上、開催1営業日前の12:00までにお申し込みをお願い致します。
(土、日、祝日は営業日としてカウント致しません。) - 当日、可能な範囲で質疑応答も対応致します。
(全ての質問にお答えできない可能性もございますので、予めご容赦ください。) - 本講座で使用する資料や配信動画は著作物であり、
無断での録音・録画・複写・転載・配布・上映・販売等を禁止致します。
下記ご確認の上、お申込み下さい
- PCもしくはタブレット・スマートフォンとネットワーク環境をご準備下さい。
- ご受講にあたり、環境の確認をお願いしております(20Mbbs以上の回線をご用意下さい)。
各ご利用ツール別の動作確認の上、お申し込み下さい。 - 開催が近くなりましたら、当日の流れ及び視聴用のURL等をメールにてご連絡致します。
Zoomを使用したオンラインセミナーとなります
- ご受講にあたり、環境の確認をお願いしております。
お手数ですが下記公式サイトからZoomが問題なく使えるかどうか、ご確認下さい。
→ 確認はこちら
※Skype/Teams/LINEなど別のミーティングアプリが起動していると、Zoomでカメラ・マイクが使えない事があります。お手数ですがこれらのツールはいったん閉じてお試し下さい。 - Zoomアプリのインストール、Zoomへのサインアップをせずブラウザからの参加も可能です。
※一部のブラウザは音声(音声参加ができない)が聞こえない場合があります。
必ずテストサイトからチェック下さい。
対応ブラウザーについて(公式) ;
「コンピューターのオーディオに参加」に対応してないものは音声が聞こえません。
申込み時に(見逃し視聴有り)を選択された方は、見逃し視聴が可能です
- 開催5営業日以内に録画動画の配信を行います(一部、編集加工します)。
- 視聴可能期間は配信開始から1週間です。
セミナーを復習したい方、当日の受講が難しい方、期間内であれば動画を何度も視聴できます。
尚、閲覧用のURLはメールにてご連絡致します。
※万一、見逃し視聴の提供ができなくなった場合、
(見逃し視聴有り)の方の受講料は(見逃し視聴無し)の受講料に準じますので、ご了承下さい。
→こちらから問題なく視聴できるかご確認下さい(テスト視聴動画へ)パスワード「123456」
受講料
41,800円(税込)/人