深層学習によるVisionandLanguageの最前線～Transformerの基本的な仕組みから画像認識やVisionandLanguage分野における最新の研究動向について～

Transformerの基本的な仕組みから始まり、画像認識やVision and Language分野における最新の研究動向について解説！

【項目】※クリックするとその項目に飛ぶことができます

セミナー趣旨

Transformerの登場以来、画像認識と自然言語処理の融合領域（Vision and Language）の研究が急速に進んでおり、様々な応用がなされている。本講座では、Transformerの基本的な仕組みから始まり、画像認識やVision and Language分野における最新の研究動向について解説する。

受講対象・レベル

・深層学習による画像認識の最新動向を把握したい方
・画像と言語の融合領域の最新動向を把握したい方
・Transformerの基礎を知りたい方

必要な予備知識

深層学習、機械学習に関する最低限の知識

習得できる知識

・Transformerの基本的な知識
・画像認識、Vision and Language分野における最新の研究動向

セミナープログラム

１． Vision and Languageにおける深層学習の現在
1.1 画像付き質問応答でヒトの性能を超えた
1.2 非常に高精細な画像生成も可能に
1.3 そのほか最新の研究紹介

２． Transformerの基礎
2.1 基本構成
2.2 注意機構（attention）
2.3 Encoder/Decoder
2.4 BERTによる革新
　① BERTの基礎
　② BERTの学習方法
　③ BERTの応用
2.5 GPT-3の衝撃
　① 言語モデルの基礎
　② GPT-1/2/3の学習方法
　③ GPT-1/2/3の応用（zero/few-shot learning）
2.6 Vision Transformerの基礎
　① 基本構成
　② DeiT
　③ Swin Transformer
　④ そのほか最新の研究紹介

３． Vision and Languageの基礎
3.1 問題設定
3,2 よく扱われるタスクの紹介（VQA, Image captioning, Text to image generationなど）
3.3 画像特徴量の抽出（Grid/Region feature）
3.4 事前学習（Masked Language modeling, Image-Text matching）
3.3 最新の研究動向
　① CLIPによるパラダイムシフト
　② 大量のimage/textデータを用いた事前学習
　③ 言語情報を利用した画像認識
　④ 最新手法の紹介

４．より現実的な応用へ～外部知識を必要とする画像付き質問応答～
4.1 問題設定（ベンチマークの紹介）
4.2 知識グラフを用いた方法
4.3 言語モデルを用いた方法
4.4 明示的な知識を用いた方法
4.5 最新の研究紹介

５． Vision and Languageの今後
5.1 現状の課題
5.2 今後の展望

■ご講演中のキーワード
Vision and Language
Transformer
言語モデル（Language model）
基盤モデル（Foundation model）

セミナー講師

菅沼雅徳先生東北大学大学院情報科学研究科助教

セミナー受講料

【オンラインセミナー（見逃し視聴なし）】：1名41,800円(税込（消費税10％）、資料付)
＊1社2名以上同時申込の場合、1名につき30,800円

【オンラインセミナー（見逃し視聴あり）】：1名47,300円(税込（消費税10％）、資料付)
＊1社2名以上同時申込の場合、1名につき36,300円

受講について

※本講座は、お手許のPCやタブレット等で受講できるオンラインセミナーです。

配布資料・講師への質問等について

配布資料はPDF等のデータで送付予定です。受取方法はメールでご案内致します。
（開催1週前～前日までには送付致します）。
※準備の都合上、開催1営業日前の12:00までにお申し込みをお願い致します。
（土、日、祝日は営業日としてカウント致しません。）
当日、可能な範囲で質疑応答も対応致します。
（全ての質問にお答えできない可能性もございますので、予めご容赦ください。）
本講座で使用する資料や配信動画は著作物であり、
無断での録音・録画・複写・転載・配布・上映・販売等を禁止致します。

下記ご確認の上、お申込み下さい

PCもしくはタブレット・スマートフォンとネットワーク環境をご準備下さい。
ご受講にあたり、環境の確認をお願いしております（20Mbbs以上の回線をご用意下さい）。
各ご利用ツール別の動作確認の上、お申し込み下さい。
開催が近くなりましたら、当日の流れ及び視聴用のURL等をメールにてご連絡致します。

Zoomを使用したオンラインセミナーとなります

ご受講にあたり、環境の確認をお願いしております。
お手数ですが下記公式サイトからZoomが問題なく使えるかどうか、ご確認下さい。
→ 確認はこちら
※Skype／Teams／LINEなど別のミーティングアプリが起動していると、Zoomでカメラ・マイクが使えない事があります。お手数ですがこれらのツールはいったん閉じてお試し下さい。
Zoomアプリのインストール、Zoomへのサインアップをせずブラウザからの参加も可能です。
※一部のブラウザは音声（音声参加ができない）が聞こえない場合があります。
　必ずテストサイトからチェック下さい。
　対応ブラウザーについて(公式) ;
　「コンピューターのオーディオに参加」に対応してないものは音声が聞こえません。

申込み時に（見逃し視聴有り）を選択された方は、見逃し視聴が可能です

開催5営業日以内に録画動画の配信を行います（一部、編集加工します）。
視聴可能期間は配信開始から1週間です。
セミナーを復習したい方、当日の受講が難しい方、期間内であれば動画を何度も視聴できます。
尚、閲覧用のURLはメールにてご連絡致します。
※万一、見逃し視聴の提供ができなくなった場合、
（見逃し視聴有り）の方の受講料は（見逃し視聴無し）の受講料に準じますので、ご了承下さい。
→こちらから問題なく視聴できるかご確認下さい（テスト視聴動画へ）パスワード「123456」

受講料

41,800円（税込）/人

※セミナーに申し込むにはものづくりドットコム会員登録が必要です

開催日時

2022/10/07（金）
12:30 ～ 16:30　
締めきりました

受講料

41,800円（税込）/人

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込、コンビニ払い

開催場所

全国

主催者

株式会社情報機構

キーワード

機械学習・ディープラーニング AI（人工知能）情報技術

このセミナーについて質問する

※セミナーに申し込むにはものづくりドットコム会員登録が必要です

開催日時

2022/10/07（金）
12:30 ～ 16:30　
締めきりました

受講料

41,800円（税込）/人

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込、コンビニ払い

開催場所

全国

主催者

株式会社情報機構

キーワード

機械学習・ディープラーニング AI（人工知能）情報技術

このセミナーについて質問する

フィジカルAIとは？定義、仕組み、応用例から未来の課題まで徹底解説
- 解説記事
【目次】これまでのAIが主にデジタル空間でのデータ処理や情報分析に特化していたのに対し、フィジカルAIは現実世界と直接インタラクシ...
AIセキュリティ対策の最前線、リスクマネジメントの実践と展望
- 解説記事
【目次】 AI技術の急速な進化は、私たちの生活やビジネスのあり方を大きく変えています。しかし、その利便性と革新性の裏には、さまざまな...
ニューラルネットワークとは？仕組みと種類、活用事例等をご紹介！
- 解説記事
【目次】ニューラルネットワークは、人工知能（AI）の中でも特に注目されている技術の一つです。人間の脳の働きを模倣したこの仕組みは、...
生成AIの能力比較：生成AI、工場でどこまで使えるのか（その３）
- 解説記事
近い将来、対話型AIが現行の検索エンジンにとって代わる可能性が指摘されていますが、今回は、連載解説（その３）生成AIの能力比較。を解説...

深層学習によるVisionandLanguageの最前線～Transformerの基本的な仕組みから画像認識やVisionandLanguage分野における最新の研究動向について～

Transformerの基本的な仕組みから始まり、画像認識やVision and Language分野における最新の研究動向について解説！

セミナー趣旨

受講対象・レベル

必要な予備知識

習得できる知識

セミナープログラム

セミナー講師

セミナー受講料

受講について

ようこそエンジニアの世界へ（基礎への扉）情報　Ｉ

ようこそエンジニアの世界へ（基礎への扉）情報　ＩＩ

初めの一歩Ｃ言語講座

機械学習・人工知能　業務活用の手引き

人工知能（ＡＩ）関連技術の法的実務の課題と対応の方向性

何ができるのか？何が必要なのか？　産業利用を考える人のための人工知能・機械学習・ディープラーニング関連技術とその活用

フィジカルAIとは？定義、仕組み、応用例から未来の課題まで徹底解説

AIセキュリティ対策の最前線、リスクマネジメントの実践と展望

ニューラルネットワークとは？仕組みと種類、活用事例等をご紹介！

生成AIの能力比較：生成AI、工場でどこまで使えるのか（その３）

ものづくりセミナーサーチ

日本最大級の技術・生産セミナーポータルサイト

深層学習によるVisionandLanguageの最前線 ～Transformerの基本的な仕組みから画像認識やVisionandLanguage分野における最新の研究動向について～

Transformerの基本的な仕組みから始まり、画像認識やVision and Language分野における最新の研究動向について解説！

セミナー趣旨

受講対象・レベル

必要な予備知識

習得できる知識

セミナープログラム

セミナー講師

セミナー受講料

受講について

類似セミナー

関連教材

ようこそエンジニアの世界へ（基礎への扉）情報 Ｉ

ようこそエンジニアの世界へ（基礎への扉）情報 ＩＩ

初めの一歩Ｃ言語講座

機械学習・人工知能 業務活用の手引き

人工知能（ＡＩ）関連技術の法的実務の課題と対応の方向性

何ができるのか？何が必要なのか？ 産業利用を考える人のための人工知能・機械学習・ディープラーニング関連技術とその活用

関連記事

フィジカルAIとは？定義、仕組み、応用例から未来の課題まで徹底解説

AIセキュリティ対策の最前線、リスクマネジメントの実践と展望

ニューラルネットワークとは？仕組みと種類、活用事例等をご紹介！

生成AIの能力比較：生成AI、工場でどこまで使えるのか（その３）

ものづくりセミナーサーチ

日本最大級の技術・生産セミナーポータルサイト

深層学習によるVisionandLanguageの最前線～Transformerの基本的な仕組みから画像認識やVisionandLanguage分野における最新の研究動向について～

ようこそエンジニアの世界へ（基礎への扉）情報　Ｉ

ようこそエンジニアの世界へ（基礎への扉）情報　ＩＩ

機械学習・人工知能　業務活用の手引き

何ができるのか？何が必要なのか？　産業利用を考える人のための人工知能・機械学習・ディープラーニング関連技術とその活用