Vision Transformerの仕組み

コンピュータビジョン応用を中心とした最前線

セミナー趣旨

   自己注意機構を活用したニューラルネットワークであるTransformerは、機械翻訳タスクでSoTAを達成し実用化を加速させている。このTransformerをコンピュータビジョンタスクに適用したモデルがVision Transformerであり、2019年以降、急速に応用と改良が加えられている。Vision Transformerは、CNNとは異なる新たな特徴表現獲得が可能となり、テクスチャノイズに対してロバストな認識が可能となっている。
 本講座ではVision Transformerについて従来の手法と対比しながらその仕組みを解説し、コンピュータビジョン応用を中心とした最前線についても紹介する。

セミナープログラム

 1 再帰型ニューラルネットワークの仕組み

  1.1 再帰型ニューラルネットワーク(RNN)
  1.2 LSTM
  1.3 Seq2seq

 2 Vision Transformerの仕組み
  2.1 Transformer
  2.2 VIsion Transformer(ViT)
  2.3 ViTによる画像認識
  2.4 ViTによる特徴表現獲得

 3 ViTの最新動向

  3.1 ViTの派生手法(Swin Transformer, ConvNeXtなど)
  3.2 ViTの派生手法の傾向

セミナー講師

藤吉 弘亘(ふじよし ひろのぶ) 氏     

中部大学 工学部 情報科学科 / 大学院 工学研究科 情報工学専攻 教授(博士(工学))  

セミナー受講料

お1人様受講の場合 49,500円[税込]/1名
1口でお申込の場合 62,700円[税込]/1口(3名まで受講可能)
 
受講申込ページで2~3名を同時に申し込んだ場合、自動的に1口申し込みと致します。

受講について

  • 本セミナーの受講にあたっての推奨環境は「Zoom」に依存しますので、ご自分の環境が対応しているか、お申込み前にZoomのテストミーティング(http://zoom.us/test)にアクセスできることをご確認下さい。
  • インターネット経由でのライブ中継ため、回線状態などにより、画像や音声が乱れる場合があります。講義の中断、さらには、再接続後の再開もありますが、予めご了承ください。
  • 受講中の録音・撮影等は固くお断りいたします。

※セミナーに申し込むにはものづくりドットコム会員登録が必要です

開催日時


13:00

受講料

49,500円(税込)/人

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込

開催場所

全国

主催者

キーワード

情報技術   機械学習・ディープラーニング   AI(人工知能)

※セミナーに申し込むにはものづくりドットコム会員登録が必要です

開催日時


13:00

受講料

49,500円(税込)/人

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込

開催場所

全国

主催者

キーワード

情報技術   機械学習・ディープラーニング   AI(人工知能)

関連記事

もっと見る