畳み込みニューラルネットワーク(CNN)とVision Transformerの基礎と画像認識への応用

~CNN:Convolutional Neural Network / Vision Transformer~ 

セミナー趣旨

   深層学習の代表的な手法である畳み込みニューラルネットワークは画像認識分野で様々なタスクへの応用が進んでいる.また,近年は自然言語分野で提案されたTransformerを応用したVision Transformerなど新たな手法も提案されている.
 本講義では,畳み込みニューラルネットワークとVision Transformerについて,仕組みと画像認識分野への応用事例について説明する.また,畳み込みニューラルネットワークの実装方法についても紹介し,実践的に活用できる知識を身につける.

セミナープログラム

1 ディープラーニングの現在

2 畳み込みニューラルネットワーク(CNN:Convolutional Neural Networks)
 2.1 CNNの構成要素
 2.2 CNN の学習方法
 2.3 汎化性能向上のテクニック
 2.4 代表的なネットワーク構造、等

3 画像認識分野への応用
 3.1 物体検出
 3.2 セグメンテーション
 3.3 姿勢推定
 3.4 判断根拠の可視化
 3.5 文章生成

4 Transformerの画像認識応用
 4.1 アテンション構造
 4.2 Transformer
 4.3 Vision Transformer
 4.4 ViTの発展(SwinTransformerなど)
 4.5 Transformerベース物体検出(DETR)
 4.6 Transformerベースセマンティックセグメンテーション(SegFormer)
 4.7 DINO(自己教師あり学習)

5 ディープラーニングの実装
 5.1 畳み込みニューラルネットワークの実装
 5.2 Transformerの実装

セミナー講師

山下 隆義(やました たかよし) 氏     中部大学 工学部 情報工学科 教授(工学博士)

 <経歴>  

 2002年 奈良先端科学技術大学院大学博士前期課程修了。
 2002年 オムロン株式会社入社。
 2011年 中部大学大学院博士後期課程修了(社会人ドクター)。

 <学会>  IEEE, Computer Society / 電子情報通信学会 / 情報処理学会 / 人工知能学会
 <研究テーマ>  物体検出、物体追跡、パターン認識、深層学習、機械学習
 <受賞>  

   2020年8月 画像の認識・理解シンポジウム(MIRU) 長尾賞
 2020年5月 電子情報通信学会 論文賞
 2019年8月 画像の認識・理解シンポジウム(MIRU) 長尾賞
 2015年6月 画像センシングシンポジウム(SSII) 最優秀学術賞
 2013年6月 電子情報通信学会 PRMU研究会 研究奨励賞 受賞
 2013年6月 電子情報通信学会 情報・システムソサイエティ論文賞 受賞
 2009年6月 SSII2009 高木賞受賞
 2007年6月 CVPR2007 Best Student Award 受賞

セミナー受講料

お1人様受講の場合 51,700円[税込]/1名
1口でお申込の場合 62,700円[税込]/1口(3名まで受講可能)
 
受講申込ページで2~3名を同時に申し込んだ場合、自動的に1口申し込みと致します。

受講について

  • 本セミナーの受講にあたっての推奨環境は「Zoom」に依存しますので、ご自分の環境が対応しているか、お申込み前にZoomのテストミーティング(http://zoom.us/test)にアクセスできることをご確認下さい。
  • インターネット経由でのライブ中継ため、回線状態などにより、画像や音声が乱れる場合があります。講義の中断、さらには、再接続後の再開もありますが、予めご了承ください。
  • 受講中の録音・撮影等は固くお断りいたします。

関連記事

もっと見る