【中止】機械学習技術を用いた画像・動画・センサデータ解析〜数値列から意味情報を導き出す〜

画像・動画・センサデータに内在する
規則性、関係性、異常性を、機械学習技術で解析!

セミナー趣旨

 データは、計算機に格納されているだけでは、単なる数値列である。つまり、人間にとって有益なサービスを提供するためには、データから意味のある情報(意味情報)を抽出しなければならない。
 本講義では、マルチメディアデータ(特に、動画像とセンサデータ)を対象として、データに内在する規則性、関係性、異常性等を解析して意味情報を抽出する機械学習技術に関する講義を行う。尚、個別の質問にも時間の許す限り応じることとする。

受講対象・レベル

・機械学習およびその関連技術を学習中、調査中の方
・画像認識、物体認識、シーン認識、動作認識、マルチメディア処理、マルチモーダル解析について研究中、調査中の方
・人工知能、ディープラーニング、自動運転、カメラ、センサ、画像、映像等に関わる研究者・技術者・戦略担当者の方 など

習得できる知識

・機械学習の基礎知識、一般的な知見
・機械学習を用いた意味情報抽出技術(特に、画像認識、物体認識、シーン認識、動作認識など)の手法・実情
・本技術に関する現状の課題、研究の動向・方向性と今後の可能性・展望 など

セミナープログラム

1. マルチメディア理解に向けた機械学習の基礎知識
 1.1 マルチメディアとは
 1.2 求められる機械学習の知識や関連手法

2 マルチメディア理解とは
 2.1 セマンティックギャップとは
 2.2 マルチメディア理解の枠組み

3 動画像からの意味情報抽出:その考え方と手法
 3.1 意味情報のベクトル表現
 (概念認識に基づく表現、埋め込みに基づく表現)
 3.2 概念認識に基づく動画像検索
  3.2.1 枠組み:概念認識 + 検索
  3.2.2 概念認識
   3.2.2.1 概念認識の問題点
   3.2.2.2 Hand-crafted特徴に基づく概念認識
   3.2.2.3 深層学習(ディープラーニング)に基づく概念認識
   3.2.2.3 世界的な映像解析コンテストTRECVID
   3.2.2.4 TRECVIDにおける概念認識の性能評価
  3.2.3 概念認識に基づく映像検索
   3.2.3.1 概念選択の考え方と実際
   3.2.3.2 選択された概念の認識結果のフュージョン
   3.2.3.3 確率モデルを用いた概念の認識結果のフュージョン
   3.2.3.4 TRECVIDにおける映像検索の性能評価
 3.3 埋め込みに基づく動画像検索
  3.3.1 埋め込みの枠組み(クロスモーダル検索)
  3.3.2 フレームと文章の埋め込み
  3.3.3 領域と単語の埋め込み
  3.3.4 TRECVIDにおける性能評価
  3.3.5 埋め込みに関する研究動向

4 センサデータからの行動認識
 4.1 研究背景
  4.1.1 ドイツでのプロジェクト
  (ドイツ連邦教育研究省(BMBF)後援の研究プロジェクト「Cognitive Village」で、
様々なセンサを用いて、高齢者の行動を認識・監視し、自立生活や健康管理をサポートするシステムを開発)
  4.1.2 日常生活動作 (ADLs: Activities of Daily Living)
 4.2 階層的な日常生活動作認識
  4.2.1 枠組み:低次動作認識 + 高次動作認識
 4.3 低次動作認識
  4.3.1 時系列分類としての低次動作認識
  4.3.2 特徴学習の必要性
  4.3.3 様々な特徴学習手法の性能比較
  (Hand-crafted特徴、コードブックアプローチ、多層パーセプトロン、畳み込みニューラルネットワーク CNN、長短期記憶(LSTM)、ハイブリッド、オートエンコーダ)
  4.3.4 個人適応のための転移学習
   4.3.4.1 既存データを用いた事前学習
   4.3.4.2 個人データに対するファインチューニング
  4.3.5 低次動作認識のデモ
 4.4 高次動作認識
  4.4.1 低次動作認識結果のプーリングに基づくアプローチ
  4.4.2 平均/最大値プーリング
  4.4.3 ランクプーリング
  4.4.4 ランクプーリングの改良
  4.4.5 高次動作認識のデモ

5 今後のマルチメディア理解
 5.1 更なる高次の意味情報の抽出のために
  5.1.1 関係性の導出
  5.1.2 詳細な意味情報の導出
  5.1.3 時間関係のモデル化
  5.1.4 マルチタスク学習
  5.1.5 異種モダリティとの統合
 5.2 具体的な応用・シチュエーションの可能性
  5.2.1 防犯カメラ
   5.2.1.1 単眼カメラからの物体の3次元位置推定
   5.2.1.2 監視カメラにおける人物のグループ抽出
   5.2.1.3 物体間の関係性に基づくイベント抽出
  5.2.2 新たなマルチメディアサービスへの展開
   5.2.2.1 ファッショントレンドの分析
   5.2.2.2 幼児/高齢者のモニタリング
   5.2.2.3 軌跡データを用いた歩容解析と日常習慣抽出
   5.2.2.3 環境保全のための微生物認識
   5.2.2.4 人間センサ:物体認識を群衆に適用し、人間をセンサにする発想

<質疑応答・名刺交換・個別相談>

セミナー講師

近畿大学 理工学部 情報学科 准教授 博士(工学) 白浜 公章 先生
略歴
2011年3月 神戸大学大学院工学研究科より博士(工学)を取得
2012〜2014年 室蘭工業大学 しくみ情報系領域 情報システム学コース 助教
同所属在籍中に、日本学術振興会 海外特別研究員に採用され、2013〜2015年までドイツ ジーゲン大学 パターン認識グループ(マルチン グジェゴジェック教授)においてポスドク研究員
その後も2018年3月まで、同グループに所属し、ドイツ連邦教育研究省(BMBF)の研究プロジェクトにおける開発リーダー
2018年4月から近畿大学 理工学部 情報学科 准教授
マルチメディア情報処理、機械学習、データマイニング、センサからの行動認識に関する研究に従事

セミナー受講料

1名41,800円(税込(消費税10%)、資料付)
 *1社2名以上同時申込の場合、1名につき30,800円
 *学校法人割引;学生、教員のご参加は受講料50%割引。


※セミナーに申し込むにはものづくりドットコム会員登録が必要です

開催日時


12:30

受講料

41,800円(税込)/人

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込、コンビニ払い

開催場所

東京都

MAP

【北区】滝野川会館

【JR】上中里駅 【地下鉄】西ケ原駅

主催者

キーワード

機械学習・ディープラーニング   情報技術

※セミナーに申し込むにはものづくりドットコム会員登録が必要です

開催日時


12:30

受講料

41,800円(税込)/人

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込、コンビニ払い

開催場所

東京都

MAP

【北区】滝野川会館

【JR】上中里駅 【地下鉄】西ケ原駅

主催者

キーワード

機械学習・ディープラーニング   情報技術

関連記事

もっと見る