データ量の少ない・スモールデータを対象とした機械学習のすすめ方とその考え方

収集が困難なスモールデータから
機械学習を使っていかに知識を抽出すれば良いのか?
データ収集から解析の方法論まで、実例を通じて解説!

<Zoomによるオンラインセミナー>

①Zoomでの受講が難しい方へ;Zoomを介さず視聴できるライブ配信形式での受講も可能です。
 本形式を希望の方は申込フォーム備考欄に【ライブ配信希望】とご記入ください。
 Zoomとの同時受講はできません。

②本セミナーは見逃し視聴を選択できます。
 ご希望の方は申込フォーム備考欄に【見逃し視聴希望】とご記入ください。

※備考欄にご記入のない場合は【Zoom・見逃し視聴なし】となります。

セミナー趣旨

 生産現場の操業データや医療データにおいては、測定されている変数の数と比較して統計モデリングに使用可能なデータ量が限られることが多い。通常のモデリングでは正例・負例双方のサンプルが必要となるが、装置故障など稀な事象のデータはなかなか収集が困難であり、医療データにおいては、倫理的な問題から多くの患者から臨床データを収集するのは大きな壁が存在する。
 このように実世界ではしばしば必要なデータが十分に収集できず、スモールなデータからいかに知識を抽出するのかが重要となる。
 本セミナーでは、実例を通じ、スモールデータの解析の実態とその方法論および、スモールデータ解析に必要となるデータ収集および解析の考え方を講義する。

受講対象・レベル

  • 少量のデータから統計モデルを構築したいと考えられている方
  • 現場でのデータ解析に従事されている方
  • 現場におけるデータ収集についてお困りの方

習得できる知識

  • 機械学習の基礎知識、及び入力変数選択・異常検知手法などスモールデータに適したデータ解析手法の習得
  • スモールデータにおけるデータ収集の心構えの習得

セミナープログラム

1. スモールデータとは
 1-1. スモールデータの特徴
 1-2. スモールデータ解析の現状

2. スモールデータ解析の方法論:次元削減と回帰分析
 2-1. 主成分分析(PCA)
  2-1-1. PCAとは
  2-1-2. 直交展開
  2-1-3. PCAの導出
  2-1-4. PCAと特異値分解
 2-2. 最小二乗法
  2-2-1. 回帰分析とは
  2-2-2. 相関係数の意味
  2-2-3. 最小二乗法の導出
  2-2-4. 最小二乗法の幾何学的意味
  2-2-5. 多重共線性の問題
 2-3. 部分的最小二乗法(PLS)
  2-3-1. PLSとは
  2-3-2. 潜在変数モデル
  2-3-3. PLSモデルの導出
  2-3-4. NIPALSアルゴリズム
  2-3-5. PLSから重回帰モデルへの変換
  2-3-6. クロスバリデーションによるパラメータチューニング

3. スモールデータ解析の方法論:入力変数選択
 3-1. 入力変数選択とは
 3-2. スパースモデリング
  3-2-1. スパースとは
  3-2-2. リッジ回帰
  3-2-3. Lasso回帰
  3-2-4. エラスティックネットモデル
  3-2-5. Group Lasso
 3-3. 変数クラスタリングによる入力変数選択
  3-3-1. スペクトラルクラスタリング
  3-3-2. NC法のコンセプト
  3-3-3. NCSCアルゴリズムの導出
  3-3-4. NCSCを用いた変数クラスタリングと入力変数選択
  3-3-5. 製薬プロセスへの応用例

4. スモールデータ解析の方法論:不均衡データ解析
 4-1. サンプリング手法
  4-1-1. サンプリング手法とは
  4-1-2 アンダーサンプリングとオーバーサンプリング
 4-2. ブースティング
  4-2-1. ブースティングとは
  4-2-2. AdaBoost
  4-2-3. RandomForest
 4-3. ブースティングとサンプリング手法を組み合わせた不均衡データ解析
  4-3-1. 何故、ブースティングとサンプリング手法を組み合わせるか
  4-3-2. RUSBoost
  4-3-3. HUSDOS-Boost
 4-4. 不均衡データ解析の大規模検診データへの適用例

5. スモールデータ解析の方法論:異常検出
 5-1. 異常検出とは
 5-2. 多変量統計的プロセス管理(MSPC)
  5-2-1. MPSCとは
  5-2-2. T2統計量とQ統計量の幾何学的意味
 5-3. 自己符号化器(オートエンコーダー)
 5-4. 異常検出問題の医療データ解析への応用例

6. スモールデータの収集・解析の考え方
 6-1. 必要となるデータの質の問題
 6-2. データ収集の際の留意点
 6-3. スモールデータ解析の手法選択
 
  <質疑応答>

セミナー講師

名古屋大学 工学研究科 物質プロセス工学専攻 准教授  藤原 幸一 先生

セミナー受講料

【オンラインセミナー(見逃し視聴なし)1名47,300円(税込(消費税10%)、資料付)
  *1社2名以上同時申込の場合、1名につき36,300円

【オンラインセミナー(見逃し視聴あり)1名52,800円(税込(消費税10%)、資料付)
  *1社2名以上同時申込の場合、1名につき41,800円

  *学校法人割引;学生、教員のご参加は受講料50%割引。

*見逃し視聴有りをご希望の方は、お申込みの際、備考欄に【見逃し視聴希望】とご記入ください。

受講について

※本講座は、お手許のPCやタブレット等で受講できるオンラインセミナーです。

下記ご確認の上、お申込み下さい

  • PCもしくはタブレット・スマートフォンとネットワーク環境をご準備下さい。
  • ご受講にあたり、環境の確認をお願いしております(20Mbbs以上の回線をご用意下さい)。
    各ご利用ツール別の動作確認の上、お申し込み下さい。
  • 開催が近くなりましたら、当日の流れ及び視聴用のURL等をメールにてご連絡致します。

Zoomを使用したオンラインセミナーとなります

  • ご受講にあたり、環境の確認をお願いしております。
    お手数ですが下記公式サイトからZoomが問題なく使えるかどうか、ご確認下さい。
    確認はこちら
    ※Skype/Teams/LINEなど別のミーティングアプリが起動していると、Zoomでカメラ・マイクが使えない事があります。お手数ですがこれらのツールはいったん閉じてお試し下さい。
  • Zoomアプリのインストール、Zoomへのサインアップをせずブラウザからの参加も可能です。
    ※一部のブラウザは音声(音声参加ができない)が聞こえない場合があります。
     必ずテストサイトからチェック下さい。
     対応ブラウザーについて(公式) ;
     「コンピューターのオーディオに参加」に対応してないものは音声が聞こえません。

※Zoomでの受講が難しい方へ;セミナー動画のライブ配信
(ライブエンコーダーを用いた同時ストリーミング配信)です。

申込み時に(見逃し視聴有り)を選択された方は、見逃し視聴が可能です

  • 開催5営業日以内に録画動画の配信を行います(一部、編集加工します)。
  • 視聴可能期間は配信開始から1週間です。視聴期間内は動画を何度でも再生可能です。
    尚、閲覧用のURLはメールにてご連絡致します。
    ※万一、見逃し視聴の提供ができなくなった場合、
    (見逃し視聴有り)の方の受講料は(見逃し視聴無し)の受講料に準じますので、ご了承下さい。
    こちらから問題なく視聴できるかご確認下さい(テスト視聴動画へ)パスワード「123456」

配布資料・講師への質問等について

  • 配布資料は、印刷物を郵送で送付致します。
    お申込の際はお受け取り可能な住所をご記入ください。
    お申込みは4営業日前までを推奨します。
    それ以降でもお申込みはお受けしておりますが(開催1営業日前の12:00まで)、
    テキスト到着がセミナー後になる可能性がございます。
  • 当日、可能な範囲で質疑応答も対応致します。
    (全ての質問にお答えできない可能性もございますので、予めご容赦ください。)
  • 本講座で使用する資料や配信動画は著作物であり、
    無断での録音・録画・複写・転載・配布・上映・販売等を禁止致します。

※セミナーに申し込むにはものづくりドットコム会員登録が必要です

開催日時


10:30

受講料

47,300円(税込)/人

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込、コンビニ払い

開催場所

全国

主催者

キーワード

機械学習・ディープラーニング   主成分分析   回帰分析

※セミナーに申し込むにはものづくりドットコム会員登録が必要です

開催日時


10:30

受講料

47,300円(税込)/人

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込、コンビニ払い

開催場所

全国

主催者

キーワード

機械学習・ディープラーニング   主成分分析   回帰分析

関連記事

もっと見る