データ量の少ない・スモールデータを対象とした機械学習のすすめ方とその考え方

収集困難なスモールなデータからいかに知識を抽出すれば良いのか?
データ収集から解析の方法論まで、実例を交え解説します!

セミナー趣旨

 生産現場の操業データや医療データにおいては、測定されている変数の数と比較して統計モデリングに使用可能なデータ量が限られることが多い。通常のモデリングでは正例・負例双方のサンプルが必要となるが、装置故障など稀な事象のデータはなかなか収集が困難であり,医療データにおいては、倫理的な問題から多くの患者から臨床データを収集するのは大きな壁が存在する。
 このように実世界ではしばしば必要なデータが十分に収集できず、スモールなデータからいかに知識を抽出するのかが重要となる。
 本セミナーでは、実例を通じ、スモールデータの解析の実態とその方法論および、スモールデータ解析に必要となるデータ収集および解析の考え方を講義する。

受講対象・レベル

・少量のデータから統計モデルを構築したいと考えられている方
・現場でのデータ解析に従事されている方
・現場におけるデータ収集についてお困りの方

習得できる知識

・機械学習の基礎知識、及び入力変数選択・異常検知手法などスモールデータに適したデータ解析手法の習得
・スモールデータにおけるデータ収集の心構えの習得

セミナープログラム

1. スモールデータとは
 1-1. スモールデータの特徴
 1-2. スモールデータ解析の現状

2. スモールデータ解析の方法論:次元削減と回帰分析
 2-1. 主成分分析(PCA)
  2-1-1. PCAとは
  2-1-2. 直交展開
  2-1-3. PCAの導出
  2-1-4. PCAと特異値分解
 2-2. 最小二乗法
  2-2-1. 回帰分析とは
  2-2-2. 相関係数の意味
  2-2-3. 最小二乗法の導出
  2-2-4. 最小二乗法の幾何学的意味
  2-2-5. 多重共線性の問題
 2-3. 部分的最小二乗法(PLS)
  2-3-1. PLSとは
  2-3-2. 潜在変数モデル
  2-3-3. PLSモデルの導出
  2-3-4. NIPALSアルゴリズム
  2-3-5. PLSから重回帰モデルへの変換
  2-3-6. クロスバリデーションによるパラメータチューニング

3. スモールデータ解析の方法論:入力変数選択
 3-1. 入力変数選択とは
 3-2. スパースモデリング
  3-2-1. スパースとは
  3-2-2. リッジ回帰
  3-2-3. Lasso回帰
  3-2-4. エラスティックネットモデル
  3-2-5. Group Lasso
 3-3. 変数クラスタリングによる入力変数選択
  3-3-1. スペクトラルクラスタリング
  3-3-2. NC法のコンセプト
  3-3-3. NCSCアルゴリズムの導出
  3-3-4. NCSCを用いた変数クラスタリングと入力変数選択
  3-3-5. 製薬プロセスへの応用例

4. スモールデータ解析の方法論:不均衡データ解析
 4-1. サンプリング手法
  4-1-1. サンプリング手法とは
  4-1-2 アンダーサンプリングとオーバーサンプリング
 4-2. ブースティング
  4-2-1. ブースティングとは
  4-2-2. AdaBoost
  4-2-3. RandomForest
 4-3. ブースティングとサンプリング手法を組み合わせた不均衡データ解析
  4-3-1. 何故、ブースティングとサンプリング手法を組み合わせるか
  4-3-2. RUSBoost
  4-3-3. HUSDOS-Boost
 4-4. 不均衡データ解析の大規模検診データへの適用例

5. スモールデータ解析の方法論:異常検出
 5-1. 異常検出とは
 5-2. 多変量統計的プロセス管理(MSPC)
  5-2-1. MPSCとは
  5-2-2. T2統計量とQ統計量の幾何学的意味
 5-3. 自己符号化器(オートエンコーダー)
 5-4. 異常検出問題の医療データ解析への応用例

6. スモールデータの収集・解析の考え方
 6-1. 必要となるデータの質の問題
 6-2. データ収集の際の留意点
 6-3. スモールデータ解析の手法選択
 
  <質疑応答>

セミナー講師

名古屋大学 工学研究科 物質プロセス工学専攻 准教授  藤原 幸一 先生

セミナー受講料

1名47,300円(税込(消費税10%)、資料・昼食付)
 *1社2名以上同時申込の場合、1名につき36,300円
 *学校法人割引;学生、教員のご参加は受講料50%割引。

※ご連絡
 当セミナーの会場では、現金による受講料支払いを休止させていただくこととなりました。
 現金にてお支払い希望の方は、コンビニエンスストアにてお支払いできる用紙をご送付申し上げますので、お近くの店舗にてお支払い頂けましたら幸いです。尚、領収証をご希望の方は、コンビニ支払い時に発行される振込受領書と引き換えにて発行させて頂きます。


※セミナーに申し込むにはものづくりドットコム会員登録が必要です

開催日時


10:30

受講料

47,300円(税込)/人

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込、コンビニ払い

開催場所

東京都

MAP

【品川区】きゅりあん

【JR・東急・りんかい線】大井町駅

主催者

キーワード

機械学習・ディープラーニング   SQC一般

※セミナーに申し込むにはものづくりドットコム会員登録が必要です

開催日時


10:30

受講料

47,300円(税込)/人

※本文中に提示された主催者の割引は申込後に適用されます

※銀行振込、コンビニ払い

開催場所

東京都

MAP

【品川区】きゅりあん

【JR・東急・りんかい線】大井町駅

主催者

キーワード

機械学習・ディープラーニング   SQC一般

関連記事

もっと見る