少数・不揃いな計測データの機械学習とモデル設計
少数・不揃いデータでも精度が出せる解析設計手法が学べる
日時
2026年6月25日(木)13:00~17:15
【アーカイブ(録画)配信】
2026年7月6日(月)まで申込受付 (視聴期間:7/6~7/16)
セミナープログラム
【13:00~15:00】
【第1部】
深層学習だけでは不十分?少数データで精度を出す計測画像解析とスパースモデリング
筑波大学 システム情報系 准教授 五十嵐 康彦 氏
【講座主旨】
本講演では、電子顕微鏡画像・放射光計測データなどの先端計測データを対象に、少数データ環境において高精度な解析を実現するための手法について解説する。近年は深層学習の活用が進んでいるが、学習データが十分に確保できない場合には性能が制限されることが多い。本講演では、画像前処理の重要性を整理した上で、辞書学習や圧縮センシングなどのスパースモデリングに基づく手法を中心に取り上げる。これらの手法は少量のデータから本質的な構造を抽出できる点に特徴があり、場合によっては深層学習を上回る性能を示す。本講演では、これらの理論的背景とともに,実データ解析への応用例を通して、実務における有効な活用方法を提示する。
【講座内容】
◆少数データで精度を出す計測画像解析
1. 計測画像解析と機械学習の現状
2. 深層学習の限界と少数データ問題
3. 精度を左右するデータ前処理の重要性
4. ノイズ除去・正規化・特徴強調の実践
5. 少数データ解析の基本戦略
6. スパースモデリングの基礎と考え方
7. 辞書学習による画像表現と特徴抽出
8. 圧縮センシングによる高精度復元
9. 深層学習との使い分けと比較
10. 実データ解析事例と導入指針
【質疑応答】
【15:15~17:15】
【第2部】
条件が揃えにくい現場スペクトルデータに対するモデル設計の考え方
東京科学大学 総合研究院 化学生命科学研究所 准教授 安藤 康伸 氏
【本講座で取得できる知識】
・マテリアルズ・インフォマティクスの概要
・データ均質化のための予測モデル設計
・スペクトルデータの低次元化や分類方法
・スペクトルデータの物理モデリング方法
・研究データ蓄積の基礎
【講座主旨】
データ科学によって研究データの利活用を促進し、研究・開発を加速することを目指すマテリアルズ・インフォマティクスやプロセス・インフィマティクスが高い注目を集めています。特に、研究・開発ではスペクトルデータを多数取り扱いますが、エネルギーの基準がずれてしまっていたり、チャネル数がずれていたりと、研究・開発の現場でこれまでに蓄積されたデータの利活用には課題が多くあります。これらをうまくモデル化することで比較可能なものにし、データを統一的に扱うことができます。本講演では、不揃いなスペクトルデータ解析を行う上での課題に注目をし、取得したスペクトルデータからの情報抽出のための機械学習活用について、「回帰」「分類」「低次元化」「ピーク検知」といった視点から、機械学習の数理的な側面も交えながら基礎的な内容を紹介します。
【講座内容】
1.物質・材料データに対する機械学習の基礎
1)機械学習の基礎
2)機械学習応用の流れと課題設定の重要性
3)代表的な機械学習応用事例の紹介
4)化学プロセスデータの特徴と注意点
5)情報科学市民権
6)材料科学の立場として忘れてはいけないこと
2.予測モデルによる均質化とモデル選択
1)予測・モデル選択の応用例
2)モデル推定の種類(最尤法, MAP推定, ベイズ推定)
3)確率論的にみた回帰と正則化
4)非線形モデリングの困難
a)マルコフ連鎖モンテカルロ法によるパラメータ最適化
b)情報量基準によるモデル選択
c)解析事例
3.スペクトルデータの低次元化とクラスター解析
1)高次元データとしてのスペクトルと低次元化の重要性
2)分類:教師あり学習と教師なし学習
3)特徴空間と類似度
4)特徴空間の解釈性と表現性
5)主成分解析によるスペクトルの低次元化
6)k-means法によるスペクトルの分類
7)階層的クラスタリングによるスペクトルの分類
4.スペクトル解析のためのEMアルゴリズムによるピーク検知
1)ピーク検知のための処理フロー
2)非線形最小二乗法の困難
3)回帰と分布推定の違い
4)ガウス分布の最尤推定
5)EMアルゴリズムによる最尤推定
6)スペクトル解析のための改良EMアルゴリズム
7)解析事例
5. 研究データ蓄積を行う上で必要なこと
1) データベース構築の3つの目的
2) データベースの種類
3) フラットファイルフォーマット
4) ツリー構造を利用した実験データ蓄積
5) 電子ラボノートの事例
【質疑応答】
セミナー講師
【第1部】
筑波大学 システム情報系 准教授 五十嵐 康彦 氏
【第2部】
東京科学大学 総合研究院 化学生命科学研究所 准教授 安藤 康伸 氏
セミナー受講料
聴講料 1名につき49,500円(消費税込/資料付き)
〔1社2名以上同時申込の場合のみ1名につき44,000円〕
主催者
開催場所
全国
受講について
セミナーの接続確認・受講手順はこちらをご確認下さい。