
インフォマティクス実施のための実験データ収集・DB化と“少ないデータ”対策
☆ 機械学習に必要十分なデータ収集の手法や、そのためのDBプラットフォームとは?
☆ データが十分でないときの打開策、データ取得コストが高い分野での実践事例が聴ける!
セミナープログラム
【10:00~11:10】
【第1部】 インフォマティクスへの活用を目指した実験データマネジメントとDB構築
三井化学(株)DX推進本部 DX企画管理部 向田 志保 氏
(信州大学 工学部 特任准教授、大阪大学 基礎工学研究科 招へい教授)
【講座主旨】
実験データの活用においては、手元のデータだけではなく、外部データの取得や、能動的にデータを取得するシステムが重要である。近年は、すべてのDBをまとめて構造化する必要はなく、データを収集する手法も多様化しており、複数のDBを関連付けて扱うことができるRDBや、さらにはコストをかけずに、必要時に必要なだけのデータを取得することができる仮想データベース技術も発達している。さらに、自律型実験装置の導入により、人手をかけずに、ロボティクスが能動的にデータを取得する潮流も看過できない。さらには、自然言語処理を活用し、市況情報などとも結び付けて、市場ニーズに見合った製品開発を行うことが重要である。これらのデータの取得と実験の効率化を結び付け、包括的なデータハーベスティングシステムの構築に向けて概要を説明する。
【講座内容】
1.DBの活用
1.1 実験に必要なデータの取得
1.2 DBの種類
1.3 外部データの活用
2.実験データマネジメント
2.1 マテリアルDXの活用
2.2 自律型実験装置とDBの連携
3.新規材料探索
3.1 自然言語処理を活用したデータの可視化
3.2 新規材料探索とマテリアルDXの連携
3.3 サプライチェーンを考慮したデータの抽出方法
4. 実験DBの発展形
4.1 仮想空間上のDB
4.2 データハーベスティングシステム
【質疑応答】
【11:20~12:30】
【第2部】マテリアルDX基盤におけるデータアーキテクチャ ~利活用を考慮したデータ構造化の進め方~
物質・材料研究機構 技術開発・共用部門マテリアル先端リサーチインフラセンター 副センター長 松波 成行 氏
【講座主旨】
データ駆動型研究の進展に伴い、効率的なデータ収集の仕組みが求められている。機械学習等による新規材料を開発するマテリアルズインフォマティックス(MI)では、実験データ等を多角的にデータ収集することが予測モデルの構築や検証において極めて重要である。このようなマテリアル開発におけるデータ駆動型研究のためには、教師データ(学習データ/検証データ)となる計測装置等からのデータおよび、そのデータ構造化の方針を策定しておかなければならない。物質・材料研究機構では、計測・プロセス技術に特化したデータ構造化の設計指針をもとにICT技術を活用したデータ収集を省人的に進めるDX基盤(マテリアルDX基盤)を運用している。本セミナーでは、マテリアルDX基盤に必要となるデータ設計(データアーキテクチャ)の考え方について紹介する。
【講座内容】
1.なぜデータ構造化が必要か ― Why ―
・データをとりまく環境の変化
・データ利活用の研究動向
・データ収集ができない主な理由
・科学技術のデータ収集で直面する三重苦
・ソリューション: データ構造化とデータ設計
・データ構造化のポイント
2.データ構造化で何ができるか ― What ―
・データ構造化システムの概要
・データ構造化のシステムデザイン
・機器の分類
・データ構造化による自動化機能
・データセットの活用形態例
・データ構造化のメリット
3.データ構造化のデータ設計指針 ― How ―
・データ構造化のための5D
・データ利活用におけるデータセットの基本構造
・計測分野におけるデータ空間の展開
・データ取得にかかる負荷(工数)
・データ設計の指針
・データ構造化の開発におけるフロー
【質疑応答】
【13:20~14:50】
【第3部】 創薬DXにおける研究データのDB化とそのシステム構築
日本たばこ産業(株) 医薬総合研究所高槻サイト薬物動態研究所 主幹研究員 篠田 清孝 氏
【講座主旨】
演者は,日本たばこ産業株式会社の医薬総合研究所内にある薬物動態研究所(以下JT薬物動態研究所と記載)においてITの仕事に従事しており,創薬研究のステージでJT薬物動態研究所が実施する各種評価の結果,発生する様々なデータ(創薬ADME評価データ)をDBに登録するシステムを,機械学習ツール「KNIME」を利用して作成して運用している。また,DB登録したデータを検索して可視化・ダウンロードするシステムもKNIMEを用いて構築し,利用してもらっている。
本講演ではJT薬物動態研究所における創薬ADMEデータの管理にKNIME Serverを活用している事例を発表する。また併せてDB登録を含む創薬研究における一般的なKNIMEの利用例についてソフトウェアの実演を通して紹介する。
【講座内容】
1.日本たばこ産業株式会社(JT)の医薬事業のご紹介
2.JT医薬総合研究所における医薬品の研究開発
3.創薬研究と薬物動態(ADME)
4.創薬DXにおける創薬ADME評価データの重要性
5.評価データのDB化
6.DB化した評価データの可視化
7.KNIMEの概要
8.創薬研究におけるKNIMEの利用
9.製薬企業でのKNIME導入
10.KNIMEを利用したデータ登録システムのプロセス
11.データ登録システムに実装している機能の詳細
12.KNIMEを利用したデータ可視化システム
13.ソフトウェア(KNIME)を利用した実演(インフォコム社様)
【質疑応答】
【15:00~16:10】
【第4部】 ベイズ最適化による少数データでの材料設計
(株)レゾナック 計算情報科学研究センター チーフ・リサーチャー 南 拓也 氏
【講座主旨】
企業においてデータ解析を行う際に、データ数が少ない問題に直面することが多い。とりわけ材料分野では、従来にない新しい材料を開発することが必要であり、基本的にはデータがない外挿領域を探索することが必要となる。本講演では、データ数が少ない場合の材料探索の事例としてベイズ最適化の事例をご紹介する。また、その他データ収集・少数データでの解析事例についてもご紹介する。
【講座内容】
1.はじめに
2.データ解析、マテリアルズインフォマティクスについて
3.熱可塑性ポリマー設計の事例紹介
3.1 予測モデル構築
3.2 機械学習と計算科学との比較
3.3 ポリマー物性予測と適用限界
3.4 ベイズ最適化による少数データでのポリマー設計
4.その他事例のご紹介
【質疑応答】
【16:20~17:30】
【第5部】 少ないデータでインフォマティクスを行う際のデータ準備・対応の事例
東レ(株) 先端材料研究所 デジタルマテリアルサイエンスG 研究員 山本 海 氏
【講座主旨】
インフォマティクス適用には「大量」のデータが必要とされるが、現実には数十件程度しか使えないことが多い。しかし「大量」とは何だろうか?「少量」であれば、どのようにすれば「役に立つ」のか?そのために必要な技術は何か?これらの疑問への対応方法を、弊社における組成設計の取り組み事例を元に議論する。
【講座内容】
―はじめに
・データが「少ない」とは?
・少なくなりがちなデータの特徴
―「少ない」データのインフォマティクス事例
・組成設計の位置づけ
・データ前処理とアルゴリズム選択
―発展的な対応方法
・データを「増やす」アプローチ
・「多い」データの活用
【質疑応答】
セミナー講師
【第1部】
三井化学(株)DX推進本部 DX企画管理部 向田 志保 氏
(信州大学 工学部 特任准教授、大阪大学 基礎工学研究科 招へい教授)
【第2部】
物質・材料研究機構 技術開発・共用部門 マテリアル先端リサーチインフラセンター 副センター長 松波 成行 氏
【第3部】
日本たばこ産業(株) 医薬総合研究所高槻サイト薬物動態研究所 主幹研究員 篠田 清孝 氏
【第4部】
(株)レゾナック 計算情報科学研究センター チーフ・リサーチャー 南 拓也 氏
【第5部】
東レ(株) 先端材料研究所 デジタルマテリアルサイエンスG 研究員 山本 海 氏
セミナー受講料
聴講料 1名につき66,000円(消費税込/資料付き)
〔1社2名以上同時申込の場合のみ1名につき60,500円〕
受講について
- 本講座はZoomを利用したLive配信セミナーです。セミナー会場での受講はできません。
- 下記リンクから視聴環境を確認の上、お申し込みください。
→ https://zoom.us/test - 開催日が近くなりましたら、視聴用のURLとパスワードをメールにてご連絡申し上げます。
セミナー開催日時に、視聴サイトにログインしていただき、ご視聴ください。 - Zoomクライアントは最新版にアップデートして使用してください。
Webブラウザから視聴する場合は、Google Chrome、Firefox、Microsoft Edgeをご利用ください。 - パソコンの他にタブレット、スマートフォンでも視聴できます。
- セミナー資料はお申込み時にお知らせいただいた住所へお送りいたします。
お申込みが直前の場合には、開催日までに資料の到着が間に合わないことがあります。ご了承ください。 - 当日は講師への質問をすることができます。可能な範囲で個別質問にも対応いたします。
- 本講座で使用される資料や配信動画は著作物であり、
録音・録画・複写・転載・配布・上映・販売等を禁止いたします。 - 本講座はお申し込みいただいた方のみ受講いただけます。
複数端末から同時に視聴することや複数人での視聴は禁止いたします。 - Zoomのグループにパスワードを設定しています。
部外者の参加を防ぐため、パスワードを外部に漏洩しないでください。
万が一部外者が侵入した場合は管理者側で部外者の退出あるいはセミナーを終了いたします。
受講料
66,000円(税込)/人