化学・材料研究者のためのExcel×Pythonデータ処理実務
Excelで行っていた実験データ処理をPythonへ
—AI時代に求められる、データ整理・前処理・自動化を実践的に学ぶ
欠損値処理、複数シート・複数ファイルの統合もPythonで効率化
—実験データ処理実務を演習を通じて習得する
日時
2026年9月9日(水)13:00~17:00
【アーカイブ(録画)配信】
2026年9月18日(金)まで申込み受付(視聴期間:9/18~9/28)
セミナー趣旨
本講座は、医薬品・化学・材料系の研究開発者を対象に、これまでExcelで行っていた実験データの管理やデータ整理をPython(Pandas)に置き換え、業務の効率化を図るための入門講座です。
近年、ケモインフォマティクス(CI)やマテリアルズインフォマティクス(MI)の導入が進んでいますが、解析ツールやアルゴリズムにデータを投入する前段階として、機械が読み込める「構造化データ」へと整理(前処理)する実務が必要となります。本講座では、数式や統計学の解説ではなく、手元のExcel形式の実験データをPython(Pandas)を用いて利活用できる形式に整える具体的なコード記述と手順を解説します。
なお、講義内では、実務で頻出するデータ構造(化合物ID、反応条件、物性値など)を再現した演習用の疑似データを使用しながら、具体的なデータ解析手順やエラーへの対処法を説明します。 複数の実験条件が記録されたExcelデータの読み込みから開始し、手入力に伴う空欄(欠損値)の検出・処理、日付やロットごとに分かれた「複数シート・複数ファイル」の自動一括統合、条件ごとの集計(平均・最大・最小など)を解説します。最終的に、整理後のデータをExcel形式で出力し、日常の定型解析業務を自動化するための一連のプログラム構成の習得を目指します。
習得できる知識
・医薬品・化学・材料系の実験データを格納したExcelファイルをPythonで処理するための基礎知識
・インフォマティクス(CI/MI)の入力データとして適合する「構造化データ」とデータ形式のルール
・手入力のExcelシートに発生する空欄(欠損値)や重複データを検出し、除外・置換する処理手法
・1つのExcelファイル内の複数シート、および複数ファイルに分散した実験データの自動一括読み込みと統合手法
・処理・集計したデータのExcelファイル(.xlsx)への書き出しと、定型解析業務をスクリプト化する手順
セミナープログラム
◆CI/MI推進におけるPython活用と実験データの利活用
・化学・材料研究におけるデータ処理をPythonへ移行する目的
・インフォマティクス(CI/MI)の入力データとして必要なデータ形式
・開発環境「Google Colaboratory」の基本操作と演習の準備
◆実験Excelデータの読み込みとデータフレーム形式への整理
・実験データの読み込み
・行名・列名による指定やデータ抽出
・数値データに応じた昇順・降順の並び替え
◆手入力Excelに生じるデータ欠損・重複への対処
・Excelシート内の空欄の検出方法と除外
・空欄データへの置換・穴埋め処理
・系列や条件ごとの平均値・最大値・最小値の自動集計
◆シート別・ファイル別に分かれた「大量データの一括処理」
・「実験日別」「ロット別」に分かれた複数シートおよび複数ファイルのディレクトリ構造
・複数シート(または複数ファイル)の自動読み込み
・読み込んだ複数の実験データの結合・統合
◆データの可視化とExcelへの書き出し処理
・実験データの傾向を把握するための可視化
・整理・集計したデータをExcel形式で保存
・日常の定型処理を自動化するためのプログラム構成と運用の進め方
【質疑応答】
セミナー講師
滋賀大学 データサイエンス学部 准教授 博士(理学) 江崎 剛史 氏
セミナー受講料
聴講料 1名につき49,500円(消費税込/資料付き)
〔1社2名以上同時申込の場合のみ1名につき44,000円〕
主催者
開催場所
全国
受講について
セミナーの接続確認・受講手順はこちらをご確認下さい。