機械学習によるデータ分析の正しい進め方と評価方法
開催日 |
10:30 ~ 16:30 締めきりました |
---|---|
主催者 | (株)R&D支援センター |
キーワード | 機械学習・ディープラーニング |
開催エリア | 東京都 |
開催場所 | 【江東区】カメリアプラザ(商工情報センター) |
交通 | 【JR・東武】亀戸駅 |
機械学習を用いたデータ分析を行う際の正しい手順,注意点を
分かりやすく解説!
講師
(株)日立製作所 研究開発グループ 知能情報研究部 主任研究員 鴨志田 亮太 氏
【専門】
機械学習・最適化技術を利用したシステムの研究開発/データ分析プロセス習熟サポートに関する研究
【活動】
トップエスイー講師(2018年11月現在)
未習熟者の機械学習によるデータ分析を支援するPythonライブラリ「MALSS」の開発
受講料
■ R&D会員登録していただいた場合、通常1名様申込で49,980円(税込)から
・1名で申込の場合、47,250円(税込)へ割引になります。
・2名同時申込で両名とも会員登録をしていただいた場合、計49,980円(2人目無料)です。
(まだR&D会員未登録の方は、申込みフォームの通信欄に「会員登録情報希望」と記入してください。詳しい情報を送付します。ご登録いただくと、今回から会員受講料が適用可能です。)
受講対象・レベル
・機械学習を用いたデータ分析を行う初学者
・データ分析の結果を受け取りその妥当性を判断する必要のある方
・データ分析を外部に依頼する方
習得できる知識
・機械学習を用いたデータ分析の正しい手順
・分析の質を向上させるためにやるべきこと,やってはいけないこと
・データ分析時の落とし穴
趣旨
機械学習・ディープラーニング・人工知能技術の流行により、これらの技術を用いてビジネスの課題を解決するデータサイエンティストという職種が注目を集めています。機械学習・ディープラーニングについてはさまざまな書籍が刊行され、オープンソースのライブラリも充実してきています。これらの書籍を参照し、ライブラリを利用することで、誰でも簡単に機械学習を利用したデータ分析を行うことが可能となりました。
しかし、実際のビジネスに機械学習技術を適用するためには、ライブラリを利用できるだけでは不十分です。データの前処理やパラメータの調整、結果の評価手法など、データ分析の正しいやり方・手順を理解していなければ、質の高い分析結果を得ることができないだけでなく、誤った判断を下してしまう危険性もあります。また、データ分析を外部に委託する場合も、分析結果の妥当性を正しく判断するためには、分析を依頼する側にも正しい知識が求められます。
本セミナーでは、データ分析の正しいやり方・手順を学び、自分自身でデータ分析を行えるようになること、または他者のデータ分析結果を正しく評価できるようになることを目指します。
プログラム
1.データの前処理・扱い方
1-1 データ分析のためのデータ形式
1-2 特徴量(説明変数)の分類
1-3 カテゴリ変数の扱い方
1-4 欠損値の扱い方
1-5 データの正しい可視化方法
1-6 データ収集・整形時の注意点
2.機械学習の基本と利用時の留意点
2-1 機械学習とは
2-2 機械学習によるデータ分析でできること
2-3 代表的なアルゴリズム
2-4 データ特性に応じた手法の選択
2-5 ディープラーニングとは
2-6 ディープラーニングの使いどころ
3.分析結果の評価法
3-1 回帰モデルの評価基準
3-2 分類(識別)モデルの評価基準
3-3 精度以外の評価基準の重要性
3-4 適合率・再現率・F値
3-5 ROC曲線・AUC
4.機械学習によるデータ分析の進め方
4-1 パラメータ調整の必要性とその方法
4-2 過学習とその対策(交差検証法など)
4-3 バイアスとバリアンスについて
4-4 学習曲線による現状の把握
5.ビジネスへの適用について
5-1 分析結果を現場にどう受け入れてもらうか
5-2 機械学習の前にやるべきことはないか
5-3 実運用時の課題
5-4 その分析は解くべき課題を解決するものか
5-5 分析結果の公平性
5-6 真実は常に一つ?
5-7 ディスカッション