Rによるデータマイニング入門<実習セミナー>

 IoTによる自動的なデータの取得を含め、人間活動の様々なデータが取得しやすくなり、AIや深層学習によりそれらの情報を活用した予測の有用性が示されている。データマイニングは、大量のデータを利用して、予測、分類、ルール発見などの目的に対して様々な手法によりアプローチする。
 本セミナーでは、フリーソフトウェアであるRを用いてデータマイニングを行うための基本的なデータの処理および可視化から、予測のためのデータマイニング手法として、線形回帰分析、ロジスティック回帰分析、決定木、サポートベクターマシン、分類のための手法として階層的クラスリング、非階層的クラスリング、自己組織化マップ、マーケットバスケット分析のための手法としてアソシエーションルール分析を紹介し、サンプルデータを用いて実際にRで分析結果を得たときの、結果の読み方、解析結果の可視化について実演する。

 当日はフリー統計ソフトR、RコマンダーおよびRStudioをインストールしたノートPCをご持参ください。別途、セミナー開催10日前を目安に、参加申込者にインストール方法(pdf)をご連絡します。


【講師】


山本 義郎 氏 : 東海大学 理学部 数学科  教授 博士(理学)


【プログラム】


  1. Rの基本
   1.1 Rstudioの基本操作
   1.2 R言語入門
   1.3 外部データの取り込み
   1.4 データの要約
   1.5 パッケージの利用
   1.6 dplyrパッケージによるデータフレームの操作
   1.7 データの可視化

  2.データマイニングとは
   2.1 ビッグデータとデータサイエンス
   2.2 CRISP-DM

  3.予測のためのデータマイニング手法
   3.1 線形回帰分析
   3.2 ロジスティック回帰分析
   3.3 決定木分析
   3.4 サポートベクターマシン
   3.5 k-近傍法
  
  4.分類のためのデータマイニング手法
   4.1 階層型クラスター分析
   4.2 非階層型クラスター分析
   4.3 自己組織化マップ(SOM)

  5. マーケットバスケット分析
   5.1 アソシエーションルール分析

  6. 複数の手法による予測の評価
   
  7. まとめ  


実習セミナーにつき1口受講はありません