自動機械学習 データ分析講座(その184)

更新日

投稿日

 

 

◆ 古くて新しい自動機械学習

似たような数理モデルあり、その中から数理モデルを選択してモデル構築する場合のことです。このようなことを自動化したのが、自動機械学習(Automated Machine Learning)というものです。今回は「古くて新しい自動機械学習(Automated Machine Learning)」というお話しです。

【目次】

1.数理モデルの構築プロセス

2.有料ツール

3.無料ツール

4.ハイブリッドな使い方が一番いいかも

5.今回のまとめ

 

1.数理モデルの構築プロセス

 

データ分析

 

数理モデルを構築するプロセスは、例えば次のような感じではないでしょうか。

データ準備

前処理(データクレンジング含む)

特徴量生成・加工・選定

モデル選定・パラメータ最適化・モデル評価

デプロイ(展開)

 

昔からある「自動機械学習(Automated Machine Learning)」は「モデル選定・パラメータ最適化・モデル評価」の部分です。最近ですと「特徴量生成・加工・選定」のフィーチャーエンジニアリングの部分も対象にしているものもあるようです。しかしフィーチャーエンジニアリングの自動化は、まだ難しいのではないかと思います。

 

2.有料ツール

最近は、クラウド上で使える有料の自動機械学習(Automated Machine Learning)も出始めています。

有料版のもので、よく名前を聞くのが以下です。

  • AutoML Tables(Google)
  • AutoAI(IBM)
  • Automated ML(Microsoft)
  • DataRobot(DataRobot)
  • AutoFlow(MatrixFlow)
  • Driverless AI(H20.ai)

有料版だけあって、ユーザインターフェースが綺麗です。

 

3.無料ツール

データ分析や数理モデル構築といえば、最近ではRやPython、Juliaなどの無料で使えるものが多数あります。

自動機械学習(Automated Machine Learning)も例外ではなく、幾つかあります。RやPyhton上で動かすものです。

  • R automl
  • R RemixAutoML
  • AUTO-WEKA
  • Python auto-sklearn
  • Python TPOT

 

4.ハイブリッドな使い方が一番いいかも

恐らく、ある程度の数理モデル構築経験のある人であれば、自動機械学習(Automated Machine Learning)で構築した数理モデルの精度を超えることはできるでしょう。有料の自動機械学習(Automated Machine Learning)ツールの場合、安くはないです。無料あれば、コスト面を気にする必要はないことでしょう。しかし、RやPython上で実施するため、それなりのスキルは必要になります。

 

そうなると、無料版を使うとき初心者にはそれなりのハードルがあります。無料版の現状一番いい使い方は、ハイブリッドな使い方が一番いいかもしれません。手作りのモデル構築をサポートする形で、自動機械学習の機能を活用する、という感じです。

 

特に、「特徴量生成・加工・選定」のフィーチャーエンジニアリングの部分は、人手が必要な気がしま...

 

 

◆ 古くて新しい自動機械学習

似たような数理モデルあり、その中から数理モデルを選択してモデル構築する場合のことです。このようなことを自動化したのが、自動機械学習(Automated Machine Learning)というものです。今回は「古くて新しい自動機械学習(Automated Machine Learning)」というお話しです。

【目次】

1.数理モデルの構築プロセス

2.有料ツール

3.無料ツール

4.ハイブリッドな使い方が一番いいかも

5.今回のまとめ

 

1.数理モデルの構築プロセス

 

データ分析

 

数理モデルを構築するプロセスは、例えば次のような感じではないでしょうか。

データ準備

前処理(データクレンジング含む)

特徴量生成・加工・選定

モデル選定・パラメータ最適化・モデル評価

デプロイ(展開)

 

昔からある「自動機械学習(Automated Machine Learning)」は「モデル選定・パラメータ最適化・モデル評価」の部分です。最近ですと「特徴量生成・加工・選定」のフィーチャーエンジニアリングの部分も対象にしているものもあるようです。しかしフィーチャーエンジニアリングの自動化は、まだ難しいのではないかと思います。

 

2.有料ツール

最近は、クラウド上で使える有料の自動機械学習(Automated Machine Learning)も出始めています。

有料版のもので、よく名前を聞くのが以下です。

  • AutoML Tables(Google)
  • AutoAI(IBM)
  • Automated ML(Microsoft)
  • DataRobot(DataRobot)
  • AutoFlow(MatrixFlow)
  • Driverless AI(H20.ai)

有料版だけあって、ユーザインターフェースが綺麗です。

 

3.無料ツール

データ分析や数理モデル構築といえば、最近ではRやPython、Juliaなどの無料で使えるものが多数あります。

自動機械学習(Automated Machine Learning)も例外ではなく、幾つかあります。RやPyhton上で動かすものです。

  • R automl
  • R RemixAutoML
  • AUTO-WEKA
  • Python auto-sklearn
  • Python TPOT

 

4.ハイブリッドな使い方が一番いいかも

恐らく、ある程度の数理モデル構築経験のある人であれば、自動機械学習(Automated Machine Learning)で構築した数理モデルの精度を超えることはできるでしょう。有料の自動機械学習(Automated Machine Learning)ツールの場合、安くはないです。無料あれば、コスト面を気にする必要はないことでしょう。しかし、RやPython上で実施するため、それなりのスキルは必要になります。

 

そうなると、無料版を使うとき初心者にはそれなりのハードルがあります。無料版の現状一番いい使い方は、ハイブリッドな使い方が一番いいかもしれません。手作りのモデル構築をサポートする形で、自動機械学習の機能を活用する、という感じです。

 

特に、「特徴量生成・加工・選定」のフィーチャーエンジニアリングの部分は、人手が必要な気がします。

 

5.今回のまとめ

今回は「古くて新しい自動機械学習(Automated Machine Learning)」というお話しをしました。多くのツールは、「モデル選定・パラメータ最適化・モデル評価」の部分を自動化しています。中には、「モデル選定・パラメータ最適化・モデル評価」の前の「特徴量生成・加工・選定」の部分も対象にしているものもあるようです。素晴らしいことです。

 

現状一番いい使い方は、ハイブリッドな使い方が一番いいかもしれません。手作りのモデル構築をサポートする形で、自動機械学習の機能を活用する、という感じです。

 

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
予測モデルの活用とは データ分析講座(その116)

◆ 予測モデルは帰納的に構築し演繹的に活用する。そして論理展開する。  データ分析・活用を推し進める時にある段階まで進むと、予測モデルが一つのトピッ...

◆ 予測モデルは帰納的に構築し演繹的に活用する。そして論理展開する。  データ分析・活用を推し進める時にある段階まで進むと、予測モデルが一つのトピッ...


要因分析とは データ分析講座(その34)

◆ 異常な指標(KPIなど)の原因を探る「要因分析」 2つのアプローチ  指標(KPIなど)をモニタリングしていると、これはおかしいという場面に出く...

◆ 異常な指標(KPIなど)の原因を探る「要因分析」 2つのアプローチ  指標(KPIなど)をモニタリングしていると、これはおかしいという場面に出く...


「相関」は曲がったことが大っ嫌い データ分析講座(その222)

    【この連載の前回:データ分析講座(その221)誰かが困っているところで、循環経済を起こせ!へのリンク】 データ分析では、...

    【この連載の前回:データ分析講座(その221)誰かが困っているところで、循環経済を起こせ!へのリンク】 データ分析では、...


「情報マネジメント一般」の活用事例

もっと見る
情報システム導入企業の悩みとは

        今回は、次の事例から、自社の生産システムにあった生産管理ソフトの選択をどうすべきかを解説します。   1. 想定事例  電...

        今回は、次の事例から、自社の生産システムにあった生産管理ソフトの選択をどうすべきかを解説します。   1. 想定事例  電...


守秘義務は情報社会の命綱

  1. 顧客データの管理  O社は、技術志向のエンジニアリング会社です。 扱う製品の設計図には、さまざまな情報が含まれています。クライアントから...

  1. 顧客データの管理  O社は、技術志向のエンジニアリング会社です。 扱う製品の設計図には、さまざまな情報が含まれています。クライアントから...


デジタルデータの保存とは

        今回は、地震災害等を想定して、デジタルデータの保存に焦点を当てて、主なバックアップ方法と長所...

        今回は、地震災害等を想定して、デジタルデータの保存に焦点を当てて、主なバックアップ方法と長所...