予測モデルの活用とは データ分析講座(その116)

更新日

投稿日

情報マネジメント

◆ 予測モデルは帰納的に構築し演繹的に活用する。そして論理展開する。

 データ分析・活用を推し進める時にある段階まで進むと、予測モデルが一つのトピックとして登場します。予測モデルとは数式で表現されたもので例えば受注や受注金額、見込み客からの離脱などを予測するためのものです。当然ながら予測モデルは天から降ってくるわけではありません。誰かが創造する必要があります。予測モデルは創造しただけでは意味はありません。誰かが実務で活用する必要があります。今回は「予測モデルは帰納的に構築し演繹(えんえき)的に活用する。そして論理展開する」というお話しをします。

1、2つの予測モデルの用途

 セールスアナリティクスにおける予測モデルの用途は、ざっくりいうと次の2つです。

  • どの程度起こりそうかの予測(質的予測)
  • どのくらいになりそうかの予測(量的予測)

 「どの程度起こりそうかの予測」とは、例えば「受注なのか失注なのか」や「離脱なのか継続なのか」のように、どちらの状態になりそうかを予測するものです。受注予測モデルや離脱予測モデルなどです。

一方「どのくらいになりそうかの予測」とは「受注するなら金額はいくらのなりそうか」や「お店の売上高はどのくらいになりそうか」のように、量を予測するものです。受注金額予測モデルや売上予測モデルなどです。他にもあるかもしれませんが、ざっくりいうとどちらか2つに分類されることでしょう。

2、帰納法と演繹法

 有名な論理展開の方法に、帰納法と演繹法というものがあります。この2つは予測モデルを構築し活用する上で欠かせない概念で、帰納法と演繹法が正しいことが前提となっています。帰納法とは「個々の事実」の積み重ねから「普遍的な事実」(一般的な傾向、セオリー、ルールなど)を導き出し、結論に導く推論方法です。

 例えば色々な哺乳類を調べ、血が流れている事実を積み重ね「哺乳類には血が流れている」という感じで結論付けます。

 演繹法とは「普遍的な事実」から結論を導く推論方法です。

 例えば「ゴリラは哺乳類である」という「普遍的な事実」と「哺乳類には血が流れている」という「普遍的な事実」から「ゴリラには血が流れている」と結論付けます。

3、予測モデルは帰納的に構築

 予測モデルは「個々の事実」である過去のデータから構築します。人が適当に数式を描くわけではありません。つまり予測モデルは帰納的に構築されます。しかし実はそうでもありません。例外もあります。ベイズ系のモデルはその典型です。人の主観がモデル構築に多少なりとも影響します。

 そもそもどの種類のモデルを使って予測モデルを構築するのかや、モデル構築する際の学習パラメータ設定など、人が考え設定する必要があります。そういう意味で予測モデル構築は、帰納かつ演繹なのかもしれません。ですが予測モデル構築を大まかに見れば機能的です。

4、予測モデルは演繹的に活用

 予測モデルを活用するときは、そのモデルが正しいものとして活用します。つまり予測モデルは演繹的に活用されます。しかし正しいと思われたモデルが複数あることもあります。どういうことかといいますと、予測モデルを複数作る場合があり、各予測値が異なることがあるからです。正しいはずの予測値がたくさんあるというおかしな状態です。このような場合、複数の予測値の平均値と計算しそれを予測値としたり複数の予測値で投票し最大得票を予測値とみなしたりします。機械学習用語で表現すると、アンサンブル学習と呼ばれるやり方です。

 「個々のモデルの予測値」の積み重ねから「今回の予測値」を導き出すという感じとなり、帰納的な匂いがしてきます。ですが予測モデル活用を大まかに見れば演繹的です。

5、もう一つの論...

情報マネジメント

◆ 予測モデルは帰納的に構築し演繹的に活用する。そして論理展開する。

 データ分析・活用を推し進める時にある段階まで進むと、予測モデルが一つのトピックとして登場します。予測モデルとは数式で表現されたもので例えば受注や受注金額、見込み客からの離脱などを予測するためのものです。当然ながら予測モデルは天から降ってくるわけではありません。誰かが創造する必要があります。予測モデルは創造しただけでは意味はありません。誰かが実務で活用する必要があります。今回は「予測モデルは帰納的に構築し演繹(えんえき)的に活用する。そして論理展開する」というお話しをします。

1、2つの予測モデルの用途

 セールスアナリティクスにおける予測モデルの用途は、ざっくりいうと次の2つです。

  • どの程度起こりそうかの予測(質的予測)
  • どのくらいになりそうかの予測(量的予測)

 「どの程度起こりそうかの予測」とは、例えば「受注なのか失注なのか」や「離脱なのか継続なのか」のように、どちらの状態になりそうかを予測するものです。受注予測モデルや離脱予測モデルなどです。

一方「どのくらいになりそうかの予測」とは「受注するなら金額はいくらのなりそうか」や「お店の売上高はどのくらいになりそうか」のように、量を予測するものです。受注金額予測モデルや売上予測モデルなどです。他にもあるかもしれませんが、ざっくりいうとどちらか2つに分類されることでしょう。

2、帰納法と演繹法

 有名な論理展開の方法に、帰納法と演繹法というものがあります。この2つは予測モデルを構築し活用する上で欠かせない概念で、帰納法と演繹法が正しいことが前提となっています。帰納法とは「個々の事実」の積み重ねから「普遍的な事実」(一般的な傾向、セオリー、ルールなど)を導き出し、結論に導く推論方法です。

 例えば色々な哺乳類を調べ、血が流れている事実を積み重ね「哺乳類には血が流れている」という感じで結論付けます。

 演繹法とは「普遍的な事実」から結論を導く推論方法です。

 例えば「ゴリラは哺乳類である」という「普遍的な事実」と「哺乳類には血が流れている」という「普遍的な事実」から「ゴリラには血が流れている」と結論付けます。

3、予測モデルは帰納的に構築

 予測モデルは「個々の事実」である過去のデータから構築します。人が適当に数式を描くわけではありません。つまり予測モデルは帰納的に構築されます。しかし実はそうでもありません。例外もあります。ベイズ系のモデルはその典型です。人の主観がモデル構築に多少なりとも影響します。

 そもそもどの種類のモデルを使って予測モデルを構築するのかや、モデル構築する際の学習パラメータ設定など、人が考え設定する必要があります。そういう意味で予測モデル構築は、帰納かつ演繹なのかもしれません。ですが予測モデル構築を大まかに見れば機能的です。

4、予測モデルは演繹的に活用

 予測モデルを活用するときは、そのモデルが正しいものとして活用します。つまり予測モデルは演繹的に活用されます。しかし正しいと思われたモデルが複数あることもあります。どういうことかといいますと、予測モデルを複数作る場合があり、各予測値が異なることがあるからです。正しいはずの予測値がたくさんあるというおかしな状態です。このような場合、複数の予測値の平均値と計算しそれを予測値としたり複数の予測値で投票し最大得票を予測値とみなしたりします。機械学習用語で表現すると、アンサンブル学習と呼ばれるやり方です。

 「個々のモデルの予測値」の積み重ねから「今回の予測値」を導き出すという感じとなり、帰納的な匂いがしてきます。ですが予測モデル活用を大まかに見れば演繹的です。

5、もう一つの論理展開「アブダクション」

 帰納法と演繹法についてお話しましたがが、それだけではありません。もう一つ有名な論理展開があります。それはアブダクションです。

 こちらの論理展開もデータ分析・活用上、非常に重要です。ここでは詳しく説明しませんが、ベイズ統計学の世界と非常に近いようです。アブダクションとは観測事実の生起要因の仮説を作り、論理的に説明するものです。

 現在から過去を探ります。そういう意味で予測とは逆になります。要因分析に近く、データ分析・活用する上で非常に重要です。予測モデルとの合わせ技として予兆検知が挙げられます。未来の異常検知です。未来から現在(もしくは近い未来)を探るのです。未来の異常を予測しその未来の異常を起こす要因を探り対処する、このような使い方です。例えばプレディクティブ・メンテナンス(予知保全)やカスタマーヘルススコア(顧客健全性スコア)などの領域で盛んに活用されています。

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
データ分析・活用の2層構造の理解 データ分析講座(その89)

  ◆ ビッグデータ活用が上手くいかない時、データ分析・活用の2層構造を理解すればスッキリする  ビッグデータが叫ばれてから、データ分析やデ...

  ◆ ビッグデータ活用が上手くいかない時、データ分析・活用の2層構造を理解すればスッキリする  ビッグデータが叫ばれてから、データ分析やデ...


データ活用プラットフォームとデータサイエンス データ分析講座(その298)

  データをいかに活用しビジネスを加速させればいいのか。そのためのツールとして、データ活用プラットフォームがあります。呼び方は様々で、単に...

  データをいかに活用しビジネスを加速させればいいのか。そのためのツールとして、データ活用プラットフォームがあります。呼び方は様々で、単に...


インダストリー4.0とFMS

 最近インダストリー(産業革命)4.0というコンセプトが注目を集めています。インダストリー4.0はドイツが発祥といわれていますが、工場内や離れた工場にある...

 最近インダストリー(産業革命)4.0というコンセプトが注目を集めています。インダストリー4.0はドイツが発祥といわれていますが、工場内や離れた工場にある...


「情報マネジメント一般」の活用事例

もっと見る
レストランでのタブレット端末

        最近、テーブルにタブレット端末を置くレストランが増えています。レストラン利用者としては、ウェ...

        最近、テーブルにタブレット端末を置くレストランが増えています。レストラン利用者としては、ウェ...


簡易版DX/IoTから機械学習への移行

  DX(デジタル・トランスフォーメーション)を使えばコスト削減と納期短縮が可能に 産業界のニュースなどをインターネットで読んでいると、DX...

  DX(デジタル・トランスフォーメーション)を使えばコスト削減と納期短縮が可能に 産業界のニュースなどをインターネットで読んでいると、DX...


Excelの帳票を見直そう

 オフィス業務においては、マイクロソフトOfficeがデファクトスタンダードになっています。とりわけ活用されているのはExcelでしょう。Excelを使う...

 オフィス業務においては、マイクロソフトOfficeがデファクトスタンダードになっています。とりわけ活用されているのはExcelでしょう。Excelを使う...