予測モデルの活用とは データ分析講座(その116)

更新日

投稿日

情報マネジメント

◆ 予測モデルは帰納的に構築し演繹的に活用する。そして論理展開する。

 データ分析・活用を推し進める時にある段階まで進むと、予測モデルが一つのトピックとして登場します。予測モデルとは数式で表現されたもので例えば受注や受注金額、見込み客からの離脱などを予測するためのものです。当然ながら予測モデルは天から降ってくるわけではありません。誰かが創造する必要があります。予測モデルは創造しただけでは意味はありません。誰かが実務で活用する必要があります。今回は「予測モデルは帰納的に構築し演繹(えんえき)的に活用する。そして論理展開する」というお話しをします。

1、2つの予測モデルの用途

 セールスアナリティクスにおける予測モデルの用途は、ざっくりいうと次の2つです。

  • どの程度起こりそうかの予測(質的予測)
  • どのくらいになりそうかの予測(量的予測)

 「どの程度起こりそうかの予測」とは、例えば「受注なのか失注なのか」や「離脱なのか継続なのか」のように、どちらの状態になりそうかを予測するものです。受注予測モデルや離脱予測モデルなどです。

一方「どのくらいになりそうかの予測」とは「受注するなら金額はいくらのなりそうか」や「お店の売上高はどのくらいになりそうか」のように、量を予測するものです。受注金額予測モデルや売上予測モデルなどです。他にもあるかもしれませんが、ざっくりいうとどちらか2つに分類されることでしょう。

2、帰納法と演繹法

 有名な論理展開の方法に、帰納法と演繹法というものがあります。この2つは予測モデルを構築し活用する上で欠かせない概念で、帰納法と演繹法が正しいことが前提となっています。帰納法とは「個々の事実」の積み重ねから「普遍的な事実」(一般的な傾向、セオリー、ルールなど)を導き出し、結論に導く推論方法です。

 例えば色々な哺乳類を調べ、血が流れている事実を積み重ね「哺乳類には血が流れている」という感じで結論付けます。

 演繹法とは「普遍的な事実」から結論を導く推論方法です。

 例えば「ゴリラは哺乳類である」という「普遍的な事実」と「哺乳類には血が流れている」という「普遍的な事実」から「ゴリラには血が流れている」と結論付けます。

3、予測モデルは帰納的に構築

 予測モデルは「個々の事実」である過去のデータから構築します。人が適当に数式を描くわけではありません。つまり予測モデルは帰納的に構築されます。しかし実はそうでもありません。例外もあります。ベイズ系のモデルはその典型です。人の主観がモデル構築に多少なりとも影響します。

 そもそもどの種類のモデルを使って予測モデルを構築するのかや、モデル構築する際の学習パラメータ設定など、人が考え設定する必要があります。そういう意味で予測モデル構築は、帰納かつ演繹なのかもしれません。ですが予測モデル構築を大まかに見れば機能的です。

4、予測モデルは演繹的に活用

 予測モデルを活用するときは、そのモデルが正しいものとして活用します。つまり予測モデルは演繹的に活用されます。しかし正しいと思われたモデルが複数あることもあります。どういうことかといいますと、予測モデルを複数作る場合があり、各予測値が異なることがあるからです。正しいはずの予測値がたくさんあるというおかしな状態です。このような場合、複数の予測値の平均値と計算しそれを予測値としたり複数の予測値で投票し最大得票を予測値とみなしたりします。機械学習用語で表現すると、アンサンブル学習と呼ばれるやり方です。

 「個々のモデルの予測値」の積み重ねから「今回の予測値」を導き出すという感じとなり、帰納的な匂いがしてきます。ですが予測モデル活用を大まかに見れば演繹的です。

5、もう一つの論...

情報マネジメント

◆ 予測モデルは帰納的に構築し演繹的に活用する。そして論理展開する。

 データ分析・活用を推し進める時にある段階まで進むと、予測モデルが一つのトピックとして登場します。予測モデルとは数式で表現されたもので例えば受注や受注金額、見込み客からの離脱などを予測するためのものです。当然ながら予測モデルは天から降ってくるわけではありません。誰かが創造する必要があります。予測モデルは創造しただけでは意味はありません。誰かが実務で活用する必要があります。今回は「予測モデルは帰納的に構築し演繹(えんえき)的に活用する。そして論理展開する」というお話しをします。

1、2つの予測モデルの用途

 セールスアナリティクスにおける予測モデルの用途は、ざっくりいうと次の2つです。

  • どの程度起こりそうかの予測(質的予測)
  • どのくらいになりそうかの予測(量的予測)

 「どの程度起こりそうかの予測」とは、例えば「受注なのか失注なのか」や「離脱なのか継続なのか」のように、どちらの状態になりそうかを予測するものです。受注予測モデルや離脱予測モデルなどです。

一方「どのくらいになりそうかの予測」とは「受注するなら金額はいくらのなりそうか」や「お店の売上高はどのくらいになりそうか」のように、量を予測するものです。受注金額予測モデルや売上予測モデルなどです。他にもあるかもしれませんが、ざっくりいうとどちらか2つに分類されることでしょう。

2、帰納法と演繹法

 有名な論理展開の方法に、帰納法と演繹法というものがあります。この2つは予測モデルを構築し活用する上で欠かせない概念で、帰納法と演繹法が正しいことが前提となっています。帰納法とは「個々の事実」の積み重ねから「普遍的な事実」(一般的な傾向、セオリー、ルールなど)を導き出し、結論に導く推論方法です。

 例えば色々な哺乳類を調べ、血が流れている事実を積み重ね「哺乳類には血が流れている」という感じで結論付けます。

 演繹法とは「普遍的な事実」から結論を導く推論方法です。

 例えば「ゴリラは哺乳類である」という「普遍的な事実」と「哺乳類には血が流れている」という「普遍的な事実」から「ゴリラには血が流れている」と結論付けます。

3、予測モデルは帰納的に構築

 予測モデルは「個々の事実」である過去のデータから構築します。人が適当に数式を描くわけではありません。つまり予測モデルは帰納的に構築されます。しかし実はそうでもありません。例外もあります。ベイズ系のモデルはその典型です。人の主観がモデル構築に多少なりとも影響します。

 そもそもどの種類のモデルを使って予測モデルを構築するのかや、モデル構築する際の学習パラメータ設定など、人が考え設定する必要があります。そういう意味で予測モデル構築は、帰納かつ演繹なのかもしれません。ですが予測モデル構築を大まかに見れば機能的です。

4、予測モデルは演繹的に活用

 予測モデルを活用するときは、そのモデルが正しいものとして活用します。つまり予測モデルは演繹的に活用されます。しかし正しいと思われたモデルが複数あることもあります。どういうことかといいますと、予測モデルを複数作る場合があり、各予測値が異なることがあるからです。正しいはずの予測値がたくさんあるというおかしな状態です。このような場合、複数の予測値の平均値と計算しそれを予測値としたり複数の予測値で投票し最大得票を予測値とみなしたりします。機械学習用語で表現すると、アンサンブル学習と呼ばれるやり方です。

 「個々のモデルの予測値」の積み重ねから「今回の予測値」を導き出すという感じとなり、帰納的な匂いがしてきます。ですが予測モデル活用を大まかに見れば演繹的です。

5、もう一つの論理展開「アブダクション」

 帰納法と演繹法についてお話しましたがが、それだけではありません。もう一つ有名な論理展開があります。それはアブダクションです。

 こちらの論理展開もデータ分析・活用上、非常に重要です。ここでは詳しく説明しませんが、ベイズ統計学の世界と非常に近いようです。アブダクションとは観測事実の生起要因の仮説を作り、論理的に説明するものです。

 現在から過去を探ります。そういう意味で予測とは逆になります。要因分析に近く、データ分析・活用する上で非常に重要です。予測モデルとの合わせ技として予兆検知が挙げられます。未来の異常検知です。未来から現在(もしくは近い未来)を探るのです。未来の異常を予測しその未来の異常を起こす要因を探り対処する、このような使い方です。例えばプレディクティブ・メンテナンス(予知保全)やカスタマーヘルススコア(顧客健全性スコア)などの領域で盛んに活用されています。

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
業効率化用ソフトウェアを導入する際の課題(その1)

   この連載は、業務効率化の課題について整理して解説していきます。今回は、業効率化用ソフトウェア導入までの課題、着眼点とアプローチについ...

   この連載は、業務効率化の課題について整理して解説していきます。今回は、業効率化用ソフトウェア導入までの課題、着眼点とアプローチについ...


データ活用の末路、データ分析講座(その309)その末路とは

  DX、AI、データサイエンス、機械学習、ディープラーニングなど、データ活用を目論むことが多くなった昨今です。ただデータ活用を過度に進め...

  DX、AI、データサイエンス、機械学習、ディープラーニングなど、データ活用を目論むことが多くなった昨今です。ただデータ活用を過度に進め...


データ活用の成果は金額換算で データ分析講座(その286)

  DX・AI・ビッグデータなど、データ活用にチャレンジする機会が増えてきました。ただし、目標設定が定性的過ぎて、単にそのためのシステム導...

  DX・AI・ビッグデータなど、データ活用にチャレンジする機会が増えてきました。ただし、目標設定が定性的過ぎて、単にそのためのシステム導...


「情報マネジメント一般」の活用事例

もっと見る
‐情報収集で配慮すべき事項(第1回)‐  製品・技術開発力強化策の事例(その9)

 前回の事例その8に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明確...

 前回の事例その8に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明確...


ソフトウェア特許とは(その1)

 色々と定義はありますが、ソフトウェア特許とは、よく言うビジネスモデル特許であり、情報システムの特許です。言葉に差はあると思いますが、我々実務家は、ソフト...

 色々と定義はありますが、ソフトウェア特許とは、よく言うビジネスモデル特許であり、情報システムの特許です。言葉に差はあると思いますが、我々実務家は、ソフト...


‐クレ-ム情報を開発に活用‐  製品・技術開発力強化策の事例(その13)

 前回の事例その12に続いて解説します。顧客から出されたクレ-ムは、技術開発や、関連製品の開発の可能性を潜在させている場合が多いようです。その視点からクレ...

 前回の事例その12に続いて解説します。顧客から出されたクレ-ムは、技術開発や、関連製品の開発の可能性を潜在させている場合が多いようです。その視点からクレ...