予測モデルの活用とは データ分析講座(その116)

更新日

投稿日

情報マネジメント

◆ 予測モデルは帰納的に構築し演繹的に活用する。そして論理展開する。

 データ分析・活用を推し進める時にある段階まで進むと、予測モデルが一つのトピックとして登場します。予測モデルとは数式で表現されたもので例えば受注や受注金額、見込み客からの離脱などを予測するためのものです。当然ながら予測モデルは天から降ってくるわけではありません。誰かが創造する必要があります。予測モデルは創造しただけでは意味はありません。誰かが実務で活用する必要があります。今回は「予測モデルは帰納的に構築し演繹(えんえき)的に活用する。そして論理展開する」というお話しをします。

1、2つの予測モデルの用途

 セールスアナリティクスにおける予測モデルの用途は、ざっくりいうと次の2つです。

  • どの程度起こりそうかの予測(質的予測)
  • どのくらいになりそうかの予測(量的予測)

 「どの程度起こりそうかの予測」とは、例えば「受注なのか失注なのか」や「離脱なのか継続なのか」のように、どちらの状態になりそうかを予測するものです。受注予測モデルや離脱予測モデルなどです。

一方「どのくらいになりそうかの予測」とは「受注するなら金額はいくらのなりそうか」や「お店の売上高はどのくらいになりそうか」のように、量を予測するものです。受注金額予測モデルや売上予測モデルなどです。他にもあるかもしれませんが、ざっくりいうとどちらか2つに分類されることでしょう。

2、帰納法と演繹法

 有名な論理展開の方法に、帰納法と演繹法というものがあります。この2つは予測モデルを構築し活用する上で欠かせない概念で、帰納法と演繹法が正しいことが前提となっています。帰納法とは「個々の事実」の積み重ねから「普遍的な事実」(一般的な傾向、セオリー、ルールなど)を導き出し、結論に導く推論方法です。

 例えば色々な哺乳類を調べ、血が流れている事実を積み重ね「哺乳類には血が流れている」という感じで結論付けます。

 演繹法とは「普遍的な事実」から結論を導く推論方法です。

 例えば「ゴリラは哺乳類である」という「普遍的な事実」と「哺乳類には血が流れている」という「普遍的な事実」から「ゴリラには血が流れている」と結論付けます。

3、予測モデルは帰納的に構築

 予測モデルは「個々の事実」である過去のデータから構築します。人が適当に数式を描くわけではありません。つまり予測モデルは帰納的に構築されます。しかし実はそうでもありません。例外もあります。ベイズ系のモデルはその典型です。人の主観がモデル構築に多少なりとも影響します。

 そもそもどの種類のモデルを使って予測モデルを構築するのかや、モデル構築する際の学習パラメータ設定など、人が考え設定する必要があります。そういう意味で予測モデル構築は、帰納かつ演繹なのかもしれません。ですが予測モデル構築を大まかに見れば機能的です。

4、予測モデルは演繹的に活用

 予測モデルを活用するときは、そのモデルが正しいものとして活用します。つまり予測モデルは演繹的に活用されます。しかし正しいと思われたモデルが複数あることもあります。どういうことかといいますと、予測モデルを複数作る場合があり、各予測値が異なることがあるからです。正しいはずの予測値がたくさんあるというおかしな状態です。このような場合、複数の予測値の平均値と計算しそれを予測値としたり複数の予測値で投票し最大得票を予測値とみなしたりします。機械学習用語で表現すると、アンサンブル学習と呼ばれるやり方です。

 「個々のモデルの予測値」の積み重ねから「今回の予測値」を導き出すという感じとなり、帰納的な匂いがしてきます。ですが予測モデル活用を大まかに見れば演繹的です。

5、もう一つの論...

情報マネジメント

◆ 予測モデルは帰納的に構築し演繹的に活用する。そして論理展開する。

 データ分析・活用を推し進める時にある段階まで進むと、予測モデルが一つのトピックとして登場します。予測モデルとは数式で表現されたもので例えば受注や受注金額、見込み客からの離脱などを予測するためのものです。当然ながら予測モデルは天から降ってくるわけではありません。誰かが創造する必要があります。予測モデルは創造しただけでは意味はありません。誰かが実務で活用する必要があります。今回は「予測モデルは帰納的に構築し演繹(えんえき)的に活用する。そして論理展開する」というお話しをします。

1、2つの予測モデルの用途

 セールスアナリティクスにおける予測モデルの用途は、ざっくりいうと次の2つです。

  • どの程度起こりそうかの予測(質的予測)
  • どのくらいになりそうかの予測(量的予測)

 「どの程度起こりそうかの予測」とは、例えば「受注なのか失注なのか」や「離脱なのか継続なのか」のように、どちらの状態になりそうかを予測するものです。受注予測モデルや離脱予測モデルなどです。

一方「どのくらいになりそうかの予測」とは「受注するなら金額はいくらのなりそうか」や「お店の売上高はどのくらいになりそうか」のように、量を予測するものです。受注金額予測モデルや売上予測モデルなどです。他にもあるかもしれませんが、ざっくりいうとどちらか2つに分類されることでしょう。

2、帰納法と演繹法

 有名な論理展開の方法に、帰納法と演繹法というものがあります。この2つは予測モデルを構築し活用する上で欠かせない概念で、帰納法と演繹法が正しいことが前提となっています。帰納法とは「個々の事実」の積み重ねから「普遍的な事実」(一般的な傾向、セオリー、ルールなど)を導き出し、結論に導く推論方法です。

 例えば色々な哺乳類を調べ、血が流れている事実を積み重ね「哺乳類には血が流れている」という感じで結論付けます。

 演繹法とは「普遍的な事実」から結論を導く推論方法です。

 例えば「ゴリラは哺乳類である」という「普遍的な事実」と「哺乳類には血が流れている」という「普遍的な事実」から「ゴリラには血が流れている」と結論付けます。

3、予測モデルは帰納的に構築

 予測モデルは「個々の事実」である過去のデータから構築します。人が適当に数式を描くわけではありません。つまり予測モデルは帰納的に構築されます。しかし実はそうでもありません。例外もあります。ベイズ系のモデルはその典型です。人の主観がモデル構築に多少なりとも影響します。

 そもそもどの種類のモデルを使って予測モデルを構築するのかや、モデル構築する際の学習パラメータ設定など、人が考え設定する必要があります。そういう意味で予測モデル構築は、帰納かつ演繹なのかもしれません。ですが予測モデル構築を大まかに見れば機能的です。

4、予測モデルは演繹的に活用

 予測モデルを活用するときは、そのモデルが正しいものとして活用します。つまり予測モデルは演繹的に活用されます。しかし正しいと思われたモデルが複数あることもあります。どういうことかといいますと、予測モデルを複数作る場合があり、各予測値が異なることがあるからです。正しいはずの予測値がたくさんあるというおかしな状態です。このような場合、複数の予測値の平均値と計算しそれを予測値としたり複数の予測値で投票し最大得票を予測値とみなしたりします。機械学習用語で表現すると、アンサンブル学習と呼ばれるやり方です。

 「個々のモデルの予測値」の積み重ねから「今回の予測値」を導き出すという感じとなり、帰納的な匂いがしてきます。ですが予測モデル活用を大まかに見れば演繹的です。

5、もう一つの論理展開「アブダクション」

 帰納法と演繹法についてお話しましたがが、それだけではありません。もう一つ有名な論理展開があります。それはアブダクションです。

 こちらの論理展開もデータ分析・活用上、非常に重要です。ここでは詳しく説明しませんが、ベイズ統計学の世界と非常に近いようです。アブダクションとは観測事実の生起要因の仮説を作り、論理的に説明するものです。

 現在から過去を探ります。そういう意味で予測とは逆になります。要因分析に近く、データ分析・活用する上で非常に重要です。予測モデルとの合わせ技として予兆検知が挙げられます。未来の異常検知です。未来から現在(もしくは近い未来)を探るのです。未来の異常を予測しその未来の異常を起こす要因を探り対処する、このような使い方です。例えばプレディクティブ・メンテナンス(予知保全)やカスタマーヘルススコア(顧客健全性スコア)などの領域で盛んに活用されています。

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
データと洞察で戦略的意思決定を導く:データ分析講座(その333)

現代の急速に変化するビジネス環境で競争優位を保つためには、データとその中からの洞察を上手く活用することが不可欠です。データ駆動のアプローチが主流となる...

現代の急速に変化するビジネス環境で競争優位を保つためには、データとその中からの洞察を上手く活用することが不可欠です。データ駆動のアプローチが主流となる...


主成分分析は特徴量の選択手法ではない、正しい特徴量選択方法とは:データ分析講座(その355)

【目次】  ▼さらに深く学ぶなら!「データ分析」に関するセミナーはこちら! データサイエンスの進展に伴い、特徴量選択(説...

【目次】  ▼さらに深く学ぶなら!「データ分析」に関するセミナーはこちら! データサイエンスの進展に伴い、特徴量選択(説...


顧客満足度・探索意向率・NPSとは データ分析講座(その264)

  自社の業績を知るには、単に売上高や市場シェアなど分析すればいいでしょう。未来の業績を知るには、過去データをもとに時系列予測モデルを構築...

  自社の業績を知るには、単に売上高や市場シェアなど分析すればいいでしょう。未来の業績を知るには、過去データをもとに時系列予測モデルを構築...


「情報マネジメント一般」の活用事例

もっと見る
現場情報の自動収集に道具だてを

 一日の作業指示の出し方で、次のどちらの組織の管理レベルの改善がより進むでしょうか?        ・A社 ➡「x製品を◯個」     ・B...

 一日の作業指示の出し方で、次のどちらの組織の管理レベルの改善がより進むでしょうか?        ・A社 ➡「x製品を◯個」     ・B...


‐時代の流れを意識した開発テ-マの設定‐  製品・技術開発力強化策の事例(その5)

 前回の事例その4に続いて解説します。時代の流れに沿う開発テ-マとして、最近では、高齢者介護機器、環境関連機器、省エネ機器、情報技術(IT)等に関心が注が...

 前回の事例その4に続いて解説します。時代の流れに沿う開発テ-マとして、最近では、高齢者介護機器、環境関連機器、省エネ機器、情報技術(IT)等に関心が注が...


生産スピード向上と品質管理

 電子メールやインターネットの普及により、ビジネスのグローバル化が大きく進みましたが、IT技術の進歩は、品質管理の方法も進歩させました。20数年前は製造条...

 電子メールやインターネットの普及により、ビジネスのグローバル化が大きく進みましたが、IT技術の進歩は、品質管理の方法も進歩させました。20数年前は製造条...