要因分析とは データ分析講座(その34)

更新日

投稿日

データ分析

◆ 異常な指標(KPIなど)の原因を探る「要因分析」 2つのアプローチ

 指標(KPIなど)をモニタリングしていると、これはおかしいという場面に出くわします。指標(KPIなど)がおかしいかどうかを判断するために、「異常検知」という定量分析をしたりします。今回は、異常検知などで、今日見た指標(KPIなど)が何かおかしいけど、何が原因なんだろう? ということを探る「要因分析」がテーマです。おかしな指標(KPIなど)を異常値と呼んで話しを進めていきます。

1. データ分析:要因分析の2つのアプローチ

 要因分析には、いくつかやり方があります。ここでは主に、2つのアプローチについて説明します。

(1)指標ツリーで探る
(2)統計モデルで探る

 (1)の「指標ツリーで探る」とは、指標(KPIなど)の異常値の要因を、指標ツリーをもとに探るアプローチするやり方です。非常にイメージしやすい方法です。指標ツリーとは、例えば、「営業利益」を「限界利益」と「固定費」に分解し、「限界利益」を「売上高」と「変動費」に分解し、「売上高」を「客数」と「客単価」に分解し「売上高」は「営業日数」と「日販」に分解し、…… という感じで指標(KPIなど)を分解したものを、ツリー上で表現したものです。もちろん、業種業態や企業によって指標ツリーは異なります。そして、多くの指標ツリーは、四則演算(+-×÷)で表現されます。(2)の「統計モデルで探る」は、(1)の「指標ツリーで探る」の後に実施します。(1)の「指標ツリーで探る」で限界がきたときに登場します。

2. データ分析:指標ツリーで探る

 多くのイメージしやすい、小売店の例で説明してみます。

 例えば、「日販」をモニタリングしていたら、異常に値が低いことがわかりました。指標ツリーを眺めると、「日販」は「客数」と「客単価」に分解されています。「日販=客数×客単価」だからです。そこで、「恐らく『客数』か『客単価』のどちらかの指標の数字が悪化したため『日販』が異常に低くなったのであろう」と考えます。調べてみたら、「客単価」はいつも通りだが、「客数」が異常に落ちていいました。「日販」が悪化した要因は「客数」にありそうなことが分かります。

 このように、指標ツリーに沿って要因を探っていく。非常にシンプルで分かりやすいアプローチが、(1)の「指標ツリーで探る」になります。このとき、層別することを忘れてはいけません。層別とは、指標をエリア別・部署別・店舗別・商材別などに分解することです。この例で考えると、「日販」の状況をエリア別に探ったり、「日販」の悪化の要因とされた「客数」の状況をエリア別に探ったりすることです。

3. データ分析:統計モデルで探る

 次に、(2)の「統計モデルで探るです」です。指標の異常値の要因を、統計学の力を借りて探るアプローチです。

 (1)の「指標ツリーで探る」で、これ以上探れなくなったときに実施することが多いです。多くの場合、四則演算(+-×÷)の関係性が使えなくなったときです。例えば、先ほどの小売店の「日販」で説明します。指標ツリーをもとに「日販」の悪化の要因が、「客数」にあることが分かっています。では、その「客数」の悪化の要因はどこにあるのであろうか。もしかしたら、実施した「施策」がよくなかったのかもしれない、「天候」の影響かもしれない、「競合」の動きによるものかもしれない。「施策」といっても、テレビCMかもしれないし、交通広告かもしれないのです。

 「客数」と「施策」、「天候」、「競合」の関係は、「日販=客数×客単価」のように関係性が明確ではありません。そのため、「客数」と「施策」、「天候」、「競合」の不明確な関係性を明確するために、統計モデルを構築します。具体的には、「内部要因」(例:実施した施策、組織変更)や「外部要因」(例:競合の動き、天候)などを説明変数とした「統計モデル」(例:重回帰モデル、ポアソン回帰モデル、ロジスティック回帰モデル)を構築します。多くの場合、重回帰モデルという昔からある統計モデルで十分です。この構築した回帰型の統計モデルを使い要因を探っていくのです。

 この例では、「客数」を増やすための施策である「チラシ」や、「客数」に影響を及ぼす外部要因である「降水量」などを説明変数とした、「統計モデル」を構築します。「客数」が目的変数となります。このような統計モデルを構築することで、目的変数である「客数」の悪化の要因を、説明変数である「チラシ」や「降水量」などから探ることができるのです。

4. データ分析:統計モデルを使った要因の探り方

 統計モデルを使った、要因の探り方はシンプルです。

 先ず、構築した統計モデルで「異常値の要因を説明できるのかどうか」を考えます。過去データで構築し統計モデルの予測値と実現値との差を見ればよいだけです。もし、予測値と実現値との差が小さく、構築した統計モデルで「説明できた場合」、どの説明変数の影響で指標が悪化したのかを特定し、何が起こっていたのかを定性的に解釈します。一方、予測値と実現値との差が大きく、構築した統計モデルで「説明できなかった場合」、説明変数以外の要因で指標が悪化したと考えます。

...

データ分析

◆ 異常な指標(KPIなど)の原因を探る「要因分析」 2つのアプローチ

 指標(KPIなど)をモニタリングしていると、これはおかしいという場面に出くわします。指標(KPIなど)がおかしいかどうかを判断するために、「異常検知」という定量分析をしたりします。今回は、異常検知などで、今日見た指標(KPIなど)が何かおかしいけど、何が原因なんだろう? ということを探る「要因分析」がテーマです。おかしな指標(KPIなど)を異常値と呼んで話しを進めていきます。

1. データ分析:要因分析の2つのアプローチ

 要因分析には、いくつかやり方があります。ここでは主に、2つのアプローチについて説明します。

(1)指標ツリーで探る
(2)統計モデルで探る

 (1)の「指標ツリーで探る」とは、指標(KPIなど)の異常値の要因を、指標ツリーをもとに探るアプローチするやり方です。非常にイメージしやすい方法です。指標ツリーとは、例えば、「営業利益」を「限界利益」と「固定費」に分解し、「限界利益」を「売上高」と「変動費」に分解し、「売上高」を「客数」と「客単価」に分解し「売上高」は「営業日数」と「日販」に分解し、…… という感じで指標(KPIなど)を分解したものを、ツリー上で表現したものです。もちろん、業種業態や企業によって指標ツリーは異なります。そして、多くの指標ツリーは、四則演算(+-×÷)で表現されます。(2)の「統計モデルで探る」は、(1)の「指標ツリーで探る」の後に実施します。(1)の「指標ツリーで探る」で限界がきたときに登場します。

2. データ分析:指標ツリーで探る

 多くのイメージしやすい、小売店の例で説明してみます。

 例えば、「日販」をモニタリングしていたら、異常に値が低いことがわかりました。指標ツリーを眺めると、「日販」は「客数」と「客単価」に分解されています。「日販=客数×客単価」だからです。そこで、「恐らく『客数』か『客単価』のどちらかの指標の数字が悪化したため『日販』が異常に低くなったのであろう」と考えます。調べてみたら、「客単価」はいつも通りだが、「客数」が異常に落ちていいました。「日販」が悪化した要因は「客数」にありそうなことが分かります。

 このように、指標ツリーに沿って要因を探っていく。非常にシンプルで分かりやすいアプローチが、(1)の「指標ツリーで探る」になります。このとき、層別することを忘れてはいけません。層別とは、指標をエリア別・部署別・店舗別・商材別などに分解することです。この例で考えると、「日販」の状況をエリア別に探ったり、「日販」の悪化の要因とされた「客数」の状況をエリア別に探ったりすることです。

3. データ分析:統計モデルで探る

 次に、(2)の「統計モデルで探るです」です。指標の異常値の要因を、統計学の力を借りて探るアプローチです。

 (1)の「指標ツリーで探る」で、これ以上探れなくなったときに実施することが多いです。多くの場合、四則演算(+-×÷)の関係性が使えなくなったときです。例えば、先ほどの小売店の「日販」で説明します。指標ツリーをもとに「日販」の悪化の要因が、「客数」にあることが分かっています。では、その「客数」の悪化の要因はどこにあるのであろうか。もしかしたら、実施した「施策」がよくなかったのかもしれない、「天候」の影響かもしれない、「競合」の動きによるものかもしれない。「施策」といっても、テレビCMかもしれないし、交通広告かもしれないのです。

 「客数」と「施策」、「天候」、「競合」の関係は、「日販=客数×客単価」のように関係性が明確ではありません。そのため、「客数」と「施策」、「天候」、「競合」の不明確な関係性を明確するために、統計モデルを構築します。具体的には、「内部要因」(例:実施した施策、組織変更)や「外部要因」(例:競合の動き、天候)などを説明変数とした「統計モデル」(例:重回帰モデル、ポアソン回帰モデル、ロジスティック回帰モデル)を構築します。多くの場合、重回帰モデルという昔からある統計モデルで十分です。この構築した回帰型の統計モデルを使い要因を探っていくのです。

 この例では、「客数」を増やすための施策である「チラシ」や、「客数」に影響を及ぼす外部要因である「降水量」などを説明変数とした、「統計モデル」を構築します。「客数」が目的変数となります。このような統計モデルを構築することで、目的変数である「客数」の悪化の要因を、説明変数である「チラシ」や「降水量」などから探ることができるのです。

4. データ分析:統計モデルを使った要因の探り方

 統計モデルを使った、要因の探り方はシンプルです。

 先ず、構築した統計モデルで「異常値の要因を説明できるのかどうか」を考えます。過去データで構築し統計モデルの予測値と実現値との差を見ればよいだけです。もし、予測値と実現値との差が小さく、構築した統計モデルで「説明できた場合」、どの説明変数の影響で指標が悪化したのかを特定し、何が起こっていたのかを定性的に解釈します。一方、予測値と実現値との差が大きく、構築した統計モデルで「説明できなかった場合」、説明変数以外の要因で指標が悪化したと考えます。

 統計モデルに組み込めないような「定性的な事実」から探ります。このような「定性的な事実」の多くは、日常的にあまり起こり得ない突発的な要因(例:東日本大震災、リーマンショック、競合品の突然のヒット)であることが多いです。もしくは、過去データが足りず回帰型の統計モデルに組み込めなかった要因の可能性もあります。

5. データ分析:一見すると難しそうだが、そうでもない

 統計モデルや回帰モデルなどの用語がでてくると、一見難しそうに思いてきます。

 しかし、Excelだけで簡単にできます。それぐらい、身近になっていますし、すぐにやろうと思えばやれます。例えば、Excelの「分析ツール」を使えば、重回帰モデルはデータさえあれば、詳しい統計理論を知らなくても、すぐに重回帰モデルという統計モデルを構築できます。普段見ている指標(KPIなど)の動きが、「何かおかしいな」と思ったら、手元にあるデータでサクッとExcelで要因分析するのもよいかもしれません。

 次回は、ビッグデータ駆動型を目指し、BIツールを導入したけど成果が出ずイライラするをテーマに解説します。

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
データ分析のビジネス成果は金額で データ分析講座(その83)

◆ ビジネス貢献できないデータ分析、ビジネス成果は金額で  ここ10年、次のような合言葉とともにデータ分析者が増えています。 「データがあるか...

◆ ビジネス貢献できないデータ分析、ビジネス成果は金額で  ここ10年、次のような合言葉とともにデータ分析者が増えています。 「データがあるか...


課題解決アプローチ データ分析講座(その101)

  ◆ データ分析を活用した「課題解決アプローチ」  データを上手く分析し、そして目の前にある課題を解決する。もっともベタで「何か特別な方法...

  ◆ データ分析を活用した「課題解決アプローチ」  データを上手く分析し、そして目の前にある課題を解決する。もっともベタで「何か特別な方法...


活用ストーリーのないデータ分析は危険 データ分析講座(その110)

◆ データ分析・活用が上手くいっている時に必ずある、2つの流れ  良くも悪くもデータから逃れることのできない時代になってしまいました。データにがんじ...

◆ データ分析・活用が上手くいっている時に必ずある、2つの流れ  良くも悪くもデータから逃れることのできない時代になってしまいました。データにがんじ...


「情報マネジメント一般」の活用事例

もっと見る
‐技術開発の目標について 第2回‐  製品・技術開発力強化策の事例(その16)

 技術開発の目標を解説する以下の項目4点について、前回は、1と2を解説しましたので、今回は、第2回として、3と4を記述します。          1....

 技術開発の目標を解説する以下の項目4点について、前回は、1と2を解説しましたので、今回は、第2回として、3と4を記述します。          1....


‐技術開発の目標について 第1回‐  製品・技術開発力強化策の事例(その15)

 前回の事例その14に続いて解説します。製品開発を目指している企業の中には、テ-マが見つかったら、または、アイデアが閃いたら開発に取り組む。そのような淡い...

 前回の事例その14に続いて解説します。製品開発を目指している企業の中には、テ-マが見つかったら、または、アイデアが閃いたら開発に取り組む。そのような淡い...


ソフトウェア特許とは(その1)

 色々と定義はありますが、ソフトウェア特許とは、よく言うビジネスモデル特許であり、情報システムの特許です。言葉に差はあると思いますが、我々実務家は、ソフト...

 色々と定義はありますが、ソフトウェア特許とは、よく言うビジネスモデル特許であり、情報システムの特許です。言葉に差はあると思いますが、我々実務家は、ソフト...