急激な変化をデータで見極める データ分析講座(その175)

更新日

投稿日

データ分析

 

◆ 売上などが急激な変化をしたとき「何が変わり何が変わっていないのか」をデータで見極める

 収益の急激な悪化は、時系列解析の用語で言うと下向きのレベルシフトが起こったことになります。小難しい時系列解析を実施しなくても、集計ベースで分かることも多いのです。今回は「売上などが急激な変化をしたとき『何が変わり何が変わっていないのか』をデータで見極める」というお話しをします。

【目次】

1. データ分析:レベルシフト

(1)取り急ぎ集計し比較する
(2)変化をコントロールするのか? 読めるのか? どちらでもないのか?

2. データ分析:時系列視点の変化

(1)例えば、アイスクリーム。
(2)例えば、東京都心のオフィス街のコンビニなどです。

3. データ分析:目的変数の集計ベースの分析でも、やれることは色々ある

 

1. データ分析:レベルシフト

 レベルシフトとは、ある時期を境に売上が2倍になったとか、売上が10%まで落ち込んだとか、そういった時系列上の現象を指します。急激なレベルシフトだけでなく、ある時期を境に徐々に売上が落ち結果的に1年前の半分の水準になったとか、商品をモデルチェンジしたことで一時的に売上が跳ねあがり徐々に落ちていき元の水準に戻った、というのもレベルシフトです。

 時系列解析と聞くと、季節変動などの周期性をイメージされやすいですが、レベルシフトと呼ばれる水準変化を数理モデルの中に組み込みデータ分析を実施します。しかし、時系列解析の実ビジネスの経験が少ない場合、いきなり実務で実施するのは、やや難易度が高い気がします。

 そもそも、ARIMAモデルや状態空間モデルなどの時系列解析の鉄板の数理も得るの理解から、レベルシフトのモデル化の方法論まで知っておく必要があるからです。

(1)取り急ぎ集計し比較する

 時系列解析をいきなり実施するのではなく、集計ベースで分かることも多いです。そもそも、時系列解析によるデータ分析を実施する前に、通常は集計ベースのデータ分析を実施します。例えば、ここ数か月の新型コロナの影響で、収益が急激に悪化したと言っても、商品やサービスによって、程度には差はあります。商品やサービスごとに売上を集計し比較すればいいでしょう。

 比較といっても、例年比較(例:昨年同月との比較)、他の商品やサービスなどとの比較(例:昨年同月比を比較)、エリア間比較(例:昨年同月比を比較)など色々考えられます。要は、例年比較(例:昨年同月との比較)をベースに、その例年比較の数値(例:昨年同月比)を、色々な切り口で比較する、ということです。それほど難しいわけではないと思います。

(2)変化をコントロールするのか? 読めるのか? どちらでもないのか?

 3月あたりから売上が悪化し場合、数か月経つと、商品やサービスなどに時系列な変化が見えてきます。例えば、3月に急激に売上が落ちそのまま4月・5月と低水準で推移する商品やサービスもあれば、3月にやや悪化し4月に急激に落ち込み5月にやや回復しつつある商品やサービスもあると思います。幾つかパターンが見えてくると思います。そのパターンごとに、商品やサービスなどを分類します。分類したら、その現象が何によるものなのかを考えていきます。

 大きくは、自社によるもの(例:営業時間の短縮、生産ラインを止めている、訪問営業自粛など)、顧客によるもの(例:顧客層の変化、顧客のマインド変化、顧客行動の変化など)、環境によるもの(例:政府や自治体の要請、交通量変化、自粛ムードなど)など色々考えらえますが、以下の3つに分類できます。

  •  コントロール可能なもの
  •  コントロール不可能だが予測できるもの
  •  コントロール不可能で予測もできないもの

 どの影響がその商品やサービスなどの売上変化に影響を与えたのかを、考えていきます。やばいパターンの中に光明が見えたり、やばくないパターンなのに実はそうでもないものが見えたりします。

2. データ分析:時系列視点の変化

 時系列解析的な観点で述べると、周期性が変化したのか、レベルシフトが起こったのか、という視点の変化の見方もあります。レベルシフトが起こったけど、周期性は変わらない、ということがあります。

(1)例えば、アイスクリーム。

 恐らく暑い日には売れるでしょう。そのため、新型コロナ下でも、全体の売上の水準は落ちたけど、周期性は変わらないという感じです。周期性が変わることもあります。

(2)例えば、東京都心のオフィス街のコンビニなどです。

 リモートワークで平日のお弁当やおにぎり、サンドイッチなどの昼食のための売上のレベルシフトが起こっていると思います。週単位の周期性(平日と休日の売上の周期性)に変化が起きたことでしょう。要は、商品やサービスごとの集計や分析だけでなく、1つの商品やサービスなどの着目したとき、周期性に変化が生じたのか、水準に変化が生じたのか、という分析の視点もあります。

 先ほど説明したことと同様に、周期性に与えた影響は、何によるものなのか、コントロール可能なものなのか、コントロールできないが予測できるものなのか、そのどちらでもないのか、ということを整理することになります。

3. データ分析:...

データ分析

 

◆ 売上などが急激な変化をしたとき「何が変わり何が変わっていないのか」をデータで見極める

 収益の急激な悪化は、時系列解析の用語で言うと下向きのレベルシフトが起こったことになります。小難しい時系列解析を実施しなくても、集計ベースで分かることも多いのです。今回は「売上などが急激な変化をしたとき『何が変わり何が変わっていないのか』をデータで見極める」というお話しをします。

【目次】

1. データ分析:レベルシフト

(1)取り急ぎ集計し比較する
(2)変化をコントロールするのか? 読めるのか? どちらでもないのか?

2. データ分析:時系列視点の変化

(1)例えば、アイスクリーム。
(2)例えば、東京都心のオフィス街のコンビニなどです。

3. データ分析:目的変数の集計ベースの分析でも、やれることは色々ある

 

1. データ分析:レベルシフト

 レベルシフトとは、ある時期を境に売上が2倍になったとか、売上が10%まで落ち込んだとか、そういった時系列上の現象を指します。急激なレベルシフトだけでなく、ある時期を境に徐々に売上が落ち結果的に1年前の半分の水準になったとか、商品をモデルチェンジしたことで一時的に売上が跳ねあがり徐々に落ちていき元の水準に戻った、というのもレベルシフトです。

 時系列解析と聞くと、季節変動などの周期性をイメージされやすいですが、レベルシフトと呼ばれる水準変化を数理モデルの中に組み込みデータ分析を実施します。しかし、時系列解析の実ビジネスの経験が少ない場合、いきなり実務で実施するのは、やや難易度が高い気がします。

 そもそも、ARIMAモデルや状態空間モデルなどの時系列解析の鉄板の数理も得るの理解から、レベルシフトのモデル化の方法論まで知っておく必要があるからです。

(1)取り急ぎ集計し比較する

 時系列解析をいきなり実施するのではなく、集計ベースで分かることも多いです。そもそも、時系列解析によるデータ分析を実施する前に、通常は集計ベースのデータ分析を実施します。例えば、ここ数か月の新型コロナの影響で、収益が急激に悪化したと言っても、商品やサービスによって、程度には差はあります。商品やサービスごとに売上を集計し比較すればいいでしょう。

 比較といっても、例年比較(例:昨年同月との比較)、他の商品やサービスなどとの比較(例:昨年同月比を比較)、エリア間比較(例:昨年同月比を比較)など色々考えられます。要は、例年比較(例:昨年同月との比較)をベースに、その例年比較の数値(例:昨年同月比)を、色々な切り口で比較する、ということです。それほど難しいわけではないと思います。

(2)変化をコントロールするのか? 読めるのか? どちらでもないのか?

 3月あたりから売上が悪化し場合、数か月経つと、商品やサービスなどに時系列な変化が見えてきます。例えば、3月に急激に売上が落ちそのまま4月・5月と低水準で推移する商品やサービスもあれば、3月にやや悪化し4月に急激に落ち込み5月にやや回復しつつある商品やサービスもあると思います。幾つかパターンが見えてくると思います。そのパターンごとに、商品やサービスなどを分類します。分類したら、その現象が何によるものなのかを考えていきます。

 大きくは、自社によるもの(例:営業時間の短縮、生産ラインを止めている、訪問営業自粛など)、顧客によるもの(例:顧客層の変化、顧客のマインド変化、顧客行動の変化など)、環境によるもの(例:政府や自治体の要請、交通量変化、自粛ムードなど)など色々考えらえますが、以下の3つに分類できます。

  •  コントロール可能なもの
  •  コントロール不可能だが予測できるもの
  •  コントロール不可能で予測もできないもの

 どの影響がその商品やサービスなどの売上変化に影響を与えたのかを、考えていきます。やばいパターンの中に光明が見えたり、やばくないパターンなのに実はそうでもないものが見えたりします。

2. データ分析:時系列視点の変化

 時系列解析的な観点で述べると、周期性が変化したのか、レベルシフトが起こったのか、という視点の変化の見方もあります。レベルシフトが起こったけど、周期性は変わらない、ということがあります。

(1)例えば、アイスクリーム。

 恐らく暑い日には売れるでしょう。そのため、新型コロナ下でも、全体の売上の水準は落ちたけど、周期性は変わらないという感じです。周期性が変わることもあります。

(2)例えば、東京都心のオフィス街のコンビニなどです。

 リモートワークで平日のお弁当やおにぎり、サンドイッチなどの昼食のための売上のレベルシフトが起こっていると思います。週単位の周期性(平日と休日の売上の周期性)に変化が起きたことでしょう。要は、商品やサービスごとの集計や分析だけでなく、1つの商品やサービスなどの着目したとき、周期性に変化が生じたのか、水準に変化が生じたのか、という分析の視点もあります。

 先ほど説明したことと同様に、周期性に与えた影響は、何によるものなのか、コントロール可能なものなのか、コントロールできないが予測できるものなのか、そのどちらでもないのか、ということを整理することになります。

3. データ分析:目的変数の集計ベースの分析でも、やれることは色々ある

 これらの例で活用している主なデータは「売上」のみです。データ分析では、目的変数Yと説明変数Xという概念が登場し、例えば目的変数Yを「売上」に設定し説明変数Xとし「販促」や「施策」などを設定し、その関係性を分析したり、その関係性をもとに数理モデルを構築し予測モデルや異常検知モデルなどを作ったりします。

 これらの例では、目的変数Yである「売上」を商品やサービスといった切り口や、カレンダー情報というすぐに手に入るデータで分析していっただけです。

 特別なデータを用意する必要はありません。新型コロナ以前の目的変数Yと説明変数Xの関係性を、新型コロナ下の状況で活用できるほど、データが溜まっていないかもしれません。新型コロナ以前の目的変数Yと説明変数Xの関係性を、新型コロナ下で活用してもいいかどうかも分かりませんし、どのように変化したのかも分かりません。そのためには、以上のような目的変数Yベースの集計ベースのデータ分析が役立つのです。

 今後のデータ分析・活用にとって重要な分析になるかと思います。先ずは、すぐ手に入る目的変数Yベースの集計ベースのデータ分析を実施し、それに解釈を加え今を乗り越えましょう。

 

 

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
ローギアとハイギアとデータ活用プロジェクト データ分析講座(その294)

  データサイエンスやデータ分析、機械学習など、データをビジネス活用する取り組みは、ここ10年増えてきています。達成したデータをビジネス活...

  データサイエンスやデータ分析、機械学習など、データをビジネス活用する取り組みは、ここ10年増えてきています。達成したデータをビジネス活...


現場のデータ活用を阻害する高精度なモデル データ分析講座(その243)

  ◆【特集】 連載記事紹介:連載記事のタイトルをまとめて紹介、各タイトルから詳細解説に直リンク!!   高精度で予測できる...

  ◆【特集】 連載記事紹介:連載記事のタイトルをまとめて紹介、各タイトルから詳細解説に直リンク!!   高精度で予測できる...


営業を確率で考える データ分析講座(その5)

  ◆ 営業は失注しても、確率で考えれば落ち込めない  「2人の極端な部下がいるけど、どちらも営業成績よくなくて…&hel...

  ◆ 営業は失注しても、確率で考えれば落ち込めない  「2人の極端な部下がいるけど、どちらも営業成績よくなくて…&hel...


「情報マネジメント一般」の活用事例

もっと見る
情報、常識の検証を考える

1、勝ち組と負け組を支配する情報  皆さんがご存じの大手予備校有名講師である林先生が、かつてテレビで「情報」に関して興味深いことをおっしゃっており、...

1、勝ち組と負け組を支配する情報  皆さんがご存じの大手予備校有名講師である林先生が、かつてテレビで「情報」に関して興味深いことをおっしゃっており、...


個票データの共用化でコストダウン

 データ解析の効率は、生データとその整理の仕方で大きく異なると言えます。 例えば、アンケート結果は単なる生データであり、そのままでは解析出来ません。解析の...

 データ解析の効率は、生データとその整理の仕方で大きく異なると言えます。 例えば、アンケート結果は単なる生データであり、そのままでは解析出来ません。解析の...


P値で行う統計リテラシー判定

 「ピーチ」って聞いたら何を連想しますか、統計を学んでいる人に取っては「 P値 」が思い浮かぶはずです。統計学の素養がある程度備わっているか一言で知ろうと...

 「ピーチ」って聞いたら何を連想しますか、統計を学んでいる人に取っては「 P値 」が思い浮かぶはずです。統計学の素養がある程度備わっているか一言で知ろうと...