ビジネス現場は時系列データで溢れている データ分析講座(その303)

更新日

投稿日

データ分析講座(その303)ビジネス現場は時系列データで溢れている

 

あなたがビジネスでデータ活用を考えているなら、時系列データを避けることは出来ません。なぜならば、ビジネス現場は時系列データで溢れているからです。あまりにも身近すぎて、意識していない人も多いことでしょう。では、この時系列データとはどのようなもので、ビジネスの現場でどのように活用されているのでしょうか。今回は「ビジネス現場は時系列データで溢れている」というお話しをいたします。

【目次】

    【この連載の前回:時系列性を加味した因果推論でよく利用されるSC法 データ分析講座(その302) へのリンク】

    ◆データ分析講座の注目記事紹介

    1. 時系列データとは何か?

    次のような折れ線グラフを見たことはないでしょうか。

    データ分析講座(その303)ビジネス現場は時系列データで溢れている 

    ビジネスの現場でよく見る折れ線グラフです。横軸が時間軸で、縦軸が色々な指標の値の軸(例では「販売金額」)になります。これは、次の時系列データのデータセットをグラフ化したものです。

    データ分析講座(その303)ビジネス現場は時系列データで溢れている

    この時系列のデータセットには、「時間を表現する変数」(例では「日付」)と「販売金額の値が入った変数」(例では「販売金額」)が1つずつあります。この例から分かる通り、時系列データは次のような特徴を持ちます。

    1.  「時間を表現する変数」(以後、「時間変数」と呼ぶ)が少なくとも1つある
    2.  「時間変数」の時間幅(例:年や四半期、月、週、日、時、分、秒など)が固定されている
    3.   固定された時間幅で計算した指標の値(例:合計や平均、中央値など)の変数(以後、「指標変数」と呼ぶ)が少なくとも1つある

     

    この例ですと「日付」が「時間変数」で「販売金額」が「指標変数」です。「販売金額」の値は、1日という固定された時間幅で、販売金額を合計した値です。このような時系列データは、ビジネスの現場に溢れています。

    •  例えば、営業・マーケティング系であれば、売上高や販売金額、受注件数や販売数量、既存顧客数や見込み顧客数、受注率や離反率、広告・販促関連のデータなどです。
    •  例えば、Web系であれば、サイト訪問数やユニークユーザ数、PV(ページビュー)数、コンバージョンレートなどです。
    •  例えば、生産系であれば、生産数や歩留まり率、サイクルタイム、各種センサーデータ(検査データや機器のデータなど)、在庫などです。

     

    これらはすべて時系列データです。この時系列データを記号で表現すると、変数yのt時点の値をytと表現します。

    データ分析講座(その303)ビジネス現場は時系列データで溢れている

     

    2. 時系列データの3つの変動成分

    時系列データを、次の4つの変動成分に分解し表現することがあります。ちなみに、分解前の元の時系列データを原系列と呼びます。

    •  T(趨勢変動成分)
    •  C(循環変動成分) 
    •  S(季節変動成分)
    •  I(不規則変動成分)

    足し算で表現する「加法モデル」の場合、次のようになります。

    •   原系列=T+C+S+I

    掛け算で表現する「乗法モデル」の場合、次のようになります。

    •   原系列=T×C×S×I

    乗法モデルも対数変換(log)によって、加法モデルの用に表現できます。

    •   log(原系列)=log(T)+log(C)+log(S)+log(I)

    個々の変動成分について簡単に説明します。

     

    3. T(趨勢変動成分)

    T(趨勢変動成分)は、データの長期的な増加または減少を表現する変動成分です。もっともシンプルな表現方法は直線で定式化する方法ですが、直線である必要はありません。

     

    4. C(循環変動成分)

    C(循環変動成分)は、周期的なパターンを表現する変動成分です。次に説明するS(季節変動成分)と似た変動成分ですが、S(季節変動成分)が一定の周期を持っているのに対し、こちらの周期は一定である必要はありません。景気循環などがよい例です。上昇と下降を繰り返すが、上昇している期間が長いときもあれば短いときもある、という感じです。S(季節変動成分...

    データ分析講座(その303)ビジネス現場は時系列データで溢れている

     

    あなたがビジネスでデータ活用を考えているなら、時系列データを避けることは出来ません。なぜならば、ビジネス現場は時系列データで溢れているからです。あまりにも身近すぎて、意識していない人も多いことでしょう。では、この時系列データとはどのようなもので、ビジネスの現場でどのように活用されているのでしょうか。今回は「ビジネス現場は時系列データで溢れている」というお話しをいたします。

    【目次】

      【この連載の前回:時系列性を加味した因果推論でよく利用されるSC法 データ分析講座(その302) へのリンク】

      ◆データ分析講座の注目記事紹介

      1. 時系列データとは何か?

      次のような折れ線グラフを見たことはないでしょうか。

      データ分析講座(その303)ビジネス現場は時系列データで溢れている 

      ビジネスの現場でよく見る折れ線グラフです。横軸が時間軸で、縦軸が色々な指標の値の軸(例では「販売金額」)になります。これは、次の時系列データのデータセットをグラフ化したものです。

      データ分析講座(その303)ビジネス現場は時系列データで溢れている

      この時系列のデータセットには、「時間を表現する変数」(例では「日付」)と「販売金額の値が入った変数」(例では「販売金額」)が1つずつあります。この例から分かる通り、時系列データは次のような特徴を持ちます。

      1.  「時間を表現する変数」(以後、「時間変数」と呼ぶ)が少なくとも1つある
      2.  「時間変数」の時間幅(例:年や四半期、月、週、日、時、分、秒など)が固定されている
      3.   固定された時間幅で計算した指標の値(例:合計や平均、中央値など)の変数(以後、「指標変数」と呼ぶ)が少なくとも1つある

       

      この例ですと「日付」が「時間変数」で「販売金額」が「指標変数」です。「販売金額」の値は、1日という固定された時間幅で、販売金額を合計した値です。このような時系列データは、ビジネスの現場に溢れています。

      •  例えば、営業・マーケティング系であれば、売上高や販売金額、受注件数や販売数量、既存顧客数や見込み顧客数、受注率や離反率、広告・販促関連のデータなどです。
      •  例えば、Web系であれば、サイト訪問数やユニークユーザ数、PV(ページビュー)数、コンバージョンレートなどです。
      •  例えば、生産系であれば、生産数や歩留まり率、サイクルタイム、各種センサーデータ(検査データや機器のデータなど)、在庫などです。

       

      これらはすべて時系列データです。この時系列データを記号で表現すると、変数yのt時点の値をytと表現します。

      データ分析講座(その303)ビジネス現場は時系列データで溢れている

       

      2. 時系列データの3つの変動成分

      時系列データを、次の4つの変動成分に分解し表現することがあります。ちなみに、分解前の元の時系列データを原系列と呼びます。

      •  T(趨勢変動成分)
      •  C(循環変動成分) 
      •  S(季節変動成分)
      •  I(不規則変動成分)

      足し算で表現する「加法モデル」の場合、次のようになります。

      •   原系列=T+C+S+I

      掛け算で表現する「乗法モデル」の場合、次のようになります。

      •   原系列=T×C×S×I

      乗法モデルも対数変換(log)によって、加法モデルの用に表現できます。

      •   log(原系列)=log(T)+log(C)+log(S)+log(I)

      個々の変動成分について簡単に説明します。

       

      3. T(趨勢変動成分)

      T(趨勢変動成分)は、データの長期的な増加または減少を表現する変動成分です。もっともシンプルな表現方法は直線で定式化する方法ですが、直線である必要はありません。

       

      4. C(循環変動成分)

      C(循環変動成分)は、周期的なパターンを表現する変動成分です。次に説明するS(季節変動成分)と似た変動成分ですが、S(季節変動成分)が一定の周期を持っているのに対し、こちらの周期は一定である必要はありません。景気循環などがよい例です。上昇と下降を繰り返すが、上昇している期間が長いときもあれば短いときもある、という感じです。S(季節変動成分)と異なり、1年以上と長くなります。

       

      5. S(季節変動成分)

      S(季節変動成分)とは、一定の周期パターンを持った変動成分です。例えば、日周期(24時間周期)、週周期(7日間周期)や年周期(12ヶ月周期)などです。C(循環変動成分)と比べ、周期が短く長くても1年程度です。

       

      6. I(不規則変動成分)

      I(不規則変動成分)は、T(趨勢変動成分)およびC(循環変動成分)、S(季節変動成分)で表現できなかった残りの変動成分です。

       

      7. 3つの変動成分で構成

      多くのビジネスの現場では、C(循環変動成分)を分解できるだけの長期間の時系列データを取得できることは稀です。そのため、T(趨勢変動成分)とC(循環変動成分)を一緒くたにTC(趨勢循環変動)とまとめ、長期的な上昇または下降の動きをする成分とします。そのため、原系列は4つの変動成分ではなく、次の3つの変動成分で構成します。

      •   TC(趨勢循環変動)を「トレンド成分」  
      •   S(季節変動成)を「季節成分」  
      •   I(不規則変動成分)を「残差成分」

       

      •     原系列=TC+S+I

       

      8. 点過程データと時系列データ

      時系列データと混同されやすいデータがあります。点過程(point process)データです。時系列データと密接に関係しています。点過程データとは、簡単に言うと、事象の発生を「発生した時刻」とともに記録したデータです。例えば、注文の発生とその時刻、営業訪問とその時刻、解約の申込みとその時刻、バナー広告のクッリクとその時刻、故障の発生とその時刻などです。あるビジネス領域ではこのようなデータを、トランザクションデータといったりします。

      データ分析講座(その303)ビジネス現場は時系列データで溢れている

       

      点過程データを手にしたとき、ざっくり2つの分析アプローチがあります。

      1.  点過程データから時系列データを作り、データ分析などを実施する
      2.  点過程データそのものに対し、データ分析などを実施する

      実務的には、前者の「点過程データから時系列データを作り、データ分析などを実施する」ことが多いようです。今、点過程データである「受注履歴データ」が手元にあったとします。この受注履歴データから、週単位や月単位、四半期単位などで受注金額や受注件数、受注単価などを計算することができます。この計算し求めたデータは、時系列データになります。

       

       

      【ものづくり セミナーサーチ】 セミナー紹介:国内最大級のセミナー掲載数 〈ものづくりセミナーサーチ〉 はこちら!

       

         続きを読むには・・・


      この記事の著者

      高橋 威知郎

      データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

      データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


      「情報マネジメント一般」の他のキーワード解説記事

      もっと見る
      データ分析のテーマ データ分析講座(その138)

        ◆ 筋のいいテーマと積小為大  データ分析のテーマには、筋の良いものと悪いものがあります。知らず知らずのうちに、筋の悪いテーマを選んでし...

        ◆ 筋のいいテーマと積小為大  データ分析のテーマには、筋の良いものと悪いものがあります。知らず知らずのうちに、筋の悪いテーマを選んでし...


      AIとセキュリティ 制御システム(その8)

          【制御システム 連載目次】 1. セキュリティ脅威と歴史 2. サイバー攻撃事例、情報システムとの違い 3....

          【制御システム 連載目次】 1. セキュリティ脅威と歴史 2. サイバー攻撃事例、情報システムとの違い 3....


      データ分析・活用の属人化とは データ分析講座(その92)

      ◆ データ分析・活用ナレッジの蓄積・共有・継承  データ分析・活用にチャレンジし右往左往している企業を傍目に、上手くいくようになった企業の事例です。...

      ◆ データ分析・活用ナレッジの蓄積・共有・継承  データ分析・活用にチャレンジし右往左往している企業を傍目に、上手くいくようになった企業の事例です。...


      「情報マネジメント一般」の活用事例

      もっと見る
      個票データの共用化でコストダウン

       データ解析の効率は、生データとその整理の仕方で大きく異なると言えます。 例えば、アンケート結果は単なる生データであり、そのままでは解析出来ません。解析の...

       データ解析の効率は、生データとその整理の仕方で大きく異なると言えます。 例えば、アンケート結果は単なる生データであり、そのままでは解析出来ません。解析の...


      中小製造業のウェブ戦略

       中小製造業がウェブサイトを立ち上げる際、その目的として「自社の信用力を高めるための会社概要的な役割」と考える経営者も少なくない。しかし、当社のクライアン...

       中小製造業がウェブサイトを立ち上げる際、その目的として「自社の信用力を高めるための会社概要的な役割」と考える経営者も少なくない。しかし、当社のクライアン...


      既存コア技術強化のためのオープン・イノベーション:富士フイルムの例

       2015年7月20日号の日経ビジネスに、富士フイルムの特集が掲載されました。富士フイルムは、既存コア技術強化のためにオープン・イノベーションを果敢に...

       2015年7月20日号の日経ビジネスに、富士フイルムの特集が掲載されました。富士フイルムは、既存コア技術強化のためにオープン・イノベーションを果敢に...