2種類の時系列データとは、 データ分析講座(その305)

投稿日

2種類の時系列データとは、 データ分析講座(その305)

 

時系列データといっても色々な形のものがあります。よく見かけるのが次の2種類です。

  1. 縦持ち時系列データ(時間軸が縦方向)
  2. 横持ち時系列データ(時間軸が横方向)

 

基本となるのが「縦持ち時系列データ」です。ビジネスの現場でよく見かけるのが「横持ち時系列データ」です。「縦持ち時系列データ」と「横持ち時系列データ」は、多くは相互に変換可能です。今回は「2種類の時系列データ」というお話しします。

【目次】

    【この連載の前回:ビジネス時系列データでよくある7つの活用事例 データ分析講座(その304)へのリンク】

    ◆データ分析講座の注目記事紹介

     

    1. 縦持ち時系列データ(時間軸が縦方向)

    「縦持ち時系列データ」とは、ここまで例として登場した時系列データで、時間変数が1つ、指標変数が1つ以上あります。もちろん、時間変数や指標変数以外の変数があっても構いません。次の例は、時間変数が「年月」(月単位)、指標変数が「販売金額」(全体の販売金額の合計)で構成された「縦持ち時系列データ」です。

    2種類の時系列データとは、 データ分析講座(その305)

     

    ビジネスの現場では、全体の販売金額だけでなく、商品や顧客、エリアなどに分けた販売金額にも関心を持つことでしょう。このような場合、例えば次のように「商品別の変数」を設け時系列データを作ったりします。

    2種類の時系列データとは、 データ分析講座(その305)

     

    このような時系列データは、ぱっと見では分かりやすいのですが、商品の種類が多いと、変数の数が非常に多くなるのが難点です。では、顧客別の場合はどうでしょうか。

     

    2. 層別変数

    商品別と同じように「顧客別の変数」を設けるという方法もあります。ただ、通常は非常に変数の数が非常に多くなります。顧客数が10万人であれば、10万変数になります。避けたいところです。このような場合、顧客の数や商品の数、エリアの数だけ新しい変数を設けるのではなく、それぞれを1つの変数(例:顧客ID、商品コード、エリアNo)で表現し、縦に長いデータセットを準備するのがいいでしょう。ここでは、このような変数を「層別変数」と呼ぶことにします。

    2種類の時系列データとは、 データ分析講座(その305)

     

    3. 基本のデータセット

    この非常に縦に長い「縦持ち時系列データ」が、基本のデータセットになります。このデータセットは集計や分析などを実施するとき非常に扱い易いです。必要に応じて、このデータセットの一部を切り出したり集計したりし、新たな「縦持ち時系列データ」を作り利用することができるからです。

     

    さらに状況に応じて、この非常に縦に長い「縦持ち時系列データ」から、この後説明する「横持ち時系列データ」や別の記事で説明する「時系列特徴量付きテーブルデータ」を作り、活用することができます。

     

    4. 横持ち時系列データ(時間軸が横方向)

    「横持ち時系列データ」とは、変数で時間を表現したデータ...

    2種類の時系列データとは、 データ分析講座(その305)

     

    時系列データといっても色々な形のものがあります。よく見かけるのが次の2種類です。

    1. 縦持ち時系列データ(時間軸が縦方向)
    2. 横持ち時系列データ(時間軸が横方向)

     

    基本となるのが「縦持ち時系列データ」です。ビジネスの現場でよく見かけるのが「横持ち時系列データ」です。「縦持ち時系列データ」と「横持ち時系列データ」は、多くは相互に変換可能です。今回は「2種類の時系列データ」というお話しします。

    【目次】

      【この連載の前回:ビジネス時系列データでよくある7つの活用事例 データ分析講座(その304)へのリンク】

      ◆データ分析講座の注目記事紹介

       

      1. 縦持ち時系列データ(時間軸が縦方向)

      「縦持ち時系列データ」とは、ここまで例として登場した時系列データで、時間変数が1つ、指標変数が1つ以上あります。もちろん、時間変数や指標変数以外の変数があっても構いません。次の例は、時間変数が「年月」(月単位)、指標変数が「販売金額」(全体の販売金額の合計)で構成された「縦持ち時系列データ」です。

      2種類の時系列データとは、 データ分析講座(その305)

       

      ビジネスの現場では、全体の販売金額だけでなく、商品や顧客、エリアなどに分けた販売金額にも関心を持つことでしょう。このような場合、例えば次のように「商品別の変数」を設け時系列データを作ったりします。

      2種類の時系列データとは、 データ分析講座(その305)

       

      このような時系列データは、ぱっと見では分かりやすいのですが、商品の種類が多いと、変数の数が非常に多くなるのが難点です。では、顧客別の場合はどうでしょうか。

       

      2. 層別変数

      商品別と同じように「顧客別の変数」を設けるという方法もあります。ただ、通常は非常に変数の数が非常に多くなります。顧客数が10万人であれば、10万変数になります。避けたいところです。このような場合、顧客の数や商品の数、エリアの数だけ新しい変数を設けるのではなく、それぞれを1つの変数(例:顧客ID、商品コード、エリアNo)で表現し、縦に長いデータセットを準備するのがいいでしょう。ここでは、このような変数を「層別変数」と呼ぶことにします。

      2種類の時系列データとは、 データ分析講座(その305)

       

      3. 基本のデータセット

      この非常に縦に長い「縦持ち時系列データ」が、基本のデータセットになります。このデータセットは集計や分析などを実施するとき非常に扱い易いです。必要に応じて、このデータセットの一部を切り出したり集計したりし、新たな「縦持ち時系列データ」を作り利用することができるからです。

       

      さらに状況に応じて、この非常に縦に長い「縦持ち時系列データ」から、この後説明する「横持ち時系列データ」や別の記事で説明する「時系列特徴量付きテーブルデータ」を作り、活用することができます。

       

      4. 横持ち時系列データ(時間軸が横方向)

      「横持ち時系列データ」とは、変数で時間を表現したデータセットです。例えば、次のように「2021年1月売上の変数」「2021年2月売上の変数」・・・といったものです。

      2種類の時系列データとは、 データ分析講座(その305)

       

      厳密には違いますが「横持ち時系列データ」は、ちょうど「縦持ち時系列データ」を転置(行と列を入れ替える)したかのようなデータセットになります。「横持ち時系列データ」の方が「縦持ち時系列データ」よりも分かりやすいと感じる方も多いことでしょう。そのためか、ビジネスの現場では「横持ち時系列データ」の方をよく見る気がします。

       

      そこで「縦持ち時系列データ」を作った方がいいのか、それとも「横持ち時系列データ」を作った方がいいのか悩むことがあります。しかし、先ほどもお話ししましたが、基本となるのは「縦持ち時系列データ」です。時系列データを利用した集計や分析などを実施するとき、最初にすべきは、非常に縦に長い「縦持ち時系列データ」を作ることです

       

      【ものづくり セミナーサーチ】 セミナー紹介:国内最大級のセミナー掲載数 〈ものづくりセミナーサーチ〉 はこちら!

       

         続きを読むには・・・


      この記事の著者

      高橋 威知郎

      データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

      データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


      「情報マネジメント一般」の他のキーワード解説記事

      もっと見る
      データドリブンとは「データ用いた継続的改善」である データ分析講座(その186)

        データ活用で重要なのは、続けることです。打ち上げ花火のような一発ドカンと何かをするのではなく、地味に続けることが重要です。打ち上げ花火...

        データ活用で重要なのは、続けることです。打ち上げ花火のような一発ドカンと何かをするのではなく、地味に続けることが重要です。打ち上げ花火...


      プロダクト・データサイエンス:データ分析講座(その323)3つのDS

        企業内のデータサイエンス組織の1つの役割として、データサイエンス技術を、より良い商品の開発やより良いCX(カスタマー・エクスペリエンス...

        企業内のデータサイエンス組織の1つの役割として、データサイエンス技術を、より良い商品の開発やより良いCX(カスタマー・エクスペリエンス...


      販売力を高めるデータ分析とは データ分析講座(その196)

        ビジネス系のデータ分析・活用(データサイエンス実践)を「ビジネスアナリティクス」という用語で表現したりします。このビジネスアナリティク...

        ビジネス系のデータ分析・活用(データサイエンス実践)を「ビジネスアナリティクス」という用語で表現したりします。このビジネスアナリティク...


      「情報マネジメント一般」の活用事例

      もっと見る
      既存コア技術強化のためのオープン・イノベーション:富士フイルムの例

       2015年7月20日号の日経ビジネスに、富士フイルムの特集が掲載されました。富士フイルムは、既存コア技術強化のためにオープン・イノベーションを果敢に...

       2015年7月20日号の日経ビジネスに、富士フイルムの特集が掲載されました。富士フイルムは、既存コア技術強化のためにオープン・イノベーションを果敢に...


      ‐情報収集で配慮すべき事項(第3回)‐  製品・技術開発力強化策の事例(その11)

       前回の事例その10に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明...

       前回の事例その10に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明...


      ‐販路開拓に関する問題 第1回‐  製品・技術開発力強化策の事例(その17)

       前回の事例その16に続いて解説します。開発が完了したから販売先を探す。そのような考え方で開発に従事することは根本的に間違っている事は既に述べました。開発...

       前回の事例その16に続いて解説します。開発が完了したから販売先を探す。そのような考え方で開発に従事することは根本的に間違っている事は既に述べました。開発...