データから垣間見る人間模様を想像する事象理解 データ分析講座(その297)

更新日

投稿日

データ分析講座(その297)データから垣間見る人間模様を想像する事象理解

【目次】

    データはあくまでも、この世で起こった事象のある一部分を切り取りデータとして表出された何かです。ある暑い夏の日、喉が渇いたという理由で、コンビニで500ペットの飲料を1つ購買すれば、それがPOSデータという名のデータとして記録されます。このように、データはあくまでも、ある事象のほんの一部分しか表現していません。それも極一部です。データサイエンスや機械学習、AI、DXなどで表現されるデータ活用の多くは、この極一部のデータを活用し、この世の何かしらより良い影響を与えようと目論むものです。そう考えると、データ活用というものは、もの凄いことです。今回は「データから垣間見る人間模様を想像する事象理解」というお話しをします。

     

    【この連載の前回:統計的機械学習で使用する混同行列と評価指標 データ分析講座(その296) へのリンク】

    ◆データ分析講座の注目記事紹介

     

    1. 想像力がものを言う

    データ活用で上手くいくかどうかの要素の一つに、想像力というものがあります。データはあくまでも、この世で起こった事象のある一部分を切り取りデータとして表出された何かです。ある事象のほんの一部分しか表現していないデータから、その事象をいかに捉えるのか、その手段は想像力しかありません。コンビニで500ペットの炭酸料がある時間帯に非常に売れた、というデータから事象の全体像を想像する、ということです。

     

    例えば……

    • その日とても暑かったから売れたのだろうか
    • 近くで何かイベントがあったのだろうか
    • 他の商品が品薄で炭酸飲料ばかりになったためだろうか
    • キャンペーン中だったからだろうか

    ……などなど。そこを見誤ると、とんでもないことが起こるかもしれません。

     

    2. データ理解とは?

    データ活用の第一歩として「データ理解」というステップがあります。文字通り、データを理解する、というステップです。集めたデータを、色々な軸で集計したり、平均値や分散、最大値、最小値などの基本統計量を計算したり、どのようなデータなのかを理解するステップです。

     

    集計したり基本統計量を計算したりするだけでは、データ理解はできません。なぜならば、データ理解とは「データを通した事象理解」だからです。「データを通した事象理解」とは「そのデータを通しどのような事象が生起したのかを理解する」ということです。

     

    3. データ理解には現場理解がポイント

    データだけをいくら眺めても、事象理解をすることは困難です。例えば、データサイエンスや機械学習などの初学者が、サンプルデータを使い、データ分析したりモデル構築したりしても、多くの人は実感が無いというか臨場感は沸かないことでしょう。なぜならば、事象理解していないからです。

     

    事象理解の前提は、現場理解です。現場を知らない人が、その現場を想像するのは困難です。そのため、データ理解をするには、データが発生している現場や、それを活用する現場などを、直に見に行ったほうが早いです。そこで、現場の人とお話しができたら、なおいいです。一番いいのは、現場を体験することです。

     

    4. 現場無視の提言

    事象理解のないデータサイエンスや機械学習などは、非常識な提言を誘発します。某飲料メーカの新卒のデータサイエンティストです。意気揚々と彼は、次のような提案をもってきました。

    • 気温が25度を超えた瞬間に増産する(それにともない工員を採用する)
    • 気温が25度以下になった瞬間に減産する(それにともない工員を解雇する)

    増産するには、働く人を増やし工場のラインの新設が必要になります。そう簡単にできることではありません。減産の場合は、どの逆のことをやる必要があります。そもそも、従業員の採用と解雇を、気温を理由に秒で行うことはできません。衝撃の提案ですが、似たようなことを、たまに見かけます。...

    データ分析講座(その297)データから垣間見る人間模様を想像する事象理解

    【目次】

      データはあくまでも、この世で起こった事象のある一部分を切り取りデータとして表出された何かです。ある暑い夏の日、喉が渇いたという理由で、コンビニで500ペットの飲料を1つ購買すれば、それがPOSデータという名のデータとして記録されます。このように、データはあくまでも、ある事象のほんの一部分しか表現していません。それも極一部です。データサイエンスや機械学習、AI、DXなどで表現されるデータ活用の多くは、この極一部のデータを活用し、この世の何かしらより良い影響を与えようと目論むものです。そう考えると、データ活用というものは、もの凄いことです。今回は「データから垣間見る人間模様を想像する事象理解」というお話しをします。

       

      【この連載の前回:統計的機械学習で使用する混同行列と評価指標 データ分析講座(その296) へのリンク】

      ◆データ分析講座の注目記事紹介

       

      1. 想像力がものを言う

      データ活用で上手くいくかどうかの要素の一つに、想像力というものがあります。データはあくまでも、この世で起こった事象のある一部分を切り取りデータとして表出された何かです。ある事象のほんの一部分しか表現していないデータから、その事象をいかに捉えるのか、その手段は想像力しかありません。コンビニで500ペットの炭酸料がある時間帯に非常に売れた、というデータから事象の全体像を想像する、ということです。

       

      例えば……

      • その日とても暑かったから売れたのだろうか
      • 近くで何かイベントがあったのだろうか
      • 他の商品が品薄で炭酸飲料ばかりになったためだろうか
      • キャンペーン中だったからだろうか

      ……などなど。そこを見誤ると、とんでもないことが起こるかもしれません。

       

      2. データ理解とは?

      データ活用の第一歩として「データ理解」というステップがあります。文字通り、データを理解する、というステップです。集めたデータを、色々な軸で集計したり、平均値や分散、最大値、最小値などの基本統計量を計算したり、どのようなデータなのかを理解するステップです。

       

      集計したり基本統計量を計算したりするだけでは、データ理解はできません。なぜならば、データ理解とは「データを通した事象理解」だからです。「データを通した事象理解」とは「そのデータを通しどのような事象が生起したのかを理解する」ということです。

       

      3. データ理解には現場理解がポイント

      データだけをいくら眺めても、事象理解をすることは困難です。例えば、データサイエンスや機械学習などの初学者が、サンプルデータを使い、データ分析したりモデル構築したりしても、多くの人は実感が無いというか臨場感は沸かないことでしょう。なぜならば、事象理解していないからです。

       

      事象理解の前提は、現場理解です。現場を知らない人が、その現場を想像するのは困難です。そのため、データ理解をするには、データが発生している現場や、それを活用する現場などを、直に見に行ったほうが早いです。そこで、現場の人とお話しができたら、なおいいです。一番いいのは、現場を体験することです。

       

      4. 現場無視の提言

      事象理解のないデータサイエンスや機械学習などは、非常識な提言を誘発します。某飲料メーカの新卒のデータサイエンティストです。意気揚々と彼は、次のような提案をもってきました。

      • 気温が25度を超えた瞬間に増産する(それにともない工員を採用する)
      • 気温が25度以下になった瞬間に減産する(それにともない工員を解雇する)

      増産するには、働く人を増やし工場のラインの新設が必要になります。そう簡単にできることではありません。減産の場合は、どの逆のことをやる必要があります。そもそも、従業員の採用と解雇を、気温を理由に秒で行うことはできません。衝撃の提案ですが、似たようなことを、たまに見かけます。ほぼ、現場理解が足りていないことによる想像力不足です。

       

      この提案はボツになりましたが、彼の愚痴を聞く限り「やる気が足りない。やとうと思っていない。現状維持のぬるま湯に噛まんじている」という感じでした。本当に「やる気が足りない。やとうと思っていない。現状維持のぬるま湯に噛まんじている」という理由で、データ活用の提案をボツになることもあるため、彼の愚痴を一概に否定することはできません。非現実すぎてボツになったのか、やる気の問題でボツになったのか、そこを履き違えると不幸なことになりそうです。気をつけたいものです。

       

      次回に続きます。

       

      【ものづくり セミナーサーチ】 セミナー紹介:国内最大級のセミナー掲載数 〈ものづくりセミナーサーチ〉 はこちら!

       

         続きを読むには・・・


      この記事の著者

      高橋 威知郎

      データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

      データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


      「情報マネジメント一般」の他のキーワード解説記事

      もっと見る
      現場業務改善を目指すITシステム導入のステップガイド

        1. ITシステム導入の課題 1.1  ITシステム導入の重要性 製造業において、ITシステムの導入は業務効率の向上や生...

        1. ITシステム導入の課題 1.1  ITシステム導入の重要性 製造業において、ITシステムの導入は業務効率の向上や生...


      SOR理論 データ分析講座(その132)

      ◆ なぜ見える化しても成果が出ないのか、その解をSOR理論から探る  データを溜めて見える化したのに上手くいかない要因は色々考えられます。その中の一...

      ◆ なぜ見える化しても成果が出ないのか、その解をSOR理論から探る  データを溜めて見える化したのに上手くいかない要因は色々考えられます。その中の一...


      サイバー攻撃事例、情報システムとの違い 制御システム(その2)

        【制御システム 連載目次】 1. セキュリティ脅威と歴史 2. サイバー攻撃事例、情報システムとの違い 3. リスク分析とセキュ...

        【制御システム 連載目次】 1. セキュリティ脅威と歴史 2. サイバー攻撃事例、情報システムとの違い 3. リスク分析とセキュ...


      「情報マネジメント一般」の活用事例

      もっと見る
      P値で行う統計リテラシー判定

       「ピーチ」って聞いたら何を連想しますか、統計を学んでいる人に取っては「 P値 」が思い浮かぶはずです。統計学の素養がある程度備わっているか一言で知ろうと...

       「ピーチ」って聞いたら何を連想しますか、統計を学んでいる人に取っては「 P値 」が思い浮かぶはずです。統計学の素養がある程度備わっているか一言で知ろうと...


      情報、常識の検証を考える

      1、勝ち組と負け組を支配する情報  皆さんがご存じの大手予備校有名講師である林先生が、かつてテレビで「情報」に関して興味深いことをおっしゃっており、...

      1、勝ち組と負け組を支配する情報  皆さんがご存じの大手予備校有名講師である林先生が、かつてテレビで「情報」に関して興味深いことをおっしゃっており、...


      ‐時代の流れを意識した開発テ-マの設定‐  製品・技術開発力強化策の事例(その5)

       前回の事例その4に続いて解説します。時代の流れに沿う開発テ-マとして、最近では、高齢者介護機器、環境関連機器、省エネ機器、情報技術(IT)等に関心が注が...

       前回の事例その4に続いて解説します。時代の流れに沿う開発テ-マとして、最近では、高齢者介護機器、環境関連機器、省エネ機器、情報技術(IT)等に関心が注が...