見える化の魔力 データ分析講座(その218)

更新日

投稿日

情報マネジメント

 

【この連載の前回:データ分析講座(その217)なぜ、開票率数%で当確なのか?へのリンク】

データ活用をするとき、「見える化」というキーワードが次のようによく出てきます。

  • 取り急ぎ「見える化」するためにデータを集めよう
  • DX(デジタルトランスフォーメーション)の初手として「見える化」から始めましょう
  • データ環境を整備し「見える化」に成功。我が社もDXしてるぞ!
  • 「見える化」なんてダサすぎる。もっとディープなラーニングがいい……
  • 「見える化」は単なる集計。データ分析とは言えないしデータサイエンスではない

 

「見える化」は、憧れの目標にされたり、ディスられたり、大変です。今回は、「見える化の魔力」という話しをします。

【目次】
1.データ活用の約半分は、見える化だけで解決する
2.多くの場合、単なる集計
3.活用現場を混乱させそっぽを向かれたら本末転倒
4.問題は何を集計し見える化しているのか、ということ
5.アクションが見えれば嬉しいね

 

1.データ活用の約半分は、見える化だけで解決する

データ分析やデータサイエンスなどをキーワードで、ビジネス活用をそれなりに経験している人の多くは、見える化だけで十分と考えているのではないでしょうか?

 

データ分析だのデータサイエンスだのビッグデータだの機械学習だの偉そうに不思議ワードを連発しても、結局のところ、集計レベルのデータ活用で解決することも少なくありません。データサイエンティストになりたい! と意気込みこの業界に入ってきた人の中には、集系レベルの簡易なデータ分析業務にガッカリする人もいることでしょう。

 

2.多くの場合、単なる集計

「見える化」しました…… と言うとき、そのアウトプットの多くは、単なる集計結果です。単純集計・クロス集計などです。それをグラフ化し見やすくします。

 

単なる集計も、データサイエンス風に、対数線形モデルだのポアソン回帰モデルだの多項分布ロジスティック回帰モデルだのと命名すれば、少しはかっこよくなるかもしれません。実は、ディスられるほど、平易なものではありません。

 

この手のモデルを使えば、重要そうなクロス集計を探し出したり(意味のある集計軸の探索)などを実施できますし、モニタリングしている集計値(指標)の異常検知などを実施することもできます。でも、ぱっと見は、単なる集計とグラフです。

 

3.活用現場を混乱させそっぽを向かれたら本末転倒

データ活用する現場の人の多くは、データ分析者やデータサイエンティスト、機械学習エンジニアではありません。普通のビジネスパーソンです。

 

普通のビジネスパーソンにとっては、分けのわからないアウトプットを提供されるより、ぱっと見が集計とグラフの方が分かりやすく感じてもらえるでしょう。ある日、LightGBMという数理モデルを使って分析していたデータサイエンティストが、現場の人にSHAP (SHapley Additive exPlanations)の値を一所懸命説明していました。

 

現場の人にSHAPの数値が○○となっています…… と言っても、恐らく「???」だと思います。それなら、売上が10%上がった下がったの方が分かりやすいです。現場の人にSHAPの数値と、現場で起こっていることが頭の中でリンクしないと、当然ですが「???」となると思います。

 

本人に……「なぜ、LightGBMを使ったの? なぜ、SHAPで語ろうとしたの?」と聞いたら……「実務で使ってみたかった」と言う目も当てられない回答が返ってきました。活用現場を混乱させそっぽを向かれたら本末転倒です。そっぽを向かれたら、そのデータ分析の結果は、現場で活用されません。そこにかけた工数も、その報告を聞いた現場の人の時間も、全くの無駄になったということです。この場合、SHAP (SHapley Additive exPlanations)が悪いと言うわけではありません。

 

4.問題は何を集計し見える化しているのか、ということ

「見える化」さえすれば、物事は良い方向に向かうのか、というとそうでもありません。だからと言って、高度なデータサイエンスや機械学習の技術が必要だ! という単純な話しでもありません。もちろん、高度なデータサイエンスや機械学習の技術でどうにかなることもあります。

 

データを蓄積し「見える化」しているの上手くいかないケースの中には、「見える化」しているものが可笑しいケースも少なくありません。

 

現場に活用し難い集計結果を提供しているケースです。現場で活用される集計結果やグラフは、どのようなものなのかを、しっかり考える必要があります。そのためには、当然ながら現場の人を交えて議論する必要があります。

 

個人的には、現場の人が一切介在しないデータ分析やデータサイエンスは、ありえないと思っています。データ分析者やデータサイエンティスト、機械学習エンジニアなどと呼ばれる人は、それを活用する現場の人(エンドクライアント)と一度も接したことがな...

情報マネジメント

 

【この連載の前回:データ分析講座(その217)なぜ、開票率数%で当確なのか?へのリンク】

データ活用をするとき、「見える化」というキーワードが次のようによく出てきます。

  • 取り急ぎ「見える化」するためにデータを集めよう
  • DX(デジタルトランスフォーメーション)の初手として「見える化」から始めましょう
  • データ環境を整備し「見える化」に成功。我が社もDXしてるぞ!
  • 「見える化」なんてダサすぎる。もっとディープなラーニングがいい……
  • 「見える化」は単なる集計。データ分析とは言えないしデータサイエンスではない

 

「見える化」は、憧れの目標にされたり、ディスられたり、大変です。今回は、「見える化の魔力」という話しをします。

【目次】
1.データ活用の約半分は、見える化だけで解決する
2.多くの場合、単なる集計
3.活用現場を混乱させそっぽを向かれたら本末転倒
4.問題は何を集計し見える化しているのか、ということ
5.アクションが見えれば嬉しいね

 

1.データ活用の約半分は、見える化だけで解決する

データ分析やデータサイエンスなどをキーワードで、ビジネス活用をそれなりに経験している人の多くは、見える化だけで十分と考えているのではないでしょうか?

 

データ分析だのデータサイエンスだのビッグデータだの機械学習だの偉そうに不思議ワードを連発しても、結局のところ、集計レベルのデータ活用で解決することも少なくありません。データサイエンティストになりたい! と意気込みこの業界に入ってきた人の中には、集系レベルの簡易なデータ分析業務にガッカリする人もいることでしょう。

 

2.多くの場合、単なる集計

「見える化」しました…… と言うとき、そのアウトプットの多くは、単なる集計結果です。単純集計・クロス集計などです。それをグラフ化し見やすくします。

 

単なる集計も、データサイエンス風に、対数線形モデルだのポアソン回帰モデルだの多項分布ロジスティック回帰モデルだのと命名すれば、少しはかっこよくなるかもしれません。実は、ディスられるほど、平易なものではありません。

 

この手のモデルを使えば、重要そうなクロス集計を探し出したり(意味のある集計軸の探索)などを実施できますし、モニタリングしている集計値(指標)の異常検知などを実施することもできます。でも、ぱっと見は、単なる集計とグラフです。

 

3.活用現場を混乱させそっぽを向かれたら本末転倒

データ活用する現場の人の多くは、データ分析者やデータサイエンティスト、機械学習エンジニアではありません。普通のビジネスパーソンです。

 

普通のビジネスパーソンにとっては、分けのわからないアウトプットを提供されるより、ぱっと見が集計とグラフの方が分かりやすく感じてもらえるでしょう。ある日、LightGBMという数理モデルを使って分析していたデータサイエンティストが、現場の人にSHAP (SHapley Additive exPlanations)の値を一所懸命説明していました。

 

現場の人にSHAPの数値が○○となっています…… と言っても、恐らく「???」だと思います。それなら、売上が10%上がった下がったの方が分かりやすいです。現場の人にSHAPの数値と、現場で起こっていることが頭の中でリンクしないと、当然ですが「???」となると思います。

 

本人に……「なぜ、LightGBMを使ったの? なぜ、SHAPで語ろうとしたの?」と聞いたら……「実務で使ってみたかった」と言う目も当てられない回答が返ってきました。活用現場を混乱させそっぽを向かれたら本末転倒です。そっぽを向かれたら、そのデータ分析の結果は、現場で活用されません。そこにかけた工数も、その報告を聞いた現場の人の時間も、全くの無駄になったということです。この場合、SHAP (SHapley Additive exPlanations)が悪いと言うわけではありません。

 

4.問題は何を集計し見える化しているのか、ということ

「見える化」さえすれば、物事は良い方向に向かうのか、というとそうでもありません。だからと言って、高度なデータサイエンスや機械学習の技術が必要だ! という単純な話しでもありません。もちろん、高度なデータサイエンスや機械学習の技術でどうにかなることもあります。

 

データを蓄積し「見える化」しているの上手くいかないケースの中には、「見える化」しているものが可笑しいケースも少なくありません。

 

現場に活用し難い集計結果を提供しているケースです。現場で活用される集計結果やグラフは、どのようなものなのかを、しっかり考える必要があります。そのためには、当然ながら現場の人を交えて議論する必要があります。

 

個人的には、現場の人が一切介在しないデータ分析やデータサイエンスは、ありえないと思っています。データ分析者やデータサイエンティスト、機械学習エンジニアなどと呼ばれる人は、それを活用する現場の人(エンドクライアント)と一度も接したことがないという状況に陥らないようにしましょう。

 

5.アクションが見えれば嬉しい

データ分析の結果などを活用する現場の人(エンドクライアント)が見たいのは、打ち手(アクション)です。別に、集計結果やグラフ、SHAPなどを見たいわけではありません。次に何をすればいいのかを知りたいのです。そのデータ分析の結果などを見て、それを活用する現場の人(エンドクライアント)が次に何をすべきか分かるのであれば、そのアウトプットは正解でしょう。その正解、不正解を簡単に確かめることができます。

 

それは、データ分析の結果などを、それを活用する現場の人(エンドクライアント)の人に見せたとき……「で?」……という反応が返ってきたら、そのアウトプットは不正解です。何かが間違っています。

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
時系列データを用いた反実仮想分析とは:データ分析講座(その326)

  ビジネスは、売上データをはじめ時系列データで溢れています。ビジネスにおいて、実施した施策の振り返りや、施策を実施したらどうなるだろうか...

  ビジネスは、売上データをはじめ時系列データで溢れています。ビジネスにおいて、実施した施策の振り返りや、施策を実施したらどうなるだろうか...


プロダクトU&E (Usage & Establishment) データ分析講座(その43)

【目次】 ◆ 売上分析フレームワークである「プロダクトU&E」は、古典的だか今でも使えて最高だ!  プロダクトU&...

【目次】 ◆ 売上分析フレームワークである「プロダクトU&E」は、古典的だか今でも使えて最高だ!  プロダクトU&...


実務で使える5つの数理モデル   データ分析講座(その287)

  色々な数理モデルがありますが、実用性ではどうでしょうか。誰もが実務で使えるという観点で考えると、次の3つの回帰モデルと2つのデータ集約...

  色々な数理モデルがありますが、実用性ではどうでしょうか。誰もが実務で使えるという観点で考えると、次の3つの回帰モデルと2つのデータ集約...


「情報マネジメント一般」の活用事例

もっと見る
‐クレ-ム情報を開発に活用‐  製品・技術開発力強化策の事例(その13)

 前回の事例その12に続いて解説します。顧客から出されたクレ-ムは、技術開発や、関連製品の開発の可能性を潜在させている場合が多いようです。その視点からクレ...

 前回の事例その12に続いて解説します。顧客から出されたクレ-ムは、技術開発や、関連製品の開発の可能性を潜在させている場合が多いようです。その視点からクレ...


中小製造業のウェブ戦略

 中小製造業がウェブサイトを立ち上げる際、その目的として「自社の信用力を高めるための会社概要的な役割」と考える経営者も少なくない。しかし、当社のクライアン...

 中小製造業がウェブサイトを立ち上げる際、その目的として「自社の信用力を高めるための会社概要的な役割」と考える経営者も少なくない。しかし、当社のクライアン...


生産スピード向上と品質管理

 電子メールやインターネットの普及により、ビジネスのグローバル化が大きく進みましたが、IT技術の進歩は、品質管理の方法も進歩させました。20数年前は製造条...

 電子メールやインターネットの普及により、ビジネスのグローバル化が大きく進みましたが、IT技術の進歩は、品質管理の方法も進歩させました。20数年前は製造条...