データ起点で考える不幸 データ分析講座(その276)

更新日

投稿日

情報マネジメント

 

「折角だからこのデータを使って!」的なことがありませんか。そのデータを溜めるまでに多大なる労力を要したのか、データ整備に多大なる時間を要したのか、ITシステム周りでコストが掛かったのか、何かは知りませんが、特定のデータに執着される方も、少なくありません。もちろん、そうでない人のほうが多いかもしれませんが……。

 

そのデータを使うかどうかは、解決すべき課題次第です。解決すべき課題にとって必要であれば、そのデータは必要ですし、不必要であれば不必要です。今回は「折角だからこのデータを使って! と言われ無理に使うと面倒なことになる」というお話しをします。

 

【目次】
1. データ起点で考える不幸
2. 無理やり登場させロジック崩壊の危機
3. 使ったふりをする無駄作業
4. 使ったふりと知らずにシステム維持されコスト垂れ流し

 

【この連載の前回:(その275)データ活用上の「お困りごと」の混在とはへのリンク】

 

◆【特集】 連載記事紹介:連載記事のタイトルをまとめて紹介、各タイトルから詳細解説に直リンク!!

 

◆データ分析講座の注目記事紹介

 

1. データ起点で考える不幸

データに執着するときに、もっとも多いパターンが、データ起点でデータ活用を考えるという不幸です。不幸とは、ビジネスの現場で何ら成果を生み出せず、労力が無駄になることを言っています。データ起点で考えるときに出てくる、典型的な口癖です。

  • 「このデータで何ができるのか?」

 

具体的なデータ名で言い換えます。

  • 「営業の受発注データあるけど、このデータで何ができる?」
  • 「コールセンターのデータあるけど、このデータで何ができる?」
  • 「工場のセンサーデータあるけど、このデータで何ができる?」

 

今、赤ちゃんが目の前にいるとしましょう。「この赤ちゃん、将来どうなりますか?」は、難問です。赤ちゃんには無限の可能性があるからです。

 

実は、データにも無限の可能性があります。何ができるのかが知りたいのなら、何をしたほうがいいのかという探索的なデータ分析から始めたほうがいいでしょう。先程の赤ちゃんの例で考えると、その赤ちゃんを見ながら、将来こんな子になるかも、あんな子かもしれない、と考えるということです。そこには、考える人の願望が入ります。データ活用も同様です。

 

何をしたいのかという願望がないことには、なかなか難しいことです。

 

2. 無理やり登場させロジック崩壊の危機

エライ人からの肝いりのデータは、データ分析をするときや数理モデル構築するときなどに、強引にでも登場させなければならないことがあります。

 

「あのデータどうだった?」みたいに聞かれるからです。

 

そのデータをどこかに登場させるロジックを組まなければなりません。恐ろしく頭を酷使する必要があります。ストーリーをうまく考えないと、無理やり感がにじみ出てきます。困ったものです。

 

3. 使ったふりをする無駄作業

ある大企業で、色々なDBや部署などに点在しているデータを集約するためのデータレイクをクラウド上に、数年かけて構築しました。

 

そのデータレイク上のデータをメインで使えというデータ縛りに、その企業のデータサイエンティストたちは非常に困っていました。結局、そのデータレイク構築を主導した役員の退任とともに、そのデータレイクは見向きもされなくなりましたが、今でも稼働し毎月膨大なコストが発生しています。

 

その企業のデータサイエンティストたちがなぜ困っていたかというと、データレイクには上げやすいデータ(ある程度きれいなデータなど)しか上がっておらず、現場課題を解決するような泥臭いデータはデータレイクには存在せず、各現場のDBなどに留まった状態だったからです。

 

そのような状況の中、データレイクにあるデータを、データ分析や数理モデル構築などをするときに、無理くり登場させるために、それなりの時間を必要としていたからです。そこまで酷くないまでも「折角だからこのデータも考慮してみて」みたいな権威のある人の軽い一言が、データ分析者やデータサイエンティスト、機械学習エンジニアなどを苦しめることがあります。

 

そのようなデータを使わないときは、使わない利用を説明する手間が発生するからです。思考と時間の無駄です。

 

4. 使ったふりと知らずにシステム維持されコスト垂れ流し

その...

情報マネジメント

 

「折角だからこのデータを使って!」的なことがありませんか。そのデータを溜めるまでに多大なる労力を要したのか、データ整備に多大なる時間を要したのか、ITシステム周りでコストが掛かったのか、何かは知りませんが、特定のデータに執着される方も、少なくありません。もちろん、そうでない人のほうが多いかもしれませんが……。

 

そのデータを使うかどうかは、解決すべき課題次第です。解決すべき課題にとって必要であれば、そのデータは必要ですし、不必要であれば不必要です。今回は「折角だからこのデータを使って! と言われ無理に使うと面倒なことになる」というお話しをします。

 

【目次】
1. データ起点で考える不幸
2. 無理やり登場させロジック崩壊の危機
3. 使ったふりをする無駄作業
4. 使ったふりと知らずにシステム維持されコスト垂れ流し

 

【この連載の前回:(その275)データ活用上の「お困りごと」の混在とはへのリンク】

 

◆【特集】 連載記事紹介:連載記事のタイトルをまとめて紹介、各タイトルから詳細解説に直リンク!!

 

◆データ分析講座の注目記事紹介

 

1. データ起点で考える不幸

データに執着するときに、もっとも多いパターンが、データ起点でデータ活用を考えるという不幸です。不幸とは、ビジネスの現場で何ら成果を生み出せず、労力が無駄になることを言っています。データ起点で考えるときに出てくる、典型的な口癖です。

  • 「このデータで何ができるのか?」

 

具体的なデータ名で言い換えます。

  • 「営業の受発注データあるけど、このデータで何ができる?」
  • 「コールセンターのデータあるけど、このデータで何ができる?」
  • 「工場のセンサーデータあるけど、このデータで何ができる?」

 

今、赤ちゃんが目の前にいるとしましょう。「この赤ちゃん、将来どうなりますか?」は、難問です。赤ちゃんには無限の可能性があるからです。

 

実は、データにも無限の可能性があります。何ができるのかが知りたいのなら、何をしたほうがいいのかという探索的なデータ分析から始めたほうがいいでしょう。先程の赤ちゃんの例で考えると、その赤ちゃんを見ながら、将来こんな子になるかも、あんな子かもしれない、と考えるということです。そこには、考える人の願望が入ります。データ活用も同様です。

 

何をしたいのかという願望がないことには、なかなか難しいことです。

 

2. 無理やり登場させロジック崩壊の危機

エライ人からの肝いりのデータは、データ分析をするときや数理モデル構築するときなどに、強引にでも登場させなければならないことがあります。

 

「あのデータどうだった?」みたいに聞かれるからです。

 

そのデータをどこかに登場させるロジックを組まなければなりません。恐ろしく頭を酷使する必要があります。ストーリーをうまく考えないと、無理やり感がにじみ出てきます。困ったものです。

 

3. 使ったふりをする無駄作業

ある大企業で、色々なDBや部署などに点在しているデータを集約するためのデータレイクをクラウド上に、数年かけて構築しました。

 

そのデータレイク上のデータをメインで使えというデータ縛りに、その企業のデータサイエンティストたちは非常に困っていました。結局、そのデータレイク構築を主導した役員の退任とともに、そのデータレイクは見向きもされなくなりましたが、今でも稼働し毎月膨大なコストが発生しています。

 

その企業のデータサイエンティストたちがなぜ困っていたかというと、データレイクには上げやすいデータ(ある程度きれいなデータなど)しか上がっておらず、現場課題を解決するような泥臭いデータはデータレイクには存在せず、各現場のDBなどに留まった状態だったからです。

 

そのような状況の中、データレイクにあるデータを、データ分析や数理モデル構築などをするときに、無理くり登場させるために、それなりの時間を必要としていたからです。そこまで酷くないまでも「折角だからこのデータも考慮してみて」みたいな権威のある人の軽い一言が、データ分析者やデータサイエンティスト、機械学習エンジニアなどを苦しめることがあります。

 

そのようなデータを使わないときは、使わない利用を説明する手間が発生するからです。思考と時間の無駄です。

 

4. 使ったふりと知らずにシステム維持されコスト垂れ流し

その企業のデータサイエンティストたちのデータ分析結果などのパワーポイントのレポートに「〇✕△分析結果 with 〇〇〇」という感じで、常に〇〇〇(データレイクの名称)が記載されていました。データレイクのデータを使ったどうかに関係なくです。今流行りの単語で言えば「忖度」(そんたく)です。〇〇〇(データレイクの名称)は今や、その企業独自のAIプラットフォームと勘違いするぐらいのパワーを持ち始めています。

 

要は、使ったふりをする無駄作業が発生し、使ったふりと知らずにそのデータレイクは維持され、お金だけ垂れ流し状態です。どこかの会社でも、このように、上手くいっていることになっているDX投資やIT投資が、誰も指摘せず、無駄に維持されコスト垂れ流し状態になっているかもしれません。

 

 

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
時系列データの3つの見方とは データ分析講座(その46)

◆ 売上分析指標(KPIなど)の3つの見方  売上分析をするデータの多くは、時系列データと呼ばれるものです。時系列データとは、時系列に推移したデータ...

◆ 売上分析指標(KPIなど)の3つの見方  売上分析をするデータの多くは、時系列データと呼ばれるものです。時系列データとは、時系列に推移したデータ...


データがあるから何かやって データ分析講座(その227)

  【この連載の前回:データ分析講座(その226)成功確度とデータサイエンスへのリンク】 ◆関連解説『情報マネジメントとは』 &nbs...

  【この連載の前回:データ分析講座(その226)成功確度とデータサイエンスへのリンク】 ◆関連解説『情報マネジメントとは』 &nbs...


データ活用プラットフォームとデータサイエンス データ分析講座(その298)

  データをいかに活用しビジネスを加速させればいいのか。そのためのツールとして、データ活用プラットフォームがあります。呼び方は様々で、単に...

  データをいかに活用しビジネスを加速させればいいのか。そのためのツールとして、データ活用プラットフォームがあります。呼び方は様々で、単に...


「情報マネジメント一般」の活用事例

もっと見る
‐情報収集で配慮すべき事項(第2回)‐  製品・技術開発力強化策の事例(その10)

 前回の事例その9に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明確...

 前回の事例その9に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明確...


現場情報の自動収集に道具だてを

 一日の作業指示の出し方で、次のどちらの組織の管理レベルの改善がより進むでしょうか?        ・A社 ➡「x製品を◯個」     ・B...

 一日の作業指示の出し方で、次のどちらの組織の管理レベルの改善がより進むでしょうか?        ・A社 ➡「x製品を◯個」     ・B...


‐時代の流れを意識した開発テ-マの設定‐  製品・技術開発力強化策の事例(その5)

 前回の事例その4に続いて解説します。時代の流れに沿う開発テ-マとして、最近では、高齢者介護機器、環境関連機器、省エネ機器、情報技術(IT)等に関心が注が...

 前回の事例その4に続いて解説します。時代の流れに沿う開発テ-マとして、最近では、高齢者介護機器、環境関連機器、省エネ機器、情報技術(IT)等に関心が注が...