成果を出したいなら、汚いデータから データ分析講座(その3)

更新日

投稿日

 

情報マネジメント

 「社内にデータが溜まっているんだけど、何かに使えないかな」よくこのような相談を受けます。できれば、収益拡大につながる儲かるデータ分析。データをただ溜めてコストを発生させているだけだと、溜めない方がましです。どうせデータを溜めるなら、儲けに繋げたい。データ分析を、マーケティングや営業活動あたりに繋げると、ストレートで分かりやすい。

1. パンドラの箱

 データをビジネスに活かしたいと考えたとき、まず最初にやるのが、データのコンディションを確認すること。多くの企業では、溜めたデータがどのような状態なのかを把握していません。

 把握していないから、夢を見ます。ものすごいことができるかもしれない、このデータで。でも、把握していないから、悪夢も見ます。もしかしたら、たいしたことがないかもしれない、このデータは。

 本当のところどうなんでしょうか。多くの場合、分析されたことのないデータほど汚い。見てはいけないものを見てしまった感じです。一度、データ分析なりすると、ヤバいと思い、データは徐々に綺麗になってきます。

 要するに、分析されたことのないデータは、ヤバいんです。このままでは、とてもじゃないけど、分析に使えない。分析に使えないデータはどうすればよいのか。答えは簡単です。綺麗にすればよいのです。この綺麗にする作業が大変なのです。だから、分析されたことのないデータのコンディションを確認するということは、パンドラの箱を開けてしまうようなものなのです。ヤバいよ、ヤバいよ、と思いながら、仕方がないからデータを綺麗にする作業をします。こんな汚いデータで分析しても意味がないんじゃないかと、心の中で愚痴りながら、データを綺麗にする作業をします。

2. データを捨てていましたという悲劇

 頑張れは、汚いデータは綺麗になります。そして、汚いデータが溜まらないようにする工夫を考え始めます。もしくは、汚いデータを綺麗にする作業手順やプログラミングを作る人もいます。つまり、一度汚いデータを綺麗にするという作業をすると、この苦労を味わいたくないので、そうならない工夫を多くの人や組織はするのです。そして、いざ分析をすると、次に新たな難問が待ち受けています。

 その難問とは、欲しいデータがない、という難問です。

 データを分析していると「こんなデータがあればよいのに……」、という場面に何度も出会います。多くの場合、ちょっとしたことで取得できるデータです。入力時のデータ項目を増やしたり、データ入力のルールを決めたり、データを捨てないようにするなどです。

 信じられないかもしれませんが、過去データを捨てている企業って少なくないのです。

 例えば、CRMの履歴データがない。CRMは履歴を保存する設定をしないと、上書きされてしまいます。上書きされたら過去の履歴は消えてしまいます。他にも、サイトのアクセスログデータが膨大なので定期的に捨てていたり、購買履歴データがあるからとレシートデータ(POSデータ)を捨てていたりします。このような例はたくさんあります。

 問題なのは、企業側に捨てているという意識がないことです。最初ヒアリングすると、決まって「データは溜まっている」と言いますが、中を覗いてみるとデータがすっからかん。汚いデータでもあるだけましなのです。

3. 溜まるのを待ったら熱が冷める。

 少なくともデータ分析をすると……

  • 「データを綺麗に溜めるにはどうすべきか」
  • 「どのようなデータを溜めるべきか」
  • 「データを捨てないようにするにはどうすべきか」

 ……とという3つの問が襲ってきます。

 データを綺麗に溜めるといっても、センサー系のデータであれば、プログラミングや機器側でなんとななります。しかし、CRMやPOSの場合には人が入力するデータなので、急には綺麗にはなりません。社員教育のようなものが必要になります。教育したからと言って、急によくなることもないので、時間がかかります。

 今までに取得していないデータを溜めるといっても、入力項目を増やすぐらいならすぐできますが、新たなシステムを導入しなければならないなど、お金と時間のかかるものは、データが溜まるようになるまでに時間がかかります。

 データを捨てないようにするとは、まず意識をもつこと。

 例えばCRMの場合だと、スナップショットなどの設定をし履歴を保存できるようにすればよいだけです。容量が増えると多少お金はかかりますが、最近は履歴データを保存するのはそれほどのコストにはなりません。問題は、例えばCRMでスナップショットの設定をしてもすぐにはデータは溜まらない。少なくとも、設定をしたときから溜まるから最低1年ぐらい溜めないと意味がない。つまり、時間がかかります。

 とにもかくにも、これからデータをどうしようかと考えると、時間がかかることだけが分かります。でも、データ活用って、時間がかかると冷めてきます。冷めたらデータが溜まってもほったらかし。もしくは、再度、データ活用熱が高まるの...

 

情報マネジメント

 「社内にデータが溜まっているんだけど、何かに使えないかな」よくこのような相談を受けます。できれば、収益拡大につながる儲かるデータ分析。データをただ溜めてコストを発生させているだけだと、溜めない方がましです。どうせデータを溜めるなら、儲けに繋げたい。データ分析を、マーケティングや営業活動あたりに繋げると、ストレートで分かりやすい。

1. パンドラの箱

 データをビジネスに活かしたいと考えたとき、まず最初にやるのが、データのコンディションを確認すること。多くの企業では、溜めたデータがどのような状態なのかを把握していません。

 把握していないから、夢を見ます。ものすごいことができるかもしれない、このデータで。でも、把握していないから、悪夢も見ます。もしかしたら、たいしたことがないかもしれない、このデータは。

 本当のところどうなんでしょうか。多くの場合、分析されたことのないデータほど汚い。見てはいけないものを見てしまった感じです。一度、データ分析なりすると、ヤバいと思い、データは徐々に綺麗になってきます。

 要するに、分析されたことのないデータは、ヤバいんです。このままでは、とてもじゃないけど、分析に使えない。分析に使えないデータはどうすればよいのか。答えは簡単です。綺麗にすればよいのです。この綺麗にする作業が大変なのです。だから、分析されたことのないデータのコンディションを確認するということは、パンドラの箱を開けてしまうようなものなのです。ヤバいよ、ヤバいよ、と思いながら、仕方がないからデータを綺麗にする作業をします。こんな汚いデータで分析しても意味がないんじゃないかと、心の中で愚痴りながら、データを綺麗にする作業をします。

2. データを捨てていましたという悲劇

 頑張れは、汚いデータは綺麗になります。そして、汚いデータが溜まらないようにする工夫を考え始めます。もしくは、汚いデータを綺麗にする作業手順やプログラミングを作る人もいます。つまり、一度汚いデータを綺麗にするという作業をすると、この苦労を味わいたくないので、そうならない工夫を多くの人や組織はするのです。そして、いざ分析をすると、次に新たな難問が待ち受けています。

 その難問とは、欲しいデータがない、という難問です。

 データを分析していると「こんなデータがあればよいのに……」、という場面に何度も出会います。多くの場合、ちょっとしたことで取得できるデータです。入力時のデータ項目を増やしたり、データ入力のルールを決めたり、データを捨てないようにするなどです。

 信じられないかもしれませんが、過去データを捨てている企業って少なくないのです。

 例えば、CRMの履歴データがない。CRMは履歴を保存する設定をしないと、上書きされてしまいます。上書きされたら過去の履歴は消えてしまいます。他にも、サイトのアクセスログデータが膨大なので定期的に捨てていたり、購買履歴データがあるからとレシートデータ(POSデータ)を捨てていたりします。このような例はたくさんあります。

 問題なのは、企業側に捨てているという意識がないことです。最初ヒアリングすると、決まって「データは溜まっている」と言いますが、中を覗いてみるとデータがすっからかん。汚いデータでもあるだけましなのです。

3. 溜まるのを待ったら熱が冷める。

 少なくともデータ分析をすると……

  • 「データを綺麗に溜めるにはどうすべきか」
  • 「どのようなデータを溜めるべきか」
  • 「データを捨てないようにするにはどうすべきか」

 ……とという3つの問が襲ってきます。

 データを綺麗に溜めるといっても、センサー系のデータであれば、プログラミングや機器側でなんとななります。しかし、CRMやPOSの場合には人が入力するデータなので、急には綺麗にはなりません。社員教育のようなものが必要になります。教育したからと言って、急によくなることもないので、時間がかかります。

 今までに取得していないデータを溜めるといっても、入力項目を増やすぐらいならすぐできますが、新たなシステムを導入しなければならないなど、お金と時間のかかるものは、データが溜まるようになるまでに時間がかかります。

 データを捨てないようにするとは、まず意識をもつこと。

 例えばCRMの場合だと、スナップショットなどの設定をし履歴を保存できるようにすればよいだけです。容量が増えると多少お金はかかりますが、最近は履歴データを保存するのはそれほどのコストにはなりません。問題は、例えばCRMでスナップショットの設定をしてもすぐにはデータは溜まらない。少なくとも、設定をしたときから溜まるから最低1年ぐらい溜めないと意味がない。つまり、時間がかかります。

 とにもかくにも、これからデータをどうしようかと考えると、時間がかかることだけが分かります。でも、データ活用って、時間がかかると冷めてきます。冷めたらデータが溜まってもほったらかし。もしくは、再度、データ活用熱が高まるのを待つだけ。

4. 今あるデータで何とかせよ

 セールス・アナリティクス(営業のデータ活用)などのデータ活用は、思い立ったらすぐやるのがコツです。データが溜まってからやろうとか考えると、データの収集基盤だけ構築してほったらかし、なんてことになります。

 データが汚なかろうが、データが足りなかろうが、分析者がいなかろうが、すぐやると上手くいきます。綺麗なデータが溜まるのを待とう、新しく取得したデータが溜めるのを待とう、分析者が育つのを待とう、などと考えるといつまでたっても何もできません。分析者は、分析しながら育つものです。教育よりも実践あるのみです。

 実践の中から、足りないことを学べばよいのです。少なくとも、わたしはそのように育ちました。育ったというよりも、組織の中で育てられました。実務という戦場に、1人ぶちこまれ、そして己の非力を知り、何が足りないのかを思い知らされ勉強する。つまり、「セールス・アナリティクス(営業のデータ活用)などのデータ活用で成果を出したいなら、今ある汚いデータから始めよ!」ということです。

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
データ分析・活用、進化の順番とは データ分析講座(その111)

◆ データ分析・活用には進化の順番がある。最初は「効率化」で次は「多様化」  今あるデータやこれから取得するであろうデータで何をするのか。これはデー...

◆ データ分析・活用には進化の順番がある。最初は「効率化」で次は「多様化」  今あるデータやこれから取得するであろうデータで何をするのか。これはデー...


データ分析の初学者と自動機械学習 データ分析講座(その202)

  ここ数年、色々なAutoML(自動機械学習)が登場してきました。有料版で勢いがあるのがDataRobotです。GoogleもIBMもM...

  ここ数年、色々なAutoML(自動機械学習)が登場してきました。有料版で勢いがあるのがDataRobotです。GoogleもIBMもM...


データサイエンス実践、3つの壁 データ分析講座(その178)

  ◆ データ分析・活用(データサイエンス実践)の3つの壁  データ活用が上手くいかない原因として、何があると思いますか? 江戸時代の剣...

  ◆ データ分析・活用(データサイエンス実践)の3つの壁  データ活用が上手くいかない原因として、何があると思いますか? 江戸時代の剣...


「情報マネジメント一般」の活用事例

もっと見る
情報システム導入企業の悩みとは

        今回は、次の事例から、自社の生産システムにあった生産管理ソフトの選択をどうすべきかを解説します。   1. 想定事例  電...

        今回は、次の事例から、自社の生産システムにあった生産管理ソフトの選択をどうすべきかを解説します。   1. 想定事例  電...


Excelの帳票を見直そう

 オフィス業務においては、マイクロソフトOfficeがデファクトスタンダードになっています。とりわけ活用されているのはExcelでしょう。Excelを使う...

 オフィス業務においては、マイクロソフトOfficeがデファクトスタンダードになっています。とりわけ活用されているのはExcelでしょう。Excelを使う...


‐社内の問題克服による開発活動‐  製品・技術開発力強化策の事例(その14)

 前回の事例その13に続いて解説します。社内における様々な問題を高いレベルで深く追及して解決することが、競争力のある技術を育成し、売れる製品を生み出す事に...

 前回の事例その13に続いて解説します。社内における様々な問題を高いレベルで深く追及して解決することが、競争力のある技術を育成し、売れる製品を生み出す事に...