データは副産物ではなく血液である データ分析講座(その265)

投稿日

データ分析

 

IT化を進めれば、その副産物としてデータは発生します。そのデータを保存さえしていれば、その副産物としてのデータを分析し、何かに活用することができます。ただ、データを副産物として扱う限り、データは活用しにくい状態で保存され続けます。そこで、いざデータ分析や数理モデルを構築しようとすると、データ整備地獄が生まれます。今回は「データは副産物ではなく血液である」というお話しをします。

 

【目次】
1. データ整備地獄
2. どのような状態のデータが必要なのか?
3. 活用イメージが湧くか?
4. データ活用ストーリー
5. データが血液になるとき

 

【この連載の前回:データ分析講座(その264)顧客満足度・探索意向率・NPSとはへのリンク】

◆【特集】 連載記事紹介連載記事のタイトルをまとめて紹介、各タイトルから詳細解説に直リンク!!

◆データ分析講座の注目記事紹介

 

1. データ整備地獄

データを分析する前に、データ整備のため多大な時間を犠牲にした人も多いと思います。それなりの分析に使われたことのないデータは、ほぼ汚いです。どう汚いかは一言では言えませんが、そのまま集計や分析するのが怖いぐらい汚く、そこから得られた結果は、間違った方向性へ導く可能性が高いです。そのため、多大な時間を使い、データを綺麗にする作業が発生します。

 

それがデータ整備地獄です。そのため、手軽にデータ分析や数理モデルなどを構築することができず、常にデータ整備を実施するという作業が入ってしまいます。であれば、最初からデータが綺麗な状態を保てるようにすればいいのでは、となります。

 

2. どのような状態のデータが必要なのか?

仮に、データが綺麗な状態を保てたとしても、それがデータ分析や数理モデル構築しやすい状態かは、別問題です。データは綺麗でも、データ分析や数理モデル構築のし難い状態が存在します。そこで問題になるのが「どのような状態のデータが必要なのか?」ということです。答えは簡単で「データ分析や数理モデル構築のし易い状態」となります。では、データ分析や数理モデル構築のし易い状態とは、どのような状態でしょうか?

 

3. 活用イメージが湧くか?

どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などによって、データ分析や数理モデル構築のし易い状態は変わります。ということは、どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などが分かっていればいいことになります。

 

この、どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などが分からないケースが多々あります。分からないケースの多くは、活用イメージが明確でない場合が多いです。どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などは、その分析結果や予測結果などを、どのように活用するのかに依存します。

 

活用イメージが分かれば、どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などが分かり、どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などが分かれば、どのような状態のデータが必要なのか?が分かります。そう考えると、活用イメージのないまま、データを整備し綺麗にする作業は非常に危険です。

 

4. データ活用ストーリー

データが情報(データ分析や予測結果など)に変わり、情報(データ分析や予測結果など)がビジネス成果(Before→After)に変わる、この流れがデータ活用ストーリーです。

 

 

データ活用ストーリーを設計するときは、逆算です。

  1. どのようなビジネス成果(Before→After)を出したいのか 
  2. そのために、どのような情報(データ分析や予測結果など)を、どのように活用するのか 
  3. そのために、どのようなデータ分析や数理モデル構築などが必要なのか 
  4. そのために、どのようなデータが必要なのか

非常にシンプルなことです。

 

5. データが血液になるとき

あるビジネスのある特定の一部分に着目し、データ活用ストーリーを構築し、データからビジネス成果を出すのもいいでしょう。そのとき、IT化の副産物であったデータが、単なる副産物以上の何かに変わります。目指すべきは、副産物からの脱却ではなく、その先のビジネス活動の血液です。多くの場合、たった1つのデ...

データ分析

 

IT化を進めれば、その副産物としてデータは発生します。そのデータを保存さえしていれば、その副産物としてのデータを分析し、何かに活用することができます。ただ、データを副産物として扱う限り、データは活用しにくい状態で保存され続けます。そこで、いざデータ分析や数理モデルを構築しようとすると、データ整備地獄が生まれます。今回は「データは副産物ではなく血液である」というお話しをします。

 

【目次】
1. データ整備地獄
2. どのような状態のデータが必要なのか?
3. 活用イメージが湧くか?
4. データ活用ストーリー
5. データが血液になるとき

 

【この連載の前回:データ分析講座(その264)顧客満足度・探索意向率・NPSとはへのリンク】

◆【特集】 連載記事紹介連載記事のタイトルをまとめて紹介、各タイトルから詳細解説に直リンク!!

◆データ分析講座の注目記事紹介

 

1. データ整備地獄

データを分析する前に、データ整備のため多大な時間を犠牲にした人も多いと思います。それなりの分析に使われたことのないデータは、ほぼ汚いです。どう汚いかは一言では言えませんが、そのまま集計や分析するのが怖いぐらい汚く、そこから得られた結果は、間違った方向性へ導く可能性が高いです。そのため、多大な時間を使い、データを綺麗にする作業が発生します。

 

それがデータ整備地獄です。そのため、手軽にデータ分析や数理モデルなどを構築することができず、常にデータ整備を実施するという作業が入ってしまいます。であれば、最初からデータが綺麗な状態を保てるようにすればいいのでは、となります。

 

2. どのような状態のデータが必要なのか?

仮に、データが綺麗な状態を保てたとしても、それがデータ分析や数理モデル構築しやすい状態かは、別問題です。データは綺麗でも、データ分析や数理モデル構築のし難い状態が存在します。そこで問題になるのが「どのような状態のデータが必要なのか?」ということです。答えは簡単で「データ分析や数理モデル構築のし易い状態」となります。では、データ分析や数理モデル構築のし易い状態とは、どのような状態でしょうか?

 

3. 活用イメージが湧くか?

どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などによって、データ分析や数理モデル構築のし易い状態は変わります。ということは、どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などが分かっていればいいことになります。

 

この、どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などが分からないケースが多々あります。分からないケースの多くは、活用イメージが明確でない場合が多いです。どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などは、その分析結果や予測結果などを、どのように活用するのかに依存します。

 

活用イメージが分かれば、どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などが分かり、どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などが分かれば、どのような状態のデータが必要なのか?が分かります。そう考えると、活用イメージのないまま、データを整備し綺麗にする作業は非常に危険です。

 

4. データ活用ストーリー

データが情報(データ分析や予測結果など)に変わり、情報(データ分析や予測結果など)がビジネス成果(Before→After)に変わる、この流れがデータ活用ストーリーです。

 

 

データ活用ストーリーを設計するときは、逆算です。

  1. どのようなビジネス成果(Before→After)を出したいのか 
  2. そのために、どのような情報(データ分析や予測結果など)を、どのように活用するのか 
  3. そのために、どのようなデータ分析や数理モデル構築などが必要なのか 
  4. そのために、どのようなデータが必要なのか

非常にシンプルなことです。

 

5. データが血液になるとき

あるビジネスのある特定の一部分に着目し、データ活用ストーリーを構築し、データからビジネス成果を出すのもいいでしょう。そのとき、IT化の副産物であったデータが、単なる副産物以上の何かに変わります。目指すべきは、副産物からの脱却ではなく、その先のビジネス活動の血液です。多くの場合、たった1つのデータ活用ストーリーを実現し満足することはありません。あるデータが、たった1つのデータ活用ストーリーの中だけで活用されることもありません。

 

あるデータは、色々なデータ活用ストーリーの中で活躍することでしょう。あるデータ活用ストーリーで生成された情報(データ分析や予測結果など)が、他のデータ活用ストーリーのデータや情報(データ分析や予測結果など)として扱われたりすることもあることでしょう。データ活用ストーリーが複合的に絡み合ったとき、そのときデータが血液に変わったときです。

 

では、どうすればいいのか?

 

1つ1つのデータ活用ストーリーを描き実現すること。さらに、それを他組織と共有すること。そして、他組織とやり取りできる状態にすること。まずは、1つ1つのデータ活用ストーリーを描き実現し、データからビジネス成果を産む流れを作ることです。

 

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
機械学習における多変量代入法、欠損データの克服:データ分析講座(その354)

  【目次】  ▼さらに深く学ぶなら!「データ分析」に関するセミナーはこちら! 機械学習は、データから学ぶ技術で...

  【目次】  ▼さらに深く学ぶなら!「データ分析」に関するセミナーはこちら! 機械学習は、データから学ぶ技術で...


会議を再考してみる

1.七つの会議    「君はなぜこの会社を選んだの?」「ここしか入れてもらえなかったんだ。」「俺も似たようなものだな。」「大企業に就職した奴...

1.七つの会議    「君はなぜこの会社を選んだの?」「ここしか入れてもらえなかったんだ。」「俺も似たようなものだな。」「大企業に就職した奴...


ケーススタディ①「リード(見込み顧客)の選別」 データ分析講座(その187)

  データを使い販売力を効率的に高めるセールスアナリティクスには、3つの典型的なテーマがあります。   新規顧客の獲得 ...

  データを使い販売力を効率的に高めるセールスアナリティクスには、3つの典型的なテーマがあります。   新規顧客の獲得 ...


「情報マネジメント一般」の活用事例

もっと見る
‐時代の流れを意識した開発テ-マの設定‐  製品・技術開発力強化策の事例(その5)

 前回の事例その4に続いて解説します。時代の流れに沿う開発テ-マとして、最近では、高齢者介護機器、環境関連機器、省エネ機器、情報技術(IT)等に関心が注が...

 前回の事例その4に続いて解説します。時代の流れに沿う開発テ-マとして、最近では、高齢者介護機器、環境関連機器、省エネ機器、情報技術(IT)等に関心が注が...


Web上で試作受注するツールを成功させるポイントとは

        今回は、「Web上で試作受注するツール」を成功させるポイントについて解説します。次の2点がポイントで、この2つを「最優先」に考える必...

        今回は、「Web上で試作受注するツール」を成功させるポイントについて解説します。次の2点がポイントで、この2つを「最優先」に考える必...


‐情報収集で配慮すべき事項(第3回)‐  製品・技術開発力強化策の事例(その11)

 前回の事例その10に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明...

 前回の事例その10に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明...