データは副産物ではなく血液である データ分析講座(その265)

投稿日

データ分析

 

IT化を進めれば、その副産物としてデータは発生します。そのデータを保存さえしていれば、その副産物としてのデータを分析し、何かに活用することができます。ただ、データを副産物として扱う限り、データは活用しにくい状態で保存され続けます。そこで、いざデータ分析や数理モデルを構築しようとすると、データ整備地獄が生まれます。今回は「データは副産物ではなく血液である」というお話しをします。

 

【目次】
1. データ整備地獄
2. どのような状態のデータが必要なのか?
3. 活用イメージが湧くか?
4. データ活用ストーリー
5. データが血液になるとき

 

【この連載の前回:データ分析講座(その264)顧客満足度・探索意向率・NPSとはへのリンク】

◆【特集】 連載記事紹介連載記事のタイトルをまとめて紹介、各タイトルから詳細解説に直リンク!!

◆データ分析講座の注目記事紹介

 

1. データ整備地獄

データを分析する前に、データ整備のため多大な時間を犠牲にした人も多いと思います。それなりの分析に使われたことのないデータは、ほぼ汚いです。どう汚いかは一言では言えませんが、そのまま集計や分析するのが怖いぐらい汚く、そこから得られた結果は、間違った方向性へ導く可能性が高いです。そのため、多大な時間を使い、データを綺麗にする作業が発生します。

 

それがデータ整備地獄です。そのため、手軽にデータ分析や数理モデルなどを構築することができず、常にデータ整備を実施するという作業が入ってしまいます。であれば、最初からデータが綺麗な状態を保てるようにすればいいのでは、となります。

 

2. どのような状態のデータが必要なのか?

仮に、データが綺麗な状態を保てたとしても、それがデータ分析や数理モデル構築しやすい状態かは、別問題です。データは綺麗でも、データ分析や数理モデル構築のし難い状態が存在します。そこで問題になるのが「どのような状態のデータが必要なのか?」ということです。答えは簡単で「データ分析や数理モデル構築のし易い状態」となります。では、データ分析や数理モデル構築のし易い状態とは、どのような状態でしょうか?

 

3. 活用イメージが湧くか?

どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などによって、データ分析や数理モデル構築のし易い状態は変わります。ということは、どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などが分かっていればいいことになります。

 

この、どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などが分からないケースが多々あります。分からないケースの多くは、活用イメージが明確でない場合が多いです。どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などは、その分析結果や予測結果などを、どのように活用するのかに依存します。

 

活用イメージが分かれば、どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などが分かり、どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などが分かれば、どのような状態のデータが必要なのか?が分かります。そう考えると、活用イメージのないまま、データを整備し綺麗にする作業は非常に危険です。

 

4. データ活用ストーリー

データが情報(データ分析や予測結果など)に変わり、情報(データ分析や予測結果など)がビジネス成果(Before→After)に変わる、この流れがデータ活用ストーリーです。

 

 

データ活用ストーリーを設計するときは、逆算です。

  1. どのようなビジネス成果(Before→After)を出したいのか 
  2. そのために、どのような情報(データ分析や予測結果など)を、どのように活用するのか 
  3. そのために、どのようなデータ分析や数理モデル構築などが必要なのか 
  4. そのために、どのようなデータが必要なのか

非常にシンプルなことです。

 

5. データが血液になるとき

あるビジネスのある特定の一部分に着目し、データ活用ストーリーを構築し、データからビジネス成果を出すのもいいでしょう。そのとき、IT化の副産物であったデータが、単なる副産物以上の何かに変わります。目指すべきは、副産物からの脱却ではなく、その先のビジネス活動の血液です。多くの場合、たった1つのデ...

データ分析

 

IT化を進めれば、その副産物としてデータは発生します。そのデータを保存さえしていれば、その副産物としてのデータを分析し、何かに活用することができます。ただ、データを副産物として扱う限り、データは活用しにくい状態で保存され続けます。そこで、いざデータ分析や数理モデルを構築しようとすると、データ整備地獄が生まれます。今回は「データは副産物ではなく血液である」というお話しをします。

 

【目次】
1. データ整備地獄
2. どのような状態のデータが必要なのか?
3. 活用イメージが湧くか?
4. データ活用ストーリー
5. データが血液になるとき

 

【この連載の前回:データ分析講座(その264)顧客満足度・探索意向率・NPSとはへのリンク】

◆【特集】 連載記事紹介連載記事のタイトルをまとめて紹介、各タイトルから詳細解説に直リンク!!

◆データ分析講座の注目記事紹介

 

1. データ整備地獄

データを分析する前に、データ整備のため多大な時間を犠牲にした人も多いと思います。それなりの分析に使われたことのないデータは、ほぼ汚いです。どう汚いかは一言では言えませんが、そのまま集計や分析するのが怖いぐらい汚く、そこから得られた結果は、間違った方向性へ導く可能性が高いです。そのため、多大な時間を使い、データを綺麗にする作業が発生します。

 

それがデータ整備地獄です。そのため、手軽にデータ分析や数理モデルなどを構築することができず、常にデータ整備を実施するという作業が入ってしまいます。であれば、最初からデータが綺麗な状態を保てるようにすればいいのでは、となります。

 

2. どのような状態のデータが必要なのか?

仮に、データが綺麗な状態を保てたとしても、それがデータ分析や数理モデル構築しやすい状態かは、別問題です。データは綺麗でも、データ分析や数理モデル構築のし難い状態が存在します。そこで問題になるのが「どのような状態のデータが必要なのか?」ということです。答えは簡単で「データ分析や数理モデル構築のし易い状態」となります。では、データ分析や数理モデル構築のし易い状態とは、どのような状態でしょうか?

 

3. 活用イメージが湧くか?

どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などによって、データ分析や数理モデル構築のし易い状態は変わります。ということは、どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などが分かっていればいいことになります。

 

この、どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などが分からないケースが多々あります。分からないケースの多くは、活用イメージが明確でない場合が多いです。どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などは、その分析結果や予測結果などを、どのように活用するのかに依存します。

 

活用イメージが分かれば、どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などが分かり、どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などが分かれば、どのような状態のデータが必要なのか?が分かります。そう考えると、活用イメージのないまま、データを整備し綺麗にする作業は非常に危険です。

 

4. データ活用ストーリー

データが情報(データ分析や予測結果など)に変わり、情報(データ分析や予測結果など)がビジネス成果(Before→After)に変わる、この流れがデータ活用ストーリーです。

 

 

データ活用ストーリーを設計するときは、逆算です。

  1. どのようなビジネス成果(Before→After)を出したいのか 
  2. そのために、どのような情報(データ分析や予測結果など)を、どのように活用するのか 
  3. そのために、どのようなデータ分析や数理モデル構築などが必要なのか 
  4. そのために、どのようなデータが必要なのか

非常にシンプルなことです。

 

5. データが血液になるとき

あるビジネスのある特定の一部分に着目し、データ活用ストーリーを構築し、データからビジネス成果を出すのもいいでしょう。そのとき、IT化の副産物であったデータが、単なる副産物以上の何かに変わります。目指すべきは、副産物からの脱却ではなく、その先のビジネス活動の血液です。多くの場合、たった1つのデータ活用ストーリーを実現し満足することはありません。あるデータが、たった1つのデータ活用ストーリーの中だけで活用されることもありません。

 

あるデータは、色々なデータ活用ストーリーの中で活躍することでしょう。あるデータ活用ストーリーで生成された情報(データ分析や予測結果など)が、他のデータ活用ストーリーのデータや情報(データ分析や予測結果など)として扱われたりすることもあることでしょう。データ活用ストーリーが複合的に絡み合ったとき、そのときデータが血液に変わったときです。

 

では、どうすればいいのか?

 

1つ1つのデータ活用ストーリーを描き実現すること。さらに、それを他組織と共有すること。そして、他組織とやり取りできる状態にすること。まずは、1つ1つのデータ活用ストーリーを描き実現し、データからビジネス成果を産む流れを作ることです。

 

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
時系列性を加味した因果推論でよく利用されるSC法 データ分析講座(その302)

  前回のデータ分析講座(その301)ABテストからExcelでも出来る差の差推定へで、ABテストにおいて時系列性(Before&...

  前回のデータ分析講座(その301)ABテストからExcelでも出来る差の差推定へで、ABテストにおいて時系列性(Before&...


プロセス インフォマティクスとは何か?製造業における重要性を解説

【目次】 「熟練の技をどうやって若手に伝えればいいんだ…」 「人手不足なのに、品質要求は年々厳しくなる…...

【目次】 「熟練の技をどうやって若手に伝えればいいんだ…」 「人手不足なのに、品質要求は年々厳しくなる…...


自動機械学習 データ分析講座(その184)

    ◆ 古くて新しい自動機械学習 似たような数理モデルあり、その中から数理モデルを選択してモデル構築する場合のことです。この...

    ◆ 古くて新しい自動機械学習 似たような数理モデルあり、その中から数理モデルを選択してモデル構築する場合のことです。この...


「情報マネジメント一般」の活用事例

もっと見る
守秘義務は情報社会の命綱

  1. 顧客データの管理  O社は、技術志向のエンジニアリング会社です。 扱う製品の設計図には、さまざまな情報が含まれています。クライアントから...

  1. 顧客データの管理  O社は、技術志向のエンジニアリング会社です。 扱う製品の設計図には、さまざまな情報が含まれています。クライアントから...


中小製造業とIoTの波

 「IoT(アイオーティー)」の波が、中小製造業にどのような影響をおよぼすのか、具体的にどのような変化がこの業界に訪れるのかについて、解説します。   ...

 「IoT(アイオーティー)」の波が、中小製造業にどのような影響をおよぼすのか、具体的にどのような変化がこの業界に訪れるのかについて、解説します。   ...


P値で行う統計リテラシー判定

 「ピーチ」って聞いたら何を連想しますか、統計を学んでいる人に取っては「 P値 」が思い浮かぶはずです。統計学の素養がある程度備わっているか一言で知ろうと...

 「ピーチ」って聞いたら何を連想しますか、統計を学んでいる人に取っては「 P値 」が思い浮かぶはずです。統計学の素養がある程度備わっているか一言で知ろうと...