データ分析・活用のアプローチとは データ分析講座(その112)

更新日

投稿日

情報マネジメント

◆ なぜ今、データサイエンスが必要なのか?

 データサイエンスという用語は、数十年前からありました。2000年代初期のころ、私が所属していたコンサルティング会社の部署名に「データサイエンス」という言葉がついていたぐらいでしたから。データサイエンスが必要な理由は、今も昔も変わりません。変わったのは、データサイエンスをする人財が至る所で必要になったことぐらいです。今回は「なぜ今、データサイエンスが必要なのか?」というお話しです。

1、 データ分析という仕事

 「データ分析者」「データ分析官」「データマイナー」「データサイエンティスト」など、データを分析する人の名称は色々あります。最近、データ分析という職業の求人が急激に増えました。私の知る限りでは、1990年代には既にこの職業はありましたし当時から注目されていました。この頃、ITベンチャーと共にデータ分析系のベンチャーもいくつか設立されました。当時のデータ分析系のベンチャーの多くは、数名から数十名程度と小ぶりな企業が多い印象があります。

2、データのビッグデータ化

 「情報爆発」という言葉が2005年頃から聞かれるようになりました。情報爆発とともに「情報疲労」という言葉もありました。それが2010年代中頃からビッグデータという言葉で言い換えられるようになりました。情報爆発とはデータが爆発的に増えること。情報疲労はそれに対処するのが困難なことです。そして、ビッグデータは情報疲労を起こすことなく爆発的に増えたデータに対し上手く対処すること。感覚的にはそのような感じだったかと思います。爆発的に増えたデータに対し、どのように向き合いビジネスチャンスに繋げたかで、現在大きな差が生まれました。

3、データサイエンスとは何か?

 ビジネスという視点で考えると、データサイエンスとは、データとビジネスを結びつけることです。もう少し一般化すると、データサイエンスとは、データとその応用領域とを結びつけることです。応用領域は、医療かもしれませんし、軍事かもしれませんし、農業かもしれません。要するに、ビジネスの文脈で考えると、増加する一方のデータとビジネスの架け橋が、データサイエンスなのです。そのデータサイエンスを実現する人が、データサイエンティストということになるでしょう。

4、データがある限り、データサイエンスは廃れない

 データとビジネスの間の架け橋が新たに必要な限り、データサイエンスは必要になります。例えば、集まるデータが同じで、ビジネスも変化しないのであれば、その間の架け橋も同じで問題ありません。

 しかし幸か不幸かデータは現在も増加中で、そしてビジネスも時間の流れとともに変化します。つまり、ビジネスの変化と取得するデータに応じて、架け橋を改修するか構築し直すかが必要になるのです。

5、20年前はなかったFacebook

 例えば広告のデータ分析の分野。20年前のデータ分析が通用するのか、10年前の統計や機械学習モデルで対応可能なののでしょうか。そのままでは、通用しませんし対応もできないでしょう。例えば20年前の主流は、テレビCMや雑誌広告、新聞広告などです。

 この時代のデータ分析がそのまま通用するわけはありませんし、統計や機械学習モデルを使って効果検証や予測なども無理があることでしょう。インターネット系の広告が考慮されていないからです。広告・販促の手段は常に進化し、その都度新しいものが登場しています。

6、新製品や新設備、新材料

 このような話しは、マーケティングなどの分野だけではありません。生産の現場でも似たようなことは起こっています。製品のライフサイクルが短くなったことや設備の進化スピードなどにより、20年前や10年前のデータ分析がそのままでは通用しなくなっています。

 20年、10年前では生産品も異なれば、得られるデータももちろん異なります。ブラウン管テレビ生産時のデータ分析を、薄型液晶テレビで活用するには無理が出てくることでしょう。設備を変えれば、センサーから発生するデータも異なってきます。利用可能なデータの期間を延ばそうと、旧設備と共通したデータだけを使って分析するのは、ナンセンスですし非常にもったいないです。

 ある製造業では、ある製品の歩留まりが非常に良くなったタイミングでその製品の販売が終了。まだまだ歩留まりの改善余地の高い新製品に対し改善活動がスタートするという、終わりのない戦いを続けているところもありました。

7、共通してるのは、データ分析・活用のアプローチだけ

 時代が変わればビジネス環境も変わり、取得されるデータも変わる。そのため、データとビジネスの架け橋であるデータサイエンスは常に変化と進化を求められるようです。その変化に対応するのは、今でい...

情報マネジメント

◆ なぜ今、データサイエンスが必要なのか?

 データサイエンスという用語は、数十年前からありました。2000年代初期のころ、私が所属していたコンサルティング会社の部署名に「データサイエンス」という言葉がついていたぐらいでしたから。データサイエンスが必要な理由は、今も昔も変わりません。変わったのは、データサイエンスをする人財が至る所で必要になったことぐらいです。今回は「なぜ今、データサイエンスが必要なのか?」というお話しです。

1、 データ分析という仕事

 「データ分析者」「データ分析官」「データマイナー」「データサイエンティスト」など、データを分析する人の名称は色々あります。最近、データ分析という職業の求人が急激に増えました。私の知る限りでは、1990年代には既にこの職業はありましたし当時から注目されていました。この頃、ITベンチャーと共にデータ分析系のベンチャーもいくつか設立されました。当時のデータ分析系のベンチャーの多くは、数名から数十名程度と小ぶりな企業が多い印象があります。

2、データのビッグデータ化

 「情報爆発」という言葉が2005年頃から聞かれるようになりました。情報爆発とともに「情報疲労」という言葉もありました。それが2010年代中頃からビッグデータという言葉で言い換えられるようになりました。情報爆発とはデータが爆発的に増えること。情報疲労はそれに対処するのが困難なことです。そして、ビッグデータは情報疲労を起こすことなく爆発的に増えたデータに対し上手く対処すること。感覚的にはそのような感じだったかと思います。爆発的に増えたデータに対し、どのように向き合いビジネスチャンスに繋げたかで、現在大きな差が生まれました。

3、データサイエンスとは何か?

 ビジネスという視点で考えると、データサイエンスとは、データとビジネスを結びつけることです。もう少し一般化すると、データサイエンスとは、データとその応用領域とを結びつけることです。応用領域は、医療かもしれませんし、軍事かもしれませんし、農業かもしれません。要するに、ビジネスの文脈で考えると、増加する一方のデータとビジネスの架け橋が、データサイエンスなのです。そのデータサイエンスを実現する人が、データサイエンティストということになるでしょう。

4、データがある限り、データサイエンスは廃れない

 データとビジネスの間の架け橋が新たに必要な限り、データサイエンスは必要になります。例えば、集まるデータが同じで、ビジネスも変化しないのであれば、その間の架け橋も同じで問題ありません。

 しかし幸か不幸かデータは現在も増加中で、そしてビジネスも時間の流れとともに変化します。つまり、ビジネスの変化と取得するデータに応じて、架け橋を改修するか構築し直すかが必要になるのです。

5、20年前はなかったFacebook

 例えば広告のデータ分析の分野。20年前のデータ分析が通用するのか、10年前の統計や機械学習モデルで対応可能なののでしょうか。そのままでは、通用しませんし対応もできないでしょう。例えば20年前の主流は、テレビCMや雑誌広告、新聞広告などです。

 この時代のデータ分析がそのまま通用するわけはありませんし、統計や機械学習モデルを使って効果検証や予測なども無理があることでしょう。インターネット系の広告が考慮されていないからです。広告・販促の手段は常に進化し、その都度新しいものが登場しています。

6、新製品や新設備、新材料

 このような話しは、マーケティングなどの分野だけではありません。生産の現場でも似たようなことは起こっています。製品のライフサイクルが短くなったことや設備の進化スピードなどにより、20年前や10年前のデータ分析がそのままでは通用しなくなっています。

 20年、10年前では生産品も異なれば、得られるデータももちろん異なります。ブラウン管テレビ生産時のデータ分析を、薄型液晶テレビで活用するには無理が出てくることでしょう。設備を変えれば、センサーから発生するデータも異なってきます。利用可能なデータの期間を延ばそうと、旧設備と共通したデータだけを使って分析するのは、ナンセンスですし非常にもったいないです。

 ある製造業では、ある製品の歩留まりが非常に良くなったタイミングでその製品の販売が終了。まだまだ歩留まりの改善余地の高い新製品に対し改善活動がスタートするという、終わりのない戦いを続けているところもありました。

7、共通してるのは、データ分析・活用のアプローチだけ

 時代が変わればビジネス環境も変わり、取得されるデータも変わる。そのため、データとビジネスの架け橋であるデータサイエンスは常に変化と進化を求められるようです。その変化に対応するのは、今でいうとデータサイエンティストという名のデータ分析者です。20年前と比べ、データの種類と量は確実に増え、分析環境も非常に良くなりました。そんな中、変わらないことがあります。

 それはデータ分析・活用のアプローチです。今も昔も大きくは変わらない印象があります。例えば、有名なCRISP-DM(CRoss-Industry Standard Process for Data Mining)というデータ分析・活用のアプローチは今も昔も使われ、それなりの成果を生み続けています。

ビジネス理解

データ理解

データ準備

モデル構築

評価

展開

 一方通行ではなく、都度戻ります。ソフトウェア開発と異なり、進めながら明らかにしていく研究調査アプローチでもあります。実ビジネスに展開するまで何度も手戻りしながら、ぐるぐる回っていきます。どれだけ高速に回すかがキモになってきます。

 この中で最重要なのが「ビジネス理解」と「データ理解」のデータ分析(「データ準備」や「モデル構築」)前です。その次に重要なのが、データ分析(「データ準備」や「モデル構築」)後の「評価」と「展開」です。

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
データ活用の可能性を高めるたった1つのこと データ分析講座(その200)

    せっかく、データ集計したり分析したり、予測モデルを作って予測値をアウトプットしても、現場で活用されないことは多々あります。...

    せっかく、データ集計したり分析したり、予測モデルを作って予測値をアウトプットしても、現場で活用されないことは多々あります。...


課題発見型データ分析と課題解決型データ分析 データ分析講座(その225)

  【この連載の前回:データ分析講座(その224)5つのデータ分析へのリンク】 ◆関連解説『情報マネジメントとは』 データ分析といって...

  【この連載の前回:データ分析講座(その224)5つのデータ分析へのリンク】 ◆関連解説『情報マネジメントとは』 データ分析といって...


評価指標の異常判断とは データ分析講座(その245)

  ビジネス活動をしていると、何かしらの指標を眺めることが多々あります。例えば、売上や受注件数、問い合せ件数、サイトのPV(ページビュー)...

  ビジネス活動をしていると、何かしらの指標を眺めることが多々あります。例えば、売上や受注件数、問い合せ件数、サイトのPV(ページビュー)...


「情報マネジメント一般」の活用事例

もっと見る
情報、常識の検証を考える

1、勝ち組と負け組を支配する情報  皆さんがご存じの大手予備校有名講師である林先生が、かつてテレビで「情報」に関して興味深いことをおっしゃっており、...

1、勝ち組と負け組を支配する情報  皆さんがご存じの大手予備校有名講師である林先生が、かつてテレビで「情報」に関して興味深いことをおっしゃっており、...


‐販路開拓に関する問題事例‐ 製品・技術開発力強化策の事例(その19)

 前回の事例その18に続いて解説します。多額の資金と労力を費やして開発した知的財産をどのように活用して販路開拓に結びつけるのか、大変重要な問題ですが、販売...

 前回の事例その18に続いて解説します。多額の資金と労力を費やして開発した知的財産をどのように活用して販路開拓に結びつけるのか、大変重要な問題ですが、販売...


‐情報収集で配慮すべき事項(第1回)‐  製品・技術開発力強化策の事例(その9)

 前回の事例その8に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明確...

 前回の事例その8に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明確...