データ分析・活用のアプローチとは データ分析講座(その112)

更新日

投稿日

情報マネジメント

◆ なぜ今、データサイエンスが必要なのか?

 データサイエンスという用語は、数十年前からありました。2000年代初期のころ、私が所属していたコンサルティング会社の部署名に「データサイエンス」という言葉がついていたぐらいでしたから。データサイエンスが必要な理由は、今も昔も変わりません。変わったのは、データサイエンスをする人財が至る所で必要になったことぐらいです。今回は「なぜ今、データサイエンスが必要なのか?」というお話しです。

1、 データ分析という仕事

 「データ分析者」「データ分析官」「データマイナー」「データサイエンティスト」など、データを分析する人の名称は色々あります。最近、データ分析という職業の求人が急激に増えました。私の知る限りでは、1990年代には既にこの職業はありましたし当時から注目されていました。この頃、ITベンチャーと共にデータ分析系のベンチャーもいくつか設立されました。当時のデータ分析系のベンチャーの多くは、数名から数十名程度と小ぶりな企業が多い印象があります。

2、データのビッグデータ化

 「情報爆発」という言葉が2005年頃から聞かれるようになりました。情報爆発とともに「情報疲労」という言葉もありました。それが2010年代中頃からビッグデータという言葉で言い換えられるようになりました。情報爆発とはデータが爆発的に増えること。情報疲労はそれに対処するのが困難なことです。そして、ビッグデータは情報疲労を起こすことなく爆発的に増えたデータに対し上手く対処すること。感覚的にはそのような感じだったかと思います。爆発的に増えたデータに対し、どのように向き合いビジネスチャンスに繋げたかで、現在大きな差が生まれました。

3、データサイエンスとは何か?

 ビジネスという視点で考えると、データサイエンスとは、データとビジネスを結びつけることです。もう少し一般化すると、データサイエンスとは、データとその応用領域とを結びつけることです。応用領域は、医療かもしれませんし、軍事かもしれませんし、農業かもしれません。要するに、ビジネスの文脈で考えると、増加する一方のデータとビジネスの架け橋が、データサイエンスなのです。そのデータサイエンスを実現する人が、データサイエンティストということになるでしょう。

4、データがある限り、データサイエンスは廃れない

 データとビジネスの間の架け橋が新たに必要な限り、データサイエンスは必要になります。例えば、集まるデータが同じで、ビジネスも変化しないのであれば、その間の架け橋も同じで問題ありません。

 しかし幸か不幸かデータは現在も増加中で、そしてビジネスも時間の流れとともに変化します。つまり、ビジネスの変化と取得するデータに応じて、架け橋を改修するか構築し直すかが必要になるのです。

5、20年前はなかったFacebook

 例えば広告のデータ分析の分野。20年前のデータ分析が通用するのか、10年前の統計や機械学習モデルで対応可能なののでしょうか。そのままでは、通用しませんし対応もできないでしょう。例えば20年前の主流は、テレビCMや雑誌広告、新聞広告などです。

 この時代のデータ分析がそのまま通用するわけはありませんし、統計や機械学習モデルを使って効果検証や予測なども無理があることでしょう。インターネット系の広告が考慮されていないからです。広告・販促の手段は常に進化し、その都度新しいものが登場しています。

6、新製品や新設備、新材料

 このような話しは、マーケティングなどの分野だけではありません。生産の現場でも似たようなことは起こっています。製品のライフサイクルが短くなったことや設備の進化スピードなどにより、20年前や10年前のデータ分析がそのままでは通用しなくなっています。

 20年、10年前では生産品も異なれば、得られるデータももちろん異なります。ブラウン管テレビ生産時のデータ分析を、薄型液晶テレビで活用するには無理が出てくることでしょう。設備を変えれば、センサーから発生するデータも異なってきます。利用可能なデータの期間を延ばそうと、旧設備と共通したデータだけを使って分析するのは、ナンセンスですし非常にもったいないです。

 ある製造業では、ある製品の歩留まりが非常に良くなったタイミングでその製品の販売が終了。まだまだ歩留まりの改善余地の高い新製品に対し改善活動がスタートするという、終わりのない戦いを続けているところもありました。

7、共通してるのは、データ分析・活用のアプローチだけ

 時代が変わればビジネス環境も変わり、取得されるデータも変わる。そのため、データとビジネスの架け橋であるデータサイエンスは常に変化と進化を求められるようです。その変化に対応するのは、今でい...

情報マネジメント

◆ なぜ今、データサイエンスが必要なのか?

 データサイエンスという用語は、数十年前からありました。2000年代初期のころ、私が所属していたコンサルティング会社の部署名に「データサイエンス」という言葉がついていたぐらいでしたから。データサイエンスが必要な理由は、今も昔も変わりません。変わったのは、データサイエンスをする人財が至る所で必要になったことぐらいです。今回は「なぜ今、データサイエンスが必要なのか?」というお話しです。

1、 データ分析という仕事

 「データ分析者」「データ分析官」「データマイナー」「データサイエンティスト」など、データを分析する人の名称は色々あります。最近、データ分析という職業の求人が急激に増えました。私の知る限りでは、1990年代には既にこの職業はありましたし当時から注目されていました。この頃、ITベンチャーと共にデータ分析系のベンチャーもいくつか設立されました。当時のデータ分析系のベンチャーの多くは、数名から数十名程度と小ぶりな企業が多い印象があります。

2、データのビッグデータ化

 「情報爆発」という言葉が2005年頃から聞かれるようになりました。情報爆発とともに「情報疲労」という言葉もありました。それが2010年代中頃からビッグデータという言葉で言い換えられるようになりました。情報爆発とはデータが爆発的に増えること。情報疲労はそれに対処するのが困難なことです。そして、ビッグデータは情報疲労を起こすことなく爆発的に増えたデータに対し上手く対処すること。感覚的にはそのような感じだったかと思います。爆発的に増えたデータに対し、どのように向き合いビジネスチャンスに繋げたかで、現在大きな差が生まれました。

3、データサイエンスとは何か?

 ビジネスという視点で考えると、データサイエンスとは、データとビジネスを結びつけることです。もう少し一般化すると、データサイエンスとは、データとその応用領域とを結びつけることです。応用領域は、医療かもしれませんし、軍事かもしれませんし、農業かもしれません。要するに、ビジネスの文脈で考えると、増加する一方のデータとビジネスの架け橋が、データサイエンスなのです。そのデータサイエンスを実現する人が、データサイエンティストということになるでしょう。

4、データがある限り、データサイエンスは廃れない

 データとビジネスの間の架け橋が新たに必要な限り、データサイエンスは必要になります。例えば、集まるデータが同じで、ビジネスも変化しないのであれば、その間の架け橋も同じで問題ありません。

 しかし幸か不幸かデータは現在も増加中で、そしてビジネスも時間の流れとともに変化します。つまり、ビジネスの変化と取得するデータに応じて、架け橋を改修するか構築し直すかが必要になるのです。

5、20年前はなかったFacebook

 例えば広告のデータ分析の分野。20年前のデータ分析が通用するのか、10年前の統計や機械学習モデルで対応可能なののでしょうか。そのままでは、通用しませんし対応もできないでしょう。例えば20年前の主流は、テレビCMや雑誌広告、新聞広告などです。

 この時代のデータ分析がそのまま通用するわけはありませんし、統計や機械学習モデルを使って効果検証や予測なども無理があることでしょう。インターネット系の広告が考慮されていないからです。広告・販促の手段は常に進化し、その都度新しいものが登場しています。

6、新製品や新設備、新材料

 このような話しは、マーケティングなどの分野だけではありません。生産の現場でも似たようなことは起こっています。製品のライフサイクルが短くなったことや設備の進化スピードなどにより、20年前や10年前のデータ分析がそのままでは通用しなくなっています。

 20年、10年前では生産品も異なれば、得られるデータももちろん異なります。ブラウン管テレビ生産時のデータ分析を、薄型液晶テレビで活用するには無理が出てくることでしょう。設備を変えれば、センサーから発生するデータも異なってきます。利用可能なデータの期間を延ばそうと、旧設備と共通したデータだけを使って分析するのは、ナンセンスですし非常にもったいないです。

 ある製造業では、ある製品の歩留まりが非常に良くなったタイミングでその製品の販売が終了。まだまだ歩留まりの改善余地の高い新製品に対し改善活動がスタートするという、終わりのない戦いを続けているところもありました。

7、共通してるのは、データ分析・活用のアプローチだけ

 時代が変わればビジネス環境も変わり、取得されるデータも変わる。そのため、データとビジネスの架け橋であるデータサイエンスは常に変化と進化を求められるようです。その変化に対応するのは、今でいうとデータサイエンティストという名のデータ分析者です。20年前と比べ、データの種類と量は確実に増え、分析環境も非常に良くなりました。そんな中、変わらないことがあります。

 それはデータ分析・活用のアプローチです。今も昔も大きくは変わらない印象があります。例えば、有名なCRISP-DM(CRoss-Industry Standard Process for Data Mining)というデータ分析・活用のアプローチは今も昔も使われ、それなりの成果を生み続けています。

ビジネス理解

データ理解

データ準備

モデル構築

評価

展開

 一方通行ではなく、都度戻ります。ソフトウェア開発と異なり、進めながら明らかにしていく研究調査アプローチでもあります。実ビジネスに展開するまで何度も手戻りしながら、ぐるぐる回っていきます。どれだけ高速に回すかがキモになってきます。

 この中で最重要なのが「ビジネス理解」と「データ理解」のデータ分析(「データ準備」や「モデル構築」)前です。その次に重要なのが、データ分析(「データ準備」や「モデル構築」)後の「評価」と「展開」です。

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
AIに奪われるべき仕事を守る日本企業:データ分析講座(その332)

  AI技術の進化により、多くの業務やタスクが自動化され、効率化が進められている国々が増えてきました。だが、日本の一部の企業では、その流れ...

  AI技術の進化により、多くの業務やタスクが自動化され、効率化が進められている国々が増えてきました。だが、日本の一部の企業では、その流れ...


データ分析は脇役、課題解決の道具 データ分析講座(その81)

◆ データ分析は脇役、課題解決の道具  「社内に溜まっているデータを使って何かしろ!」「外からデータを買ってきて、何かできないか?」と言われても、言...

◆ データ分析は脇役、課題解決の道具  「社内に溜まっているデータを使って何かしろ!」「外からデータを買ってきて、何かできないか?」と言われても、言...


顧客満足度・探索意向率・NPSとは データ分析講座(その264)

  自社の業績を知るには、単に売上高や市場シェアなど分析すればいいでしょう。未来の業績を知るには、過去データをもとに時系列予測モデルを構築...

  自社の業績を知るには、単に売上高や市場シェアなど分析すればいいでしょう。未来の業績を知るには、過去データをもとに時系列予測モデルを構築...


「情報マネジメント一般」の活用事例

もっと見る
‐技術開発の目標について 第1回‐  製品・技術開発力強化策の事例(その15)

 前回の事例その14に続いて解説します。製品開発を目指している企業の中には、テ-マが見つかったら、または、アイデアが閃いたら開発に取り組む。そのような淡い...

 前回の事例その14に続いて解説します。製品開発を目指している企業の中には、テ-マが見つかったら、または、アイデアが閃いたら開発に取り組む。そのような淡い...


中小製造業のウェブ戦略

 中小製造業がウェブサイトを立ち上げる際、その目的として「自社の信用力を高めるための会社概要的な役割」と考える経営者も少なくない。しかし、当社のクライアン...

 中小製造業がウェブサイトを立ち上げる際、その目的として「自社の信用力を高めるための会社概要的な役割」と考える経営者も少なくない。しかし、当社のクライアン...


情報システム導入企業の悩みとは

        今回は、次の事例から、自社の生産システムにあった生産管理ソフトの選択をどうすべきかを解説します。   1. 想定事例  電...

        今回は、次の事例から、自社の生産システムにあった生産管理ソフトの選択をどうすべきかを解説します。   1. 想定事例  電...