データ分析・活用のアプローチとは データ分析講座(その112)

更新日

投稿日

情報マネジメント

◆ なぜ今、データサイエンスが必要なのか?

 データサイエンスという用語は、数十年前からありました。2000年代初期のころ、私が所属していたコンサルティング会社の部署名に「データサイエンス」という言葉がついていたぐらいでしたから。データサイエンスが必要な理由は、今も昔も変わりません。変わったのは、データサイエンスをする人財が至る所で必要になったことぐらいです。今回は「なぜ今、データサイエンスが必要なのか?」というお話しです。

1、 データ分析という仕事

 「データ分析者」「データ分析官」「データマイナー」「データサイエンティスト」など、データを分析する人の名称は色々あります。最近、データ分析という職業の求人が急激に増えました。私の知る限りでは、1990年代には既にこの職業はありましたし当時から注目されていました。この頃、ITベンチャーと共にデータ分析系のベンチャーもいくつか設立されました。当時のデータ分析系のベンチャーの多くは、数名から数十名程度と小ぶりな企業が多い印象があります。

2、データのビッグデータ化

 「情報爆発」という言葉が2005年頃から聞かれるようになりました。情報爆発とともに「情報疲労」という言葉もありました。それが2010年代中頃からビッグデータという言葉で言い換えられるようになりました。情報爆発とはデータが爆発的に増えること。情報疲労はそれに対処するのが困難なことです。そして、ビッグデータは情報疲労を起こすことなく爆発的に増えたデータに対し上手く対処すること。感覚的にはそのような感じだったかと思います。爆発的に増えたデータに対し、どのように向き合いビジネスチャンスに繋げたかで、現在大きな差が生まれました。

3、データサイエンスとは何か?

 ビジネスという視点で考えると、データサイエンスとは、データとビジネスを結びつけることです。もう少し一般化すると、データサイエンスとは、データとその応用領域とを結びつけることです。応用領域は、医療かもしれませんし、軍事かもしれませんし、農業かもしれません。要するに、ビジネスの文脈で考えると、増加する一方のデータとビジネスの架け橋が、データサイエンスなのです。そのデータサイエンスを実現する人が、データサイエンティストということになるでしょう。

4、データがある限り、データサイエンスは廃れない

 データとビジネスの間の架け橋が新たに必要な限り、データサイエンスは必要になります。例えば、集まるデータが同じで、ビジネスも変化しないのであれば、その間の架け橋も同じで問題ありません。

 しかし幸か不幸かデータは現在も増加中で、そしてビジネスも時間の流れとともに変化します。つまり、ビジネスの変化と取得するデータに応じて、架け橋を改修するか構築し直すかが必要になるのです。

5、20年前はなかったFacebook

 例えば広告のデータ分析の分野。20年前のデータ分析が通用するのか、10年前の統計や機械学習モデルで対応可能なののでしょうか。そのままでは、通用しませんし対応もできないでしょう。例えば20年前の主流は、テレビCMや雑誌広告、新聞広告などです。

 この時代のデータ分析がそのまま通用するわけはありませんし、統計や機械学習モデルを使って効果検証や予測なども無理があることでしょう。インターネット系の広告が考慮されていないからです。広告・販促の手段は常に進化し、その都度新しいものが登場しています。

6、新製品や新設備、新材料

 このような話しは、マーケティングなどの分野だけではありません。生産の現場でも似たようなことは起こっています。製品のライフサイクルが短くなったことや設備の進化スピードなどにより、20年前や10年前のデータ分析がそのままでは通用しなくなっています。

 20年、10年前では生産品も異なれば、得られるデータももちろん異なります。ブラウン管テレビ生産時のデータ分析を、薄型液晶テレビで活用するには無理が出てくることでしょう。設備を変えれば、センサーから発生するデータも異なってきます。利用可能なデータの期間を延ばそうと、旧設備と共通したデータだけを使って分析するのは、ナンセンスですし非常にもったいないです。

 ある製造業では、ある製品の歩留まりが非常に良くなったタイミングでその製品の販売が終了。まだまだ歩留まりの改善余地の高い新製品に対し改善活動がスタートするという、終わりのない戦いを続けているところもありました。

7、共通してるのは、データ分析・活用のアプローチだけ

 時代が変わればビジネス環境も変わり、取得されるデータも変わる。そのため、データとビジネスの架け橋であるデータサイエンスは常に変化と進化を求められるようです。その変化に対応するのは、今でい...

情報マネジメント

◆ なぜ今、データサイエンスが必要なのか?

 データサイエンスという用語は、数十年前からありました。2000年代初期のころ、私が所属していたコンサルティング会社の部署名に「データサイエンス」という言葉がついていたぐらいでしたから。データサイエンスが必要な理由は、今も昔も変わりません。変わったのは、データサイエンスをする人財が至る所で必要になったことぐらいです。今回は「なぜ今、データサイエンスが必要なのか?」というお話しです。

1、 データ分析という仕事

 「データ分析者」「データ分析官」「データマイナー」「データサイエンティスト」など、データを分析する人の名称は色々あります。最近、データ分析という職業の求人が急激に増えました。私の知る限りでは、1990年代には既にこの職業はありましたし当時から注目されていました。この頃、ITベンチャーと共にデータ分析系のベンチャーもいくつか設立されました。当時のデータ分析系のベンチャーの多くは、数名から数十名程度と小ぶりな企業が多い印象があります。

2、データのビッグデータ化

 「情報爆発」という言葉が2005年頃から聞かれるようになりました。情報爆発とともに「情報疲労」という言葉もありました。それが2010年代中頃からビッグデータという言葉で言い換えられるようになりました。情報爆発とはデータが爆発的に増えること。情報疲労はそれに対処するのが困難なことです。そして、ビッグデータは情報疲労を起こすことなく爆発的に増えたデータに対し上手く対処すること。感覚的にはそのような感じだったかと思います。爆発的に増えたデータに対し、どのように向き合いビジネスチャンスに繋げたかで、現在大きな差が生まれました。

3、データサイエンスとは何か?

 ビジネスという視点で考えると、データサイエンスとは、データとビジネスを結びつけることです。もう少し一般化すると、データサイエンスとは、データとその応用領域とを結びつけることです。応用領域は、医療かもしれませんし、軍事かもしれませんし、農業かもしれません。要するに、ビジネスの文脈で考えると、増加する一方のデータとビジネスの架け橋が、データサイエンスなのです。そのデータサイエンスを実現する人が、データサイエンティストということになるでしょう。

4、データがある限り、データサイエンスは廃れない

 データとビジネスの間の架け橋が新たに必要な限り、データサイエンスは必要になります。例えば、集まるデータが同じで、ビジネスも変化しないのであれば、その間の架け橋も同じで問題ありません。

 しかし幸か不幸かデータは現在も増加中で、そしてビジネスも時間の流れとともに変化します。つまり、ビジネスの変化と取得するデータに応じて、架け橋を改修するか構築し直すかが必要になるのです。

5、20年前はなかったFacebook

 例えば広告のデータ分析の分野。20年前のデータ分析が通用するのか、10年前の統計や機械学習モデルで対応可能なののでしょうか。そのままでは、通用しませんし対応もできないでしょう。例えば20年前の主流は、テレビCMや雑誌広告、新聞広告などです。

 この時代のデータ分析がそのまま通用するわけはありませんし、統計や機械学習モデルを使って効果検証や予測なども無理があることでしょう。インターネット系の広告が考慮されていないからです。広告・販促の手段は常に進化し、その都度新しいものが登場しています。

6、新製品や新設備、新材料

 このような話しは、マーケティングなどの分野だけではありません。生産の現場でも似たようなことは起こっています。製品のライフサイクルが短くなったことや設備の進化スピードなどにより、20年前や10年前のデータ分析がそのままでは通用しなくなっています。

 20年、10年前では生産品も異なれば、得られるデータももちろん異なります。ブラウン管テレビ生産時のデータ分析を、薄型液晶テレビで活用するには無理が出てくることでしょう。設備を変えれば、センサーから発生するデータも異なってきます。利用可能なデータの期間を延ばそうと、旧設備と共通したデータだけを使って分析するのは、ナンセンスですし非常にもったいないです。

 ある製造業では、ある製品の歩留まりが非常に良くなったタイミングでその製品の販売が終了。まだまだ歩留まりの改善余地の高い新製品に対し改善活動がスタートするという、終わりのない戦いを続けているところもありました。

7、共通してるのは、データ分析・活用のアプローチだけ

 時代が変わればビジネス環境も変わり、取得されるデータも変わる。そのため、データとビジネスの架け橋であるデータサイエンスは常に変化と進化を求められるようです。その変化に対応するのは、今でいうとデータサイエンティストという名のデータ分析者です。20年前と比べ、データの種類と量は確実に増え、分析環境も非常に良くなりました。そんな中、変わらないことがあります。

 それはデータ分析・活用のアプローチです。今も昔も大きくは変わらない印象があります。例えば、有名なCRISP-DM(CRoss-Industry Standard Process for Data Mining)というデータ分析・活用のアプローチは今も昔も使われ、それなりの成果を生み続けています。

ビジネス理解

データ理解

データ準備

モデル構築

評価

展開

 一方通行ではなく、都度戻ります。ソフトウェア開発と異なり、進めながら明らかにしていく研究調査アプローチでもあります。実ビジネスに展開するまで何度も手戻りしながら、ぐるぐる回っていきます。どれだけ高速に回すかがキモになってきます。

 この中で最重要なのが「ビジネス理解」と「データ理解」のデータ分析(「データ準備」や「モデル構築」)前です。その次に重要なのが、データ分析(「データ準備」や「モデル構築」)後の「評価」と「展開」です。

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
バイオインフォマティクスとは?~おススメのプログラミング言語~

  薬剤開発、iPS細胞などの品質管理、新規生物種の発見、または既知生物種の再分類など、ゲノムあるいは遺伝情報の研究で、これらのデータを取...

  薬剤開発、iPS細胞などの品質管理、新規生物種の発見、または既知生物種の再分類など、ゲノムあるいは遺伝情報の研究で、これらのデータを取...


データ分析講座 【連載記事紹介】

  好評 連載中のデータ分析講座の記事が、無料でお読みいただけます! 【特集】連載記事紹介の一覧へ戻る ◆データ分析 データ分析は、...

  好評 連載中のデータ分析講座の記事が、無料でお読みいただけます! 【特集】連載記事紹介の一覧へ戻る ◆データ分析 データ分析は、...


データによる効果検証とネクストアクション データ分析講座(その213)

  【この連載の前回へのリンク】 プロモーションを実施したとき、その効果を知りたくなるものです。例えば、A群とB群に分け、A群には従来の...

  【この連載の前回へのリンク】 プロモーションを実施したとき、その効果を知りたくなるものです。例えば、A群とB群に分け、A群には従来の...


「情報マネジメント一般」の活用事例

もっと見る
ソーシャルメディアデータの解析事例:異分野研究から得られる共通した目的とは

 2020年、コロナウィルス感染の問題が大きくなり始めた頃、少人数の開催ということで、ソーシャルメディアデータ解析を専門にされている先生の講演会を聞く...

 2020年、コロナウィルス感染の問題が大きくなり始めた頃、少人数の開催ということで、ソーシャルメディアデータ解析を専門にされている先生の講演会を聞く...


‐情報収集と開発活動、営業の役割‐  製品・技術開発力強化策の事例(その12)

   前回の事例その11に続いて解説します。製品開発は完了したがどのように売れば良いのか、ベンチャ-ビジネスの相談や異業種交流の会合では特に売り方に関する...

   前回の事例その11に続いて解説します。製品開発は完了したがどのように売れば良いのか、ベンチャ-ビジネスの相談や異業種交流の会合では特に売り方に関する...


個票データの共用化でコストダウン

 データ解析の効率は、生データとその整理の仕方で大きく異なると言えます。 例えば、アンケート結果は単なる生データであり、そのままでは解析出来ません。解析の...

 データ解析の効率は、生データとその整理の仕方で大きく異なると言えます。 例えば、アンケート結果は単なる生データであり、そのままでは解析出来ません。解析の...