データ分析・活用の戦略的資産 データ分析講座(その113)

更新日

投稿日

情報マネジメント

 

◆ データ分析・活用でビジネス成果を安定的に確保するための戦略的資産とは

 最近流行りのキーワードです。

  • AI(人工知能)
  • DL(ディープラーニング)
  • DX(デジタルトランスフォーメーション)
  • データサイエンス
  • IoT(モノのインターネット)
  • デジタルマニュファクチュアリング
  • xTech
  • 自動運転
  • AIスピーカー
  • チャットボット
  • ロボティクス
  • データビジネス
  • 〇〇プラットファーム など。

 最近流行りのキーワードを並べると面白いことが分かります。すべてデータが必要ということです。今回は「データ分析・活用でビジネス成果を安定的に確保するための戦略的資産とは」というお話しです。

1、戦略的資産

 戦略的資産とは何でしょうか、ここでは、戦略的資産をデータ分析・活用の安定・発展を図り、データ分析・活用の基盤を維持するために、安定的に確保する必要がある資産と定義します。

 「戦略的」というワードからイメージできる通り「短期的・場当たり的」ではなく「長期的・全体的」といったところです。では、データ分析・活用の戦略的資産とは何でしょうか。

2、データ分析・活用の戦略的資産

 データ分析・活用の戦略的資産として色々考えられますが、真っ先に挙げるとすれば、以下の2つでしょう。

  • データそのもの
  • データから知識獲得する能力 

 データは、どこからともなくいきなり湧いてきません。知識獲得能力も天から降ってはきません。

3、実験計画法

 実験計画法というデータ分析・活用には欠かせない、データ収集技術があります。実験計画法とは、効率的なデータ収集を設計する技術で、分散分析という分析手法の概念と密接に結び付いています。生産系やマーケティング系では、今でも比較的よく使われています。マーケティング系では、コンジョイント分析という名前で使われていることが多いようです。さらに、ネット系のデータ分析・活用で比較的よく登場する、ABテストや多変量テストも実験計画法の一種です。

4、ディープラーニング

 ディープラーニングは画像認識の世界で成功し、現在色々な分野で適応が試みられています。ニューラルネットワークの枠組みで語れることが多いわけですが、今やニューラルネットワークの枠組みで縛られるものではなくなりました。簡単にいうと、簡単な関数を組み合わせて「深い関数」(表現力の高い関数)を作り、そのパラメータをデータから推定する技術として語られることが多くなりました。つまり、ニューラルネットワークである必要はないわけです。

 それはさておき、ニューラルネットワーク系のディープラーニングではある問題があります。以下の2つの問題は、今現在非常に大きな問題となっていることです。

  • どうやってデータを収集するのか?
  • どうやってアノテーション(データにラベルなどを与えて正解データを作る)するのか?

 学習用のデータは、勝手に生成されません。誰かがデータを集め、学習用データを作る必要があります。従来型の機械学習は、対象分野(ドメイン)の知識が精度向上に大きく寄与していました。ディープラーニングは、どちらかというとデータと計算量が精度向上に寄与する技術です。今現在のディープラーニングの世界では、学習で使うデータそのものが大きな資産となっています。

5、ビッグデータの時代

 実験計画法やディープラーニングの世界では、データを集め準備するというのが大きなポイントです。実験計画法は、データを集め準備するための技術ですし、ディープラーニングは、データ収集とアノテーション(データにラベルなどを与えて正解データを作る)次第です。今は、ビッグデータの時代ともいわれています。

 簡単にいうと、量的には絶え間なく湧き出て、次々と蓄積され、質的には玉石混交の時代です。実験計画法やディープラーニングの世界とはちょっと異なる世界です。実験計画法は少量の良質なデータを取得する技術です。しかし玉石混交のデータをディープラーニングで学習させてはいけません。使えない何かが生まれます。

 十分なデータがなければ、データを分析することも、データを活用することもできません。玉石混交のデータの場合、クレンジングするという手間暇が発生する可能性が高く、作業コストも莫大になるかもしれません。しかし、データが無ければ手間暇すらかけられないのです。それなりのデータを手にする機会や可能性が全く無い、ということです。そのため、少なくとも、データそのものは戦略的資産です。

6、データから知識獲得する能力...

情報マネジメント

 

◆ データ分析・活用でビジネス成果を安定的に確保するための戦略的資産とは

 最近流行りのキーワードです。

  • AI(人工知能)
  • DL(ディープラーニング)
  • DX(デジタルトランスフォーメーション)
  • データサイエンス
  • IoT(モノのインターネット)
  • デジタルマニュファクチュアリング
  • xTech
  • 自動運転
  • AIスピーカー
  • チャットボット
  • ロボティクス
  • データビジネス
  • 〇〇プラットファーム など。

 最近流行りのキーワードを並べると面白いことが分かります。すべてデータが必要ということです。今回は「データ分析・活用でビジネス成果を安定的に確保するための戦略的資産とは」というお話しです。

1、戦略的資産

 戦略的資産とは何でしょうか、ここでは、戦略的資産をデータ分析・活用の安定・発展を図り、データ分析・活用の基盤を維持するために、安定的に確保する必要がある資産と定義します。

 「戦略的」というワードからイメージできる通り「短期的・場当たり的」ではなく「長期的・全体的」といったところです。では、データ分析・活用の戦略的資産とは何でしょうか。

2、データ分析・活用の戦略的資産

 データ分析・活用の戦略的資産として色々考えられますが、真っ先に挙げるとすれば、以下の2つでしょう。

  • データそのもの
  • データから知識獲得する能力 

 データは、どこからともなくいきなり湧いてきません。知識獲得能力も天から降ってはきません。

3、実験計画法

 実験計画法というデータ分析・活用には欠かせない、データ収集技術があります。実験計画法とは、効率的なデータ収集を設計する技術で、分散分析という分析手法の概念と密接に結び付いています。生産系やマーケティング系では、今でも比較的よく使われています。マーケティング系では、コンジョイント分析という名前で使われていることが多いようです。さらに、ネット系のデータ分析・活用で比較的よく登場する、ABテストや多変量テストも実験計画法の一種です。

4、ディープラーニング

 ディープラーニングは画像認識の世界で成功し、現在色々な分野で適応が試みられています。ニューラルネットワークの枠組みで語れることが多いわけですが、今やニューラルネットワークの枠組みで縛られるものではなくなりました。簡単にいうと、簡単な関数を組み合わせて「深い関数」(表現力の高い関数)を作り、そのパラメータをデータから推定する技術として語られることが多くなりました。つまり、ニューラルネットワークである必要はないわけです。

 それはさておき、ニューラルネットワーク系のディープラーニングではある問題があります。以下の2つの問題は、今現在非常に大きな問題となっていることです。

  • どうやってデータを収集するのか?
  • どうやってアノテーション(データにラベルなどを与えて正解データを作る)するのか?

 学習用のデータは、勝手に生成されません。誰かがデータを集め、学習用データを作る必要があります。従来型の機械学習は、対象分野(ドメイン)の知識が精度向上に大きく寄与していました。ディープラーニングは、どちらかというとデータと計算量が精度向上に寄与する技術です。今現在のディープラーニングの世界では、学習で使うデータそのものが大きな資産となっています。

5、ビッグデータの時代

 実験計画法やディープラーニングの世界では、データを集め準備するというのが大きなポイントです。実験計画法は、データを集め準備するための技術ですし、ディープラーニングは、データ収集とアノテーション(データにラベルなどを与えて正解データを作る)次第です。今は、ビッグデータの時代ともいわれています。

 簡単にいうと、量的には絶え間なく湧き出て、次々と蓄積され、質的には玉石混交の時代です。実験計画法やディープラーニングの世界とはちょっと異なる世界です。実験計画法は少量の良質なデータを取得する技術です。しかし玉石混交のデータをディープラーニングで学習させてはいけません。使えない何かが生まれます。

 十分なデータがなければ、データを分析することも、データを活用することもできません。玉石混交のデータの場合、クレンジングするという手間暇が発生する可能性が高く、作業コストも莫大になるかもしれません。しかし、データが無ければ手間暇すらかけられないのです。それなりのデータを手にする機会や可能性が全く無い、ということです。そのため、少なくとも、データそのものは戦略的資産です。

6、データから知識獲得する能力

 データそのものを溜めても、ディープラーニングで何かを学習させても、単に溜めたり学習させたりしただけでは、無価値です。データから知識獲得する能力が必要になります。知識獲得能力は、個人のスキルかもしれませんし、組織的なものかもしれません。いきなり「デジタルトランスフォーメーションだ!」「データビジネスだ!」「ビッグデータだ!」と叫んだところで、データから知識獲得する能力は個人からも組織としても、湧き出てきません。

 データから知識獲得する能力は、少なくとも「短期的・場当たり的」には獲得できないと思います。データから知識獲得する能力のある個人を、外から連れてくるという手もありますが、組織としてデータから知識獲得する能力が無ければ、大組織であればあるほど何も起こらないことでしょう。相対的に個人の影響が小さいからです。影響力のある個人(例えば、CEOレベルの人など)を連れてくれば別です。

 要するに「データから知識獲得する能力」は、戦略的資産ということです。そのためには、データ分析・活用を成果の多寡や規模に関係なく、組織的なチャレンジをし続ける必要があります。

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
メタ知識とデータカタログ データ分析講座(その69)

◆ データ分析の属人化を避けるためのメタ知識とデータカタログ  データ分析の特徴として、「属人化しやすい」という特徴があります。  なぜか属人化し...

◆ データ分析の属人化を避けるためのメタ知識とデータカタログ  データ分析の特徴として、「属人化しやすい」という特徴があります。  なぜか属人化し...


CRM(顧客関係管理システム)とは データ分析講座(その39)

◆ CRMのデータ分析をダメにする〇〇管理という合言葉、すぐできる解決策とは?  CRM(顧客関係管理システム)などでやたらと出てくる言葉に、「〇〇...

◆ CRMのデータ分析をダメにする〇〇管理という合言葉、すぐできる解決策とは?  CRM(顧客関係管理システム)などでやたらと出てくる言葉に、「〇〇...


予測モデルの活用とは データ分析講座(その116)

◆ 予測モデルは帰納的に構築し演繹的に活用する。そして論理展開する。  データ分析・活用を推し進める時にある段階まで進むと、予測モデルが一つのトピッ...

◆ 予測モデルは帰納的に構築し演繹的に活用する。そして論理展開する。  データ分析・活用を推し進める時にある段階まで進むと、予測モデルが一つのトピッ...


「情報マネジメント一般」の活用事例

もっと見る
ソーシャルメディアデータの解析事例:異分野研究から得られる共通した目的とは

 2020年、コロナウィルス感染の問題が大きくなり始めた頃、少人数の開催ということで、ソーシャルメディアデータ解析を専門にされている先生の講演会を聞く...

 2020年、コロナウィルス感染の問題が大きくなり始めた頃、少人数の開催ということで、ソーシャルメディアデータ解析を専門にされている先生の講演会を聞く...


‐販路開拓に関する問題 第2回‐ 製品・技術開発力強化策の事例(その18)

 販路開拓に関する問題点、次に示す4点について、第1回として、1と2項を解説しました。今回は、第2回として、3と4項を解説します。        1....

 販路開拓に関する問題点、次に示す4点について、第1回として、1と2項を解説しました。今回は、第2回として、3と4項を解説します。        1....


P値で行う統計リテラシー判定

 「ピーチ」って聞いたら何を連想しますか、統計を学んでいる人に取っては「 P値 」が思い浮かぶはずです。統計学の素養がある程度備わっているか一言で知ろうと...

 「ピーチ」って聞いたら何を連想しますか、統計を学んでいる人に取っては「 P値 」が思い浮かぶはずです。統計学の素養がある程度備わっているか一言で知ろうと...