リスク少なく物事を上手く運ぶには データ分析講座(その130)

更新日

投稿日

データ分析

◆ ビジネスにおけるデータサイエンス

 ビジネスにおけるデータサイエンスに対し、みなさんはどのような印象があるでしょうか。人によっては、魔法のような不思議さを感じる方もいれば、最新のテクノロジーを使った派手なイメージを思い浮かべる方もいます。サイエンスという響きが、通常のテクノロジーを凌駕した不思議と最近のAIブームが、魔法っぽさを醸し出しているようです。しかし実状は異なります。今回は「やってみなはれの精神でデータで石橋を叩きながら渡る」というお話しをします。

1、データ分析:石橋を叩いて渡る

 「石橋を叩いて渡る」ということわざがあります。意味は、用心に用心を重ねて物事を行うことで、用心深さに対する皮肉を込めて使われることが多いです。確かに、壊れる可能性が低い頑丈な石の橋を叩き、強度を確かめながら渡るのですから、相当用心深いことが伺えます。しかしデータ分析の世界では笑い事ではありません。データ活用をするということは「石橋を叩いて渡る」ようなものだからです。

2、データでリスクを減らす

 なぜデータ活用をするということが、石橋を叩いて渡るようなものなのでしょうか。例えばデータが全くない状態で、明日の来月の売上を予測することは至難の業です。データがあることで、来月の売上に対し、何らかのあたりを付けることができます。例えば昨年同月の売り上げが50億円だったから、来月の売り上げは50億円ぐらいだろう、とか。例えば今月の売り上げは昨年比で10%高いから、来月も昨年に比べ10%高いだろうから、55億円ぐらいかな、とか。そういった感じです。

3、データ分析:〇〇をしたら▢▢になる

 アクションと売り上げが紐づいていて「法人営業の訪問回数を昨年に比べ1.2倍に増やしたので売り上げが10%高くなった」という関係性が分かるとどうでしょうか。多くの場合さらに嬉しいでしょう。このような関係は、データさえあれば見つけ出すことができます。ちなみに、次のように説明変数と目的変数というワードでよく説明されます。

  • 説明変数 X:訪問回数
  • 目的変数 Y:売上

 つまり、XとYの関係性をデータから見出すということです。この「XとYの関係性をデータから見出す」ことができると、リスクを減らすことができるのです。

4、データ分析:統計モデルなどを思い浮かべると分かりやすい

 統計モデルなどを思い浮かべると分かりやすいでしょう。リスクとは分散(もしくは標準偏差)の大きさを意味するからです。統計モデルを上手く構築することで、目的変数 Yの分散を小さくすることができるのです。もちろんモデル上のお話しです。統計学に馴染みがない方にとって、統計モデルや分散という言葉を使うと、より分かりにくくなってしまうと思いますので簡単に説明します。

(1) 分散とは

 分散とは目的変数 Y(例では売上)のバラつきの大きさのことです。実際にデータの値が大きくばらついている場合、分散が大きくなります。データがある値の近くに集中している場合では分散は小さくなります。予測する上でこのバラつき(分散)は小さいとほうが嬉しいでしょう。なぜでしょうか。

 来月の売上Yの分散が大きいとは、来月の売上Yの値がどうなるか分からない(振れ幅が大きいい)、ということです。例えば「来月の売上は10億円から90億円の間である」といった感じです。そこで過去の売り上げデータや、説明変数となるデータ(例では営業訪問回数)などがあると、この売上Yの分散を小さくすることができます。例えば「来月の売上は49億円から51億円の間である」といった感じです。

 このように、データがあればあるほど、どうなるか分からないといった蓋然性が減ることで、リスクが減っていきます。

(2) やってみなければデータは溜まらない

 データさえあれば、実施する前にどうなるかの目途が立ち、リスク少なく物事が上手く運べる、といった感じでしょう。しかし落とし穴があります。「データさえあれば」というところにです。データさえあれば実施する前に目途が立ちますが、データは実施しなければ溜まりません。やってみなければデータは溜まらないということです。データサイエンスやデータ分析活用は、データがなければ無力です。

 ...

データ分析

◆ ビジネスにおけるデータサイエンス

 ビジネスにおけるデータサイエンスに対し、みなさんはどのような印象があるでしょうか。人によっては、魔法のような不思議さを感じる方もいれば、最新のテクノロジーを使った派手なイメージを思い浮かべる方もいます。サイエンスという響きが、通常のテクノロジーを凌駕した不思議と最近のAIブームが、魔法っぽさを醸し出しているようです。しかし実状は異なります。今回は「やってみなはれの精神でデータで石橋を叩きながら渡る」というお話しをします。

1、データ分析:石橋を叩いて渡る

 「石橋を叩いて渡る」ということわざがあります。意味は、用心に用心を重ねて物事を行うことで、用心深さに対する皮肉を込めて使われることが多いです。確かに、壊れる可能性が低い頑丈な石の橋を叩き、強度を確かめながら渡るのですから、相当用心深いことが伺えます。しかしデータ分析の世界では笑い事ではありません。データ活用をするということは「石橋を叩いて渡る」ようなものだからです。

2、データでリスクを減らす

 なぜデータ活用をするということが、石橋を叩いて渡るようなものなのでしょうか。例えばデータが全くない状態で、明日の来月の売上を予測することは至難の業です。データがあることで、来月の売上に対し、何らかのあたりを付けることができます。例えば昨年同月の売り上げが50億円だったから、来月の売り上げは50億円ぐらいだろう、とか。例えば今月の売り上げは昨年比で10%高いから、来月も昨年に比べ10%高いだろうから、55億円ぐらいかな、とか。そういった感じです。

3、データ分析:〇〇をしたら▢▢になる

 アクションと売り上げが紐づいていて「法人営業の訪問回数を昨年に比べ1.2倍に増やしたので売り上げが10%高くなった」という関係性が分かるとどうでしょうか。多くの場合さらに嬉しいでしょう。このような関係は、データさえあれば見つけ出すことができます。ちなみに、次のように説明変数と目的変数というワードでよく説明されます。

  • 説明変数 X:訪問回数
  • 目的変数 Y:売上

 つまり、XとYの関係性をデータから見出すということです。この「XとYの関係性をデータから見出す」ことができると、リスクを減らすことができるのです。

4、データ分析:統計モデルなどを思い浮かべると分かりやすい

 統計モデルなどを思い浮かべると分かりやすいでしょう。リスクとは分散(もしくは標準偏差)の大きさを意味するからです。統計モデルを上手く構築することで、目的変数 Yの分散を小さくすることができるのです。もちろんモデル上のお話しです。統計学に馴染みがない方にとって、統計モデルや分散という言葉を使うと、より分かりにくくなってしまうと思いますので簡単に説明します。

(1) 分散とは

 分散とは目的変数 Y(例では売上)のバラつきの大きさのことです。実際にデータの値が大きくばらついている場合、分散が大きくなります。データがある値の近くに集中している場合では分散は小さくなります。予測する上でこのバラつき(分散)は小さいとほうが嬉しいでしょう。なぜでしょうか。

 来月の売上Yの分散が大きいとは、来月の売上Yの値がどうなるか分からない(振れ幅が大きいい)、ということです。例えば「来月の売上は10億円から90億円の間である」といった感じです。そこで過去の売り上げデータや、説明変数となるデータ(例では営業訪問回数)などがあると、この売上Yの分散を小さくすることができます。例えば「来月の売上は49億円から51億円の間である」といった感じです。

 このように、データがあればあるほど、どうなるか分からないといった蓋然性が減ることで、リスクが減っていきます。

(2) やってみなければデータは溜まらない

 データさえあれば、実施する前にどうなるかの目途が立ち、リスク少なく物事が上手く運べる、といった感じでしょう。しかし落とし穴があります。「データさえあれば」というところにです。データさえあれば実施する前に目途が立ちますが、データは実施しなければ溜まりません。やってみなければデータは溜まらないということです。データサイエンスやデータ分析活用は、データがなければ無力です。

 要するに先ずは「やってみなはれの精神で、やってみる」そして「溜まったデータで石橋を叩きながら渡る」といった感じです。このサイクルが上手く回りだすと、どんどんいい方向にいくことでしょう。

5、データ分析:今回のまとめ

 今回は「やってみなはれの精神でデータで石橋を叩きながら渡る」というお話しをしました。実は、データ活用をするということは「石橋を叩いて渡る」ようなものだからです。なぜでしょうか。データを上手く活用することで、リスクを減らすことができるからです。一体どのように? と感じる方もいることでしょう。例えば、統計モデルを上手く構築することで、リスクを減らすことができます。来月の売上の予測値の確度を上げることができる、ということです。この時、営業訪問などのアクションとの紐づけができると嬉しいことでしょう。

 例えば、法人営業の訪問回数を昨年に比べ1.2倍に増やすと売上が10%高くなる、といったことです。もちろん、アクションに対する生産性や効率性、コストパフォーマンスなどを考慮する必要はあります。

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
目的変数、説明変数とは データ分析講座(その31)

◆ データで売上拡大を目指すなら、「目的変数」と「説明変数」を意識することが何よりも重要です。  データ分析では、「目的変数」と「説明変数」という用...

◆ データで売上拡大を目指すなら、「目的変数」と「説明変数」を意識することが何よりも重要です。  データ分析では、「目的変数」と「説明変数」という用...


データをいくら集めても100発0中が当たり前 データ分析講座(その281)

  データを使って何かを予測する、データを使って答えを導き出す、それが最適なものであると最高です。しかし、多くの場合、データを上手く活用す...

  データを使って何かを予測する、データを使って答えを導き出す、それが最適なものであると最高です。しかし、多くの場合、データを上手く活用す...


リモートセンシング技術の進歩、そしてドローンへ

  リモートセンシングとは、離れたところから対象物に触れずに、その形状や性質など様々な情報を取得する技術または手法のことをいいます。可視光...

  リモートセンシングとは、離れたところから対象物に触れずに、その形状や性質など様々な情報を取得する技術または手法のことをいいます。可視光...


「情報マネジメント一般」の活用事例

もっと見る
簡易版DX/IoTから機械学習への移行

  DX(デジタル・トランスフォーメーション)を使えばコスト削減と納期短縮が可能に 産業界のニュースなどをインターネットで読んでいると、DX...

  DX(デジタル・トランスフォーメーション)を使えばコスト削減と納期短縮が可能に 産業界のニュースなどをインターネットで読んでいると、DX...


‐技術開発の目標について 第2回‐  製品・技術開発力強化策の事例(その16)

 技術開発の目標を解説する以下の項目4点について、前回は、1と2を解説しましたので、今回は、第2回として、3と4を記述します。          1....

 技術開発の目標を解説する以下の項目4点について、前回は、1と2を解説しましたので、今回は、第2回として、3と4を記述します。          1....


個票データの共用化でコストダウン

 データ解析の効率は、生データとその整理の仕方で大きく異なると言えます。 例えば、アンケート結果は単なる生データであり、そのままでは解析出来ません。解析の...

 データ解析の効率は、生データとその整理の仕方で大きく異なると言えます。 例えば、アンケート結果は単なる生データであり、そのままでは解析出来ません。解析の...