リスク少なく物事を上手く運ぶには データ分析講座(その130)

更新日

投稿日

データ分析

◆ ビジネスにおけるデータサイエンス

 ビジネスにおけるデータサイエンスに対し、みなさんはどのような印象があるでしょうか。人によっては、魔法のような不思議さを感じる方もいれば、最新のテクノロジーを使った派手なイメージを思い浮かべる方もいます。サイエンスという響きが、通常のテクノロジーを凌駕した不思議と最近のAIブームが、魔法っぽさを醸し出しているようです。しかし実状は異なります。今回は「やってみなはれの精神でデータで石橋を叩きながら渡る」というお話しをします。

1、データ分析:石橋を叩いて渡る

 「石橋を叩いて渡る」ということわざがあります。意味は、用心に用心を重ねて物事を行うことで、用心深さに対する皮肉を込めて使われることが多いです。確かに、壊れる可能性が低い頑丈な石の橋を叩き、強度を確かめながら渡るのですから、相当用心深いことが伺えます。しかしデータ分析の世界では笑い事ではありません。データ活用をするということは「石橋を叩いて渡る」ようなものだからです。

2、データでリスクを減らす

 なぜデータ活用をするということが、石橋を叩いて渡るようなものなのでしょうか。例えばデータが全くない状態で、明日の来月の売上を予測することは至難の業です。データがあることで、来月の売上に対し、何らかのあたりを付けることができます。例えば昨年同月の売り上げが50億円だったから、来月の売り上げは50億円ぐらいだろう、とか。例えば今月の売り上げは昨年比で10%高いから、来月も昨年に比べ10%高いだろうから、55億円ぐらいかな、とか。そういった感じです。

3、データ分析:〇〇をしたら▢▢になる

 アクションと売り上げが紐づいていて「法人営業の訪問回数を昨年に比べ1.2倍に増やしたので売り上げが10%高くなった」という関係性が分かるとどうでしょうか。多くの場合さらに嬉しいでしょう。このような関係は、データさえあれば見つけ出すことができます。ちなみに、次のように説明変数と目的変数というワードでよく説明されます。

  • 説明変数 X:訪問回数
  • 目的変数 Y:売上

 つまり、XとYの関係性をデータから見出すということです。この「XとYの関係性をデータから見出す」ことができると、リスクを減らすことができるのです。

4、データ分析:統計モデルなどを思い浮かべると分かりやすい

 統計モデルなどを思い浮かべると分かりやすいでしょう。リスクとは分散(もしくは標準偏差)の大きさを意味するからです。統計モデルを上手く構築することで、目的変数 Yの分散を小さくすることができるのです。もちろんモデル上のお話しです。統計学に馴染みがない方にとって、統計モデルや分散という言葉を使うと、より分かりにくくなってしまうと思いますので簡単に説明します。

(1) 分散とは

 分散とは目的変数 Y(例では売上)のバラつきの大きさのことです。実際にデータの値が大きくばらついている場合、分散が大きくなります。データがある値の近くに集中している場合では分散は小さくなります。予測する上でこのバラつき(分散)は小さいとほうが嬉しいでしょう。なぜでしょうか。

 来月の売上Yの分散が大きいとは、来月の売上Yの値がどうなるか分からない(振れ幅が大きいい)、ということです。例えば「来月の売上は10億円から90億円の間である」といった感じです。そこで過去の売り上げデータや、説明変数となるデータ(例では営業訪問回数)などがあると、この売上Yの分散を小さくすることができます。例えば「来月の売上は49億円から51億円の間である」といった感じです。

 このように、データがあればあるほど、どうなるか分からないといった蓋然性が減ることで、リスクが減っていきます。

(2) やってみなければデータは溜まらない

 データさえあれば、実施する前にどうなるかの目途が立ち、リスク少なく物事が上手く運べる、といった感じでしょう。しかし落とし穴があります。「データさえあれば」というところにです。データさえあれば実施する前に目途が立ちますが、データは実施しなければ溜まりません。やってみなければデータは溜まらないということです。データサイエンスやデータ分析活用は、データがなければ無力です。

 ...

データ分析

◆ ビジネスにおけるデータサイエンス

 ビジネスにおけるデータサイエンスに対し、みなさんはどのような印象があるでしょうか。人によっては、魔法のような不思議さを感じる方もいれば、最新のテクノロジーを使った派手なイメージを思い浮かべる方もいます。サイエンスという響きが、通常のテクノロジーを凌駕した不思議と最近のAIブームが、魔法っぽさを醸し出しているようです。しかし実状は異なります。今回は「やってみなはれの精神でデータで石橋を叩きながら渡る」というお話しをします。

1、データ分析:石橋を叩いて渡る

 「石橋を叩いて渡る」ということわざがあります。意味は、用心に用心を重ねて物事を行うことで、用心深さに対する皮肉を込めて使われることが多いです。確かに、壊れる可能性が低い頑丈な石の橋を叩き、強度を確かめながら渡るのですから、相当用心深いことが伺えます。しかしデータ分析の世界では笑い事ではありません。データ活用をするということは「石橋を叩いて渡る」ようなものだからです。

2、データでリスクを減らす

 なぜデータ活用をするということが、石橋を叩いて渡るようなものなのでしょうか。例えばデータが全くない状態で、明日の来月の売上を予測することは至難の業です。データがあることで、来月の売上に対し、何らかのあたりを付けることができます。例えば昨年同月の売り上げが50億円だったから、来月の売り上げは50億円ぐらいだろう、とか。例えば今月の売り上げは昨年比で10%高いから、来月も昨年に比べ10%高いだろうから、55億円ぐらいかな、とか。そういった感じです。

3、データ分析:〇〇をしたら▢▢になる

 アクションと売り上げが紐づいていて「法人営業の訪問回数を昨年に比べ1.2倍に増やしたので売り上げが10%高くなった」という関係性が分かるとどうでしょうか。多くの場合さらに嬉しいでしょう。このような関係は、データさえあれば見つけ出すことができます。ちなみに、次のように説明変数と目的変数というワードでよく説明されます。

  • 説明変数 X:訪問回数
  • 目的変数 Y:売上

 つまり、XとYの関係性をデータから見出すということです。この「XとYの関係性をデータから見出す」ことができると、リスクを減らすことができるのです。

4、データ分析:統計モデルなどを思い浮かべると分かりやすい

 統計モデルなどを思い浮かべると分かりやすいでしょう。リスクとは分散(もしくは標準偏差)の大きさを意味するからです。統計モデルを上手く構築することで、目的変数 Yの分散を小さくすることができるのです。もちろんモデル上のお話しです。統計学に馴染みがない方にとって、統計モデルや分散という言葉を使うと、より分かりにくくなってしまうと思いますので簡単に説明します。

(1) 分散とは

 分散とは目的変数 Y(例では売上)のバラつきの大きさのことです。実際にデータの値が大きくばらついている場合、分散が大きくなります。データがある値の近くに集中している場合では分散は小さくなります。予測する上でこのバラつき(分散)は小さいとほうが嬉しいでしょう。なぜでしょうか。

 来月の売上Yの分散が大きいとは、来月の売上Yの値がどうなるか分からない(振れ幅が大きいい)、ということです。例えば「来月の売上は10億円から90億円の間である」といった感じです。そこで過去の売り上げデータや、説明変数となるデータ(例では営業訪問回数)などがあると、この売上Yの分散を小さくすることができます。例えば「来月の売上は49億円から51億円の間である」といった感じです。

 このように、データがあればあるほど、どうなるか分からないといった蓋然性が減ることで、リスクが減っていきます。

(2) やってみなければデータは溜まらない

 データさえあれば、実施する前にどうなるかの目途が立ち、リスク少なく物事が上手く運べる、といった感じでしょう。しかし落とし穴があります。「データさえあれば」というところにです。データさえあれば実施する前に目途が立ちますが、データは実施しなければ溜まりません。やってみなければデータは溜まらないということです。データサイエンスやデータ分析活用は、データがなければ無力です。

 要するに先ずは「やってみなはれの精神で、やってみる」そして「溜まったデータで石橋を叩きながら渡る」といった感じです。このサイクルが上手く回りだすと、どんどんいい方向にいくことでしょう。

5、データ分析:今回のまとめ

 今回は「やってみなはれの精神でデータで石橋を叩きながら渡る」というお話しをしました。実は、データ活用をするということは「石橋を叩いて渡る」ようなものだからです。なぜでしょうか。データを上手く活用することで、リスクを減らすことができるからです。一体どのように? と感じる方もいることでしょう。例えば、統計モデルを上手く構築することで、リスクを減らすことができます。来月の売上の予測値の確度を上げることができる、ということです。この時、営業訪問などのアクションとの紐づけができると嬉しいことでしょう。

 例えば、法人営業の訪問回数を昨年に比べ1.2倍に増やすと売上が10%高くなる、といったことです。もちろん、アクションに対する生産性や効率性、コストパフォーマンスなどを考慮する必要はあります。

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
データ指向ものづくり、生産性を高める設計を可能にするものづくり

 IoT やビックデータは、ものづくりの世界も大きく変えるのは間違いありません。日本の製造業は大手も中小も、この変化に否応なく対応を迫られるはずです。実際...

 IoT やビックデータは、ものづくりの世界も大きく変えるのは間違いありません。日本の製造業は大手も中小も、この変化に否応なく対応を迫られるはずです。実際...


欠損データの克服とは:データ分析講座(その351)

  【目次】  ▼さらに深く学ぶなら!「データ分析」に関するセミナーはこちら! データ分析の世界では、完璧なデー...

  【目次】  ▼さらに深く学ぶなら!「データ分析」に関するセミナーはこちら! データ分析の世界では、完璧なデー...


指標から知りたい2つのこと データ分析講座(その23)

  ◆ データ分析の事始めは、モニタリング指標(KPIなど)の異常検知  「いつも見ているこの数字、このままで大丈夫なのか、簡単にわから...

  ◆ データ分析の事始めは、モニタリング指標(KPIなど)の異常検知  「いつも見ているこの数字、このままで大丈夫なのか、簡単にわから...


「情報マネジメント一般」の活用事例

もっと見る
‐情報収集で配慮すべき事項(第1回)‐  製品・技術開発力強化策の事例(その9)

 前回の事例その8に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明確...

 前回の事例その8に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明確...


電子メール、簡潔過ぎると逆効果

◆電子メール:多忙な人に確実な返信をもらうテクニック  皆様は仕事で電子メールを一日に何通受信しますか、企業の従業員数、所属部署、職務、職位などでも...

◆電子メール:多忙な人に確実な返信をもらうテクニック  皆様は仕事で電子メールを一日に何通受信しますか、企業の従業員数、所属部署、職務、職位などでも...


‐販路開拓に関する問題 第2回‐ 製品・技術開発力強化策の事例(その18)

 販路開拓に関する問題点、次に示す4点について、第1回として、1と2項を解説しました。今回は、第2回として、3と4項を解説します。        1....

 販路開拓に関する問題点、次に示す4点について、第1回として、1と2項を解説しました。今回は、第2回として、3と4項を解説します。        1....