リスク少なく物事を上手く運ぶには データ分析講座(その130)

更新日

投稿日

データ分析

◆ ビジネスにおけるデータサイエンス

 ビジネスにおけるデータサイエンスに対し、みなさんはどのような印象があるでしょうか。人によっては、魔法のような不思議さを感じる方もいれば、最新のテクノロジーを使った派手なイメージを思い浮かべる方もいます。サイエンスという響きが、通常のテクノロジーを凌駕した不思議と最近のAIブームが、魔法っぽさを醸し出しているようです。しかし実状は異なります。今回は「やってみなはれの精神でデータで石橋を叩きながら渡る」というお話しをします。

1、データ分析:石橋を叩いて渡る

 「石橋を叩いて渡る」ということわざがあります。意味は、用心に用心を重ねて物事を行うことで、用心深さに対する皮肉を込めて使われることが多いです。確かに、壊れる可能性が低い頑丈な石の橋を叩き、強度を確かめながら渡るのですから、相当用心深いことが伺えます。しかしデータ分析の世界では笑い事ではありません。データ活用をするということは「石橋を叩いて渡る」ようなものだからです。

2、データでリスクを減らす

 なぜデータ活用をするということが、石橋を叩いて渡るようなものなのでしょうか。例えばデータが全くない状態で、明日の来月の売上を予測することは至難の業です。データがあることで、来月の売上に対し、何らかのあたりを付けることができます。例えば昨年同月の売り上げが50億円だったから、来月の売り上げは50億円ぐらいだろう、とか。例えば今月の売り上げは昨年比で10%高いから、来月も昨年に比べ10%高いだろうから、55億円ぐらいかな、とか。そういった感じです。

3、データ分析:〇〇をしたら▢▢になる

 アクションと売り上げが紐づいていて「法人営業の訪問回数を昨年に比べ1.2倍に増やしたので売り上げが10%高くなった」という関係性が分かるとどうでしょうか。多くの場合さらに嬉しいでしょう。このような関係は、データさえあれば見つけ出すことができます。ちなみに、次のように説明変数と目的変数というワードでよく説明されます。

  • 説明変数 X:訪問回数
  • 目的変数 Y:売上

 つまり、XとYの関係性をデータから見出すということです。この「XとYの関係性をデータから見出す」ことができると、リスクを減らすことができるのです。

4、データ分析:統計モデルなどを思い浮かべると分かりやすい

 統計モデルなどを思い浮かべると分かりやすいでしょう。リスクとは分散(もしくは標準偏差)の大きさを意味するからです。統計モデルを上手く構築することで、目的変数 Yの分散を小さくすることができるのです。もちろんモデル上のお話しです。統計学に馴染みがない方にとって、統計モデルや分散という言葉を使うと、より分かりにくくなってしまうと思いますので簡単に説明します。

(1) 分散とは

 分散とは目的変数 Y(例では売上)のバラつきの大きさのことです。実際にデータの値が大きくばらついている場合、分散が大きくなります。データがある値の近くに集中している場合では分散は小さくなります。予測する上でこのバラつき(分散)は小さいとほうが嬉しいでしょう。なぜでしょうか。

 来月の売上Yの分散が大きいとは、来月の売上Yの値がどうなるか分からない(振れ幅が大きいい)、ということです。例えば「来月の売上は10億円から90億円の間である」といった感じです。そこで過去の売り上げデータや、説明変数となるデータ(例では営業訪問回数)などがあると、この売上Yの分散を小さくすることができます。例えば「来月の売上は49億円から51億円の間である」といった感じです。

 このように、データがあればあるほど、どうなるか分からないといった蓋然性が減ることで、リスクが減っていきます。

(2) やってみなければデータは溜まらない

 データさえあれば、実施する前にどうなるかの目途が立ち、リスク少なく物事が上手く運べる、といった感じでしょう。しかし落とし穴があります。「データさえあれば」というところにです。データさえあれば実施する前に目途が立ちますが、データは実施しなければ溜まりません。やってみなければデータは溜まらないということです。データサイエンスやデータ分析活用は、データがなければ無力です。

 ...

データ分析

◆ ビジネスにおけるデータサイエンス

 ビジネスにおけるデータサイエンスに対し、みなさんはどのような印象があるでしょうか。人によっては、魔法のような不思議さを感じる方もいれば、最新のテクノロジーを使った派手なイメージを思い浮かべる方もいます。サイエンスという響きが、通常のテクノロジーを凌駕した不思議と最近のAIブームが、魔法っぽさを醸し出しているようです。しかし実状は異なります。今回は「やってみなはれの精神でデータで石橋を叩きながら渡る」というお話しをします。

1、データ分析:石橋を叩いて渡る

 「石橋を叩いて渡る」ということわざがあります。意味は、用心に用心を重ねて物事を行うことで、用心深さに対する皮肉を込めて使われることが多いです。確かに、壊れる可能性が低い頑丈な石の橋を叩き、強度を確かめながら渡るのですから、相当用心深いことが伺えます。しかしデータ分析の世界では笑い事ではありません。データ活用をするということは「石橋を叩いて渡る」ようなものだからです。

2、データでリスクを減らす

 なぜデータ活用をするということが、石橋を叩いて渡るようなものなのでしょうか。例えばデータが全くない状態で、明日の来月の売上を予測することは至難の業です。データがあることで、来月の売上に対し、何らかのあたりを付けることができます。例えば昨年同月の売り上げが50億円だったから、来月の売り上げは50億円ぐらいだろう、とか。例えば今月の売り上げは昨年比で10%高いから、来月も昨年に比べ10%高いだろうから、55億円ぐらいかな、とか。そういった感じです。

3、データ分析:〇〇をしたら▢▢になる

 アクションと売り上げが紐づいていて「法人営業の訪問回数を昨年に比べ1.2倍に増やしたので売り上げが10%高くなった」という関係性が分かるとどうでしょうか。多くの場合さらに嬉しいでしょう。このような関係は、データさえあれば見つけ出すことができます。ちなみに、次のように説明変数と目的変数というワードでよく説明されます。

  • 説明変数 X:訪問回数
  • 目的変数 Y:売上

 つまり、XとYの関係性をデータから見出すということです。この「XとYの関係性をデータから見出す」ことができると、リスクを減らすことができるのです。

4、データ分析:統計モデルなどを思い浮かべると分かりやすい

 統計モデルなどを思い浮かべると分かりやすいでしょう。リスクとは分散(もしくは標準偏差)の大きさを意味するからです。統計モデルを上手く構築することで、目的変数 Yの分散を小さくすることができるのです。もちろんモデル上のお話しです。統計学に馴染みがない方にとって、統計モデルや分散という言葉を使うと、より分かりにくくなってしまうと思いますので簡単に説明します。

(1) 分散とは

 分散とは目的変数 Y(例では売上)のバラつきの大きさのことです。実際にデータの値が大きくばらついている場合、分散が大きくなります。データがある値の近くに集中している場合では分散は小さくなります。予測する上でこのバラつき(分散)は小さいとほうが嬉しいでしょう。なぜでしょうか。

 来月の売上Yの分散が大きいとは、来月の売上Yの値がどうなるか分からない(振れ幅が大きいい)、ということです。例えば「来月の売上は10億円から90億円の間である」といった感じです。そこで過去の売り上げデータや、説明変数となるデータ(例では営業訪問回数)などがあると、この売上Yの分散を小さくすることができます。例えば「来月の売上は49億円から51億円の間である」といった感じです。

 このように、データがあればあるほど、どうなるか分からないといった蓋然性が減ることで、リスクが減っていきます。

(2) やってみなければデータは溜まらない

 データさえあれば、実施する前にどうなるかの目途が立ち、リスク少なく物事が上手く運べる、といった感じでしょう。しかし落とし穴があります。「データさえあれば」というところにです。データさえあれば実施する前に目途が立ちますが、データは実施しなければ溜まりません。やってみなければデータは溜まらないということです。データサイエンスやデータ分析活用は、データがなければ無力です。

 要するに先ずは「やってみなはれの精神で、やってみる」そして「溜まったデータで石橋を叩きながら渡る」といった感じです。このサイクルが上手く回りだすと、どんどんいい方向にいくことでしょう。

5、データ分析:今回のまとめ

 今回は「やってみなはれの精神でデータで石橋を叩きながら渡る」というお話しをしました。実は、データ活用をするということは「石橋を叩いて渡る」ようなものだからです。なぜでしょうか。データを上手く活用することで、リスクを減らすことができるからです。一体どのように? と感じる方もいることでしょう。例えば、統計モデルを上手く構築することで、リスクを減らすことができます。来月の売上の予測値の確度を上げることができる、ということです。この時、営業訪問などのアクションとの紐づけができると嬉しいことでしょう。

 例えば、法人営業の訪問回数を昨年に比べ1.2倍に増やすと売上が10%高くなる、といったことです。もちろん、アクションに対する生産性や効率性、コストパフォーマンスなどを考慮する必要はあります。

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
営業データ分析の良し悪しとは データ分析講座(その8)

  ◆ 営業データ分析の事始めは、「見える化」で失敗し「指標作り」で成功する  「どのようなデータを集めれば、営業力を上げられるのか」こ...

  ◆ 営業データ分析の事始めは、「見える化」で失敗し「指標作り」で成功する  「どのようなデータを集めれば、営業力を上げられるのか」こ...


データに基づくポリティクスと意思決定 データ分析講座(その171)

  ◆ データに基づくポリティクスと意思決定  前回もお話しましたが、変化が激しく先々の状況が読めないときほど情報を集め、適切な状況判断...

  ◆ データに基づくポリティクスと意思決定  前回もお話しましたが、変化が激しく先々の状況が読めないときほど情報を集め、適切な状況判断...


見積システムによるDX(その3)

  【目次】 1.アナログ情報をデジタル化 2.プロセス全体をデジタル化 3.価値の創造と利益の拡大   ここ...

  【目次】 1.アナログ情報をデジタル化 2.プロセス全体をデジタル化 3.価値の創造と利益の拡大   ここ...


「情報マネジメント一般」の活用事例

もっと見る
P値で行う統計リテラシー判定

 「ピーチ」って聞いたら何を連想しますか、統計を学んでいる人に取っては「 P値 」が思い浮かぶはずです。統計学の素養がある程度備わっているか一言で知ろうと...

 「ピーチ」って聞いたら何を連想しますか、統計を学んでいる人に取っては「 P値 」が思い浮かぶはずです。統計学の素養がある程度備わっているか一言で知ろうと...


守秘義務は情報社会の命綱

  1. 顧客データの管理  O社は、技術志向のエンジニアリング会社です。 扱う製品の設計図には、さまざまな情報が含まれています。クライアントから...

  1. 顧客データの管理  O社は、技術志向のエンジニアリング会社です。 扱う製品の設計図には、さまざまな情報が含まれています。クライアントから...


既存コア技術強化のためのオープン・イノベーション:富士フイルムの例

 2015年7月20日号の日経ビジネスに、富士フイルムの特集が掲載されました。富士フイルムは、既存コア技術強化のためにオープン・イノベーションを果敢に...

 2015年7月20日号の日経ビジネスに、富士フイルムの特集が掲載されました。富士フイルムは、既存コア技術強化のためにオープン・イノベーションを果敢に...