予測と事実と感想 データ分析講座(その236)

更新日

投稿日

データ分析

 

議論や報告書などで、何かしらの事実(ファクト)を元にしているのか、予測した結果(もしくは推論した結果)から導き出したものなのか、単なる感想なのか、よく分からないことがあります。受け手(聞き手や読み手など)は、常に元になった事実(ファクト)が何なのか意識したほうがいいでしょうし、送り手(話し手や書き手など)は、常に明確に分かるようにしたほうがいいでしょう。今回は、「予測と事実と感想」というお話しをします。

 

【目次】
1.事実と感想
2.仮説思考
3.予測というややこしいモノ
4.要は分けよう

 

【この連載の前回:データ分析講座(その235)ホメオスタシスな現場を動かすのは大変へのリンク】

 

1.事実と感想

昔から、事実(客観的な何か)と感想(主観的な何か)を明確に分けて、報告書を書きましょう! とは言われたものです。事実(ファクト)には、客観性の高い数値などの裏付けがあります。例えば、数値的な裏付けを確認することなく、「日本人の中学1年生の身長は明治時代にくらべ増えている」というのは、単なる感想というか主観です。

 

一方、文部科学省「学校保健統計調査」の結果を知っていて、「日本人の中学1年生の身長は、明治時代にくらべ増えている」、というのは客観性の高い数値などの裏付けのある事実(ファクト)です。

 

日本人男性12歳(中1)の平均身長

明治33年:133.9cm
令和2年:154.3cm

日本人女性12歳(中1)の平均身長

明治33年:133cm

令和2年:152.6cm

 【出典】文部科学省「学校保健統計調査」から

 

この事実(ファクト)を数値的な裏付けなく言及すれば、それは感想というか主観に過ぎないということです。たまたま、感想(主観的な何か)を調べてみたら、数値的な裏付けがあった、ということはあるかもしれませんが、数値的な裏付けのないまま述べれば、それは単なる感想(主観的な何か)です。

 

2.仮説思考

先ほど、数値的な裏付けを確認することなく、「日本人の中学1年生の身長は明治時代にくらべ増えている」というのは、単なる感想というか主観だ、ということを述べました。この単なる感想(主観的な何か)は、「仮説」と言い換えることが出来てます。仮説ですから、後で裏付けを確かめる必要が出てきます。

 

仮説の裏付けを取るとき、2方向から情報と言うかデータを集める必要があります。

  • 仮説を肯定する情報やデータなど
  • 仮説を否定する情報やデータなど

 

多くの人は、仮説の裏付けを取るとき、仮説を肯定する都合のよい情報と言うかデータを集めようとします。そうすると、都合のいいものだけを集め、臭い物に蓋をすると言うか、臭い物を見ない、寄り付かない、無かったことになる、という感じになり可笑しなことになります。ですので、仮説にとって都合の悪い情報と言うかデータも積極的に集めます。そうすることで、仮説が成り立つ前提条件のようなものが見えてきます。

 

3.予測というややこしいモノ

最近、データを使った統計処理や機械学習による予測などが実施されるケースも増えてきました。ここでは、予測にデータから導き出した推論も含めて議論します。この推論とは、例えば統計的推測(推定と検定、因果推論など)などです。ですので、ここで言っている予測には「未来予測だけでない」ということです。

 

先ほどの日本人の身長の例のように、客観的なデータから直接言及できる場合と異なり、統計処理や機械学習による予測などの場合、注意が必要です。なぜならば、統計処理や機械学習による予測などは、データを使っているため客観性が高そうに見えますが、実は人間の介在する余地が大きく、客観性が薄れます。

 

例えば、統計処理で有名な相関係数などは、一見すると因果関係のような錯覚を受けますが、実際はそうではありません。因果のようなものを検討する際のツールに過ぎません。機械学習によ...

データ分析

 

議論や報告書などで、何かしらの事実(ファクト)を元にしているのか、予測した結果(もしくは推論した結果)から導き出したものなのか、単なる感想なのか、よく分からないことがあります。受け手(聞き手や読み手など)は、常に元になった事実(ファクト)が何なのか意識したほうがいいでしょうし、送り手(話し手や書き手など)は、常に明確に分かるようにしたほうがいいでしょう。今回は、「予測と事実と感想」というお話しをします。

 

【目次】
1.事実と感想
2.仮説思考
3.予測というややこしいモノ
4.要は分けよう

 

【この連載の前回:データ分析講座(その235)ホメオスタシスな現場を動かすのは大変へのリンク】

 

1.事実と感想

昔から、事実(客観的な何か)と感想(主観的な何か)を明確に分けて、報告書を書きましょう! とは言われたものです。事実(ファクト)には、客観性の高い数値などの裏付けがあります。例えば、数値的な裏付けを確認することなく、「日本人の中学1年生の身長は明治時代にくらべ増えている」というのは、単なる感想というか主観です。

 

一方、文部科学省「学校保健統計調査」の結果を知っていて、「日本人の中学1年生の身長は、明治時代にくらべ増えている」、というのは客観性の高い数値などの裏付けのある事実(ファクト)です。

 

日本人男性12歳(中1)の平均身長

明治33年:133.9cm
令和2年:154.3cm

日本人女性12歳(中1)の平均身長

明治33年:133cm

令和2年:152.6cm

 【出典】文部科学省「学校保健統計調査」から

 

この事実(ファクト)を数値的な裏付けなく言及すれば、それは感想というか主観に過ぎないということです。たまたま、感想(主観的な何か)を調べてみたら、数値的な裏付けがあった、ということはあるかもしれませんが、数値的な裏付けのないまま述べれば、それは単なる感想(主観的な何か)です。

 

2.仮説思考

先ほど、数値的な裏付けを確認することなく、「日本人の中学1年生の身長は明治時代にくらべ増えている」というのは、単なる感想というか主観だ、ということを述べました。この単なる感想(主観的な何か)は、「仮説」と言い換えることが出来てます。仮説ですから、後で裏付けを確かめる必要が出てきます。

 

仮説の裏付けを取るとき、2方向から情報と言うかデータを集める必要があります。

  • 仮説を肯定する情報やデータなど
  • 仮説を否定する情報やデータなど

 

多くの人は、仮説の裏付けを取るとき、仮説を肯定する都合のよい情報と言うかデータを集めようとします。そうすると、都合のいいものだけを集め、臭い物に蓋をすると言うか、臭い物を見ない、寄り付かない、無かったことになる、という感じになり可笑しなことになります。ですので、仮説にとって都合の悪い情報と言うかデータも積極的に集めます。そうすることで、仮説が成り立つ前提条件のようなものが見えてきます。

 

3.予測というややこしいモノ

最近、データを使った統計処理や機械学習による予測などが実施されるケースも増えてきました。ここでは、予測にデータから導き出した推論も含めて議論します。この推論とは、例えば統計的推測(推定と検定、因果推論など)などです。ですので、ここで言っている予測には「未来予測だけでない」ということです。

 

先ほどの日本人の身長の例のように、客観的なデータから直接言及できる場合と異なり、統計処理や機械学習による予測などの場合、注意が必要です。なぜならば、統計処理や機械学習による予測などは、データを使っているため客観性が高そうに見えますが、実は人間の介在する余地が大きく、客観性が薄れます。

 

例えば、統計処理で有名な相関係数などは、一見すると因果関係のような錯覚を受けますが、実際はそうではありません。因果のようなものを検討する際のツールに過ぎません。機械学習による予測なども、どのようなアルゴリズムで予測モデルを構築するかで、予測モデルそのものも異なりますし予測結果も異なります。

 

予測結果を事実(ファクト)のごとく扱うのは言語道断です。このような予測というモノは、非常にややこしいモノで、データを使っているがために事実(ファクト)のようにも見えますが、実はそうではないく、人的要素が存分にブレンドされたものに過ぎません。

 

4.要は分けよう

要するに、予測と事実と感想は、明確に分けて考えた方が良いということです。受け手(聞き手や読み手など)も送り手(話し手や書き手など)も、常に意識して分けた方がいいでしょう。結構、ごっちゃになっているケースを最近目にします。

 

次回に続きます。

 

◆データ分析講座の注目記事紹介

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
AIに奪われるべき仕事を守る日本企業:データ分析講座(その332)

  AI技術の進化により、多くの業務やタスクが自動化され、効率化が進められている国々が増えてきました。だが、日本の一部の企業では、その流れ...

  AI技術の進化により、多くの業務やタスクが自動化され、効率化が進められている国々が増えてきました。だが、日本の一部の企業では、その流れ...


プロセス インフォマティクスとは何か?製造業における重要性を解説

【目次】 「熟練の技をどうやって若手に伝えればいいんだ…」 「人手不足なのに、品質要求は年々厳しくなる…...

【目次】 「熟練の技をどうやって若手に伝えればいいんだ…」 「人手不足なのに、品質要求は年々厳しくなる…...


IT化の不効率を加速させたビッグデータブーム データ分析講座(その75)

◆ ビッグデータブームは、IT化の不効率を加速させて余計な業務が増えた  IT化して楽になるはずが、従来よりも手間暇が掛かっている。IT化が進むほど...

◆ ビッグデータブームは、IT化の不効率を加速させて余計な業務が増えた  IT化して楽になるはずが、従来よりも手間暇が掛かっている。IT化が進むほど...


「情報マネジメント一般」の活用事例

もっと見る
‐技術開発の目標について 第1回‐  製品・技術開発力強化策の事例(その15)

 前回の事例その14に続いて解説します。製品開発を目指している企業の中には、テ-マが見つかったら、または、アイデアが閃いたら開発に取り組む。そのような淡い...

 前回の事例その14に続いて解説します。製品開発を目指している企業の中には、テ-マが見つかったら、または、アイデアが閃いたら開発に取り組む。そのような淡い...


‐情報収集で配慮すべき事項(第2回)‐  製品・技術開発力強化策の事例(その10)

 前回の事例その9に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明確...

 前回の事例その9に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明確...


‐技術開発の目標について 第2回‐  製品・技術開発力強化策の事例(その16)

 技術開発の目標を解説する以下の項目4点について、前回は、1と2を解説しましたので、今回は、第2回として、3と4を記述します。          1....

 技術開発の目標を解説する以下の項目4点について、前回は、1と2を解説しましたので、今回は、第2回として、3と4を記述します。          1....