「検定・推定」とは、キーワードからわかりやすく解説

 

1. 「検定・推定」とは

有限のサンプルで有意差の判定、平均値、標準偏差などの全体を判断する時は、絶対的な真実はなく、あるリスクを持つ必要があります。 統計的に危険率を決めて判断する事を検定、ある範囲を設定する事を推定と呼びます。

 

2. 統計学と「検定・推定」

統計学はデータを数量化して母集団の特徴や傾向を分析したり、母集団からサンプルを抜き取り、この中から母集団の特徴を推測する科学的な学問です。

 

統計学は大きく記述統計学(descriptive statistics)と推測統計学(inferential statistics)に分けられ、前者は大量の数量データから母集団の性質を記述します。 集団の大きさや、平均値、標準偏差の統計量を読み取り性質を把握するもので、統計学の歴史的に最も早く発達しました。

 

一方の推測統計学は、母集団から抜き取った標本を使って母集団そのものの特徴を推測します。一般的なデータ分析では、限られた標本数しか得られないケースが多いため、一般的に統計分析を行う場合はこの推測統計学が用いられます。

 

有意差検定と区間推定は、後者の推測統計学の中核を成す手法です。統計的有意差検定とは、一定の確率の元で◯×判定を行うもので、言わば定性分析評価です。一方の推定は◯×の度合いがどの程度なのかを量的範囲で推定するもので言わば定量分析評価になります。

 

3. 「検定・推定」の目的

検定推定の目的は、ある仮説が正しいかどうかを統計的に判定するものです。統計ですから間違っている可能性がありますので、その判定基準を予め決めておき(一般的にはP値:5%)客観的に判断する方法です。統計的仮説検定を活用することにより、無駄なサンプル収集を防止でき、結論を先延ばしせずに効率よく最終判定に辿り着くことができます。

 

統計学を学ぶ最大の利点の一つは『効果と誤差』についての理解ができることです。逆に言えば改善アクションを行った時、効果と誤差を区別出来なければ、それが意味があるアクションなのかどうかを正しく判断することが出来ません。

 

例えば改善を行い検証試験を行い以前より平均値が3%良くなった、しかし、その平均値は以前と同じ条件でも何度か試行を繰り返していれば、時々生じる程度の変化では無いのか、所謂ばらつきの範囲内では無いのか、 という疑問に行き着く事も珍しくないのでは無いでしょう。これを疑問に思うか、疑わず効果があったと信じこんで先に進むかは大きな違いです。

 

条件を変えてテストを行った時、それが従来条件でも生じうる誤差範囲の変化なのか、新しい条件故の効果なのかを科学的に判断する手法を知らなければ、自信を持って判断が出来ないと思います。この疑問に答える基本となる手法が『統計的検定、区間推定や分散分析』なのです。

4. 統計的仮説検定の具体的なステップと概念

【仮説の設定と棄却域】 

統計的仮説検定を進めるには、まず帰無仮説と対立仮説の二つの仮説を設定します。帰無仮説は「効果がない」「差がない」「変化がない」といった、検証したい事柄と反対の、否定したい主張を立てるのが一般的です。例えば、「新しい改善策には効果がない」などです。これに対し、対立仮説は「効果がある」「差がある」など、研究者が立証したい主張を立てます。

検定の目的は、この帰無仮説が正しいと仮定したときに、実際に得られたデータがどれだけ珍しいかを評価することです。珍しい、つまり、起こる確率が極めて低いと判断されれば、帰無仮説を棄却し、対立仮説を採択します。この「珍しさ」の基準として設定するのが、有意水準(一般的には5%や1%)です。

 

 【統計量とP値】 

データに基づいて計算される、仮説の真偽を判断するための基準となる値を検定統計量と呼びます。この検定統計量は、帰無仮説が正しいならば従うであろう、理論的な確率分布を持っています。得られた検定統計量に基づき、その値以上に極端な値(帰無仮説に反する方向の値)が出る確率をP値と呼びます。このP値こそが、検定における最も重要なアウトプットです。P値が有意水準よりも小さければ、「帰無仮説が正しいという前提では、今回得られたデータは非常に珍しい」と判断し、帰無仮説を棄却します。つまり、統計的に見て、対立仮説(効果や差があること)を支持する十分な根拠が得られた、と結論づけるわけです。

 

【推定:点推定と区間推定】 

検定が「あるか、ないか(◯×判定)」という定性的な判断であるのに対し、推定は「どのくらいの大きさか」という定量的な判断を提供します。推定には点推定と区間推定の二種類があります。

点推定は、標本データから計算された平均値や標準偏差などの統計量を、そのまま母集団のパラメータ(真の値)として推定する方法です。これは計算が容易ですが、「真の値」がこの一つの値である確率は限りなくゼロに近いため、その精度には限界があります。

そこで重要となるのが区間推定です。区間推定では、信頼度(一般的には95%や99%)を設定し、「母集団の真の値が、ある範囲(信頼区間)に含まれている確率が、その信頼度である」と推定します。例えば、「95%信頼区間が3.0%から5.0%」であれば、「この手順で信頼区間を計算すると、100回のうち95回は真の値がこの区間に入る」と解釈します。信頼区間は、推定の不確かさ、つまり誤差の幅を定量的に示すものであり、実務での意思決定において非常に有用です。検定で「差がある」と判断されたとしても、信頼区間が狭ければより説得力が増し、区間が広ければ結果の解釈に慎重さが求められます。

 

【検定・推定の限界と応用】 

統計的検定は、結果が統計的に有意であることを示せますが、それが実務的に重要であるか、あるいは因果関係があるかどうかまでは示しません。例えば、極めて大きなサンプルサイズを用いれば、実務上意味のない小さな差でも統計的に有意になることがあります。そのため、統計的な判断だけでなく、その背景にある専門知識と組み合わせて、最終的な意思決定を行う必要があります。これらの統計的手法は、新薬の効果判定、製造工程の品質管理、マーケティング施策の比較、世論調査など、科学的な根拠に基づいた判断が求められるあらゆる分野で、効率的かつ客観的な意思決定を支える基盤となっています。


「検定・推定」のキーワード解説記事

もっと見る
検定推定を行う手順とは

   今回は、次の事例をもとに、検定推定を行う手順を解説します。   1. 二つの母分散の比に関する検定と推定  事例として、ゴルフシャフトの...

   今回は、次の事例をもとに、検定推定を行う手順を解説します。   1. 二つの母分散の比に関する検定と推定  事例として、ゴルフシャフトの...


Ω(オメガ)変換とは   

1. Ω(オメガ)変換が必要な理由  歩留り90%のものを95%にするのは、歩留り30%を60%にするより難しいといいます。これは元々よいも...

1. Ω(オメガ)変換が必要な理由  歩留り90%のものを95%にするのは、歩留り30%を60%にするより難しいといいます。これは元々よいも...


「検定・推定」の活用事例

もっと見る
仮説検定:洞窟ツアーと p値

        今回は、ケンタッキー州にあるマンモス・ケーブ国立公園に行った事からの事例解説です。この国立公...

        今回は、ケンタッキー州にあるマンモス・ケーブ国立公園に行った事からの事例解説です。この国立公...


母平均の検定事例(母分散が既知の場合)

 今回は、母集団が正規分布であり、平均値と分散値が既知である場合の検定事例を取り上げます。  小学校4年生のある年の全国身長調査で平均値は143.5cm...

 今回は、母集団が正規分布であり、平均値と分散値が既知である場合の検定事例を取り上げます。  小学校4年生のある年の全国身長調査で平均値は143.5cm...