正規分布について

投稿日

1.正規分布とは

 一般に自然界のデータ分布は左右対称の釣鐘形状になります。例えば平均が50点の試験があれば、そこを中心に点数の分布が左右に広がります。受験者数nが大きくなればなるほど平均値周辺の人数が増え、分布の形は滑らかになり正規分布という形に近づきます。

 正規分布は最も基本となる分布の一つで、自然界の分布は多くがこの分布の形を取ります。正規分布は、ばらつきが大きければすそ野の広い富士山形状となり、小さければシャープな釣鐘型形状となります。

 分布が下図の左の様であればばらつきが小さいことを示し、試験は受験者による差が少なく実力が拮抗していたと言えます。逆に右の様に幅が広ければばらつきが大きい、つまり点数が良かった人も悪かった人もいたことを示します。

正規分布とは

2.正規分布と標準偏差の関係

 別項で、ばらつきを示す統計量として標準偏差σについて述べました。 シャープな正規分布は、σが小さい分布です。ブロードな正規分布はσが大きい分布です。

正規分布の形状

 では正規分布の中央から±1σの範囲に入るのは全体の何%でしょう?先ほどの試験結果の例で考えてみましょう。平均50点で標準偏差が10点だとすると±1σの範囲は40点から60点の範囲に当たります。 同様に±2σは30~70点、±3σは20-80点の範囲に該当します。この時の分布は次の図のようになります。

正規分布と標準偏差

 即ち各得点の範囲に入る受験生は次の割合です。

 •±1σ (40-60点):約68%
 •±2σ (30-70点):約95%
 •±3σ (20-80点):約99.7%

正規分布と存在範囲

 良く使う偏差値は、平均と標準偏差を元に計算します。偏差値は、平均点を取れば点数の大小に関わらず50となるような数値です。

 次にこの正規分布を、規格の中心が100mmの部品の寸法分布で再度考えてみます。理想は、すべての部品が100mmピッタリになる事です。しかしこれまで述べてきたように、残念ながら必ずばらつきが生じます。もし規格幅が100mm±1mmであれば98.5mmや101.5mmの部品は納品できません。平均が100mmで標準偏差が0.3mmだとしたら、100±0.9mmの範囲に99.7%が入ります。逆に言えば1000本作成した中に、規格外れが3個ほど発生する可能性があります。もし1日10万個を作る大量生産部品ならば300個の不適合品が出来る事になります。

 規格幅99.0~101.0mmの中に分布がすっぽりと収まるのが理想です。合格率を高めて不適合を減ら...

1.正規分布とは

 一般に自然界のデータ分布は左右対称の釣鐘形状になります。例えば平均が50点の試験があれば、そこを中心に点数の分布が左右に広がります。受験者数nが大きくなればなるほど平均値周辺の人数が増え、分布の形は滑らかになり正規分布という形に近づきます。

 正規分布は最も基本となる分布の一つで、自然界の分布は多くがこの分布の形を取ります。正規分布は、ばらつきが大きければすそ野の広い富士山形状となり、小さければシャープな釣鐘型形状となります。

 分布が下図の左の様であればばらつきが小さいことを示し、試験は受験者による差が少なく実力が拮抗していたと言えます。逆に右の様に幅が広ければばらつきが大きい、つまり点数が良かった人も悪かった人もいたことを示します。

正規分布とは

2.正規分布と標準偏差の関係

 別項で、ばらつきを示す統計量として標準偏差σについて述べました。 シャープな正規分布は、σが小さい分布です。ブロードな正規分布はσが大きい分布です。

正規分布の形状

 では正規分布の中央から±1σの範囲に入るのは全体の何%でしょう?先ほどの試験結果の例で考えてみましょう。平均50点で標準偏差が10点だとすると±1σの範囲は40点から60点の範囲に当たります。 同様に±2σは30~70点、±3σは20-80点の範囲に該当します。この時の分布は次の図のようになります。

正規分布と標準偏差

 即ち各得点の範囲に入る受験生は次の割合です。

 •±1σ (40-60点):約68%
 •±2σ (30-70点):約95%
 •±3σ (20-80点):約99.7%

正規分布と存在範囲

 良く使う偏差値は、平均と標準偏差を元に計算します。偏差値は、平均点を取れば点数の大小に関わらず50となるような数値です。

 次にこの正規分布を、規格の中心が100mmの部品の寸法分布で再度考えてみます。理想は、すべての部品が100mmピッタリになる事です。しかしこれまで述べてきたように、残念ながら必ずばらつきが生じます。もし規格幅が100mm±1mmであれば98.5mmや101.5mmの部品は納品できません。平均が100mmで標準偏差が0.3mmだとしたら、100±0.9mmの範囲に99.7%が入ります。逆に言えば1000本作成した中に、規格外れが3個ほど発生する可能性があります。もし1日10万個を作る大量生産部品ならば300個の不適合品が出来る事になります。

 規格幅99.0~101.0mmの中に分布がすっぽりと収まるのが理想です。合格率を高めて不適合を減らすには、もっとシャープな分布にすることが必要です。その為にはばらつきを減らす工夫をして、標準偏差σをもっと小さくしなければなりません。上の例で言えば、1σを0.25mmまで下げることで8個分のσが規格範囲に入ります。それによって、規格内の部品は99.994%となり10万個中6個程度にまで不適合品の発生を抑える事ができます。

 統計的解析は基本的に正規分布するという仮定の元に行います。母集団の数が多い時すべてのデータを取るのは難しい為サンプリングを行い、そのサンプルの平均や標準偏差から正規分布を仮定して母集団の姿を推測する事になります。

   続きを読むには・・・


この記事の著者

眞名子 和義

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します


「SQC一般」の他のキーワード解説記事

もっと見る
天体は音楽を奏でる? ~奇跡的一致の不思議 現場数学(その5)

  1. 天体運動に思い馳せたピタゴラス  数学といえば、現場数学であろうが純粋数学であろうが、何と言ってもピタゴラスです。紀元前500...

  1. 天体運動に思い馳せたピタゴラス  数学といえば、現場数学であろうが純粋数学であろうが、何と言ってもピタゴラスです。紀元前500...


~長方形の面積S=a×b?-誤差の概念、誤差の伝播― 現場数学(その3)

  1. 誤差の概念について  子どもの頃、面積を求める問題は分かりやすく、誰でも算数が出来た気になりました。その時、悩みもせず、例えば...

  1. 誤差の概念について  子どもの頃、面積を求める問題は分かりやすく、誰でも算数が出来た気になりました。その時、悩みもせず、例えば...


分散の加法性とは

     SQC(Statistical Quality Control:統計的品質管理)というと、期待値、確率変数、標準偏差、正規分布...

     SQC(Statistical Quality Control:統計的品質管理)というと、期待値、確率変数、標準偏差、正規分布...


「SQC一般」の活用事例

もっと見る
ビックデータ時代と米国大統領戦

 ビックデータ時代を考える事例として、今回の第45代米国大統領選挙を見てみます。第45代の米国大統領に、ドナルド・トランプ氏が決まりましたが、トランプ氏当...

 ビックデータ時代を考える事例として、今回の第45代米国大統領選挙を見てみます。第45代の米国大統領に、ドナルド・トランプ氏が決まりましたが、トランプ氏当...


第1種の誤りと第2種の誤り

 「あわて者の誤り」と「ぼんやり者の誤り」をご存知ですか、あわて者の誤りは正式には『第一種の誤り』(Type Ⅰ error)と呼称し、ぼんやり者の誤りは...

 「あわて者の誤り」と「ぼんやり者の誤り」をご存知ですか、あわて者の誤りは正式には『第一種の誤り』(Type Ⅰ error)と呼称し、ぼんやり者の誤りは...


飛行機事故とセンサー・フィードバックの分布

   ボーイング 737 Max 8機が短い期間に2回の墜落死亡事故を起こし、多くの航空会社が同機種の運航を停止する事態となっています。多くの...

   ボーイング 737 Max 8機が短い期間に2回の墜落死亡事故を起こし、多くの航空会社が同機種の運航を停止する事態となっています。多くの...