正規分布について

投稿日

1.正規分布とは

 一般に自然界のデータ分布は左右対称の釣鐘形状になります。例えば平均が50点の試験があれば、そこを中心に点数の分布が左右に広がります。受験者数nが大きくなればなるほど平均値周辺の人数が増え、分布の形は滑らかになり正規分布という形に近づきます。

 正規分布は最も基本となる分布の一つで、自然界の分布は多くがこの分布の形を取ります。正規分布は、ばらつきが大きければすそ野の広い富士山形状となり、小さければシャープな釣鐘型形状となります。

 分布が下図の左の様であればばらつきが小さいことを示し、試験は受験者による差が少なく実力が拮抗していたと言えます。逆に右の様に幅が広ければばらつきが大きい、つまり点数が良かった人も悪かった人もいたことを示します。

正規分布とは

2.正規分布と標準偏差の関係

 別項で、ばらつきを示す統計量として標準偏差σについて述べました。 シャープな正規分布は、σが小さい分布です。ブロードな正規分布はσが大きい分布です。

正規分布の形状

 では正規分布の中央から±1σの範囲に入るのは全体の何%でしょう?先ほどの試験結果の例で考えてみましょう。平均50点で標準偏差が10点だとすると±1σの範囲は40点から60点の範囲に当たります。 同様に±2σは30~70点、±3σは20-80点の範囲に該当します。この時の分布は次の図のようになります。

正規分布と標準偏差

 即ち各得点の範囲に入る受験生は次の割合です。

 •±1σ (40-60点):約68%
 •±2σ (30-70点):約95%
 •±3σ (20-80点):約99.7%

正規分布と存在範囲

 良く使う偏差値は、平均と標準偏差を元に計算します。偏差値は、平均点を取れば点数の大小に関わらず50となるような数値です。

 次にこの正規分布を、規格の中心が100mmの部品の寸法分布で再度考えてみます。理想は、すべての部品が100mmピッタリになる事です。しかしこれまで述べてきたように、残念ながら必ずばらつきが生じます。もし規格幅が100mm±1mmであれば98.5mmや101.5mmの部品は納品できません。平均が100mmで標準偏差が0.3mmだとしたら、100±0.9mmの範囲に99.7%が入ります。逆に言えば1000本作成した中に、規格外れが3個ほど発生する可能性があります。もし1日10万個を作る大量生産部品ならば300個の不適合品が出来る事になります。

 規格幅99.0~101.0mmの中に分布がすっぽりと収まるのが理想です。合格率を高めて不適合を減ら...

1.正規分布とは

 一般に自然界のデータ分布は左右対称の釣鐘形状になります。例えば平均が50点の試験があれば、そこを中心に点数の分布が左右に広がります。受験者数nが大きくなればなるほど平均値周辺の人数が増え、分布の形は滑らかになり正規分布という形に近づきます。

 正規分布は最も基本となる分布の一つで、自然界の分布は多くがこの分布の形を取ります。正規分布は、ばらつきが大きければすそ野の広い富士山形状となり、小さければシャープな釣鐘型形状となります。

 分布が下図の左の様であればばらつきが小さいことを示し、試験は受験者による差が少なく実力が拮抗していたと言えます。逆に右の様に幅が広ければばらつきが大きい、つまり点数が良かった人も悪かった人もいたことを示します。

正規分布とは

2.正規分布と標準偏差の関係

 別項で、ばらつきを示す統計量として標準偏差σについて述べました。 シャープな正規分布は、σが小さい分布です。ブロードな正規分布はσが大きい分布です。

正規分布の形状

 では正規分布の中央から±1σの範囲に入るのは全体の何%でしょう?先ほどの試験結果の例で考えてみましょう。平均50点で標準偏差が10点だとすると±1σの範囲は40点から60点の範囲に当たります。 同様に±2σは30~70点、±3σは20-80点の範囲に該当します。この時の分布は次の図のようになります。

正規分布と標準偏差

 即ち各得点の範囲に入る受験生は次の割合です。

 •±1σ (40-60点):約68%
 •±2σ (30-70点):約95%
 •±3σ (20-80点):約99.7%

正規分布と存在範囲

 良く使う偏差値は、平均と標準偏差を元に計算します。偏差値は、平均点を取れば点数の大小に関わらず50となるような数値です。

 次にこの正規分布を、規格の中心が100mmの部品の寸法分布で再度考えてみます。理想は、すべての部品が100mmピッタリになる事です。しかしこれまで述べてきたように、残念ながら必ずばらつきが生じます。もし規格幅が100mm±1mmであれば98.5mmや101.5mmの部品は納品できません。平均が100mmで標準偏差が0.3mmだとしたら、100±0.9mmの範囲に99.7%が入ります。逆に言えば1000本作成した中に、規格外れが3個ほど発生する可能性があります。もし1日10万個を作る大量生産部品ならば300個の不適合品が出来る事になります。

 規格幅99.0~101.0mmの中に分布がすっぽりと収まるのが理想です。合格率を高めて不適合を減らすには、もっとシャープな分布にすることが必要です。その為にはばらつきを減らす工夫をして、標準偏差σをもっと小さくしなければなりません。上の例で言えば、1σを0.25mmまで下げることで8個分のσが規格範囲に入ります。それによって、規格内の部品は99.994%となり10万個中6個程度にまで不適合品の発生を抑える事ができます。

 統計的解析は基本的に正規分布するという仮定の元に行います。母集団の数が多い時すべてのデータを取るのは難しい為サンプリングを行い、そのサンプルの平均や標準偏差から正規分布を仮定して母集団の姿を推測する事になります。

   続きを読むには・・・


この記事の著者

眞名子 和義

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します


「SQC一般」の他のキーワード解説記事

もっと見る
エクセルでの多変量解析はソルバーが必須

 エクセルにソルバーという機能があるのをご存知でしょうか、知っている方は使う機会はありますか、ソルバーとは、解決するという意味のSolveから命名されてい...

 エクセルにソルバーという機能があるのをご存知でしょうか、知っている方は使う機会はありますか、ソルバーとは、解決するという意味のSolveから命名されてい...


転ばぬ先の杖~RFCの備え

 RFCとはResponse Flow Chart(若しくはchecksheet)の略語です。あまりポピュラーな用語ではありませんが、外資系の製造業では良...

 RFCとはResponse Flow Chart(若しくはchecksheet)の略語です。あまりポピュラーな用語ではありませんが、外資系の製造業では良...


~ 「フラクタル次元」 現場数学(その16)

  ♦ 単純そうに見え、実は奥が深い次元のお話 1.次元  空間には1次元、2次元、3次元とあり、時間も加えれば4次元があ...

  ♦ 単純そうに見え、実は奥が深い次元のお話 1.次元  空間には1次元、2次元、3次元とあり、時間も加えれば4次元があ...


「SQC一般」の活用事例

もっと見る
ビックデータ時代と米国大統領戦

 ビックデータ時代を考える事例として、今回の第45代米国大統領選挙を見てみます。第45代の米国大統領に、ドナルド・トランプ氏が決まりましたが、トランプ氏当...

 ビックデータ時代を考える事例として、今回の第45代米国大統領選挙を見てみます。第45代の米国大統領に、ドナルド・トランプ氏が決まりましたが、トランプ氏当...


信頼できる結果を得るために統計的手法の活用を

昔の事になりますが、配属された職場の先輩の下である実験を手伝いました。先輩は図1のような計画をたてました。2つの量的因子A、Bの効果を確認する実験でした。...

昔の事になりますが、配属された職場の先輩の下である実験を手伝いました。先輩は図1のような計画をたてました。2つの量的因子A、Bの効果を確認する実験でした。...


統計教育が必須な検査担当者

 測定や検査結果の値で合格判定を行い、製品性能の品質保証をする事は製造業に取っては当たり前と言える日常的作業です。一方で検査や測定の正確さや信頼性を担保す...

 測定や検査結果の値で合格判定を行い、製品性能の品質保証をする事は製造業に取っては当たり前と言える日常的作業です。一方で検査や測定の正確さや信頼性を担保す...