Zスコアと標準化とは、工程能力の理解

 

 

【目次】

 

 今回は、その4として、Zスコアと標準化を、4回連載の工程能力の理解の最後として解説します。

 

1. 工程能力・工程能力指数とは

 特性値の規格に対する充足度を工程能力と言います。工程により作り出される特性の状態を評価するには平均値だけでは不十分で、母集団のばらつきを考慮した分布の大きさを観る事が重要です。この分布が、規格(スペック)幅の内側に十分収まるように管理を行う事が、品質保証に直結しコスト削減と顧客満足に繋がります。

 工程能力とは安定した工程における品質特性値の状態を、統計的に表す能力の事を言います。ここで言う安定した工程とは、簡単に言えば特性の異常なばらつきが無い状態と言えます。管理図で言えば管理限界内で点が、特異な傾向無く上下している様なケースになります。設備の故障や人為的ミス、その他平常時とは異なるイベントによる異常を含まない状態です。

 

 その2の復習になりますが、スペックに対し特性の分布がどの程度余裕を持って納まっているかを知る為の指標が、工程能力指数です。特性値の中心を決めるのが平均値とすれば、分布の範囲を決めるのが、ばらつきといえます。 この場合ばらつきは標準偏差σを基準として算出されます。              

  平均値と標準偏差を用いて工程能力を分かりやすく指数化したものが”工程能力指数”です。 一般的にCpの記号で表記されますがこれは、Process Capabilityの頭文字を取ったものです。

 

2.Zスコアとは何か

 
 前回のその3に続いて解説します。Zスコアは、ある値xiが分布の中でどの辺りに位置するかを平均値0、標準偏差1の標準正規分布に置き換え表したものです。Zスコアは下の算出式で導く事が出来ます。
 
        zskoa1
 
 xiが平均値と等しければZスコアは0となり、平均より高い値ならZスコアはプラスの値、低ければマイナスの値となります。このZスコアを求める式は、標準偏差の値が異なる分布を、標準正規分布に置き換えたものと考えることが出来ます。例えば上限規格値が40で、平均値30、標準偏差10の正規分布を計算すると図1の様になり、Zスコアは1となります。
 
  zskoa2  
 図1.標準化イメージ
 
 Zスコアを用いる利点は、平均値や標準偏差が異なる分布の値も、標準正規分布という同一分布の中の値として比較が可能な所です。例えば数学と英語の成績の良し悪しは単なる点数の比較では判断できません。同じ70点でも点数の分布の平均と標準偏差によって分布のどの辺に位置するかが異なるからです。数学の平均と標準偏差が50点と10点(分布A)で、英語の平均と標準偏差が60点と15点(分布B)だとすれば、70点の結果のZスコアは、図2のように、数学が2.0、英語は0.67となります。
 
  zskoa3 
図2.異なる2つの分布の標準化イメージ
 
 因みに両試験における70点を偏差値に表すと、それぞれ数学は偏差値70、英語は偏差値60相当となります。偏差値70は1000人受験者がいれば23位付近であり、60は253位付近となります。
 

3.Zスコアの応用 偏差値

 
 学力を表す統計指標に偏差値がありますが、これもZスコアと同様に標準化指標です。偏差値は分布の平均が50となり、50<の場合は平均より成績が上位で、50>は成績が下位である事を示唆します。偏差値はZスコアを用いる事で次の式にて容易に求める事が出来ます。
 
                              zskoa4  
 
 数学の点数分布において、Zスコア及び偏差値をZスコア分布と共に図3に示します。また各Zスコアが上位から何%に相当するかも併せて記します。
 
         zskoa5
         
図3.数学試験点数分布におけるZスコアと偏差値
 
...

 

 

【目次】

 

 今回は、その4として、Zスコアと標準化を、4回連載の工程能力の理解の最後として解説します。

 

1. 工程能力・工程能力指数とは

 特性値の規格に対する充足度を工程能力と言います。工程により作り出される特性の状態を評価するには平均値だけでは不十分で、母集団のばらつきを考慮した分布の大きさを観る事が重要です。この分布が、規格(スペック)幅の内側に十分収まるように管理を行う事が、品質保証に直結しコスト削減と顧客満足に繋がります。

 工程能力とは安定した工程における品質特性値の状態を、統計的に表す能力の事を言います。ここで言う安定した工程とは、簡単に言えば特性の異常なばらつきが無い状態と言えます。管理図で言えば管理限界内で点が、特異な傾向無く上下している様なケースになります。設備の故障や人為的ミス、その他平常時とは異なるイベントによる異常を含まない状態です。

 

 その2の復習になりますが、スペックに対し特性の分布がどの程度余裕を持って納まっているかを知る為の指標が、工程能力指数です。特性値の中心を決めるのが平均値とすれば、分布の範囲を決めるのが、ばらつきといえます。 この場合ばらつきは標準偏差σを基準として算出されます。              

  平均値と標準偏差を用いて工程能力を分かりやすく指数化したものが”工程能力指数”です。 一般的にCpの記号で表記されますがこれは、Process Capabilityの頭文字を取ったものです。

 

2.Zスコアとは何か

 
 前回のその3に続いて解説します。Zスコアは、ある値xiが分布の中でどの辺りに位置するかを平均値0、標準偏差1の標準正規分布に置き換え表したものです。Zスコアは下の算出式で導く事が出来ます。
 
        zskoa1
 
 xiが平均値と等しければZスコアは0となり、平均より高い値ならZスコアはプラスの値、低ければマイナスの値となります。このZスコアを求める式は、標準偏差の値が異なる分布を、標準正規分布に置き換えたものと考えることが出来ます。例えば上限規格値が40で、平均値30、標準偏差10の正規分布を計算すると図1の様になり、Zスコアは1となります。
 
  zskoa2  
 図1.標準化イメージ
 
 Zスコアを用いる利点は、平均値や標準偏差が異なる分布の値も、標準正規分布という同一分布の中の値として比較が可能な所です。例えば数学と英語の成績の良し悪しは単なる点数の比較では判断できません。同じ70点でも点数の分布の平均と標準偏差によって分布のどの辺に位置するかが異なるからです。数学の平均と標準偏差が50点と10点(分布A)で、英語の平均と標準偏差が60点と15点(分布B)だとすれば、70点の結果のZスコアは、図2のように、数学が2.0、英語は0.67となります。
 
  zskoa3 
図2.異なる2つの分布の標準化イメージ
 
 因みに両試験における70点を偏差値に表すと、それぞれ数学は偏差値70、英語は偏差値60相当となります。偏差値70は1000人受験者がいれば23位付近であり、60は253位付近となります。
 

3.Zスコアの応用 偏差値

 
 学力を表す統計指標に偏差値がありますが、これもZスコアと同様に標準化指標です。偏差値は分布の平均が50となり、50<の場合は平均より成績が上位で、50>は成績が下位である事を示唆します。偏差値はZスコアを用いる事で次の式にて容易に求める事が出来ます。
 
                              zskoa4  
 
 数学の点数分布において、Zスコア及び偏差値をZスコア分布と共に図3に示します。また各Zスコアが上位から何%に相当するかも併せて記します。
 
         zskoa5
         
図3.数学試験点数分布におけるZスコアと偏差値
 
 Zスコア2若しくは偏差値70は上位2.3%に入るほど成績上位という事になります。偏差値60でも25%なので1学年200人が受験していれば50位に入りますので悪くありません。
 
  

  残り20% 続きを読むには・・・


この記事の著者

眞名子 和義

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します


「SQC」の他のキーワード解説記事

もっと見る
現場数学(その18)~ 倫理・論理・数理

♦ 情報倫理とはいうけれど… 1.奥が深い情報倫理  最近「メールや投稿で人を中傷しない」などといった問題に関係して、情...

♦ 情報倫理とはいうけれど… 1.奥が深い情報倫理  最近「メールや投稿で人を中傷しない」などといった問題に関係して、情...


現場数学(その17)~ 「定幅図形」マンホールのフタはなぜ丸い?

  ♦ ルーローの三角形と定幅図形 1.自動車のタイヤは丸くないといけない?  ピラミッドを造った時、大きな石をどうやって...

  ♦ ルーローの三角形と定幅図形 1.自動車のタイヤは丸くないといけない?  ピラミッドを造った時、大きな石をどうやって...


基本統計量について(平均値・中央値・分散・標準偏差など)

 数値データを分析するにあたり、情報の特徴を知るために基本的な統計量がありますので、今回はその中のいくつかについて説明します。 1.平均値(mean、a...

 数値データを分析するにあたり、情報の特徴を知るために基本的な統計量がありますので、今回はその中のいくつかについて説明します。 1.平均値(mean、a...


「SQC」の活用事例

もっと見る
DPMOとは何か

 DPMOとはDefects Per Million Opportunityのイニシャルを取ったものです。DPMOを百万個当りの欠陥数(製品百万個当りの不...

 DPMOとはDefects Per Million Opportunityのイニシャルを取ったものです。DPMOを百万個当りの欠陥数(製品百万個当りの不...


飛行機事故とセンサー・フィードバックの分布

   ボーイング 737 Max 8機が短い期間に2回の墜落死亡事故を起こし、多くの航空会社が同機種の運航を停止する事態となっています。多くの...

   ボーイング 737 Max 8機が短い期間に2回の墜落死亡事故を起こし、多くの航空会社が同機種の運航を停止する事態となっています。多くの...


ビックデータ時代と米国大統領戦

 ビックデータ時代を考える事例として、今回の第45代米国大統領選挙を見てみます。第45代の米国大統領に、ドナルド・トランプ氏が決まりましたが、トランプ氏当...

 ビックデータ時代を考える事例として、今回の第45代米国大統領選挙を見てみます。第45代の米国大統領に、ドナルド・トランプ氏が決まりましたが、トランプ氏当...