分散の加法性とは

更新日

投稿日

 

 

 SQC(Statistical Quality Control:統計的品質管理)というと、期待値、確率変数、標準偏差、正規分布、共分散、公差、確率分布などの言葉と、QC七つ道具、実験計画法、回帰分析、多変量解析などの統計的方法や抜取検査、サンプリングなどの手法が出てきます。統計的品質管理はSQCの言葉を理解して最適な手法を駆使した品質管理です。 戦後の日本製造業を強くしたのは、デミング博士がこれらを持ち込み、教育指導したためです。経験や勘に頼るのではなく、事実とデータに基づいた管理を重視する点が特徴です。

 今回は、最初に偏差と分散を整理して解説した後に、分散の加法性について解説します。

 

◆ばらつきの算出~偏差と分散

 

 統計学を学び始めると最初に出てくるのが標本と母集団や「ばらつき」の説明です。まず始めに「ばらつき」とは一般的にどう言う意味でしょうか。広辞苑では次のように解説してありました。 「測定した数値などが平均値や標準値の前後に不規則に分布すること。また、ふぞろいの程度。」

 統計でばらつきと言えば直ぐに思い浮かべるのは「標準偏差」だと思います。ばらつきを表す統計量である標準偏差は最もポピュラーな統計量の一つです。 エクセルを使えば面倒な計算式を入れずとも一発でドーンと算出できます。

 標準偏差の算出、個人的には統計を数学的に考え過ぎると食わず嫌いになってしまうので数学のように式の展開過程を深追いするのはお勧めしません。Σの記号が出てくるともう見たくないって気持ちになりませんか、ただ標準偏差の計算式を導く過程は逆にばらつきの定義の理解を深める事に役立つので紹介します。

 

1. 偏差と分散 

 標準偏差=分散の平方根です。偏差は分散の計算に用いられるからです。偏差は平均値と各データの差です。 図1が、イメージです。

 

偏差
図1.偏差イメージ図
 
 

 Xの上に横棒を引いた記号はデータXの平均値を表します。例えば平均値50点の試験結果で56点の人の偏差は6点です。47点の人の偏差は-3点です。わかりやすいですね。偏差を合計すればばらつきの程度が分かるような気がしませんか。でも平均値からのプラスとマイナスを足すわけなので全部足したら”ゼロ”になります。そこでゼロに成らないように各偏差を自乗して和を取ります。この”偏差の自乗和が偏差平方和“です。 エクセル関数はdevsqです。データを選べば勝手に平均を算出し各データとの偏差を算出し自乗和を返します。

 次にこの偏差平方和をデータ数で割ったものが”分散“です。例えば10個のデータの偏差平方和を計算しそれを10で割れば分散が算出出来ます。ただし正確には”母分散“です。

 母集団の偏差を導きたい場合は分散は全データ数Nで割ることで算出されますが一部の データn個をサンプルとして抜き取りそのデータから母分散値を推定する場合はn-1で 割ります。何故サンプルデータから計算する場合はn-1になるのかの説明は一端置いといて一部の データからばらつきを求めた場合は全てのデータから求めた場合よりも小さくなると思 いませんか。

 サンプルデータは当然母集団全てのデータより少ないので滅多に出現しない平均値から 離れたデータが含まれる可能性も低いです。平均値に近いデータだけで計算すると全データでの計算値よりも小さくなってしまうの でサンプルだけで母集団の分散を推定する場合は補正が必要なのです。よってデータ1つ分小さい数値n-1で割ってやるのだと理解してみて下さい。ちなみにn-1は自由度と呼ばれています。

 今度は数学的に説明すると偏差の和はゼロになると上で述べました。「各データと平均値の差(=偏差)」の和がゼロの数式が成り立ちます。未知数Xが5個あってもこの数式を用いれば4つ分かれば残り一つは決まります。つまりn個の未知数があればn-1個が分かれば残り一つは自動的に決まります。分かりやすく言えばn-1人は自由に椅子を選べるが残りの人は自ずと残った椅子に座ら ざるを得ないと言う感じです。その為自由度と呼ぶと思って下さい。分散が出たら後はその平方根を計算すれば標準偏差となります。 平方根を取るのはデータを自乗しているので元の単位に戻すためです。

 言葉だとわかりにくいかもしれませんが上図と合わせてイメージは掴めると思います。細かい事ですが母集団全てのデータが使える場合は全データ数で割り、サンプルで母集団の分散を推測する場合はデータ数-1で割るという事を覚えて下さい。分散は他の統計的手法でも度々出てきますので是非理解を深めて下さい。

 

◆ 分散の加法性 ばらつきの合計

 

2.分散の加法性とは

 
 inf012分散の加法性とは何でしょうか、分散は、ばらつきを表す統計量で記号ではVで表されます。ある棒状の部品Yは部品AとB二つのパーツを繋げて制作されているとします。Yの長さの分散V(Y)と、部品AとBの分散V(A),V(B)の間に、次の関係が成り立ちます。
 
V(Y)=V(A)+V(B)
 
 つまり分散に対して加法の定理が成り立つことを示しています。この事を分散の加法性と言います。具体的に説明します。加工精度が長さによらず一定と仮定し、この場合の分散を0.01とします。Yの分散は加法性から考えて
 
V(Y)=V(A)+V(B)=0.01+0.01=0.02となります。
 
 これは実際にYの長さデータを採取し分散を算出すれば証明出来ます。もしYが部品を組み合わせず一本のパーツなら分散は0.01となります。つまりYを2つの部品で構成した場合は分散は2倍になります。
 
 分散の加法性は、品質管理を考える場合に留意しておく必要があります。長さや厚み、隙間等を精密に管理する必要がある場合、複数のパーツで構成されていれば単一加工品よりもばらつきが大きくなるのでコントロールが難しくなるのです。
 
 また加法性は期待値Eで...

 

 

 SQC(Statistical Quality Control:統計的品質管理)というと、期待値、確率変数、標準偏差、正規分布、共分散、公差、確率分布などの言葉と、QC七つ道具、実験計画法、回帰分析、多変量解析などの統計的方法や抜取検査、サンプリングなどの手法が出てきます。統計的品質管理はSQCの言葉を理解して最適な手法を駆使した品質管理です。 戦後の日本製造業を強くしたのは、デミング博士がこれらを持ち込み、教育指導したためです。経験や勘に頼るのではなく、事実とデータに基づいた管理を重視する点が特徴です。

 今回は、最初に偏差と分散を整理して解説した後に、分散の加法性について解説します。

 

◆ばらつきの算出~偏差と分散

 

 統計学を学び始めると最初に出てくるのが標本と母集団や「ばらつき」の説明です。まず始めに「ばらつき」とは一般的にどう言う意味でしょうか。広辞苑では次のように解説してありました。 「測定した数値などが平均値や標準値の前後に不規則に分布すること。また、ふぞろいの程度。」

 統計でばらつきと言えば直ぐに思い浮かべるのは「標準偏差」だと思います。ばらつきを表す統計量である標準偏差は最もポピュラーな統計量の一つです。 エクセルを使えば面倒な計算式を入れずとも一発でドーンと算出できます。

 標準偏差の算出、個人的には統計を数学的に考え過ぎると食わず嫌いになってしまうので数学のように式の展開過程を深追いするのはお勧めしません。Σの記号が出てくるともう見たくないって気持ちになりませんか、ただ標準偏差の計算式を導く過程は逆にばらつきの定義の理解を深める事に役立つので紹介します。

 

1. 偏差と分散 

 標準偏差=分散の平方根です。偏差は分散の計算に用いられるからです。偏差は平均値と各データの差です。 図1が、イメージです。

 

偏差
図1.偏差イメージ図
 
 

 Xの上に横棒を引いた記号はデータXの平均値を表します。例えば平均値50点の試験結果で56点の人の偏差は6点です。47点の人の偏差は-3点です。わかりやすいですね。偏差を合計すればばらつきの程度が分かるような気がしませんか。でも平均値からのプラスとマイナスを足すわけなので全部足したら”ゼロ”になります。そこでゼロに成らないように各偏差を自乗して和を取ります。この”偏差の自乗和が偏差平方和“です。 エクセル関数はdevsqです。データを選べば勝手に平均を算出し各データとの偏差を算出し自乗和を返します。

 次にこの偏差平方和をデータ数で割ったものが”分散“です。例えば10個のデータの偏差平方和を計算しそれを10で割れば分散が算出出来ます。ただし正確には”母分散“です。

 母集団の偏差を導きたい場合は分散は全データ数Nで割ることで算出されますが一部の データn個をサンプルとして抜き取りそのデータから母分散値を推定する場合はn-1で 割ります。何故サンプルデータから計算する場合はn-1になるのかの説明は一端置いといて一部の データからばらつきを求めた場合は全てのデータから求めた場合よりも小さくなると思 いませんか。

 サンプルデータは当然母集団全てのデータより少ないので滅多に出現しない平均値から 離れたデータが含まれる可能性も低いです。平均値に近いデータだけで計算すると全データでの計算値よりも小さくなってしまうの でサンプルだけで母集団の分散を推定する場合は補正が必要なのです。よってデータ1つ分小さい数値n-1で割ってやるのだと理解してみて下さい。ちなみにn-1は自由度と呼ばれています。

 今度は数学的に説明すると偏差の和はゼロになると上で述べました。「各データと平均値の差(=偏差)」の和がゼロの数式が成り立ちます。未知数Xが5個あってもこの数式を用いれば4つ分かれば残り一つは決まります。つまりn個の未知数があればn-1個が分かれば残り一つは自動的に決まります。分かりやすく言えばn-1人は自由に椅子を選べるが残りの人は自ずと残った椅子に座ら ざるを得ないと言う感じです。その為自由度と呼ぶと思って下さい。分散が出たら後はその平方根を計算すれば標準偏差となります。 平方根を取るのはデータを自乗しているので元の単位に戻すためです。

 言葉だとわかりにくいかもしれませんが上図と合わせてイメージは掴めると思います。細かい事ですが母集団全てのデータが使える場合は全データ数で割り、サンプルで母集団の分散を推測する場合はデータ数-1で割るという事を覚えて下さい。分散は他の統計的手法でも度々出てきますので是非理解を深めて下さい。

 

◆ 分散の加法性 ばらつきの合計

 

2.分散の加法性とは

 
 inf012分散の加法性とは何でしょうか、分散は、ばらつきを表す統計量で記号ではVで表されます。ある棒状の部品Yは部品AとB二つのパーツを繋げて制作されているとします。Yの長さの分散V(Y)と、部品AとBの分散V(A),V(B)の間に、次の関係が成り立ちます。
 
V(Y)=V(A)+V(B)
 
 つまり分散に対して加法の定理が成り立つことを示しています。この事を分散の加法性と言います。具体的に説明します。加工精度が長さによらず一定と仮定し、この場合の分散を0.01とします。Yの分散は加法性から考えて
 
V(Y)=V(A)+V(B)=0.01+0.01=0.02となります。
 
 これは実際にYの長さデータを採取し分散を算出すれば証明出来ます。もしYが部品を組み合わせず一本のパーツなら分散は0.01となります。つまりYを2つの部品で構成した場合は分散は2倍になります。
 
 分散の加法性は、品質管理を考える場合に留意しておく必要があります。長さや厚み、隙間等を精密に管理する必要がある場合、複数のパーツで構成されていれば単一加工品よりもばらつきが大きくなるのでコントロールが難しくなるのです。
 
 また加法性は期待値Eでも同様に成り立ちます。つまりE(Y)=E(A)+E(B)となります。期待値とは最も出現する確率が高い値となるのでこの場合は平均値となります。
 
 因みにばらつきを表す統計量としてポピュラーな標準偏差ですが、標準偏差の加法性は成り立ちませんので注意が必要です。
 
 例えば標準偏差0.2のパーツを二つ繋げたものの標準偏差は0.4ではありません。まず分散に直すと、一個のパーツの分散値は0.2×0.2=0.04となりますから、二つの和である0.08が繋げたパーツの分散値となります。
 
 よって標準偏差は分散0.08の平方根となるので約0.28となり、単純に標準偏差を足したもの(0.4)よりも小さい値となります。つまり標準偏差で加法性を誤って使うと実際よりもばらつきを大きく見積もってしまうのでご注意下さい。
 
 分散の加法性は2群の和のばらつきを知りたい時、それぞれの群の分散がわかっていれば容易に推測出来ますので実業務で活用する機会は少なからずあると思います。
 
 

   続きを読むには・・・


この記事の著者

眞名子 和義

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します


「SQC一般」の他のキーワード解説記事

もっと見る
~ 数学は世の中を変える! 現場数学(その12)

  ♦ 現場数学者に期待される判断能力 ~ 計算機パワーを最大限に活用 1.専門家の経験に基づく判断  英国のケンブリッジ...

  ♦ 現場数学者に期待される判断能力 ~ 計算機パワーを最大限に活用 1.専門家の経験に基づく判断  英国のケンブリッジ...


~大工さんは建築現場の数学者 現場数学(その11)

  ♦ 日本文化伝承する規矩準縄術 1.曲尺と発音  棟梁(とうりょう)をはじめとする大工さんたちの腕の素晴らしさは、日本...

  ♦ 日本文化伝承する規矩準縄術 1.曲尺と発音  棟梁(とうりょう)をはじめとする大工さんたちの腕の素晴らしさは、日本...


算術平均と幾何平均 平均のいろいろ(その1)

◆関連解説『SQCとは』


「SQC一般」の活用事例

もっと見る
統計手法による 2018年LPGA公式記録データの解析事例(その1)

【統計手法による 2018年LPGA公式記録データの解析 連載目次】 統計手法による 2018年LPGA公式記録データの解析事例(その1) 統...

【統計手法による 2018年LPGA公式記録データの解析 連載目次】 統計手法による 2018年LPGA公式記録データの解析事例(その1) 統...


飛行機事故とセンサー・フィードバックの分布

【目次】  ボーイング 737 Max 8機が短い期間に2回の墜落死亡事故を起こし、多くの航空会社が同機種の運航...

【目次】  ボーイング 737 Max 8機が短い期間に2回の墜落死亡事故を起こし、多くの航空会社が同機種の運航...


DPMOとは何か

 DPMOとはDefects Per Million Opportunityのイニシャルを取ったものです。DPMOを百万個当りの欠陥数(製品百万個当りの不...

 DPMOとはDefects Per Million Opportunityのイニシャルを取ったものです。DPMOを百万個当りの欠陥数(製品百万個当りの不...