※いずれも質問投稿には会員登録が必要です
個人情報(個人名やメールアドレスなど)が公開されることはありません。


QUESTION 質問No.546

不偏分散とデータの予測値の分散について

設計・開発  | 投稿日時:
首記件、母分散をσ^2とすると、σ^2=1/n・Σ(xi-xbar)^2+σ^2/nという関係が成り立つ(母分散=標本分散+母分散/データ数)と言いますが、これを母分散について解くと1/(n-1)・Σ(xi-xbar)^2、つまり不偏分散が得られると思います。

ここで疑問ですが、不偏分散(すなわち母分散の不偏推定量)は、その導出過程から考えると、標本の分散+平均値の分散の両方から得られるものと考えられます。換言するとロット内バラツキとロット間バラツキから構成される?感じなので、不偏分散こそがデータの予測(予測区間を考える)をする上で妥当な分散と思われます。

しかし実際、データの予測区間で一般にもちいられる分散は、不偏分散+不偏分散/データ数とされています。不偏分散のみで、すでに標本と平均値の分散の両方をカバーしているはずなのに、そこにさらに不偏分散/データ数を平均値の分散をあらためて加えていること重複しているように感じるのですがいかがでしょうか。

長文につき伝わりづらくすみませんが、予測区間の分散として単純に不偏分散をもちいてはいけない理由をご教示いただけないでしょうか。







spacer
ANSWER
回答No1 | 投稿日時:

レベルの高い質問です。
下記の理解でいいでしょうか??

  観察されるばらつき成分=偏り成分+ばらつき成分

文中に、不偏推定量、不偏分散という統計用語と式があり、文章が相当に複雑になっております。

おもちさんは、知識レベルが高いようで質問内容を理解したく思います。







ANSWER
回答No2 | 投稿日時:

前回のA:お世話になっています。
上記して頂いているとおり、
観察されるばらつき成分=偏り成分+ばらつき成分
と考えています。

これが正しければ、√不偏分散だけで事足りると思うのですが、一般的には√不偏分散+(不偏分散/データ数)を使用するようで、少し違和感をもっております。

回答例

出来上がりの製品の品質は、観測したばらつきで表します。
次に、でき上り品質を向上させようとしますと下記の「偏り」をまず「ゼロ」にします。一般的には、特性に関係する工程条件を変更して「偏り⇒0」とします。この時、ばらつき成分は変化せず同じになります。
  観察されるばらつき成分=偏り成分+ばらつき成分

従って、工程改善での商品の品質向上は、商品の観察されたばらつきを2成分に分解して「偏り」を優先して対策をします。工程管理は出来上がり品質でしますが、品質改善はばらつきを偏りとばらつきに2分類する解析管理を作成して対策します。 摩耗する工具の偏りは、新品は中心より上から開始して、交換時は中心より下となります。ともに規格内に収まるようにします。一般的には、工具・工程の変化に対し偏りをゼロにする工夫をします。従って対策のためにばらつきを2分類します。

これで回答になっていればいいのですが??