※いずれも質問投稿には会員登録が必要です
個人情報(個人名やメールアドレスなど)が公開されることはありません。


QUESTION 質問No.449

MT法の単位空間に関するご質問

全体/その他  | 投稿日時:
MT法では、あるサンプルの中で単位空間を決め、評価対象のサンプルとのマハラノビス距離を求め、その値がある閾値を超えているかどうかで異質かどうかを判別すると思います。
ただ、単位空間の中のサンプルで、マハラノビス距離がその閾値を超えているサンプルが存在する場合があると思うのですが、その場合はそのサンプルは異質と判別されるのでしょうか?


ANSWER
回答No1 | 投稿日時:

品質工学や実験計画法、多変量解析を主体としたコンサルを実施している村島です。ご質問のようなことは、起こりえます。多くはないですが、結構おこります。単位空間のマハラノビス距離の平均が1になるといっても、単位空間として選んだデ-タの平均、標準偏差を使う限り、個々のデ-タでマハラノビス距離が1を超えたり、ある閾値を超えたりすることは異常ではありません。よって、異質かといえば、それだけで異質とは言えません。単位空間として選んだとしても、その特徴項目が単位空間と関係なければ、いくらでも起こりえます。異質かどうか、同質かどうかは、あくまでそのデ-タが単位空間かどうかということで、単位空間とは、簡単に言えば「普通」かどうかということです。単位区間を最初に選べば、それは個々のマハラノビス距離が何であれ、単位空間です。だから、難しいのだと思います。
 管理図が流行らない、難しい最大の問題点が、安定域の定義があやふやなことだということとよく似ています。ご存じのとおり、管理図では管理限界線を基準にします。この管理限界線に対する挙動で、異常かどうかを見るわけです。しかし、管理限界線は、安定域から計算することとなっています。ここに論理的な矛盾が生じます。安定性を判断したいのに、安定域を選べと言われても困るわけです。それで、「適当に」、「感覚的に」安定しているという領域を決めておいて、そこから、管理限界線を算出しているのが現状です。もし、ある人が、大きな外れ値を最初に安定域に選べば、計算上の管理限界は大きくなって、それ以降のデ-タが異常にならないことも起こるわけです。
 マハラノビス距離は、この点で、よく似ていて、「普通の感覚」がどうかで単位空間の選び方が変わるわけです。例えば、健康な人とか、不健康な人とか言われても、医者から見た場合と、スポ-ツマンから見た場合、年寄りから見た場合、私から見た場合、、、、それぞれで変わります。最初に単位空間のあり方、テ-マごとの定義を決めておかないと、単位空間は変わります。残念ながら、それをマハラノビス距離で決めることはできません。単位空間を決めた後に、マハラノビス距離を計算するのであって、マハラノビス距離から単位空間を決めているわけではありません。
 実際に、どう「普通の状態」を定義するのかについては、いろいろな場面において、手法の経験者とよく相談なさったほうがいいと思います。
 分かりにくい話ですいません。でも、わかりにくいんです。実際のところ。市販テキストも、大体この辺のことは触れていないのが大半です。手法上のアキレス腱だと思っています。




ANSWER
回答No2 | 投稿日時:

品質工学のコンサルティングをしております対馬と申します。

しきい値は、単位空間のサンプルが持つマハラノビス距離(MD)と比較することによって、未知のサンプルが正常か異常かを判定するために用いるものですので、単位空間のMDに対して十分に大きいMDを持つ未知のサンプルが異常(異質)と判定されることになります。実際にはいくつかの未知のサンプルのMDを求めてから、適切なしきい値を決定する必要があります。 したがって、「単位空間の中のサンプルで、マハラノビス距離がその閾値を超えているサンプルが存在する場合がある」ということではないことを理解してください。
ちなみに、しきい値は一般的には4が目安とされています。

以 上