Q&Aサービスは終了いたしました。過去のQ&Aの閲覧のみ可能となっております。
新規に質問をする場合は上記「コミュニティ」より投稿してみましょう。


QUESTION 質問No.622

平均値も分散も異なる2つのデータの比較

設計・開発統計・SQC |投稿日時:
とある条件を変えたA,Bというサンプルのとある特性データをそれぞれ1000個採取しました。

結果として2つのサンプルは平均値も分散も異なっていました。ヒストグラム化しても違いが分かった為、今回はA,Bで差異があると判断しました。

ただ今後このようなはっきりした差ではない結果になることも考えられます。その場合、どれぐらいの差異があった時に有意差ありとするかの指標が必要となります。母平均か母分散のどちらかが同じと仮定した場合の検定などは習ったことがあるのですが、今回どちらも変わっている可能性が高いと考えています。

その場合にその差異を検定できる手法はありませんでしょうか?

アドバイスをしていただく際の補足になるかわかりませんが、この特性は数値が大きいほうが良くないです。そのため現在はある一定以上の数値を持つデータの比率を求め、それを下げていく改良を行っていきます。なので、極端なことを言えば平均値を下げる手法でも標準偏差を下げる手法でもどちらでもいいと考えています。

補足1 投稿日時:2023/06/30 17:40

清岡様 ありがとうございました

早速、試してみました
今後はこのように評価していこうと思います

ただ、t検定に色々な手法があることを初めて知りました
excelのツールの中には3種類のt検定がありました

せっかくですのでそれぞれがどういった計算式によって成り立っているのかやどういった場合に使うべきなのかということを学んでおきたいです
計算式レベルまで解説されている参考書やホームページなどはご存じないでしょうか?

spacer
ANSWER
回答No1 | 投稿日時:

kobay様
保全ラボの清岡と申します。
弊社は、工場の生産設備が壊れないように、設備維持管理の企画・計画設計を支援する会社です。

ご質問ありがとうございます。
特性データの判断基準でお困りのことお察しします。
一般的な回答になりますが、「対応のないt検定」という手法で解決できるのではないかと、考えております。
検定は、Excelなどの標準ツールで対応が可能です。

対応のないt検定とは、2つの母集団の平均値に差があるかどうかを検定する統計検定の手法です。
2つの母集団は独立であり、同じ単位が2つの母集団にそれぞれ1回ずつ割り当てられている場合に使用します。
対応のないt検定は、2つの母集団の平均値に差があるかどうかを検定する統計検定として広く使用されています。

Excelのt検定手法
1.Excelのアドインである「分析ツール」を使用できるようにする
2.Excelの分析ツールで「t検定:等分布を仮定した2標本にyる検定」を選択
3.変数1の入力範囲、変数2の入力範囲、仮説との差異(差がない→0)、α=0.05を入力しOK(この相対を
4.t-検定: 等分散を仮定した2標本による検定が出力される
5.P(T<=t)の値が、0.05未満になると、差があるという結果になります。
※αは有意水準の値(0.05の場合は、95%で差がある。という意味です)です。こちらの値を変えてt検定を行うことで、どの程度の有意差があるかの判断も可能です。

問題解決に少しでもお力になれれば幸いです。
何卒よろしくお願い申し上げます。




ANSWER
回答No2 | 投稿日時:

kobayさん

お世話になります。
早速、試していただき、ありがとうございます。

参考書ですが、少し古い本になりますが、統計の基礎を学ぶには以下の2冊がお勧めです。
もしよろしければ、ご検討ください。
よろしくお願い申し上げます。

■参考書籍
統計学がわかる 著者:向後 千春、冨永 敦子 出版社:技術評論社 発行年:2007年
統計学がわかる 【回帰分析・因子分析編】 著者:向後 千春、冨永 敦子 出版社:技術評論社 発行年:2008年




ANSWER
回答No3 | 投稿日時:

kobayさんこんにちは。
技術士の深澤といいます。
t検定について少しお話しします。これはギネス社のゴゼットさんの功績だということは有名です。
「t分布」のことを「Studentのt分布:」と呼ぶことがあります。このStudentという人物についてお話しします。
Studentというのはこの分布を発見したGosset氏のペンネームです。
William Sealy Gossetはオックスフォード大学を卒業して23歳の時にギネスビールに就職しました。1899年のことです。当時ギネスビールでは若い科学者を採用して近代的な科学技術の導入を目指していました。ギネス社にとってゴゼット氏への投資は大正解でした。ゴゼット自身有能な管理者としての働きを見せて,大ロンドン市の事業全体を管理するまでに出世しましたが、実は彼の功績はそれ以上に統計学にとって偉大なものだったのです。
彼が最初に発表した論文はビール製造工程での酵母に関するものです。発酵の過程で投入する酵母の量を正確に求めるにはどうしたらよいかを考えました。液から標本を採って顕微鏡で観察し酵母細胞の数を求めたのですが,酵母は培養液の中で常に増殖しています。添加する酵母の量が少ないと十分に発酵しないし,多すぎると苦いビールになってしまいます。彼の目的は標本中の酵母の数ではなく,瓶の中の酵母の数を推定することだったのです。つまり1単位当たりの酵母細胞の確率分布を知ることです。→これは記述統計学ではなく推測統計学といえます。
この内容は「統計学を拓いた異才たち」に詳しいです。では続きです。
「ほかのことはともかく,すべての科学者がゴゼットの「平均についての起こりうる誤差」というタイトルの短い論文の恩恵を受けている。その論文は1908年にバイオメトリカ誌に発表された。この注目すべき論文の一般的な合意を指摘したのは,ロナルド・エイルマー・フィッシャーだった。」というものです。ゴゼットは夜に台所のテーブルに座って標本サイズが小さいデータセットをとり,その平均と推定した標準偏差の両方を調べると平均を標準偏差で割って,その結果をグラフ用紙にプロットしました。そして4つの母数がこの比と関連していること,また,ピアソンの歪んだ分布の1つと適合していることを突き止めました。この大きな発見のおかげで,もとの分布の4つの母数すべてについて正確な値を知る手間が省けるようになりました。最初の2つの母数の推定値の比についての確率分布を表にすることができました。2つの標本推定値の比をとると,既知の分布に従うことが分かったのです。→これがStudentのt分布です。
本では以下のように続きます。
「スチューデントのtの開発によって,我々は科学に広まった統計分布理論を使うようになったが,それは深い哲学的問題をはらんでいる。すなわち「仮説検定」とか「有意差検定」と呼ばれる手法を使うことである。」
次にEXCELのt検定のお話しです。分析ツールには3つの検定方式が選択できます。この中に「t検定:分散が等しくないと仮定した2標本による検定」があります。これは2つの分散を等しくないと仮定して、welchの検定を行うものです。この検定を最初から使えばよいと推奨する人もいます。
品質工学では,平均値とばらつきを同時解析する手法として、SN比を用いることをお勧めしています。この例の場合は望目特性のSN比か望小特性のSN比が使えます。テキストは「ベーシックオフライン品質工学」日本規格協会がお勧めです。