※いずれも質問投稿には会員登録が必要です
個人情報(個人名やメールアドレスなど)が公開されることはありません。


QUESTION 質問No.419

複数日に跨るデータを日数で割て

企画 SQC(統計的品質管理) | 投稿日時:
同じ質問をしましたが、分類を入力し忘れました。再投稿します。

はじめまして。日本の大学生です。現在、インドネシアに留学しています。

僕は今、インドネシアでメタンガス製造の最適条件を研究しています。当初は生成ガスの濃度と体積を毎日測定したいと思っていました。

しかし、授業や休日などの関係で、毎日の測定は困難です。そのため、例えば3,4日に一回の測定にしようと思っています。

この場合、例えば3日間の生成ガスの合計体積を3で割って求めた平均値をその期間の1日分の体積とみなしてデータ整理することは妥当でしょうか。

3日間の体積を等しく分配すると、誤差が実際よりも小さくみなしてしまいそうですが、誤差を丸める方法で使われていることもあるかなとも思いました。

また、濃度は3日間とも同じであったとみなすことについても御意見を頂きたいです。

最終的には、横軸に時間、縦軸に体積の蓄積量をとって、グラフを作成することを考えています。結果を説明できると思われる理論式は存在します。

言葉では伝えにくいため、理解の難しい記述でしたら、指摘して頂けると助かります。宜しくお願い致します。


ANSWER
回答No1 | 投稿日時:

最初に、母集団・サンプル・データ・統計量の関係について確認します。
・母集団は、我々が知りたい或いはアクションを起こしたい対象です。
・サンプルは、母集団に対する何らかの目的のため、抜き取った母集団の一部です。
・データは、抜き取ったサンプルの特性の測定結果です。
・統計量は、得られたデータを加工して母集団の性質を予測するための数値です。

さて、質問者の方が行おうとしていることは、
・ある目的のために、生成ガスの体積を測定してデータを集めています。
・データ採りは、毎日出来ないので3,4日に1回にしたいと考えています。

ここまでは良いのですが、3日間の合計データを3で割って、
1日のデータとして扱おうとしているようです。
これが問題です。
データを3で割った値はデータでなく、平均値という統計量です。
3日間の平均値と4日間の平均値は性質が異なります。
統計量をデータと見なして、その数値を用いて求めた統計量は本来の統計量と性質が異なり、間違った判断を起こす可能性があります。

回りくどい話で申し訳ありません。
データを採る目的に対して、収集すべきデータ、必要な統計量が決まります。
目的とは、以下のようなことが考えられます。
・現状の工程能力(良品を作り出す能力)を知りたい
・現状の工程に異常が発生していないか監視したい。
・改善後のデータは従来と比較して改善しているか。・・・等です。
目的が明確になれば、もう少しアドバイスが出来ると思います。