時系列解析

設計・開発｜統計・SQC ｜投稿日時：2023/07/15 18:54

工場の生産量と、操業条件を１時間間隔で取得しているとします。生産量を目的変数に操業条件を説明変数において予測や各説明変数の寄与度(重要度)を求めたい場合に用いる統計モデルは
①時間的な依存関係を前提にしたモデル(時系列モデル,AR,多変量だとVAR等)
②一般のテーブルデータ用に用いる線型回帰や決定木のようなモデル

のどちらが適切でしょうか。一概にいえないかもしれませんが、例えば景気動向指数などの様々な外的要因や周期性に影響されるものは①が適切と思いますが、今回のケースだと②の方が適切だと考えています。結局得られるデータは時系列型なので①を採用という考えもある気がしています。各変数の自己相関係数を調べて（全変数？）ゼロ付近であれば依存関係なしと機械的に判断が下せるのでしょうが、そこまでやる価値があるのかも疑問です。
お手数ですがご教授頂けると幸いです

投稿者：もみじ

ANSWER

回答No1　｜　投稿日時：2023/07/17 10:21

品質工学、多変量解析、品質管理全般のコンサルティングをしている村島技術士事務所の村島です。時系列予測は、あまり経験ありませんが、半導体製造会社勤務時代に、10件程度の実施をしました。品質工学のように、頑健性で片が付くものばかりではなく、やはり、現場データの多変量変動や時系列変化を予測して、パラメータを調節（変化させる）ことが大事になるときもあって、時系列分析と重回帰分析を組み合わせたモデルで、結構大きな効果を得た経験があります。
ご質問の件ですが、その経験から、①と②のドッキングがいいと思います。
　たとえば、AR（１）モデルとプロセス調整パラメータの線形モデルのドッキングです。私は、IBM社からでているSPSSをつかっていました。時系列の長所である「時間的予測」と、そうはいっても、なるがままにはできないので、調節パラメータで線形モデルでの適切なチューニングを行うという考えです。
　ご存じのうえでのご質問でしたら、申し訳ないです。
　時系列分析と回帰分析のドッキング事例は、いろいろあるかもしれませんが、私が前職のころ、論文発表したなかでは、下記のものがあります。
　Centering value by using TSMRA prediction of CD process variation (ISSM, 2008)
です。ISSM：International Symposium on Semiconductor Manufacturing の略です。なにぶん、大昔のことなので、今時、古いかもしれません。参考になれば幸いです。
　

村島繁延　（むらしま　しげのぶ）　/　専門家S　/　村島技術士事務所

QCDはバランスさせるものではなく、全て両立させるものだという信念で向かいます。一石三鳥を狙った成果を目指します。

この回答の評価：
	AR（１）モデルとプロセス調整パラメータの線形モデルのドッキングですか。当方はSTATWORKSですが、論文含めて参考にさせていただきます。ありがとうございました

ANSWER

回答No2　｜　投稿日時：2023/07/27 10:07

村島です。2回目ですが、補足的な説明をさせていただきます。①と②のドッキングというのは、単に①と②を別々に計算して、総合的に判断するというものではありません。式でいえば、
目的変数ｙ、説明変数ｘ1, x2, 時間をｔとしますと、モデル式は、以下のようになります。

y(t)=a+b1x1(t)+b2x2(t)+r(t)
r(t)=ρ*r(t-1)+u(t)

ここで、r(t)は自己回帰AR(1)モデルでの残差（誤差）、u(t)はホワイトノイズとします。

ＳＰＳＳでは、a, b1, b2, ρ が自動計算され、出力されますが、たしかSTATWORKSはできなかったように覚えています。（別々には出力されますが、時系列を考えた上での説明変数の偏回帰係数ではありません。）
STATWORKSも日々アップデートされているので、今今はわかりません。もしくは、私の勘違い、記憶違いかもしれません。ご確認の上、お試しいただいたほうが良いかと思います。