※いずれも質問投稿には会員登録が必要です
個人情報(個人名やメールアドレスなど)が公開されることはありません。


QUESTION 質問No.469

交互作用と説明変数

生産  | 投稿日時:
直交表で有意になった交互作用を重回帰分析で説明変数に取り上げることはできますか。


全て2水準にて、因子A,因子B,因子C,因子D,交互作用A×B
を割り付けた実験を行い、
有意となったのは、
因子A,因子C,交互作用A×Bだった場合です。

ここから重回帰もでるにてシミュレーションを行う予定です。

よろしくお願いいたします。



ANSWER
回答No1 | 投稿日時:

実験計画法や多変量解析を分かり易く説明することで、生産と品質の両立を可能とするようなコンサルを目指している村島です。
ご質問の答えを結論から申し上げると、「できます」=「可能」ということです。重回帰分析は、ご存じの通り、マルチコ(多重共線性)に注意を払う必要があります。これは、簡単に言えば、2つの説明変数間に高い相関があると、目的変数に対する相関の解釈が複雑になり、かつ、重回帰式の安定性がない(平たく言えば、次にデータとっても再現しない式)ということです。ところが、直交表(ご質問内容からすると直交表かと思われます、そうでないなら以下の話は、違ってきます)を用いた実験であれば、各列はすべて直交しています。すなわち、直交=内積ゼロ=相関なし ということです。よって、直交表の結果は、むしろ、直交実験こそ重回帰分析で解いたほうが早いのです。
ただ、交互作用がある場合には、単純に一つの変数と他の変数を線形置換できません。y=aA+bB+cAB のようにはできません。AとBに交互作用があるということは、同時に、線形変換できない効果があるということですから、その効果が、たとえばA,Bを単独の主効果とした表現にして、
効果がcABなのか、cA/Bなのか、cA2二乗×Bなのか、わかりませんから、可能ではあるが、線形に置き換えられないので、実際には難しいということになります。実際にどうするかは、複雑なため、生データを開示できることを前提に専門家にコンサルを申し込むことをお勧めします。このサイトでも、可能です。
宜しくご検討願います。




ANSWER
回答No2 | 投稿日時:

ご質問の情報量だけでは判断が難しいため、以下2つの視点でご回答します。

(1) 直交実験の結果(だけ)を用いて重回帰分析はできます。ただ、交互作用を含めるのは無理です。

(2) 重回帰分析には、項目数≧サンプル数の場合や多重共線の場合に計算ができないなど弱点があります。T法(1)やMSRの利用もお奨めします。いずれの場合も、有意かどうかは気にせずに全要因を使用し、診断機能を使うことで要因効果が解析できます。詳しいことは、以下をご参照ください。

https://www.angletry.com/mtsystem6.php
前田誠 : T法(1)の考え方を利用した新しい回帰法の提案,品質, 47、[2] (2017),p.71-80, 日本品質管理学会




ANSWER
回答No3 | 投稿日時:

再質問へのご回答です:

ご質問の場合、サンプル数は8、項目数はA,B,C,Dの4です。
重回帰、T法(1)、MSRの式はいずれも y=a*A+b*B+c*C+d*D なので、交互作用A×Bは直接入れることができません。

重回帰とMSRでは交互作用の要素が計算された回帰係数(a,b,c,d)に擦りこまれます。
T法(1)は、交互作用はあえて捨てるという割り切りです。




ANSWER
回答No4 | 投稿日時:

 おっしゃっている実験の目的が知りたいところです。何かしらの改善や最適化のために実験をやられているのであれば、交互作用を調べることより、考えるべきは意思決定が変わってしまうような強い交互作用を避けることです。AとBという因子があった場合、A1の条件ではB1がB2より圧倒的に良く、A2ではB2がB1より優れているというような強い交互作用を避けたいのです。これは技術的考察で対策できます。もちろん全く未知の領域では難しい戦術ではありますが、・・・。
 そのために何を考えるかは主に2つあります。
一つ目は何を特性値(英語でいうIndependent Variable)にするかです。例えば熱処理の機能でA:温度、B:時間という因子があります。収率とか歩留まりを特性値にとると強い交互作用があることは明確です。低い温度と短時間では歩留まりは「生焼け」で歩留まりは低いし、高い温度と長時間では「焦げ過ぎ」で歩留まりが低いのは当然です。要するに「生焼け」と「焦げ過ぎ」の区別がつかないのです。熱処理において熱処理をする対象物の温度の上昇を特性値にすれば交互作用は大きく減少します。もっと言えば温度の上昇がバラツキなく調度いい値になれば歩留まりは改善します。この場合特性値を対象物の温度上昇としてバラツキを減らすことを目的にすれば無駄な研究活動を減らせます。特性値の定義と目的の定義が重要なのです。機械、電気、電子、化学’、制御系にしても機能がエネルギー変換ですからエネルギー変換のバラツキとエネルギー変換の効率に注目することが大事です。
 二つあるといった二つ目は実験で取り上げる因子の定義です。熱処理の場合で説明します。特性値を上手く定義しても因子の定義を下手にすると失敗します。熱処理でいえば、A;熱処理温度とB:熱処理時間と定義するのではなく、A:総熱エネルギーとB:熱処理時間とするなどです。
 このような洞察を議論をして進めていくことのほうが研究の効率を上げることは間違いないと思っています。以上のことはある意味常識的ですがここまで考えていない研究者が多いことは間違いありません。
 わたくしの父田口玄一はこのようなことを主張していたのです。




ANSWER
回答No5 | 投稿日時:

村島です。再度のお答えします。
直交実験でも、2水準では、そもそも重回帰分析もT法も意味ないです。必ずし直線になります。
式に意味がありません。2点結べば、必ず直線ですから。
又、もし3水準以上であっても、交互作用ある場合の重回帰分析は初心者にはまず無理です。理由は最初に申し上げた通りです。コンサルへの仕事依頼して下さい。
簡単なやり方としては、ストレートに直交多項式に展開したらいいです。交互作用あっても大丈夫です。