※いずれも質問投稿には会員登録が必要です
個人情報(個人名やメールアドレスなど)が公開されることはありません。


QUESTION 質問No.517

相関比と決定係数

全体/その他  | 投稿日時:
質的データ(A B)と量的データにて散布図(x軸が質的データ)を書き、相関比を計算します。決定係数であてはまりを確認する場合は、単純に相関比を2乗すれば良いでしょうか?よろしくお願い致します。


ANSWER
回答No1 | 投稿日時:

決定係数の求め方の詳細は、以下のサイトなどを参照してください。
https://bellcurve.jp/statistics/blog/15664.html

相関比とは相関係数のことでしょうか?
相関係数は、正の分散を持つ確率変数 X, Y が与えられたとき、
共分散cov(X,Y)を、標準偏差sd(X), sd(Y)の積で割った以下の式で求めます。

相関係数 = cov(X,Y) / sd(X) * sd(Y)

リンク先にあるように、決定係数は、回帰平方和を全平方和で割ることで求めることができます。

相関係数の2乗が、たまたま決定係数になる場合もありますが、
https://mathtrain.jp/ketteikeisu

そもそも異なる考え方から定義されたものなので、そうならないケースもあるので、そのような計算はおすすめしないです。
https://biolab.sakura.ne.jp/r2.html




ANSWER
回答No2 | 投稿日時:

多変量解析や実験計画法、最近ではQC7つ道具に凝っている、村島技術士事務所の村島です。ご質問のご回答に、簡単にお答えさせて頂きます。

結論:決定係数を相関比の二乗にしても、求められない。意味がない。

説明:決定係数は相関係数の二乗になります。問題は、相関係数と相関比とは全く違うものだということです。相関係数は、共分散と2変数それぞれの分散から求められますが、まず、ご質問の場合、共分散もxの分散も計算できません(分散は量的データでないと計算できません。たとえば、リンゴとミカンのような質的データは分散計算のしようがありません。)よって、相関係数は求められません。このことからも相関係数と相関比は異なるものだということが分かると思います。
 相関比は、判別分析ではよく使われますが、一言でいえば、全変動に対するグループ間変動(級間変動ともいいます。級内変動に対する言葉で、全変動は級間変動と級内変動の和になります。)の比です。これはいくらでも計算できます。ですから、質的データにも適用できるわけです。この式は、よく似た言葉ではありますが、相関係数とは全く違います。
 統計学はよく似た言葉があって、ややこしいですね。

                               村島
                             




ANSWER
回答No3 | 投稿日時:

村島です。いきなりですが、補足です。説明のところで、決定係数は相関係数の二乗と書きましたが、正確には「相関係数の二乗は決定係数になる」です。決定係数の定義は、いろいろあるので、必ずしも相関係数の二乗となるわけではないからです。相関係数の二乗なら、必ず正の数になりますが、そうでない定義式からの決定係数は負になることもあります。
 いずれにせよ、決定係数は『相関比』の二乗にはなりません。
 




ANSWER
回答No4 | 投稿日時:

補足質問へのご回答です。結論から言えば、問題ありません。2水準の層別因子であれば、水準値を0,1にしようが、ー1と1にしようが、なにをもってきても決定係数は同じになり、かつ相関比に一致します。3水準以上になると、水準値のとりかたに注意しないといけませんが、ご存じのことと思い、説明は省かせていただきます。(重回帰分析でも同じ)
2水準の時には、水準値になにをもってきても同じ結果になるので問題ないですが、相関比を2乗してはいけません。相関比と決定係数は、一致していますから、2乗する必要は全くありません。