単回帰分析で二変数間の従属関係を知る

投稿日

1.単回帰分析とは

 一般的に2変数以上の多変量のデータで、ある1変数を残りの変数で説明しようとする解析法を回帰分析と言います。主となる変数は"目的変数"もしくは従属変数と呼び、目的変数を説明する変数を"説明変数"もしくは独立変数と言います。相関分析では2変数の関係を対等とみなしているところが、大きな違いです。目的変数に対して説明変数が一つであるものが単回帰分析であり、説明変数が二つ以上のものを重回帰分析と呼びます。単回帰も重回帰も考え方は同じです。

 目的変数をY、説明変数をXとした場合、YとXの関係を説明する式を単回帰式と呼び、単回帰式はY=aX+bで与えられます。aは回帰式の傾きを示し、回帰係数と呼称します。bは切片です。

散布図と回帰式 単回帰式はエクセルを用いてXY散布図を描くと、簡単に求められます。右の図1で示すように、マーカー上を右クリックすれば近似式の追加コマンドが出ますから、線形近似を選択すれば図中に表示出来ます。

 この近似式はデータ群の中央付近を通過しているように見えます。この単回帰式は最小二乗法という方法で求めることが出来、その式自体は上述の様にエクセルを用いて簡単に求めることが出来ますが、回帰分析の考え方を理解するため最小二乗法による求め方を次に解説します。  
                             図1.散布図と回帰式

2.単回帰のイメージ

 回帰直線ではあるxiにおけるYの値を予測する事になりますが、実際の測定値yiは一定の範囲でばらつきます。つまり一つのxiに対しyiが正規分布します。例えば身長と体重の散布データの場合、身長は160cmでも体重は様々に異なる人がいますから同一の値にならずに一定の範囲にばらつき、回帰直線と散布データの関係は下図2のようなイメージとなります。

単回帰とデータのばらつき
図2.単回帰とデータのばらつき

 Y値をXで上手く説明出来ている回帰式、即ち回帰方程式の精度が高い場合は、直線が各分布の平均点を通過している事になります。上図2で表示している分布の幅が狭ければ、データの多くは直線付近に存在しており、目的変数Yは説明変数X一つで良く説明が出来る事を意味します。
  

3.回帰式の求め方

 上の図2からもわかるように、X=xiの時に回帰式から予測されたY値と観測Y値の間には誤差が生じます。この誤差が最小となる様に回帰係数と切片を求める事になります。

 観測値と予測値の差を下図3のように残差と呼びます。また残差をデータ全体で算出し誤差を定義したものが次式Qeで表される残差平方和です。
残差平方和


回帰式と残差このQeが最小値となるように回帰係数と切片を決める方法が最小二乗法なのです。

 このQeを最小とするaとbを計算で求めるのは非常に面倒なので、エクセルのソルバー機能を用いて求めることができます。然しながら実際の算出には次に述べる回帰方程式を用いる方法が最も簡便且つ一般的方法です。


  


                          図3
.回帰式と残差の関係    

4.回帰方程式の係数計算

 目的変数Y、説明変数Xの2変数の回帰式がY=aX+bで表される時、回帰係数aと切片bは以下の回帰方程式で求めること...

1.単回帰分析とは

 一般的に2変数以上の多変量のデータで、ある1変数を残りの変数で説明しようとする解析法を回帰分析と言います。主となる変数は"目的変数"もしくは従属変数と呼び、目的変数を説明する変数を"説明変数"もしくは独立変数と言います。相関分析では2変数の関係を対等とみなしているところが、大きな違いです。目的変数に対して説明変数が一つであるものが単回帰分析であり、説明変数が二つ以上のものを重回帰分析と呼びます。単回帰も重回帰も考え方は同じです。

 目的変数をY、説明変数をXとした場合、YとXの関係を説明する式を単回帰式と呼び、単回帰式はY=aX+bで与えられます。aは回帰式の傾きを示し、回帰係数と呼称します。bは切片です。

散布図と回帰式 単回帰式はエクセルを用いてXY散布図を描くと、簡単に求められます。右の図1で示すように、マーカー上を右クリックすれば近似式の追加コマンドが出ますから、線形近似を選択すれば図中に表示出来ます。

 この近似式はデータ群の中央付近を通過しているように見えます。この単回帰式は最小二乗法という方法で求めることが出来、その式自体は上述の様にエクセルを用いて簡単に求めることが出来ますが、回帰分析の考え方を理解するため最小二乗法による求め方を次に解説します。  
                             図1.散布図と回帰式

2.単回帰のイメージ

 回帰直線ではあるxiにおけるYの値を予測する事になりますが、実際の測定値yiは一定の範囲でばらつきます。つまり一つのxiに対しyiが正規分布します。例えば身長と体重の散布データの場合、身長は160cmでも体重は様々に異なる人がいますから同一の値にならずに一定の範囲にばらつき、回帰直線と散布データの関係は下図2のようなイメージとなります。

単回帰とデータのばらつき
図2.単回帰とデータのばらつき

 Y値をXで上手く説明出来ている回帰式、即ち回帰方程式の精度が高い場合は、直線が各分布の平均点を通過している事になります。上図2で表示している分布の幅が狭ければ、データの多くは直線付近に存在しており、目的変数Yは説明変数X一つで良く説明が出来る事を意味します。
  

3.回帰式の求め方

 上の図2からもわかるように、X=xiの時に回帰式から予測されたY値と観測Y値の間には誤差が生じます。この誤差が最小となる様に回帰係数と切片を求める事になります。

 観測値と予測値の差を下図3のように残差と呼びます。また残差をデータ全体で算出し誤差を定義したものが次式Qeで表される残差平方和です。
残差平方和


回帰式と残差このQeが最小値となるように回帰係数と切片を決める方法が最小二乗法なのです。

 このQeを最小とするaとbを計算で求めるのは非常に面倒なので、エクセルのソルバー機能を用いて求めることができます。然しながら実際の算出には次に述べる回帰方程式を用いる方法が最も簡便且つ一般的方法です。


  


                          図3
.回帰式と残差の関係    

4.回帰方程式の係数計算

 目的変数Y、説明変数Xの2変数の回帰式がY=aX+bで表される時、回帰係数aと切片bは以下の回帰方程式で求めることが出来ます。
回帰方程式の回帰係数
 ここでxとyは変数xとyの平均値で、sx2はxの分散値、sxyはxとyの共分散です。

                         表1.回帰係数計算用のデータ
回帰式計算用のデータ この回帰方程式を使って、右表1のデータで回帰係数aと切片bを求めてみます。このデータは相関分析の相関係数計算で用いているものと同じです。

 まず表1のデータからxとyの共分散を計算します。エクセル関数COVARを用いて計算するとsxy=23.7となります。

 そして、Xの分散はsx2=37.96です。

 これを回帰方程式に入力すると、
a=23.73/37.96=0.625
b=51.23-0.625×159.7=-48.60

即ち回帰式は次式の様になります。

Y=0.625X-48.60

   続きを読むには・・・


この記事の著者

眞名子 和義

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します


「回帰分析」の他のキーワード解説記事

もっと見る
重回帰分析とは

         今回は、重回帰分析をおこなうために、ある目的変数に対して相関分析を行い、相関係数の高い項目をピッアップし、回帰式を作成したい場合を...

         今回は、重回帰分析をおこなうために、ある目的変数に対して相関分析を行い、相関係数の高い項目をピッアップし、回帰式を作成したい場合を...


回帰分析とは データ分析講座(その157)

   「回帰分析」とは  回帰分析では、狙いとする特性(従属変数)に対して、複数の影響変数が組み合わされたサンプルデータから、...

   「回帰分析」とは  回帰分析では、狙いとする特性(従属変数)に対して、複数の影響変数が組み合わされたサンプルデータから、...


エクセルでの重回帰分析

 重回帰分析といえば説明変数が複数の回帰式をいいます。ものづくりの場面ではもちろん、マーケット調査や心理学など社会科学の分野でも活用されている一方で、単回...

 重回帰分析といえば説明変数が複数の回帰式をいいます。ものづくりの場面ではもちろん、マーケット調査や心理学など社会科学の分野でも活用されている一方で、単回...


「回帰分析」の活用事例

もっと見る
統計手法による改善事例:検査コスト削減〔回帰分析〕

 製造メーカーG社は製品品質の保証を最終分析結果にて行っていましたが、分析結果を待っての出荷となる為、 生産計画が組みにくい問題点を抱えていました。最終検...

 製造メーカーG社は製品品質の保証を最終分析結果にて行っていましたが、分析結果を待っての出荷となる為、 生産計画が組みにくい問題点を抱えていました。最終検...


回帰分析の応用事例

   今回は、統計手法の一つである「回帰分析」の解析事例を解説します。    事例として、ほぼ同じタイミングで製造を開始した製品(約200個)に現時...

   今回は、統計手法の一つである「回帰分析」の解析事例を解説します。    事例として、ほぼ同じタイミングで製造を開始した製品(約200個)に現時...