因子分析の概要と考え方

更新日

投稿日

 

1. 因子分析とは

 因子分析は多変量解析の手法の一つで、ある観測された変数(科目テストの各教科の成績など)が、どのような潜在的な変数(観測されない、仮定された変数、例えば生徒の読解力、発想力、など)から影響を受けているかを探る手法です。多変量解析は大きく分けて、将来の「予測」をする教師あり学習と、数多いデータを「要約」する教師なし学習に分けられますが、因子分析はデータを要約する教師なし学習に当たります。因子分析は当初、心理学の特に心理尺度の研究手法として利用されていましたが、現在は経済学や医学など多様な学問分野に用いられ、ビジネス現場では特にマーケティングの分析で頻繁に利用されます。

2. 因子分析の考え方

 因子分析の考え方は、まず、例えば、小学校での生徒の能力を測るためにいくつかの科目テストを行うことを考えます。各生徒の試験成績について、各教科の成績を並べてみるだけでは、なぜその成績になるのか、科目により点数差があるのはなぜなのか、などの要因は分かりません。そこで、生徒の各教科の成績を総合的に分析し、成績の背後に隠れた成績を左右する個人の能力、読解力、表現力、計算力などにより少数の「共通因子」を見出すことを考えます。各生徒の成績は、それぞれが持つ共通因子の能力の大小やその組み合わせ及び、各教科固有の要因である「独自因子(特殊因子)」によって説明できると考えられます。

図1.因子分析の考え方

 例えば、ある生徒で、国語、算数、理科、社会の4科目につき、x1 , x2 , x3 , x4が得られたとし、それぞれの科目の平均点がμ1 , μ2 , μ3 , μであった場合の平均点との差を、潜在変数である共通因子fと独自因子εで表現すると、上記のような式が考えられます。ここで「共通因子」とは、分析対象となる説明変数の組(ここでは、各科目の得点の組)に共通の因子で複数存在します。この例では読解力f1、表現力f、計算力fとしています。「独自因子」は、各変数(ここでは各科目)に独自に関わる因子で、誤差と考える場合もあります。共通因子にかかる係数λは、因子負荷(量)と呼ばれ、それぞれの観測変数(ここでは、各科目の得点)がその因子にどの程度反映されているかを示すもので、因子の観測変数に対する影響の強さを示すものです。これは、多変量回帰分析の偏回帰係数に相当します。

 因子分析の最大の目的は、共通因子の特定と因子負荷量の決定です。それ以外に「因子寄与」と「共通性」を求めます。因子寄与とは、観測変数(ここでは、各科目の得点)がある因子で説明できる大きさを表す指標で、因子が観測変数に対してどの程度寄与しているかという指標です。因子寄与率すなわち、因子寄与を%表示したもので表現します。共通性とは、観測変数のうち共通因子によって説明される割合のことです。基本的に共通性の最大値は1であり、(1-共通性=独自性)の関係が成り立ちます。

3. 因子分析の手順

 ①因子数の決定:分析したいデータから「固有値」を計算し、これに基づいて共通因子の数を決定します。固有値とは各因子の全項目に対する支配度に相当します。従って固有値が大きいほど、影響の大きい因子ということになります。

 ②因子負荷量の算出:次に共通因子の影響の強さを示す「因子負荷量」を計算します。計算方法は多くの種類があります。最も一般的なのは「最尤(さいゆう)法」です。また「因子寄与」、「寄与率」、「共通性」などが得られます。

 ③因子軸の回転:各観測変数の因子負荷の散布図グラフは、そのままでは共通因子が何を指しているのか分かりにくい場合が多いため、解釈しやすいようにグラフの軸を、各因子の数値が軸に沿って位置するように回転させます。回転の計算方法は多くの種類があり、バリマックス法やプロマックス法という方法がよく使われます。

4. 主成分分析との違い

 多変量解析の中で、因子分析と同じようにデータを要約する教師なし学習に「主成分分析」があります。主成分分析では、主成分と呼ばれる合成変数を求めますが、これは複数の説明変数から、導き出される結果を反映しています(図2)。

図2. 主成分分析の主成分


 一方、因子分析で求める共通因子は、複数の説明変数を説明する要因という位置づけです(図3)。従って、主成分分析と因子分析は求めているものや視点が異なります。また主成分分析では、因子分析の独自因子のような誤差は考慮しません。このように全く異なる方法ですが、計算方法が似通っているため、しばしば似たような結果が出ることがあります。

図3. 因子分析の共通因子と独自因子


【参考文献】
1)  Wikipedia「因子分析」
https://ja.wikipedia.org/wiki/%E5%9B%A0%...

 

1. 因子分析とは

 因子分析は多変量解析の手法の一つで、ある観測された変数(科目テストの各教科の成績など)が、どのような潜在的な変数(観測されない、仮定された変数、例えば生徒の読解力、発想力、など)から影響を受けているかを探る手法です。多変量解析は大きく分けて、将来の「予測」をする教師あり学習と、数多いデータを「要約」する教師なし学習に分けられますが、因子分析はデータを要約する教師なし学習に当たります。因子分析は当初、心理学の特に心理尺度の研究手法として利用されていましたが、現在は経済学や医学など多様な学問分野に用いられ、ビジネス現場では特にマーケティングの分析で頻繁に利用されます。

2. 因子分析の考え方

 因子分析の考え方は、まず、例えば、小学校での生徒の能力を測るためにいくつかの科目テストを行うことを考えます。各生徒の試験成績について、各教科の成績を並べてみるだけでは、なぜその成績になるのか、科目により点数差があるのはなぜなのか、などの要因は分かりません。そこで、生徒の各教科の成績を総合的に分析し、成績の背後に隠れた成績を左右する個人の能力、読解力、表現力、計算力などにより少数の「共通因子」を見出すことを考えます。各生徒の成績は、それぞれが持つ共通因子の能力の大小やその組み合わせ及び、各教科固有の要因である「独自因子(特殊因子)」によって説明できると考えられます。

図1.因子分析の考え方

 例えば、ある生徒で、国語、算数、理科、社会の4科目につき、x1 , x2 , x3 , x4が得られたとし、それぞれの科目の平均点がμ1 , μ2 , μ3 , μであった場合の平均点との差を、潜在変数である共通因子fと独自因子εで表現すると、上記のような式が考えられます。ここで「共通因子」とは、分析対象となる説明変数の組(ここでは、各科目の得点の組)に共通の因子で複数存在します。この例では読解力f1、表現力f、計算力fとしています。「独自因子」は、各変数(ここでは各科目)に独自に関わる因子で、誤差と考える場合もあります。共通因子にかかる係数λは、因子負荷(量)と呼ばれ、それぞれの観測変数(ここでは、各科目の得点)がその因子にどの程度反映されているかを示すもので、因子の観測変数に対する影響の強さを示すものです。これは、多変量回帰分析の偏回帰係数に相当します。

 因子分析の最大の目的は、共通因子の特定と因子負荷量の決定です。それ以外に「因子寄与」と「共通性」を求めます。因子寄与とは、観測変数(ここでは、各科目の得点)がある因子で説明できる大きさを表す指標で、因子が観測変数に対してどの程度寄与しているかという指標です。因子寄与率すなわち、因子寄与を%表示したもので表現します。共通性とは、観測変数のうち共通因子によって説明される割合のことです。基本的に共通性の最大値は1であり、(1-共通性=独自性)の関係が成り立ちます。

3. 因子分析の手順

 ①因子数の決定:分析したいデータから「固有値」を計算し、これに基づいて共通因子の数を決定します。固有値とは各因子の全項目に対する支配度に相当します。従って固有値が大きいほど、影響の大きい因子ということになります。

 ②因子負荷量の算出:次に共通因子の影響の強さを示す「因子負荷量」を計算します。計算方法は多くの種類があります。最も一般的なのは「最尤(さいゆう)法」です。また「因子寄与」、「寄与率」、「共通性」などが得られます。

 ③因子軸の回転:各観測変数の因子負荷の散布図グラフは、そのままでは共通因子が何を指しているのか分かりにくい場合が多いため、解釈しやすいようにグラフの軸を、各因子の数値が軸に沿って位置するように回転させます。回転の計算方法は多くの種類があり、バリマックス法やプロマックス法という方法がよく使われます。

4. 主成分分析との違い

 多変量解析の中で、因子分析と同じようにデータを要約する教師なし学習に「主成分分析」があります。主成分分析では、主成分と呼ばれる合成変数を求めますが、これは複数の説明変数から、導き出される結果を反映しています(図2)。

図2. 主成分分析の主成分


 一方、因子分析で求める共通因子は、複数の説明変数を説明する要因という位置づけです(図3)。従って、主成分分析と因子分析は求めているものや視点が異なります。また主成分分析では、因子分析の独自因子のような誤差は考慮しません。このように全く異なる方法ですが、計算方法が似通っているため、しばしば似たような結果が出ることがあります。

図3. 因子分析の共通因子と独自因子


【参考文献】
1)  Wikipedia「因子分析」
https://ja.wikipedia.org/wiki/%E5%9B%A0%E5%AD%90%E5%88%86%E6%9E%90

2)  因子分析
http://cogpsy.educ.kyoto-u.ac.jp/personal/Kusumi/datasem13/masuda.pdf

3)  因子分析とは~市場調査ならインテージ
https://www.intage.co.jp/glossary/050/

4)  S+rescue [因子分析] ―数理システム
https://www.msi.co.jp/splus/learning/rescue/factor.html

5)  主成分分析は因子分析でない!
http://www.sigmath.es.osaka-u.ac.jp/~kano/research/seminar/30BSJ/kano.pdf

6)  心理測定の立場から見た因子分析と主成分分析
http://www.sigmath.es.osaka-u.ac.jp/~kano/research/seminar/30BSJ/murakami.pdf

   続きを読むには・・・


この記事の著者

石井 一夫

ゲノム科学、ビッグデータとクラウドコンピューティングが専門です

ゲノム科学、ビッグデータとクラウドコンピューティングが専門です