「散布図」とは、キーワードからわかりやすく解説
1. 「散布図」とは
散布図とは、2つの特性間の相関を評価するために、縦と横にそれぞれ2特性値を配置し、サンプル毎にその2特性値に対応した座標にプロットした図のことです。
2. 「散布図」の概要
散布図とは、同一条件下で採られた2つのグループのデータを、それぞれX軸とY軸にプロットする事により、両者の関係を示した図です。散布図は2群に相関関係があるか、あればどの程度の関係にあるかを確認する事を目的としています。相関がある場合に片方の特性値が分かれば、もう片方の特性値範囲を予測する事が出来ます。相関度が高ければXの値を一定範囲にコントロールする事により、Yの値も一定範囲に制御する事が出来ます。またプロットした点が異常値であればすぐに気づくことが出来ます。
例えば体重をYとして、Xを身長、胸囲、腹囲と変えてそれぞれの散布図を描けば、どのXが最も体重と相関が高いかが散布図を観て分かると思います。
・X-Y相関のパターンとして
- Xが増加すればYも増加する右上がりの正の相関
- Xが増加すればYは減少する右下がりの負の相関
- X-Y間に関係性が観られない無相関
の3つがあります。
3. 「散布図」の注意点
注意点としては、一見無相関に見えても、層別を行った後に再度散布図を描けば相関が出てくるケースが多々あるという事です。例えば、研磨時間Xと研磨量Yに相関が観られなかったとします。 それを研磨装置で層別して、それぞれ散布図を描くと相関が観られる場合です。 相関度の高さを見る指標として、相関係数があります。相関係数の絶対値が1に近いほど相関が高く、両者の関係は直線に近くなります。 目安として0.7以上あれば相関があると言えます。
ただし相関有無は、相関係数のみで判断してはいけません。 直線関係に無い点の分布でも相関係数が高い場合があります。異常値に影響されて相関が低くなったり、逆に少ないデータで計算した相関係数が高かったりと実用には、注意が必要です。 あくまで“散布図で相関有無を確認”し、相関係数は相関度合の確認に用いて下さい。
4. 「散布図」の具体的な作成手順
散布図を正しく作成し、分析に活かすためには、以下のステップを踏むことが一般的です。
データの収集と整理: まず、対となる2つのデータ(変数)を準備します。例えば「気温と飲料の売上」や「製品の加熱時間と硬度」など、因果関係が想定される組み合わせを選びます。この際、データの組(サンプル数)は最低でも30対以上あることが望ましいとされています。
軸の決定: 一般的に横軸(X軸)には「原因」と考えられる独立変数を、縦軸(Y軸)にはその結果として生じる「結果」の従属変数を配置します。
プロットの実施: データの各ペアを座標点として打点していきます。
全体像の観察: 全ての点を打ち終えたら、特定の傾向(右上がり、右下がり、あるいはバラバラか)や、他の点から大きく離れた「外れ値」がないかを確認します。
5. 相関パターンの詳細な見極め方
散布図から読み取れる相関のパターンについて、より深く掘り下げてみましょう。単に「右上がりか、右下がりか」だけでなく、その「分布の形」に注目することが重要です。
強い正の相関: 点が右上がりの直線状に細長く密集している状態です。Xが決まれば、Yの値がほぼ特定できるため、管理の精度が非常に高くなります。
弱い負の相関: 点が右下がりの傾向を示しているものの、分布の幅が広く、モヤっとしている状態です。傾向は掴めますが、X以外の要因(誤差や別の変数)の影響も大きいことを示唆しています。
非線形(曲線)相関: 点が直線ではなく、放物線やS字状に並ぶことがあります。この場合、相関係数が低く算出されても、実際には強い関係性があるため、データの特性に応じた回帰分析が必要になります。
群管理の必要性: 全体ではバラバラに見えても、特定の範囲で点が固まっている場合(クラスター)は、背景に別の要因が隠れているサインです。
6. 実務における「散布図」の活用シーン
散布図は、ビジネスや製造現場において、単なる現状把握以上の価値を発揮します。
第一に「因果関係の仮説検証」です。「この作業ミスは、経験年数が短いから起きているのではないか」という仮説を立てた際、経験年数とミス件数の散布図を描くことで、その推測が正しいかどうかを視覚的に証明できます。
第二に「異常の早期発見」です。日常的に散布図を更新していると、普段の分布から明らかに逸脱した「一点」が現れることがあります。これは測定ミス、あるいは設備の不具合といった「特異な変化」を捉えるセンサーとなります。
第三に「プロセスの最適化」です。相関が確認できれば、目標とするY(品質や成果)を得るために、X(投入量や設定値)をどの程度に調整すべきかの指針が得られます。
7. まとめ
散布図は、一見複雑に見えるデータの中に潜む「秩序」を、誰の目にも明らかな形で視覚化してくれる強力なツールです。数値だけで判断するのではなく、まずは図として描き出し、その「顔つき」を観察する習慣をつけることが大切です。層別や外れ値の検討を重ねることで、散布図は単なるグラフから、問題解決のための確かな武器へと進化します。
