その他の統計手法 その1、箱ひげ図 / Box and Whisker plot

投稿日

 ヒストグラムは分布形状を知る上で非常に有効なツールですが、形状を形作るにはそれなりのデータ数が必要となります。サンプル数が5~20程度と少ないと歪な分布となる為、形状把握には適さない事があります。 一方で箱ひげ図は分布の詳細情報はヒストグラムに及びませんが、分布の中心や幅の情報を持った箱型のマーカーで表わされるため他の分布との比較に適しています。例えば複数の異なる水準で実験を行い、各水準のサンプル数が5個づつで比較を行う場合は箱ひげ図の方がビジュアル的に差異が把握しやすく効果的です。箱ひげ図は英語ではボックスプロット(Box Plot)と呼ばれる様に四角い箱形状で分布の大きさ(中心と分布の幅)を表します。分布が小さくシャープな形状であればボックスの高さが低く、分布がブロードであれば長いボックス形状となります。
 

1.箱ひげ図の作成方法

(1)データよりメジアンとボックスの上側ヒンジと下側ヒンジ点を計算します
   上側は相対累積度数が75%に相当する点で、下側は25%に相当する点です
(2)上側ヒンジをボックスの上辺、下側ヒンジをボックスの下辺とした箱を作り
   計算したメジアンを横線として引きます
(3)箱の高さをL(75%点と25%点の間の差)とし、髭の長さを決めます
(4)上ヒゲはボックスの上ヒンジから上に1.5Lの範囲で最も大きいデータまで繋い
   だもの、下ヒゲは逆に下ヒンジから下に1.5Lの範囲で最も小さいデータまでを
   繋いだもの
(5)最後にヒゲの先端よりも外側にある点を外れ値として打点×で表示する
     この様にして作成した箱ひげ図は図1のような形となります。
                       hakohuge1        
図1.箱ひげ図
 
 75%点がボックスの上ヒンジ位置となり、25%点がボックスの下ヒンジ値となります。上ヒゲはボックスの上端(75%値)から上方に箱の高さLの1.5倍の範囲に在り且つ最大点まで線を引き作成します。同様にボックスの下端(25%値)から下方へ1.5Lの範囲に在り且つ最小点まで線を引き作成します。上ヒゲ、下ヒゲより外側の点を外れ値として打点します。
 
 分布が正規分布形状なら中央値を挟んで上下に対象な形状となります。分布がシャープであればボックスは小さく、ヒゲの長さも短くなります。逆にデータのばらつきが大きければ箱は大きくなり、外れ値も見られます。
 
 n数が少ない実験データは下図の様に複数の箱ヒゲ図を用いて比較すればヒストグラムより差異がわかりやすく第三者に提示する場合も解りやすいグラフとなります。
 
          hakohuge2
図2.箱ひげ図イメージ
 
 図2のケースでは条件Aは箱が小さくヒゲの長さも短いので4つの条件の中で最も分布が狭くばらつきも小さい事がわかります...
 ヒストグラムは分布形状を知る上で非常に有効なツールですが、形状を形作るにはそれなりのデータ数が必要となります。サンプル数が5~20程度と少ないと歪な分布となる為、形状把握には適さない事があります。 一方で箱ひげ図は分布の詳細情報はヒストグラムに及びませんが、分布の中心や幅の情報を持った箱型のマーカーで表わされるため他の分布との比較に適しています。例えば複数の異なる水準で実験を行い、各水準のサンプル数が5個づつで比較を行う場合は箱ひげ図の方がビジュアル的に差異が把握しやすく効果的です。箱ひげ図は英語ではボックスプロット(Box Plot)と呼ばれる様に四角い箱形状で分布の大きさ(中心と分布の幅)を表します。分布が小さくシャープな形状であればボックスの高さが低く、分布がブロードであれば長いボックス形状となります。
 

1.箱ひげ図の作成方法

(1)データよりメジアンとボックスの上側ヒンジと下側ヒンジ点を計算します
   上側は相対累積度数が75%に相当する点で、下側は25%に相当する点です
(2)上側ヒンジをボックスの上辺、下側ヒンジをボックスの下辺とした箱を作り
   計算したメジアンを横線として引きます
(3)箱の高さをL(75%点と25%点の間の差)とし、髭の長さを決めます
(4)上ヒゲはボックスの上ヒンジから上に1.5Lの範囲で最も大きいデータまで繋い
   だもの、下ヒゲは逆に下ヒンジから下に1.5Lの範囲で最も小さいデータまでを
   繋いだもの
(5)最後にヒゲの先端よりも外側にある点を外れ値として打点×で表示する
     この様にして作成した箱ひげ図は図1のような形となります。
                       hakohuge1        
図1.箱ひげ図
 
 75%点がボックスの上ヒンジ位置となり、25%点がボックスの下ヒンジ値となります。上ヒゲはボックスの上端(75%値)から上方に箱の高さLの1.5倍の範囲に在り且つ最大点まで線を引き作成します。同様にボックスの下端(25%値)から下方へ1.5Lの範囲に在り且つ最小点まで線を引き作成します。上ヒゲ、下ヒゲより外側の点を外れ値として打点します。
 
 分布が正規分布形状なら中央値を挟んで上下に対象な形状となります。分布がシャープであればボックスは小さく、ヒゲの長さも短くなります。逆にデータのばらつきが大きければ箱は大きくなり、外れ値も見られます。
 
 n数が少ない実験データは下図の様に複数の箱ヒゲ図を用いて比較すればヒストグラムより差異がわかりやすく第三者に提示する場合も解りやすいグラフとなります。
 
          hakohuge2
図2.箱ひげ図イメージ
 
 図2のケースでは条件Aは箱が小さくヒゲの長さも短いので4つの条件の中で最も分布が狭くばらつきも小さい事がわかります。条件CはAと同様のシャープな分布ですが左右に裾野を引っ張った分布であることが予想できます。一方で条件Bは最も箱が大きくブロードな分布であることが直感的に解ります。この様に箱ひげ図は複数条件の分布を簡易的に比較するのに適したツールです。
 

2.箱ひげ図使用時の注意点

 箱ひげ図は少数データの層間比較に便利ですが、データが少ない故に数点の異常値で箱の形状が影響を受けやすくなります。異常値1点を除くだけで長い箱が小さく変化する場合もありますのでデータの正当性は充分なチェックが必要です。逆に正当なばらつきで生じた値を外れ値として削除し評価結果を都合よく操作しないよう意識しなければなりません。
  

   続きを読むには・・・


この記事の著者

眞名子 和義

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します


「品質マネジメント総合」の他のキーワード解説記事

もっと見る
4M変化点管理の目的とポイント

 4M変化点管理で重要なキーワードは「異常」「先手管理」「重点項目」「予測できる変化点」「予測できない変化点」です。取引先からの要望で変化点管理を実施しな...

 4M変化点管理で重要なキーワードは「異常」「先手管理」「重点項目」「予測できる変化点」「予測できない変化点」です。取引先からの要望で変化点管理を実施しな...


中国進出での失敗事例 中国工場の品質改善(その1)

         【中国工場の品質改善 連載全84回から各章の冒頭ページ 】 【第1章】中...

         【中国工場の品質改善 連載全84回から各章の冒頭ページ 】 【第1章】中...


~品質を確保する活動~ ファブレス小売業の品質保証(その5)

  特定分野を長期間に渡って学び・経験された方は多いと思います。しかし、同じ製造業でも業界が異なると、慣習や考え方の基準は変ります。まして...

  特定分野を長期間に渡って学び・経験された方は多いと思います。しかし、同じ製造業でも業界が異なると、慣習や考え方の基準は変ります。まして...


「品質マネジメント総合」の活用事例

もっと見る
コストを下げて品質を改善した洗浄機の事例

    高価な機械ほど、適切な利用状態を追及する必要がありますが、同じ洗浄機械を使用していても非常に良い表面改質を実現できる会社とそうでない会社がありま...

    高価な機械ほど、適切な利用状態を追及する必要がありますが、同じ洗浄機械を使用していても非常に良い表面改質を実現できる会社とそうでない会社がありま...


全社的品質管理活動の第一歩とは

 企業はサービスを提供しお客様から対価を得る事で経営が成り立ちます。サービスに満足し継続して利用していただくにはお客様目線で考えることが大切です。私には幼...

 企業はサービスを提供しお客様から対価を得る事で経営が成り立ちます。サービスに満足し継続して利用していただくにはお客様目線で考えることが大切です。私には幼...


品質管理をやさしく実践し、極意に至る

  ある企業から、品質向上に向けて新たなスタートを切るべく、「品質管理をやさしく実践し、極意に至る」道について講演してほしいとの要請を受けました。難しい話...

  ある企業から、品質向上に向けて新たなスタートを切るべく、「品質管理をやさしく実践し、極意に至る」道について講演してほしいとの要請を受けました。難しい話...