その他の統計手法 その1、箱ひげ図 / Box and Whisker plot

投稿日

 ヒストグラムは分布形状を知る上で非常に有効なツールですが、形状を形作るにはそれなりのデータ数が必要となります。サンプル数が5~20程度と少ないと歪な分布となる為、形状把握には適さない事があります。 一方で箱ひげ図は分布の詳細情報はヒストグラムに及びませんが、分布の中心や幅の情報を持った箱型のマーカーで表わされるため他の分布との比較に適しています。例えば複数の異なる水準で実験を行い、各水準のサンプル数が5個づつで比較を行う場合は箱ひげ図の方がビジュアル的に差異が把握しやすく効果的です。箱ひげ図は英語ではボックスプロット(Box Plot)と呼ばれる様に四角い箱形状で分布の大きさ(中心と分布の幅)を表します。分布が小さくシャープな形状であればボックスの高さが低く、分布がブロードであれば長いボックス形状となります。
 

1.箱ひげ図の作成方法

(1)データよりメジアンとボックスの上側ヒンジと下側ヒンジ点を計算します
   上側は相対累積度数が75%に相当する点で、下側は25%に相当する点です
(2)上側ヒンジをボックスの上辺、下側ヒンジをボックスの下辺とした箱を作り
   計算したメジアンを横線として引きます
(3)箱の高さをL(75%点と25%点の間の差)とし、髭の長さを決めます
(4)上ヒゲはボックスの上ヒンジから上に1.5Lの範囲で最も大きいデータまで繋い
   だもの、下ヒゲは逆に下ヒンジから下に1.5Lの範囲で最も小さいデータまでを
   繋いだもの
(5)最後にヒゲの先端よりも外側にある点を外れ値として打点×で表示する
     この様にして作成した箱ひげ図は図1のような形となります。
                       hakohuge1        
図1.箱ひげ図
 
 75%点がボックスの上ヒンジ位置となり、25%点がボックスの下ヒンジ値となります。上ヒゲはボックスの上端(75%値)から上方に箱の高さLの1.5倍の範囲に在り且つ最大点まで線を引き作成します。同様にボックスの下端(25%値)から下方へ1.5Lの範囲に在り且つ最小点まで線を引き作成します。上ヒゲ、下ヒゲより外側の点を外れ値として打点します。
 
 分布が正規分布形状なら中央値を挟んで上下に対象な形状となります。分布がシャープであればボックスは小さく、ヒゲの長さも短くなります。逆にデータのばらつきが大きければ箱は大きくなり、外れ値も見られます。
 
 n数が少ない実験データは下図の様に複数の箱ヒゲ図を用いて比較すればヒストグラムより差異がわかりやすく第三者に提示する場合も解りやすいグラフとなります。
 
          hakohuge2
図2.箱ひげ図イメージ
 
 図2のケースでは条件Aは箱が小さくヒゲの長さも短いので4つの条件の中で最も分布が狭くばらつきも小さい事がわかります...
 ヒストグラムは分布形状を知る上で非常に有効なツールですが、形状を形作るにはそれなりのデータ数が必要となります。サンプル数が5~20程度と少ないと歪な分布となる為、形状把握には適さない事があります。 一方で箱ひげ図は分布の詳細情報はヒストグラムに及びませんが、分布の中心や幅の情報を持った箱型のマーカーで表わされるため他の分布との比較に適しています。例えば複数の異なる水準で実験を行い、各水準のサンプル数が5個づつで比較を行う場合は箱ひげ図の方がビジュアル的に差異が把握しやすく効果的です。箱ひげ図は英語ではボックスプロット(Box Plot)と呼ばれる様に四角い箱形状で分布の大きさ(中心と分布の幅)を表します。分布が小さくシャープな形状であればボックスの高さが低く、分布がブロードであれば長いボックス形状となります。
 

1.箱ひげ図の作成方法

(1)データよりメジアンとボックスの上側ヒンジと下側ヒンジ点を計算します
   上側は相対累積度数が75%に相当する点で、下側は25%に相当する点です
(2)上側ヒンジをボックスの上辺、下側ヒンジをボックスの下辺とした箱を作り
   計算したメジアンを横線として引きます
(3)箱の高さをL(75%点と25%点の間の差)とし、髭の長さを決めます
(4)上ヒゲはボックスの上ヒンジから上に1.5Lの範囲で最も大きいデータまで繋い
   だもの、下ヒゲは逆に下ヒンジから下に1.5Lの範囲で最も小さいデータまでを
   繋いだもの
(5)最後にヒゲの先端よりも外側にある点を外れ値として打点×で表示する
     この様にして作成した箱ひげ図は図1のような形となります。
                       hakohuge1        
図1.箱ひげ図
 
 75%点がボックスの上ヒンジ位置となり、25%点がボックスの下ヒンジ値となります。上ヒゲはボックスの上端(75%値)から上方に箱の高さLの1.5倍の範囲に在り且つ最大点まで線を引き作成します。同様にボックスの下端(25%値)から下方へ1.5Lの範囲に在り且つ最小点まで線を引き作成します。上ヒゲ、下ヒゲより外側の点を外れ値として打点します。
 
 分布が正規分布形状なら中央値を挟んで上下に対象な形状となります。分布がシャープであればボックスは小さく、ヒゲの長さも短くなります。逆にデータのばらつきが大きければ箱は大きくなり、外れ値も見られます。
 
 n数が少ない実験データは下図の様に複数の箱ヒゲ図を用いて比較すればヒストグラムより差異がわかりやすく第三者に提示する場合も解りやすいグラフとなります。
 
          hakohuge2
図2.箱ひげ図イメージ
 
 図2のケースでは条件Aは箱が小さくヒゲの長さも短いので4つの条件の中で最も分布が狭くばらつきも小さい事がわかります。条件CはAと同様のシャープな分布ですが左右に裾野を引っ張った分布であることが予想できます。一方で条件Bは最も箱が大きくブロードな分布であることが直感的に解ります。この様に箱ひげ図は複数条件の分布を簡易的に比較するのに適したツールです。
 

2.箱ひげ図使用時の注意点

 箱ひげ図は少数データの層間比較に便利ですが、データが少ない故に数点の異常値で箱の形状が影響を受けやすくなります。異常値1点を除くだけで長い箱が小さく変化する場合もありますのでデータの正当性は充分なチェックが必要です。逆に正当なばらつきで生じた値を外れ値として削除し評価結果を都合よく操作しないよう意識しなければなりません。
  

   続きを読むには・・・


この記事の著者

眞名子 和義

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します


「品質マネジメント総合」の他のキーワード解説記事

もっと見る
<組立工程> ファブレス小売業の品質保証(その10)

  特定分野を長期間に渡って学び・経験された方は多いと思います。しかし、同じ製造業でも業界が異なると、慣習や考え方の基準は変ります。まして...

  特定分野を長期間に渡って学び・経験された方は多いと思います。しかし、同じ製造業でも業界が異なると、慣習や考え方の基準は変ります。まして...


中国進出での失敗事例 中国工場の品質改善(その2)

       【第1章 中国進出での失敗事例】    前回のその1に続いて解説します。 &n...

       【第1章 中国進出での失敗事例】    前回のその1に続いて解説します。 &n...


顧客の期待に応えられる品質管理とは 中小製造業の課題と解決への道筋(その7)

  【中小製造業の課題と解決への道筋 連載目次】 1. 世界一の品質はなぜ生まれたか 2. 相次ぐ品質問題 3. モグラ叩きの品...

  【中小製造業の課題と解決への道筋 連載目次】 1. 世界一の品質はなぜ生まれたか 2. 相次ぐ品質問題 3. モグラ叩きの品...


「品質マネジメント総合」の活用事例

もっと見る
メッキ厚不具合が発見できなかった理由とは

 前回の記事:事例:メッキ厚不良に続いて解説します。  メッキが終わった製品は、1度加工業者の工場に戻り、メッキ外観のチェックと修正をした後に梱包し...

 前回の記事:事例:メッキ厚不良に続いて解説します。  メッキが終わった製品は、1度加工業者の工場に戻り、メッキ外観のチェックと修正をした後に梱包し...


品質管理の原点から考える多品種少量生産の不良削減

 ある一流会社での話です。大量生産ラインでは、不良の発生が非常に低く抑えられている一方で、多品種少量生産ラインでは「ある程度の不良は仕方ない」という空気が...

 ある一流会社での話です。大量生産ラインでは、不良の発生が非常に低く抑えられている一方で、多品種少量生産ラインでは「ある程度の不良は仕方ない」という空気が...


QCサークル活動 生産現場の悩みとは

 「忙しいから」「人がいないから」これは、どこの企業も条件は同じです。工夫して時間を捻出している企業が勝ち組となります。つまり、生産性を上げる &rArr...

 「忙しいから」「人がいないから」これは、どこの企業も条件は同じです。工夫して時間を捻出している企業が勝ち組となります。つまり、生産性を上げる &rArr...