その他の統計手法 その1、箱ひげ図 / Box and Whisker plot

投稿日

 ヒストグラムは分布形状を知る上で非常に有効なツールですが、形状を形作るにはそれなりのデータ数が必要となります。サンプル数が5~20程度と少ないと歪な分布となる為、形状把握には適さない事があります。 一方で箱ひげ図は分布の詳細情報はヒストグラムに及びませんが、分布の中心や幅の情報を持った箱型のマーカーで表わされるため他の分布との比較に適しています。例えば複数の異なる水準で実験を行い、各水準のサンプル数が5個づつで比較を行う場合は箱ひげ図の方がビジュアル的に差異が把握しやすく効果的です。箱ひげ図は英語ではボックスプロット(Box Plot)と呼ばれる様に四角い箱形状で分布の大きさ(中心と分布の幅)を表します。分布が小さくシャープな形状であればボックスの高さが低く、分布がブロードであれば長いボックス形状となります。
 

1.箱ひげ図の作成方法

(1)データよりメジアンとボックスの上側ヒンジと下側ヒンジ点を計算します
   上側は相対累積度数が75%に相当する点で、下側は25%に相当する点です
(2)上側ヒンジをボックスの上辺、下側ヒンジをボックスの下辺とした箱を作り
   計算したメジアンを横線として引きます
(3)箱の高さをL(75%点と25%点の間の差)とし、髭の長さを決めます
(4)上ヒゲはボックスの上ヒンジから上に1.5Lの範囲で最も大きいデータまで繋い
   だもの、下ヒゲは逆に下ヒンジから下に1.5Lの範囲で最も小さいデータまでを
   繋いだもの
(5)最後にヒゲの先端よりも外側にある点を外れ値として打点×で表示する
     この様にして作成した箱ひげ図は図1のような形となります。
                       hakohuge1        
図1.箱ひげ図
 
 75%点がボックスの上ヒンジ位置となり、25%点がボックスの下ヒンジ値となります。上ヒゲはボックスの上端(75%値)から上方に箱の高さLの1.5倍の範囲に在り且つ最大点まで線を引き作成します。同様にボックスの下端(25%値)から下方へ1.5Lの範囲に在り且つ最小点まで線を引き作成します。上ヒゲ、下ヒゲより外側の点を外れ値として打点します。
 
 分布が正規分布形状なら中央値を挟んで上下に対象な形状となります。分布がシャープであればボックスは小さく、ヒゲの長さも短くなります。逆にデータのばらつきが大きければ箱は大きくなり、外れ値も見られます。
 
 n数が少ない実験データは下図の様に複数の箱ヒゲ図を用いて比較すればヒストグラムより差異がわかりやすく第三者に提示する場合も解りやすいグラフとなります。
 
          hakohuge2
図2.箱ひげ図イメージ
 
 図2のケースでは条件Aは箱が小さくヒゲの長さも短いので4つの条件の中で最も分布が狭くばらつきも小さい事がわかります...
 ヒストグラムは分布形状を知る上で非常に有効なツールですが、形状を形作るにはそれなりのデータ数が必要となります。サンプル数が5~20程度と少ないと歪な分布となる為、形状把握には適さない事があります。 一方で箱ひげ図は分布の詳細情報はヒストグラムに及びませんが、分布の中心や幅の情報を持った箱型のマーカーで表わされるため他の分布との比較に適しています。例えば複数の異なる水準で実験を行い、各水準のサンプル数が5個づつで比較を行う場合は箱ひげ図の方がビジュアル的に差異が把握しやすく効果的です。箱ひげ図は英語ではボックスプロット(Box Plot)と呼ばれる様に四角い箱形状で分布の大きさ(中心と分布の幅)を表します。分布が小さくシャープな形状であればボックスの高さが低く、分布がブロードであれば長いボックス形状となります。
 

1.箱ひげ図の作成方法

(1)データよりメジアンとボックスの上側ヒンジと下側ヒンジ点を計算します
   上側は相対累積度数が75%に相当する点で、下側は25%に相当する点です
(2)上側ヒンジをボックスの上辺、下側ヒンジをボックスの下辺とした箱を作り
   計算したメジアンを横線として引きます
(3)箱の高さをL(75%点と25%点の間の差)とし、髭の長さを決めます
(4)上ヒゲはボックスの上ヒンジから上に1.5Lの範囲で最も大きいデータまで繋い
   だもの、下ヒゲは逆に下ヒンジから下に1.5Lの範囲で最も小さいデータまでを
   繋いだもの
(5)最後にヒゲの先端よりも外側にある点を外れ値として打点×で表示する
     この様にして作成した箱ひげ図は図1のような形となります。
                       hakohuge1        
図1.箱ひげ図
 
 75%点がボックスの上ヒンジ位置となり、25%点がボックスの下ヒンジ値となります。上ヒゲはボックスの上端(75%値)から上方に箱の高さLの1.5倍の範囲に在り且つ最大点まで線を引き作成します。同様にボックスの下端(25%値)から下方へ1.5Lの範囲に在り且つ最小点まで線を引き作成します。上ヒゲ、下ヒゲより外側の点を外れ値として打点します。
 
 分布が正規分布形状なら中央値を挟んで上下に対象な形状となります。分布がシャープであればボックスは小さく、ヒゲの長さも短くなります。逆にデータのばらつきが大きければ箱は大きくなり、外れ値も見られます。
 
 n数が少ない実験データは下図の様に複数の箱ヒゲ図を用いて比較すればヒストグラムより差異がわかりやすく第三者に提示する場合も解りやすいグラフとなります。
 
          hakohuge2
図2.箱ひげ図イメージ
 
 図2のケースでは条件Aは箱が小さくヒゲの長さも短いので4つの条件の中で最も分布が狭くばらつきも小さい事がわかります。条件CはAと同様のシャープな分布ですが左右に裾野を引っ張った分布であることが予想できます。一方で条件Bは最も箱が大きくブロードな分布であることが直感的に解ります。この様に箱ひげ図は複数条件の分布を簡易的に比較するのに適したツールです。
 

2.箱ひげ図使用時の注意点

 箱ひげ図は少数データの層間比較に便利ですが、データが少ない故に数点の異常値で箱の形状が影響を受けやすくなります。異常値1点を除くだけで長い箱が小さく変化する場合もありますのでデータの正当性は充分なチェックが必要です。逆に正当なばらつきで生じた値を外れ値として削除し評価結果を都合よく操作しないよう意識しなければなりません。
  

   続きを読むには・・・


この記事の著者

眞名子 和義

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します


「品質マネジメント総合」の他のキーワード解説記事

もっと見る
品質保証度評価法とは(9) 【快年童子の豆鉄砲】(その36)

    ◆CAL値(品質保証度の値)の使い方 1.通常使うCAL値  CAL値は、次の表33-2にありますように...

    ◆CAL値(品質保証度の値)の使い方 1.通常使うCAL値  CAL値は、次の表33-2にありますように...


4M変化点(4M変動)管理はなぜ必要か

◆ 目的と4つのポイント    多品種少量受注生産工場では、管理の主体は「4M変化点管理」です。しかし、ISO9000の仕組みだけでは、体系...

◆ 目的と4つのポイント    多品種少量受注生産工場では、管理の主体は「4M変化点管理」です。しかし、ISO9000の仕組みだけでは、体系...


電子デバイスの故障解析とは

  1. 故障解析に求められる知見  故障解析を実施する場合、故障モードに適した「試験装置、試験条件」の選定、さらに物理解析においては解析プロ...

  1. 故障解析に求められる知見  故障解析を実施する場合、故障モードに適した「試験装置、試験条件」の選定、さらに物理解析においては解析プロ...


「品質マネジメント総合」の活用事例

もっと見る
品質管理の原点から考える多品種少量生産の不良削減

 ある一流会社での話です。大量生産ラインでは、不良の発生が非常に低く抑えられている一方で、多品種少量生産ラインでは「ある程度の不良は仕方ない」という空気が...

 ある一流会社での話です。大量生産ラインでは、不良の発生が非常に低く抑えられている一方で、多品種少量生産ラインでは「ある程度の不良は仕方ない」という空気が...


顧客事情による品質低下

  顧客クレームは宝の山と言いますが出来れば顧客苦情は受け付けたくないものです。 基本的には自社サービス提供過程に問題がある事を前提に調査を行いますが、時...

  顧客クレームは宝の山と言いますが出来れば顧客苦情は受け付けたくないものです。 基本的には自社サービス提供過程に問題がある事を前提に調査を行いますが、時...


検査記録のない中国工場の事例

   わたしは中国工場セミナーの中で、どんなにレベルの低い中国工場でもまったく記録がないというところはなく、何らかの検査記録は取っていると...

   わたしは中国工場セミナーの中で、どんなにレベルの低い中国工場でもまったく記録がないというところはなく、何らかの検査記録は取っていると...