その他の統計手法 その1、箱ひげ図 / Box and Whisker plot

投稿日

 ヒストグラムは分布形状を知る上で非常に有効なツールですが、形状を形作るにはそれなりのデータ数が必要となります。サンプル数が5~20程度と少ないと歪な分布となる為、形状把握には適さない事があります。 一方で箱ひげ図は分布の詳細情報はヒストグラムに及びませんが、分布の中心や幅の情報を持った箱型のマーカーで表わされるため他の分布との比較に適しています。例えば複数の異なる水準で実験を行い、各水準のサンプル数が5個づつで比較を行う場合は箱ひげ図の方がビジュアル的に差異が把握しやすく効果的です。箱ひげ図は英語ではボックスプロット(Box Plot)と呼ばれる様に四角い箱形状で分布の大きさ(中心と分布の幅)を表します。分布が小さくシャープな形状であればボックスの高さが低く、分布がブロードであれば長いボックス形状となります。
 

1.箱ひげ図の作成方法

(1)データよりメジアンとボックスの上側ヒンジと下側ヒンジ点を計算します
   上側は相対累積度数が75%に相当する点で、下側は25%に相当する点です
(2)上側ヒンジをボックスの上辺、下側ヒンジをボックスの下辺とした箱を作り
   計算したメジアンを横線として引きます
(3)箱の高さをL(75%点と25%点の間の差)とし、髭の長さを決めます
(4)上ヒゲはボックスの上ヒンジから上に1.5Lの範囲で最も大きいデータまで繋い
   だもの、下ヒゲは逆に下ヒンジから下に1.5Lの範囲で最も小さいデータまでを
   繋いだもの
(5)最後にヒゲの先端よりも外側にある点を外れ値として打点×で表示する
     この様にして作成した箱ひげ図は図1のような形となります。
                       hakohuge1        
図1.箱ひげ図
 
 75%点がボックスの上ヒンジ位置となり、25%点がボックスの下ヒンジ値となります。上ヒゲはボックスの上端(75%値)から上方に箱の高さLの1.5倍の範囲に在り且つ最大点まで線を引き作成します。同様にボックスの下端(25%値)から下方へ1.5Lの範囲に在り且つ最小点まで線を引き作成します。上ヒゲ、下ヒゲより外側の点を外れ値として打点します。
 
 分布が正規分布形状なら中央値を挟んで上下に対象な形状となります。分布がシャープであればボックスは小さく、ヒゲの長さも短くなります。逆にデータのばらつきが大きければ箱は大きくなり、外れ値も見られます。
 
 n数が少ない実験データは下図の様に複数の箱ヒゲ図を用いて比較すればヒストグラムより差異がわかりやすく第三者に提示する場合も解りやすいグラフとなります。
 
          hakohuge2
図2.箱ひげ図イメージ
 
 図2のケースでは条件Aは箱が小さくヒゲの長さも短いので4つの条件の中で最も分布が狭くばらつきも小さい事がわかります...
 ヒストグラムは分布形状を知る上で非常に有効なツールですが、形状を形作るにはそれなりのデータ数が必要となります。サンプル数が5~20程度と少ないと歪な分布となる為、形状把握には適さない事があります。 一方で箱ひげ図は分布の詳細情報はヒストグラムに及びませんが、分布の中心や幅の情報を持った箱型のマーカーで表わされるため他の分布との比較に適しています。例えば複数の異なる水準で実験を行い、各水準のサンプル数が5個づつで比較を行う場合は箱ひげ図の方がビジュアル的に差異が把握しやすく効果的です。箱ひげ図は英語ではボックスプロット(Box Plot)と呼ばれる様に四角い箱形状で分布の大きさ(中心と分布の幅)を表します。分布が小さくシャープな形状であればボックスの高さが低く、分布がブロードであれば長いボックス形状となります。
 

1.箱ひげ図の作成方法

(1)データよりメジアンとボックスの上側ヒンジと下側ヒンジ点を計算します
   上側は相対累積度数が75%に相当する点で、下側は25%に相当する点です
(2)上側ヒンジをボックスの上辺、下側ヒンジをボックスの下辺とした箱を作り
   計算したメジアンを横線として引きます
(3)箱の高さをL(75%点と25%点の間の差)とし、髭の長さを決めます
(4)上ヒゲはボックスの上ヒンジから上に1.5Lの範囲で最も大きいデータまで繋い
   だもの、下ヒゲは逆に下ヒンジから下に1.5Lの範囲で最も小さいデータまでを
   繋いだもの
(5)最後にヒゲの先端よりも外側にある点を外れ値として打点×で表示する
     この様にして作成した箱ひげ図は図1のような形となります。
                       hakohuge1        
図1.箱ひげ図
 
 75%点がボックスの上ヒンジ位置となり、25%点がボックスの下ヒンジ値となります。上ヒゲはボックスの上端(75%値)から上方に箱の高さLの1.5倍の範囲に在り且つ最大点まで線を引き作成します。同様にボックスの下端(25%値)から下方へ1.5Lの範囲に在り且つ最小点まで線を引き作成します。上ヒゲ、下ヒゲより外側の点を外れ値として打点します。
 
 分布が正規分布形状なら中央値を挟んで上下に対象な形状となります。分布がシャープであればボックスは小さく、ヒゲの長さも短くなります。逆にデータのばらつきが大きければ箱は大きくなり、外れ値も見られます。
 
 n数が少ない実験データは下図の様に複数の箱ヒゲ図を用いて比較すればヒストグラムより差異がわかりやすく第三者に提示する場合も解りやすいグラフとなります。
 
          hakohuge2
図2.箱ひげ図イメージ
 
 図2のケースでは条件Aは箱が小さくヒゲの長さも短いので4つの条件の中で最も分布が狭くばらつきも小さい事がわかります。条件CはAと同様のシャープな分布ですが左右に裾野を引っ張った分布であることが予想できます。一方で条件Bは最も箱が大きくブロードな分布であることが直感的に解ります。この様に箱ひげ図は複数条件の分布を簡易的に比較するのに適したツールです。
 

2.箱ひげ図使用時の注意点

 箱ひげ図は少数データの層間比較に便利ですが、データが少ない故に数点の異常値で箱の形状が影響を受けやすくなります。異常値1点を除くだけで長い箱が小さく変化する場合もありますのでデータの正当性は充分なチェックが必要です。逆に正当なばらつきで生じた値を外れ値として削除し評価結果を都合よく操作しないよう意識しなければなりません。
  

   続きを読むには・・・


この記事の著者

眞名子 和義

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します


「品質マネジメント総合」の他のキーワード解説記事

もっと見る
電子デバイスの故障解析とは

  1. 故障解析に求められる知見    故障解析を実施する場合、故障モードに適した「試験装置、試験条件」の選定、さらに物理...

  1. 故障解析に求められる知見    故障解析を実施する場合、故障モードに適した「試験装置、試験条件」の選定、さらに物理...


品質の維持と改善 品質保証概論(その4)

    【品質保証概論 連載の目次】 1. 品質とは何か 2. 品質を保証するということ 3. 品質管理のためのPDCA...

    【品質保証概論 連載の目次】 1. 品質とは何か 2. 品質を保証するということ 3. 品質管理のためのPDCA...


夢商品開発七つ道具とは(2) 【快年童子の豆鉄砲】(その38)

  ◆夢商品開発七つ道具とは(2) 2.「夢商品開発七つ道具(Y7)」開発の契機(つづき) 前回の3)「創造的魅力商品」の定義に続けて...

  ◆夢商品開発七つ道具とは(2) 2.「夢商品開発七つ道具(Y7)」開発の契機(つづき) 前回の3)「創造的魅力商品」の定義に続けて...


「品質マネジメント総合」の活用事例

もっと見る
不良の原因究明に進歩あり 中国企業の壁(その48)

        日本向けに鉄加工製品を販売している中国企業A社の工場では、日本品質を目指して開発・生産に取り組んでいます。顧客クレームが発生すれば、...

        日本向けに鉄加工製品を販売している中国企業A社の工場では、日本品質を目指して開発・生産に取り組んでいます。顧客クレームが発生すれば、...


量産後に規格が守れない、寸法NGの対策とは 中国企業の壁(その16)

         工場の受入検査である部品が厚さ寸法NGとなったときのことです。    仕入先(日系工場)の現物確認でも不合格であることが確認さ...

         工場の受入検査である部品が厚さ寸法NGとなったときのことです。    仕入先(日系工場)の現物確認でも不合格であることが確認さ...


クリーンルームで使用するテープについて

 クリーンルーム内ではテープを使用しない方が良いのですが、どうしても必要な場合もありますので、そのことについて解説します。  クリーンルーム外で掲示の時...

 クリーンルーム内ではテープを使用しない方が良いのですが、どうしても必要な場合もありますので、そのことについて解説します。  クリーンルーム外で掲示の時...