層別比較に便利なグラフ

投稿日

 層別比較に便利なツールとしては、『箱ひげ図があります。箱ひげ図は少数データの扱いも容易で作成も簡便なので便利ですが、分布の中心が中央値で、分布の幅がパーセンタイルで表されます。
 
  一方、平均値や標準偏差(SD)を用いて分布のばらつきを比較した方がヒストグラムと整合性も取れるし統計的なイメージも取りやすい場合も多いと思います。この様な場合は平均値の上下に標準偏差SDを上髭下髭と伸ばしたグラフを描画してみると、イメージ通りの各層比較グラフが描けます。
 
 実験結果の比較データを平均値プロットで比較しているデータを時々見ますが、ばらつきである標準偏差が考慮されていないか、数値データだけ添付されています。平均値とばらつきを別々に見せられると分布として層別比較するのが難しく、第三者による良し悪し判断もつきにくいです。そこで上述の様な平均値の上下にSDを描画してやれば両方を一つのグラフで参照出来るので条件による違いが一目瞭然です。
 
 箱ひげ図の形を利用して次のようにデータを置き換え、平均値を中心に上下にSD幅のBoxを成す変形箱ひげ図を描いてみます。
 
•中央値を平均値へ置き換え
 
•上髭点を平均値+3SD点へ、下髭点を平均値-3SD点へ置き換え
 
•75%点を平均値+1SD点へ、25%点を平均値-1SD点へ置き換え
 
 箱ひげ図との対比を明確にする為に下図の様に両図を隣接して描いてみます。緑箱は箱ひげ図、赤箱は平均値+SD図です。分布が狭いデータAと広いデータBの2種類について描画しています。(図1)
 
       sd22
図1・箱ひげ図とSD図の対比
 
 隣接グラフを見比べると解りますが、箱ひげ図に対しSD図は箱部分が大きくなります。ばらつきが大きな分布は箱及び髭が長くなり箱ひげ図よりも顕著に現れます。
 
 SD図は平均値に対し...
 層別比較に便利なツールとしては、『箱ひげ図があります。箱ひげ図は少数データの扱いも容易で作成も簡便なので便利ですが、分布の中心が中央値で、分布の幅がパーセンタイルで表されます。
 
  一方、平均値や標準偏差(SD)を用いて分布のばらつきを比較した方がヒストグラムと整合性も取れるし統計的なイメージも取りやすい場合も多いと思います。この様な場合は平均値の上下に標準偏差SDを上髭下髭と伸ばしたグラフを描画してみると、イメージ通りの各層比較グラフが描けます。
 
 実験結果の比較データを平均値プロットで比較しているデータを時々見ますが、ばらつきである標準偏差が考慮されていないか、数値データだけ添付されています。平均値とばらつきを別々に見せられると分布として層別比較するのが難しく、第三者による良し悪し判断もつきにくいです。そこで上述の様な平均値の上下にSDを描画してやれば両方を一つのグラフで参照出来るので条件による違いが一目瞭然です。
 
 箱ひげ図の形を利用して次のようにデータを置き換え、平均値を中心に上下にSD幅のBoxを成す変形箱ひげ図を描いてみます。
 
•中央値を平均値へ置き換え
 
•上髭点を平均値+3SD点へ、下髭点を平均値-3SD点へ置き換え
 
•75%点を平均値+1SD点へ、25%点を平均値-1SD点へ置き換え
 
 箱ひげ図との対比を明確にする為に下図の様に両図を隣接して描いてみます。緑箱は箱ひげ図、赤箱は平均値+SD図です。分布が狭いデータAと広いデータBの2種類について描画しています。(図1)
 
       sd22
図1・箱ひげ図とSD図の対比
 
 隣接グラフを見比べると解りますが、箱ひげ図に対しSD図は箱部分が大きくなります。ばらつきが大きな分布は箱及び髭が長くなり箱ひげ図よりも顕著に現れます。
 
 SD図は平均値に対し上下に対象ですが、箱ひげ図は中央値に対し上下どちらかに偏りが見られます。つまり分布が正規分布形状の場合はSD図の方が分かりやすいですが、正規分布形状でなく偏りがある場合は箱ひげ図の方がイメージしやすいと言えます。どちらが優れていると言うより用途に応じて使い分けることが重要です。また2群比較ならグラフ上にp値を記載しておけば両者に統計的有意差があるかどうかも一目でわかるので大変有用なグラフとなります。
 

   続きを読むには・・・


この記事の著者

眞名子 和義

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します


「SQC一般」の他のキーワード解説記事

もっと見る
~速算:暗算計算と九去法 続・現場数学(その20)

  ♦ 計算を身近なケースから考える   1. 電卓よりはるかに速く~ 速算と暗算の活用  本シリーズのタイト...

  ♦ 計算を身近なケースから考える   1. 電卓よりはるかに速く~ 速算と暗算の活用  本シリーズのタイト...


~マルチスケール模型での計算 現場数学(その6)

  1.  計算の限界  如何(いか)にスーパーコンピューターを活用しても、計算出来る範囲はやはり限られています。例えば、タン...

  1.  計算の限界  如何(いか)にスーパーコンピューターを活用しても、計算出来る範囲はやはり限られています。例えば、タン...


基本統計量について(平均値・中央値・分散・標準偏差など)

 数値データを分析するにあたり、情報の特徴を知るために基本的な統計量がありますので、今回はその中のいくつかについて説明します。 1.平均値(mean、a...

 数値データを分析するにあたり、情報の特徴を知るために基本的な統計量がありますので、今回はその中のいくつかについて説明します。 1.平均値(mean、a...


「SQC一般」の活用事例

もっと見る
飛行機事故とセンサー・フィードバックの分布

   ボーイング 737 Max 8機が短い期間に2回の墜落死亡事故を起こし、多くの航空会社が同機種の運航を停止する事態となっています。多くの...

   ボーイング 737 Max 8機が短い期間に2回の墜落死亡事故を起こし、多くの航空会社が同機種の運航を停止する事態となっています。多くの...


DPMOとは何か

 DPMOとはDefects Per Million Opportunityのイニシャルを取ったものです。DPMOを百万個当りの欠陥数(製品百万個当りの不...

 DPMOとはDefects Per Million Opportunityのイニシャルを取ったものです。DPMOを百万個当りの欠陥数(製品百万個当りの不...


統計教育が必須な検査担当者

 測定や検査結果の値で合格判定を行い、製品性能の品質保証をする事は製造業に取っては当たり前と言える日常的作業です。一方で検査や測定の正確さや信頼性を担保す...

 測定や検査結果の値で合格判定を行い、製品性能の品質保証をする事は製造業に取っては当たり前と言える日常的作業です。一方で検査や測定の正確さや信頼性を担保す...