母比率の区間推定 - 視聴率の一喜一憂 -

投稿日

 統計的区間推定は%などの比率データにも適用できます。比率データとして代表的なものに視聴率データがあります。予備知識としてビデオリサーチ社のウェブサイト情報を元に記載します。視聴データは調査対象となる家庭に設置した機器から自動的に視聴結果を吸い上げる方法と記録用紙への記入方法の2種類があるようです。現在は機器を設置し自動で吸い上げる方法が主流の様です。瞬間視聴率は機器を用いた連続測定ならではの情報と言えるでしょう。放送エリアは全国で32に分かれており、27エリアが調査対象となっています。 27エリアは都市規模に応じて3つに分類されており調査方法が微妙に異なります。関東、関西、名古屋の3地区は600世帯と最大サンプル数、且つデータが最も詳細に取るシステムを設置するエリアの様です。残りは24エリアは世帯数は200と共通で収集方法も共通ですが、速報発信の頻度が異なるようです。このように全国平均としての視聴率は集計されずエリア集計の様です。
 
 さて本題に入りましょう。 関東エリアで視聴率10%のドラマについて考えてみます。 一話目が10%で二話目が9%だったら視聴率が落ちたと断言して良いでしょうか、ここで母比率の区間推定を行ってみます。大都市圏600世帯の調査で視聴率10%の場合の推定区間を算出します。信頼度は95%とすると、計算式と式中の各記号は、次のようになります。
 
                kukann22
 
 r=0.1 n=600を代入して計算すると、推定区間は10%±2.4%となります。視聴率が10%の時、2.4%は標本誤差になるので二話目が9%になっても一話目より視聴率が下がったとは断言出来ない事になります。言い換えれば標本の採り方でこの区間で視聴率が変動し9%も誤差範囲と言うわけです。計算式からわかりますがこの誤差を半分にするにはn数が4倍必要で、2400世帯に機器を設置する必要があります。それでも誤差は1.2%なので2話めの視聴率が下がったと統計的には言い切れません。
 
 4倍にしても1%以下になりませんからサンプリングコストと得られる誤差精度が見合うかと言われると確かに疑問ですね。機器設置コスト考えると仕方ないかもしれません。都市圏以外のエリアはサンプル数が200なので誤差は±4.2%に増大します。標本誤差については調査会社のサイトにも記載があります。
 
 95%の信頼区間について補足すると、異なる600世帯100グループの調査を行った場合、95グループは上記の10%±2.4%の範囲に収まる確率という事になります。 600世帯のサンプルをどれだけ採取しても常に視聴率がこの範囲に収まって変動するというわけではないのでご注意下さい。
 
 インターネットのニュースで1%未満の視聴率変動について主観的に分析した記事が良く掲載されていますが、非常に非論理的だと思ってみています。恐らく今は視聴したか、してないというオンオフ視聴率よりももっと時間を細かく見た瞬間視聴率が重要な情報...
 統計的区間推定は%などの比率データにも適用できます。比率データとして代表的なものに視聴率データがあります。予備知識としてビデオリサーチ社のウェブサイト情報を元に記載します。視聴データは調査対象となる家庭に設置した機器から自動的に視聴結果を吸い上げる方法と記録用紙への記入方法の2種類があるようです。現在は機器を設置し自動で吸い上げる方法が主流の様です。瞬間視聴率は機器を用いた連続測定ならではの情報と言えるでしょう。放送エリアは全国で32に分かれており、27エリアが調査対象となっています。 27エリアは都市規模に応じて3つに分類されており調査方法が微妙に異なります。関東、関西、名古屋の3地区は600世帯と最大サンプル数、且つデータが最も詳細に取るシステムを設置するエリアの様です。残りは24エリアは世帯数は200と共通で収集方法も共通ですが、速報発信の頻度が異なるようです。このように全国平均としての視聴率は集計されずエリア集計の様です。
 
 さて本題に入りましょう。 関東エリアで視聴率10%のドラマについて考えてみます。 一話目が10%で二話目が9%だったら視聴率が落ちたと断言して良いでしょうか、ここで母比率の区間推定を行ってみます。大都市圏600世帯の調査で視聴率10%の場合の推定区間を算出します。信頼度は95%とすると、計算式と式中の各記号は、次のようになります。
 
                kukann22
 
 r=0.1 n=600を代入して計算すると、推定区間は10%±2.4%となります。視聴率が10%の時、2.4%は標本誤差になるので二話目が9%になっても一話目より視聴率が下がったとは断言出来ない事になります。言い換えれば標本の採り方でこの区間で視聴率が変動し9%も誤差範囲と言うわけです。計算式からわかりますがこの誤差を半分にするにはn数が4倍必要で、2400世帯に機器を設置する必要があります。それでも誤差は1.2%なので2話めの視聴率が下がったと統計的には言い切れません。
 
 4倍にしても1%以下になりませんからサンプリングコストと得られる誤差精度が見合うかと言われると確かに疑問ですね。機器設置コスト考えると仕方ないかもしれません。都市圏以外のエリアはサンプル数が200なので誤差は±4.2%に増大します。標本誤差については調査会社のサイトにも記載があります。
 
 95%の信頼区間について補足すると、異なる600世帯100グループの調査を行った場合、95グループは上記の10%±2.4%の範囲に収まる確率という事になります。 600世帯のサンプルをどれだけ採取しても常に視聴率がこの範囲に収まって変動するというわけではないのでご注意下さい。
 
 インターネットのニュースで1%未満の視聴率変動について主観的に分析した記事が良く掲載されていますが、非常に非論理的だと思ってみています。恐らく今は視聴したか、してないというオンオフ視聴率よりももっと時間を細かく見た瞬間視聴率が重要な情報なのかもしれません。 これなら連続データですから時系列変動は妥当性があります。
 
 スポンサーに有益な情報を発信するため個人視聴率や瞬間視聴率などIT技術を活用した詳細な情報も発信されているようですが、受け取る方に統計素養が無いと広告宣伝コストに見合う活用ができていないかもしれません。
 
 母比率の推定が出来れば歩留りの変動や契約件数の変動が有意かどうかの統計的判断が容易に行えます。一喜一憂する前にそれが意味があるものかどうかの理解が必要です。統計に騙されないためには正しい統計知識を身につける必要があります。統計データを処理するような業務は無縁だと思っていても、統計処理した情報を受け取る機会は多分にあると思います。
  

   続きを読むには・・・


この記事の著者

眞名子 和義

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します

ムダ・ムラ・ムリの「3ムの撤廃が企業収益向上に繋がる」を信条とし、お客様の"視座"に立ったご提案を致します


「検定・推定」の他のキーワード解説記事

もっと見る
有意水準、5%の考察

  統計的有意差検定とは一定確率の元で◯×判定を下す手法です。この一定の確率を『有意水準』と呼びます。有意水準とは危険率とも呼ばれ逆に100%から危険率を...

  統計的有意差検定とは一定確率の元で◯×判定を下す手法です。この一定の確率を『有意水準』と呼びます。有意水準とは危険率とも呼ばれ逆に100%から危険率を...


コスト改善と、有意差検定

 コスト改善と聞いてどの様な取り組みをイメージしますか、一般的にはコストダウンと絞り込んだ方がわかりやすいかもしれません。製造業で言えばある製品を一個造る...

 コスト改善と聞いてどの様な取り組みをイメージしますか、一般的にはコストダウンと絞り込んだ方がわかりやすいかもしれません。製造業で言えばある製品を一個造る...


統計的有意差検定とは

1.検定と推定  統計学はデータを数量化して母集団の特徴や傾向を分析したり、母集団からサンプルを抜き取り、この中から母集団の特徴を推測する科学的な学...

1.検定と推定  統計学はデータを数量化して母集団の特徴や傾向を分析したり、母集団からサンプルを抜き取り、この中から母集団の特徴を推測する科学的な学...


「検定・推定」の活用事例

もっと見る
仮説検定:洞窟ツアーと p値

        今回は、ケンタッキー州にあるマンモス・ケーブ国立公園に行った事からの事例解説です。この国立公...

        今回は、ケンタッキー州にあるマンモス・ケーブ国立公園に行った事からの事例解説です。この国立公...


母平均の検定事例(母分散が既知の場合)

 今回は、母集団が正規分布であり、平均値と分散値が既知である場合の検定事例を取り上げます。  小学校4年生のある年の全国身長調査で平均値は143.5cm...

 今回は、母集団が正規分布であり、平均値と分散値が既知である場合の検定事例を取り上げます。  小学校4年生のある年の全国身長調査で平均値は143.5cm...