なぜ、開票率数%で当確なのか? データ分析講座(その217)

投稿日

 

 

【この連載の前回:データ分析講座(その216)パレート指数による売上分析へのリンク】

各報道機関の選挙速報で、よく開票率が数%なのに当確(当選確実)が出ることがあります。これを、データサイエンスのアプローチとして考えると次の2点の利用が出てきます。これらは伝統的な数理統計学のアプローチでどうにかなります。今回は、「なぜ、開票率数%で当確なのか?」というお話しをします。

  • 出口調査を利用したもの
  • 中間投票状況(開票率○○%)の結果を利用したもの

 

【目次】
1.中間投票状況(開票率○○%)
2.候補者が2名のケースで考えると……
3.開票率1%の例
4.開票率10%の例
5.当確ラインの求め方
6.出口調査
7.候補者が2名のケースで考えると……
8.100人に対し出口調査を行ったとします……
9.得票率の区間とは?
10.先ほどの例で考えると……
11.得票率の区間の求め方

 

1.中間投票状況(開票率○○%)

当選かどうかは、開票率100%でないと言えませんが、開票率数%の状況でも当選の可能性を言うことができます。伝統的な数理統計学のアプローチを活用します。

例えば……

開票率1%で当確と言えたり
開票率10%で当確と言えたり

……します。

 

2.候補者が2名のケースで考えると……

今、候補者が2名のケースで考えてみます。

候補者A
候補者B

候補者Aが当選するには、得票率が50%を超える必要があります。有効投票者数が10,000と想定した場合、得票数が5,000を超えれば(5,001以上)であれば当選します。開票率1%とは100人分の票が確定したことになります。開票率10%とは1,000人分の票が確定したことになります。

 

3.開票率1%の例

では、開票率1%の段階で当確をだすためには、候補者Aはどのくらいの票を得ればいいのでしょうか?ざっくり計算すると100人の60%つまり60人の票を獲得すると、当確と判断することができます。開票されたのが100人の場合、当確ラインは60%になります。なぜでしょうか?

 

4.開票率10%の例

では、開票率10%の段階で当確をだすためには、候補者Aはどのくらいの票を得ればいいのでしょうか?ざっくり計算すると1,000人の53%つまり531人の票を獲得すると、当確と判断することができます。開票されたのが1,000人の場合、当確ラインは53%になります。なぜでしょうか?

 

5.当確ラインの求め方

当確ラインを求める簡単な算定式があります。

 

データ分析

 

要は、候補者Aと候補者Bが競っていればいるほど、開票率が高くならないと当確は出せない、ということです。この算定式は簡単に作ることがでますが、ここでは作り方の説明は割愛します。興味のある方は、数理統計学の入門書などを参考にしていただければと思います。正規分布をベースにしたものです。

 

6.出口調査

出口調査とは、選挙当日などに投票所の出口で投票を終えた有権者に対し、誰に投票したのを質問する調査です。もちろん、全員に質問するわけではなく、ある投票所から出てきた人に対し、10人置きに聞くとかします。国政選挙では、1989年の参院選からと言われています。総選挙では、1993年(細川政権誕生)からと言われています。

調査方法は、2段抽出法を使っています。

1次抽出:投票区の抽出
2次抽出:抽出した投票区の投票者個人

出口調査は、最近の各報道機関の選挙速報では、欠かせないものになっています。出口調査の結果によっては、開票率0%で当確ということもあり得ます。

 

7.候補者が2名のケースで考えると……

今、候補者が2名のケースで考えてみます。先ほどの例と同じ想定です。

候補者A
候補者B

候補者Aが当選するには、得票率が50%を超える必要があります。

 

8.100人に対し出口調査を行ったとします……

100人に対し出口調査をした結果、以下のようになったとします。

63人が候補者Aに投票(出口調査の得票率:63%)
37人が候補者Bに投票(出口調査の得票率:37%)

ここで候補者Aの得票率の区間を作ることができます。

 

9.得票率の区間とは?

得票率の区間とは、候補者Aの真の得票率は分からないが……、「だいたいこのくらいの区間に入ってるんじゃないかな?」という感じのものです。得票率の区間には、区間というぐらいなので、下限と上限があります。この区間の下限が50%を超えていれば当確と言えそうです。

 

10.先ほどの例で考えると……

100人に対し出口調査をした結果、以下のようになったとお話ししました。

63人が候補者Aに投票(出口調査の得票率:63%)
37人が候補者Bに投票(出口調査の...

 

 

【この連載の前回:データ分析講座(その216)パレート指数による売上分析へのリンク】

各報道機関の選挙速報で、よく開票率が数%なのに当確(当選確実)が出ることがあります。これを、データサイエンスのアプローチとして考えると次の2点の利用が出てきます。これらは伝統的な数理統計学のアプローチでどうにかなります。今回は、「なぜ、開票率数%で当確なのか?」というお話しをします。

  • 出口調査を利用したもの
  • 中間投票状況(開票率○○%)の結果を利用したもの

 

【目次】
1.中間投票状況(開票率○○%)
2.候補者が2名のケースで考えると……
3.開票率1%の例
4.開票率10%の例
5.当確ラインの求め方
6.出口調査
7.候補者が2名のケースで考えると……
8.100人に対し出口調査を行ったとします……
9.得票率の区間とは?
10.先ほどの例で考えると……
11.得票率の区間の求め方

 

1.中間投票状況(開票率○○%)

当選かどうかは、開票率100%でないと言えませんが、開票率数%の状況でも当選の可能性を言うことができます。伝統的な数理統計学のアプローチを活用します。

例えば……

開票率1%で当確と言えたり
開票率10%で当確と言えたり

……します。

 

2.候補者が2名のケースで考えると……

今、候補者が2名のケースで考えてみます。

候補者A
候補者B

候補者Aが当選するには、得票率が50%を超える必要があります。有効投票者数が10,000と想定した場合、得票数が5,000を超えれば(5,001以上)であれば当選します。開票率1%とは100人分の票が確定したことになります。開票率10%とは1,000人分の票が確定したことになります。

 

3.開票率1%の例

では、開票率1%の段階で当確をだすためには、候補者Aはどのくらいの票を得ればいいのでしょうか?ざっくり計算すると100人の60%つまり60人の票を獲得すると、当確と判断することができます。開票されたのが100人の場合、当確ラインは60%になります。なぜでしょうか?

 

4.開票率10%の例

では、開票率10%の段階で当確をだすためには、候補者Aはどのくらいの票を得ればいいのでしょうか?ざっくり計算すると1,000人の53%つまり531人の票を獲得すると、当確と判断することができます。開票されたのが1,000人の場合、当確ラインは53%になります。なぜでしょうか?

 

5.当確ラインの求め方

当確ラインを求める簡単な算定式があります。

 

データ分析

 

要は、候補者Aと候補者Bが競っていればいるほど、開票率が高くならないと当確は出せない、ということです。この算定式は簡単に作ることがでますが、ここでは作り方の説明は割愛します。興味のある方は、数理統計学の入門書などを参考にしていただければと思います。正規分布をベースにしたものです。

 

6.出口調査

出口調査とは、選挙当日などに投票所の出口で投票を終えた有権者に対し、誰に投票したのを質問する調査です。もちろん、全員に質問するわけではなく、ある投票所から出てきた人に対し、10人置きに聞くとかします。国政選挙では、1989年の参院選からと言われています。総選挙では、1993年(細川政権誕生)からと言われています。

調査方法は、2段抽出法を使っています。

1次抽出:投票区の抽出
2次抽出:抽出した投票区の投票者個人

出口調査は、最近の各報道機関の選挙速報では、欠かせないものになっています。出口調査の結果によっては、開票率0%で当確ということもあり得ます。

 

7.候補者が2名のケースで考えると……

今、候補者が2名のケースで考えてみます。先ほどの例と同じ想定です。

候補者A
候補者B

候補者Aが当選するには、得票率が50%を超える必要があります。

 

8.100人に対し出口調査を行ったとします……

100人に対し出口調査をした結果、以下のようになったとします。

63人が候補者Aに投票(出口調査の得票率:63%)
37人が候補者Bに投票(出口調査の得票率:37%)

ここで候補者Aの得票率の区間を作ることができます。

 

9.得票率の区間とは?

得票率の区間とは、候補者Aの真の得票率は分からないが……、「だいたいこのくらいの区間に入ってるんじゃないかな?」という感じのものです。得票率の区間には、区間というぐらいなので、下限と上限があります。この区間の下限が50%を超えていれば当確と言えそうです。

 

10.先ほどの例で考えると……

100人に対し出口調査をした結果、以下のようになったとお話ししました。

63人が候補者Aに投票(出口調査の得票率:63%)
37人が候補者Bに投票(出口調査の得票率:37%)

この例の候補者Aの得票率の区間は、次のようになります(n:出口調査のサンプル数、p:出口調査の得票率)。

上限:72%
下限:54%

下限が50%を超えているので、当確と言えそうです。

 

11.得票率の区間の求め方

得票率の区間を求める簡単な算定式があります。

 

データ分析

 

この算定式も簡単に作ることがでますが、ここでは作り方の説明は割愛します。興味のある方は、数理統計学の入門書などを参考にしていただければと思います。正規分布をベースにしたものです。

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
ロジカルシンキングのリスキリング 【厳選記事紹介】真の原因に迫る思考プロセス

【目次】 トラブルに遭遇した時に、真の原因に迫るその思考プロセスが分かっていたらムダな時間を費やさなくてすみ、出した結論に対しても自...

【目次】 トラブルに遭遇した時に、真の原因に迫るその思考プロセスが分かっていたらムダな時間を費やさなくてすみ、出した結論に対しても自...


データから未来とアクションを検討する データ分析講座(その139)

◆ データ分析:所詮データは、過去の一部分でしかない  データ活用全般にいえることですが、データは「過去」の「ある事象」(例:受注や生産、購買など)...

◆ データ分析:所詮データは、過去の一部分でしかない  データ活用全般にいえることですが、データは「過去」の「ある事象」(例:受注や生産、購買など)...


データから垣間見る人間模様を想像する事象理解 データ分析講座(その297)

【目次】 データはあくまでも、この世で起こった事象のある一部分を切り取りデータとして表出された何かです。ある暑い夏の日、喉が渇いたと...

【目次】 データはあくまでも、この世で起こった事象のある一部分を切り取りデータとして表出された何かです。ある暑い夏の日、喉が渇いたと...


「情報マネジメント一般」の活用事例

もっと見る
簡易版DX/IoTから機械学習への移行

  ◆ DX(デジタル・トランスフォーメーション)を使えばコスト削減と納期短縮が可能に  産業界のニュースなどをインターネットで読んでいると...

  ◆ DX(デジタル・トランスフォーメーション)を使えばコスト削減と納期短縮が可能に  産業界のニュースなどをインターネットで読んでいると...


‐情報収集で配慮すべき事項(第2回)‐  製品・技術開発力強化策の事例(その10)

 前回の事例その9に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明確...

 前回の事例その9に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明確...


‐クレ-ム情報を開発に活用‐  製品・技術開発力強化策の事例(その13)

 前回の事例その12に続いて解説します。顧客から出されたクレ-ムは、技術開発や、関連製品の開発の可能性を潜在させている場合が多いようです。その視点からクレ...

 前回の事例その12に続いて解説します。顧客から出されたクレ-ムは、技術開発や、関連製品の開発の可能性を潜在させている場合が多いようです。その視点からクレ...