【中止】ベイズ統計学の基礎とデータ分析・予測への応用
★ベイズ統計の基本的な考え方を様々な職種・業務の方が理解しやすいように
シンプルな活用例を示すとともに、最近話題のベイズ分析ツールRStanを
使ったベイズ統計によるデータ分析の実践例をご説明します!
※本セミナーはZOOMを使ったLIVE配信セミナーです。会場での参加はございません。
【アーカイブ配信:6/27~7/4(何度でも受講可能)】での受講もお選びいただけます。
セミナー趣旨
今や世界の最も貴重な資源は石油ではなくデータであるといわれています。IoTやスマートデバイスの進展により様々な機器から得られる多種多様なビッグデータ。これらの分析と利活用が既に多くの分野で重要な課題になっており、そのための方法論としてベイズ統計や機械学習が注目を集めています。
ベイズ統計は条件付き確率に基いて推測するという一貫した考え方ですので、基本的な考え方が理解できれば様々な場面に応用できます。
そこで、本セミナーではベイズ統計の基本的な考え方を多くの例で学んでいきます。特に、様々な職種・業務の方が理解しやすいようにシンプルな活用例をとりあげます。
セミナーの前半ではスライドによる説明に加えて、手を動かす簡単な計算や、Rのサンプルプログラムのデモ (ソースは受講者に配布)もさしはさみます。効率よく理解を深めていきましょう。
後半では、最近話題のベイズ分析ツールRStanと、その基礎となるアルゴリズム(マルコフ連鎖モンテカルロ法)も説明しRStanを使ったベイズ統計によるデータ分析の実践例を示します(ソースは受講者に配布)。
受講対象・レベル
・ベイズ統計の基本について効率よく学びたい研究者、実務の方(業種や職種は問いません)
・ベイズ統計に基いたデータ分析や活用方法に興味がある研究者、実務の方(業種や職種は問いません)
・各種ソフトやツールを利用してベイズ分析を行っており基本的な部分をしっかりと理解したい方
必要な予備知識
・大学などで統計を一通り習っていることが望ましい(セミナーの最初に説明します)
・大学初年度程度の数学知識(期待値や分散の計算に必要なレベルの微積分)
※簡単なプログラミング経験(言語不問)とPC操作ができれば、配布するR、RStanコードの実行を通じて、さらに理解が深まるでしょう。
習得できる知識
・従来の統計手法との違いを理解し、ベイズ統計による分析が必要かどうか判断できる。
・データ分析において、ベイズモデリングや予測分布の手法を取り入れることができる。
・データが手に入る状況で、ベイズ統計に基づいた意思決定を取り入れることができる。
・ベイズ統計を応用する場面で、プログラミング言語を用いてマルコフ連鎖モンテカルロ法を実装もしくはツールで実行できる。
セミナープログラム
1. イントロダクション:ベイズ統計でなにができるようになるか
1-1. 原発でのポンプ故障率の分析例 (階層ベイズモデル)
2. 条件付き確率とベイズの定理
2-1. 確率分布と期待値、分散
2-2. 条件付き確率、独立性
2-3. 条件付き確率を活用する
(1) 確率と条件付き確率の違い
(2) モンティ・ホール問題
2-4. ベイズの定理とその応用
(1) ベイズの定理と分解公式
(2) 応用上の意味
(3) がん診断
(4) ベイズの定理を用いた計算例
2-5. 機械学習への応用
(1) 迷惑メールフィルタ
(2) 迷惑メールの確率
(3) 迷惑メールフィルタの仕組み
(4) 機械学習の考え方
3. ベイズ統計入門
3-1. 統計モデル
(1) 推測統計でのデータの解釈
(2) 母集団と統計モデル
(3) モデルの明示
(4) 基本的な分析の流れ
3-2. 事前分布の導入
(1) パラメータの不確実性の表現
(2) データから計算したい条件付き確率
(3) 事前分布の導入
3-3. 事後分布
(1) 事後分布の定義
(2) ベイズ分析の主要な部分
4. 事後分布に基いた統計推測
4-1. 事前分布の設定の仕方
4-2. 共役事前分布
(1) 共役事前分布
(2) 二項分布+ベータ分布
(3) ポアソン分布+ガンマ分布
(4) 正規分布+正規分布
4-3. 事後分布に基いたパラメータ推定
(1) ベイズ分析の報告の基本
(2) 点推定
(3) 信用区間
5. ベイズモデリングと予測分布
5-1. 広告効果を確率で評価する
(1) 問題設定
(2) 統計モデルの設定
(3) 事前分布の設定
(4) 分析結果
5-2. 新規店舗の売上を分布で予測する
(1) 問題設定と統計モデル
(2) 予測分布
(3) 分析結果
5-3. 期待損失最小化で中古PCの追加購入台数を決める
(1) 問題設定
(2) 損失関数
(3) 決定関数
(4) 分析結果
6. コンピュータ(計算機)を用いたベイズ分析の実践
~各モデリング手法及びRStanによる実行・評価~
6-1. ベイズ分析ツールRStanについて
(1) ベイズ分析ツールの仕組み
(2) Stanの概要
(3) RStanの使い方
6-2. モンテカルロ法
(1) ベイズ分析に必要な計算
(2) モンテカルロサンプリング
(3) モンテカルロ積分
(4) IIDサンプル(理想的なモンテカルロサンプル)
6-3. マルコフ連鎖と定常分布
(1) マルコフ連鎖
(2) 1次元山登りウオーク
(3) 定常分布
6-4. マルコフ連鎖モンテカルロ法(MCMC法)
(1) メトロポリス・ヘイスティングス法(MH法)のアルゴリズム
(2) MH法の実装例とMCMCサンプル
(3) ギブス・サンプリングの概要
(4) ギブス・サンプリングのアルゴリズム
6-5. 階層ベイズモデルとその分析例
(1) 問題設定
(2) 統計モデルの設定
(3) 事前分布の設定
(4) 分析結果
6-6. 一般化線形モデルとその分析例
(1) 問題設定
(2) 統計モデルの設定
(3) 事前分布の設定
(4) 分析結果
6-7. 状態空間モデルとその分析例
(1) 問題設定
(2) 統計モデルの設定
(3) 事前分布の設定
(4) 分析結果
【質疑応答】
キーワード:
ベイズ統計,分析,機械学習,モデリング,推測,データ,RStan,セミナー,講演,研修
セミナー講師
大阪大学 全学教育推進機構 教授 博士(情報理工)
田中 冬彦 氏
【ご専門】
統計理論、特にベイズ統計学
【ご経歴等】
2007年3月 東京大学大学院情報理工学系研究科 博士取得
2007年4月~2009年3月 東京大学大学院 情報理工学系研究科 助教
2009年4月~2011年3月 (独)科学技術振興機構 さきがけ専任研究者
2011年4月~2013年9月 東京大学大学院 情報理工学系研究科 助教
2013年10月~2022年3月 大阪大学大学院 基礎工学研究科 准教授
現在、大阪大学にて
「統計モデリング」「統計学C-II(工学部1年次)」「データ科学による課題解決入門」を講義
セミナー受講料
55,000円(税込、資料付)
■ セミナー主催者からの会員登録をしていただいた場合、1名で申込の場合49,500円、
2名同時申込の場合計55,000円(2人目無料:1名あたり27,500円)で受講できます。
(セミナーのお申し込みと同時に会員登録をさせていただきますので、
今回の受講料から会員価格を適用いたします。)
※ 会員登録とは
ご登録いただきますと、セミナーや書籍などの商品をご案内させていただきます。
すべて無料で年会費・更新料・登録費は一切かかりません。
メールまたは郵送でのご案内となります。
郵送での案内をご希望の方は、備考欄に【郵送案内希望】とご記入ください。
受講について
Zoomを使ったWEB配信セミナー受講の手順
- Zoomを使用されたことがない方は、こちらからミーティング用Zoomクライアントをダウンロードしてください。ダウンロードできない方はブラウザ版でも受講可能です。
- セミナー前日までに必ず動作確認をお願いします。
- 開催日直前にWEBセミナーへの招待メールをお送りいたします。当日のセミナー開始10分前までに招待メールに記載されている視聴用URLよりWEB配信セミナーにご参加ください。
- セミナー資料は開催前日までにお送りいたします。
- アーカイブの場合は、配信開始日以降に、セミナー資料と動画のURLをメールでお送りします。
- 無断転載、二次利用や講義の録音、録画などの行為を固く禁じます。