Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
EN
Uploaded by
Ken'ichi Matsui
PDF, PPTX
4,527 views
ベータ分布の謎に迫る
社内の勉強会で発表した、ベータ分布を直感的に理解する試みを紹介します。
Data & Analytics
◦
Read more
2
Save
Share
Embed
Embed presentation
Download
Download as PDF, PPTX
1
/ 25
2
/ 25
3
/ 25
4
/ 25
5
/ 25
6
/ 25
7
/ 25
8
/ 25
9
/ 25
10
/ 25
11
/ 25
12
/ 25
Most read
13
/ 25
14
/ 25
15
/ 25
16
/ 25
Most read
17
/ 25
18
/ 25
Most read
19
/ 25
20
/ 25
21
/ 25
22
/ 25
23
/ 25
24
/ 25
25
/ 25
More Related Content
PPTX
ようやく分かった!最尤推定とベイズ推定
by
Akira Masuda
PDF
『バックドア基準の入門』@統数研研究集会
by
takehikoihayashi
PDF
因果探索: 基本から最近の発展までを概説
by
Shiga University, RIKEN
PDF
pymcとpystanでベイズ推定してみた話
by
Classi.corp
PDF
工学系大学4年生のための論文の読み方
by
ychtanaka
PDF
グラフィカル Lasso を用いた異常検知
by
Yuya Takashina
PPTX
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
by
Yoshitake Takebayashi
PPTX
SSII2020SS: 微分可能レンダリングの最新動向 〜「見比べる」ことによる3次元理解 〜
by
SSII
ようやく分かった!最尤推定とベイズ推定
by
Akira Masuda
『バックドア基準の入門』@統数研研究集会
by
takehikoihayashi
因果探索: 基本から最近の発展までを概説
by
Shiga University, RIKEN
pymcとpystanでベイズ推定してみた話
by
Classi.corp
工学系大学4年生のための論文の読み方
by
ychtanaka
グラフィカル Lasso を用いた異常検知
by
Yuya Takashina
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
by
Yoshitake Takebayashi
SSII2020SS: 微分可能レンダリングの最新動向 〜「見比べる」ことによる3次元理解 〜
by
SSII
What's hot
PPTX
劣モジュラ最適化と機械学習1章
by
Hakky St
PPTX
5分でわかるベイズ確率
by
hoxo_m
PDF
負の二項分布について
by
Hiroshi Shimizu
PDF
階層モデルの分散パラメータの事前分布について
by
hoxo_m
PDF
「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料
by
Ken'ichi Matsui
PPTX
MCMCでマルチレベルモデル
by
Hiroshi Shimizu
PDF
Stan超初心者入門
by
Hiroshi Shimizu
PDF
機械学習による統計的実験計画(ベイズ最適化を中心に)
by
Kota Matsui
PPTX
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
by
Shota Imai
PDF
学部生向けベイズ統計イントロ(公開版)
by
考司 小杉
PDF
レコメンドアルゴリズムの基本と周辺知識と実装方法
by
Takeshi Mikami
PPTX
強化学習アルゴリズムPPOの解説と実験
by
克海 納谷
PDF
深層生成モデルと世界モデル
by
Masahiro Suzuki
PPTX
15分でわかる(範囲の)ベイズ統計学
by
Ken'ichi Matsui
PPTX
MCMC法
by
MatsuiRyo
PDF
SSII2021 [TS2] 深層強化学習 〜 強化学習の基礎から応用まで 〜
by
SSII
PDF
強化学習その2
by
nishio
PPTX
ベイズ統計学の概論的紹介
by
Naoki Hayashi
PDF
Stanコードの書き方 中級編
by
Hiroshi Shimizu
PDF
トピックモデルの評価指標 Perplexity とは何なのか?
by
hoxo_m
劣モジュラ最適化と機械学習1章
by
Hakky St
5分でわかるベイズ確率
by
hoxo_m
負の二項分布について
by
Hiroshi Shimizu
階層モデルの分散パラメータの事前分布について
by
hoxo_m
「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料
by
Ken'ichi Matsui
MCMCでマルチレベルモデル
by
Hiroshi Shimizu
Stan超初心者入門
by
Hiroshi Shimizu
機械学習による統計的実験計画(ベイズ最適化を中心に)
by
Kota Matsui
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
by
Shota Imai
学部生向けベイズ統計イントロ(公開版)
by
考司 小杉
レコメンドアルゴリズムの基本と周辺知識と実装方法
by
Takeshi Mikami
強化学習アルゴリズムPPOの解説と実験
by
克海 納谷
深層生成モデルと世界モデル
by
Masahiro Suzuki
15分でわかる(範囲の)ベイズ統計学
by
Ken'ichi Matsui
MCMC法
by
MatsuiRyo
SSII2021 [TS2] 深層強化学習 〜 強化学習の基礎から応用まで 〜
by
SSII
強化学習その2
by
nishio
ベイズ統計学の概論的紹介
by
Naoki Hayashi
Stanコードの書き方 中級編
by
Hiroshi Shimizu
トピックモデルの評価指標 Perplexity とは何なのか?
by
hoxo_m
Similar to ベータ分布の謎に迫る
PDF
Pattern Recognition and Machine Learning study session - パターン認識と機械学習 勉強会資料
by
Taro Masuda
PDF
演習II.第1章 ベイズ推論の考え方 Part 2.講義ノート
by
Wataru Shito
PDF
ベータ分布
by
Makoto Hirakawa
PDF
ベイズ統計入門
by
Miyoshi Yuya
PPTX
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章
by
Shushi Namba
PDF
第4回MachineLearningのための数学塾資料(浅川)
by
Shin Asakawa
PPTX
色々な確率分布とその応用
by
Hiroki Iida
PDF
PRML勉強会第3回 2章前半 2013/11/28
by
kurotaki_weblab
PDF
20191006 bayesian dl_1_pub
by
Yoichi Tokita
PDF
演習II.第1章 ベイズ推論の考え方 Part 2.スライド
by
Wataru Shito
PPTX
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 8: Inferring Two Binomial P...
by
Junki Marui
PDF
Prml2.1 2.2,2.4-2.5
by
Takuto Kimura
PDF
「全ての確率はコイン投げに通ず」 Japan.R 発表資料
by
Ken'ichi Matsui
PDF
PRML2.1 2.2
by
Takuto Kimura
PPTX
ラビットチャレンジレポート 応用数学
by
HiroyukiTerada4
PPTX
基礎からのベイズ統計学 3章(3.1~3.3)
by
TeranishiKeisuke
PDF
【社内勉強会用】統計学超入門
by
Akira Torii
PDF
Tokyowebmining #49 Matirx and nonparametric bayes
by
Kenny ISHIMURA
Pattern Recognition and Machine Learning study session - パターン認識と機械学習 勉強会資料
by
Taro Masuda
演習II.第1章 ベイズ推論の考え方 Part 2.講義ノート
by
Wataru Shito
ベータ分布
by
Makoto Hirakawa
ベイズ統計入門
by
Miyoshi Yuya
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章
by
Shushi Namba
第4回MachineLearningのための数学塾資料(浅川)
by
Shin Asakawa
色々な確率分布とその応用
by
Hiroki Iida
PRML勉強会第3回 2章前半 2013/11/28
by
kurotaki_weblab
20191006 bayesian dl_1_pub
by
Yoichi Tokita
演習II.第1章 ベイズ推論の考え方 Part 2.スライド
by
Wataru Shito
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 8: Inferring Two Binomial P...
by
Junki Marui
Prml2.1 2.2,2.4-2.5
by
Takuto Kimura
「全ての確率はコイン投げに通ず」 Japan.R 発表資料
by
Ken'ichi Matsui
PRML2.1 2.2
by
Takuto Kimura
ラビットチャレンジレポート 応用数学
by
HiroyukiTerada4
基礎からのベイズ統計学 3章(3.1~3.3)
by
TeranishiKeisuke
【社内勉強会用】統計学超入門
by
Akira Torii
Tokyowebmining #49 Matirx and nonparametric bayes
by
Kenny ISHIMURA
More from Ken'ichi Matsui
PDF
音楽波形データからコードを推定してみる
by
Ken'ichi Matsui
PDF
データサイエンティストの仕事とデータ分析コンテスト
by
Ken'ichi Matsui
PDF
分析コンペティションの光と影
by
Ken'ichi Matsui
PDF
Kaggle Google Quest Q&A Labeling 反省会 LT資料 47th place solution
by
Ken'ichi Matsui
PDF
BERT入門
by
Ken'ichi Matsui
PDF
データ分析コンテストとデータサイエンティストの働きかた
by
Ken'ichi Matsui
PDF
確率分布の成り立ちを理解してスポーツにあてはめてみる
by
Ken'ichi Matsui
PDF
SIGNATE産業技術総合研究所 衛星画像分析コンテスト2位入賞モデルの工夫点
by
Ken'ichi Matsui
PDF
Introduction of VAE
by
Ken'ichi Matsui
PDF
Variational Autoencoderの紹介
by
Ken'ichi Matsui
PDF
数学カフェ 確率・統計・機械学習回 「速習 確率・統計」
by
Ken'ichi Matsui
PDF
DS LT祭り 「AUCが0.01改善したって どういうことですか?」
by
Ken'ichi Matsui
PDF
統計的学習の基礎 4章 前半
by
Ken'ichi Matsui
PDF
基礎からのベイズ統計学 輪読会資料 第8章 「比率・相関・信頼性」
by
Ken'ichi Matsui
PDF
第13回数学カフェ「素数!!」二次会 LT資料「乱数!!」
by
Ken'ichi Matsui
PDF
「ベータ分布の謎に迫る」第6回 プログラマのための数学勉強会 LT資料
by
Ken'ichi Matsui
PPTX
Random Forest による分類
by
Ken'ichi Matsui
PDF
基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法
by
Ken'ichi Matsui
PDF
基礎からのベイズ統計学 輪読会資料 第1章 確率に関するベイズの定理
by
Ken'ichi Matsui
PDF
白い陽気なやつとPythonでたわむれる
by
Ken'ichi Matsui
音楽波形データからコードを推定してみる
by
Ken'ichi Matsui
データサイエンティストの仕事とデータ分析コンテスト
by
Ken'ichi Matsui
分析コンペティションの光と影
by
Ken'ichi Matsui
Kaggle Google Quest Q&A Labeling 反省会 LT資料 47th place solution
by
Ken'ichi Matsui
BERT入門
by
Ken'ichi Matsui
データ分析コンテストとデータサイエンティストの働きかた
by
Ken'ichi Matsui
確率分布の成り立ちを理解してスポーツにあてはめてみる
by
Ken'ichi Matsui
SIGNATE産業技術総合研究所 衛星画像分析コンテスト2位入賞モデルの工夫点
by
Ken'ichi Matsui
Introduction of VAE
by
Ken'ichi Matsui
Variational Autoencoderの紹介
by
Ken'ichi Matsui
数学カフェ 確率・統計・機械学習回 「速習 確率・統計」
by
Ken'ichi Matsui
DS LT祭り 「AUCが0.01改善したって どういうことですか?」
by
Ken'ichi Matsui
統計的学習の基礎 4章 前半
by
Ken'ichi Matsui
基礎からのベイズ統計学 輪読会資料 第8章 「比率・相関・信頼性」
by
Ken'ichi Matsui
第13回数学カフェ「素数!!」二次会 LT資料「乱数!!」
by
Ken'ichi Matsui
「ベータ分布の謎に迫る」第6回 プログラマのための数学勉強会 LT資料
by
Ken'ichi Matsui
Random Forest による分類
by
Ken'ichi Matsui
基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法
by
Ken'ichi Matsui
基礎からのベイズ統計学 輪読会資料 第1章 確率に関するベイズの定理
by
Ken'ichi Matsui
白い陽気なやつとPythonでたわむれる
by
Ken'ichi Matsui
ベータ分布の謎に迫る
1.
2022.2.9 松井 健一 株式会社ディー・エヌ・エー +
株式会社 Mobility Technologies ベータ分布の謎に迫る DS勉強会発表資料
2.
社外秘 2 ⾃⼰紹介(松井 健⼀) 株式会社Mobility Technologies
AI技術開発部 データサイエンスグループ グループマネージャー(Kaggle Master) (株式会社 ディー・エヌ・エーより出向) 最近のプロジェクト • ドライブデータの解析 (DRIVE CHART) • https://drive-chart.com 著書 • New!「ワンランク上を⽬指す⼈のためのPython実践活⽤ガイド」共著(2022年3⽉予定) • 「ソフトウェアデザイン 2020年10⽉号 【第1特集】Pythonではじめる統計学 2-4章」著 • 「アクセンチュアのプロフェッショナルが教える データ・アナリティクス実践講座」共著 経歴 ⼤⼿SIer ⇒ ⼤⼿通信キャリア ⇒ 外資系コンサルティングファーム ⇒ 現職 NEW!
3.
第1種ベータ分布を単に「ベータ分布」と呼ぶ場合もある。 その確率密度関数は以下で定義される。 ここで はベータ関数である。 期待値は、 ,
分散は ベータ関数の定義は下記の通り。 ベータ分布とは (Wikipediaより [一部改変]) 図の出典: https://ja.wikipedia.org/wiki/ベータ分布
4.
4 一体どういう事象がこの分布に従うのでしょう?
5.
まず、使う変数名を変えて理解しやすくしてみる xって なんだね。じゃあ試しに確率と解釈してp とおいてみよう! ベータ関数のtって
なんだね。 これも確率と解釈してpに変えてみよう! ベータ分布の確率密度関数
6.
まず、使う変数名を変えて理解しやすくしてみる xって なんだね。じゃあ試しに確率と解釈してp とおいてみよう! ベータ関数のtって
なんだね。 これも確率と解釈してpに変えてみよう! ベータ分布の確率密度関数 同じだ!
7.
まず、使う変数名を変えて理解しやすくしてみる 形が同じなので、ベータ分布の確率密度関数を積分すると1になることがわ かります。 確率分布は曲線の下の面積が1になるので、 ベータ分布もこの要件を満たしている。
8.
ベータ分布の本質 ということで、分母の は定数、かつ分布の積分を1にするための 正規化定数であることがわかりました。 とりあえず定数なので、下記の通り分子部分だけにしたものと比例関係にあ り、この右辺の式が本質的な部分です。 ココが本質的 確率分布は曲線の下の面積が1になるので、 ベータ分布もこの要件を満たしている。
9.
ベータ分布の本質 が本質的な形を決めているので、これだけで縦の縮尺以外は ベータ分布に一致します。 のグラフ
10.
10 (́・ω・) ん? (́・ω・) よく見るとコイン投げ?
11.
コイン投げ(ベルヌーイ分布)について さらにこのベルヌーイ施行を n回実施した時の同時確率を考える。 コインを投げて表が出る事象を ,
裏が出る事象を とする。 その時の確率分布を下記のように表現する。またこのような試行をベルヌーイ試行 という。 ベルヌーイ分布 … 表が出た時 … 裏が出た時 このように書く場合も。 ※ pは表が出る確率を表す。普通のコインならp=0.5になることが予測される。 表は1 裏は0 → X(表) = 1 X(裏) = 0 → 0 1
12.
コイン投げ(ベルヌーイ分布)について と表現できます。 n回試行した時の同時確率 表が a回、裏が b回とすると a=α-1,
b=β-1 とすると、ベータ分布に比例したものと同じです!
13.
尤度の考え方 1回の試行の表の出る確率pがあらかじめ定数として決まっていて、 試行の結果の が変数として扱われている。 ただし、式の形が一緒なのですが、意味がかなり異なります。結果が与えられた 後に、密度関数のパラメーターを変更して得られる値を尤度と言います。 ベルヌーイ分布 ベータ分布(に比例したもの) αとβがパラメーターとして与えられ、pは0〜1の間の値をとる変数。 ベルヌーイ分布の同時確率に対する尤度に見える。 宣伝: 尤度について詳しくは
http://qiita.com/kenmatsu4/items/b28d1b3b3d291d0cc698
14.
尤度の考え方 1回の試行の表の出る確率pがあらかじめ定数として決まっていて、 試行の結果の が変数として扱われている。 ただし、式の形が一緒なのですが、意味がかなり異なります。結果が与えられた 後に、密度関数のパラメーターを変更して得られる値を尤度と言います。 ベルヌーイ分布 ベータ分布(に比例したもの) αとβがパラメーターとして与えられ、pは0〜1の間の値をとる変数。 ベルヌーイ分布の同時確率に対する尤度に見える。 宣伝: 尤度について詳しくは
http://qiita.com/kenmatsu4/items/b28d1b3b3d291d0cc698 コインをn回投げ終わって、表のでた回数を知っている状態。 その時、元々の1回あたりの表が出る確率pによって、どれくらい 起こりうる現象であるかを把握するための関数。(なのpを引数にと っている) 何でこんなに回りくどいのかというと、既に事象が発生してしまった 後なので、「確率」とは言えないから。
15.
15 pを確率変数だと思ってみよう
16.
一様分布の順序統計量 [0,1]の一様分布に従う乱数を9個発生させて順番に並び替える そこで、例えば i=6 番目の乱数が従う分布を考える。 1番目
2番目 3番目 4番目 5番目 6番目 7番目 8番目 9番目 0.137 0.185 0.310 0.483 0.530 0.695 0.731 0.768 0.950 例: p1 p2 p3 p4 p5 p6 p7 p8 p9 < < < < < < < < 1番目 2番目 3番目 4番目 5番目 6番目 7番目 8番目 9番目 0.137 0.185 0.310 0.483 0.530 0.695 0.731 0.768 0.950 例: p1 p2 p3 p4 p5 p6 p7 p8 p9 < < < < < < < <
17.
一様分布の順序統計量 これは、下記のような分布に従うことがわかっている。 (n個の乱数を順番に並べてi番目のものというふうに一般化) (これがなぜなのかはの詳細は巻末のREFERENCEページの「順序統計量」のPDFを参考としてください) 正規化定数 1番目 2番目 3番目
4番目 i 番目 n-1番目 n番目 … … 1番目 2番目 n番目 n-1番目 n-2番目 n-3番目 j 番目 i-1 番目 j-1 番目 前から: 後ろから: p1 p2 p3 p4 p pi-1 pi+1 pn-2 pn < < < < < < i-1個 j-1個 ベータ分布の形!
18.
一様分布の順序統計量 1番目 2番目 3番目
4番目 i 番目 n-1番目 n番目 … … 1番目 2番目 n番目 n-1番目 n-2番目 n-3番目 j 番目 i-1 番目 j-1 番目 前から: 後ろから: p1 p2 p3 p4 p pi-1 pi+1 pn-2 pn < < < < < < i-1個 j-1個 ここに入る確率が p i-1個 ここは 1-p j-1個 一様分布に従う確率変数 により定まる境界線から、 小さい方に i-1個、大きい方に j-1個得られる確率となっている。
19.
一様分布の順序統計量 1番目 2番目 3番目
4番目 i 番目 n-1番目 n番目 … … 1番目 2番目 n番目 n-1番目 n-2番目 n-3番目 j 番目 i-1 番目 j-1 番目 前から: 後ろから: p1 p2 p3 p4 p pi-1 pi+1 pn-2 pn < < < < < < i-1個 j-1個 ここに入る確率が p i-1個 ここは 1-p j-1個 一様分布に従う確率変数 により定まる境界線から、 小さい方に i-1個、大きい方に j-1個得られる確率となっている。 表の出る確率pのコインを10回投げて、 表がi-1回、裏がj-1回出る確率分布に対する パラメーター p の確率分布となっている。
20.
一様分布の順序統計量の直感的意味 ベータ関数とガンマ関数と階乗の関係性 また、今回の問題設定では であることを踏まえて、 、 nが自然数の場合、下記のようにガンマ関数を用いて書き換えられる。 ベータ関数 逆数の関係 正規化定数をどう解釈するかを考えていきます。
21.
一様分布の順序統計量の直感的意味 前ページの結果を用いて、 がベータ分布に書き換えられるとわかる。 ※: 正確には、n,
i, jを正の実数に拡張している。 つまり、ベータ分布とは、一様乱数をn個発生させ、 それを順番に並び替えて i 番目のものが従う確率分布と言える!
22.
22 シミュレーション & デモンストレーション @interact(a=(1,15,1),
b=(1,15,1)) def draw_norm_dist(a=2, b=2): set_size = a+b-1 trial_size = 30000 bin_width = 51 def gen_orderd_unif(size): unif = rd.rand(size) # (0, 1)の一様分布に従う乱数をsize個生成 unif.sort() # 大きさの順に並べる return unif # a+b-1個の順番に並べた一様乱数を生成、それをtrial_sizeセット実施して各セットa番目を抜き出す result = [gen_orderd_unif(set_size)[a-1] for _ in np.arange(trial_size)] plt.hist(result, bins=np.linspace(0,1,bin_width)) # 結果をヒストグラムで表示 plt.plot(p, st.beta.pdf(p, a, b)*trial_size/bin_width, c="g", lw=3) # ベータ分布の密度関数を表示 plt.show() Pythonによる乱数を用いたシミュレーションで も、ヒストグラムが理論的な密度関数に一致して いることがわかる。
23.
23 シミュレーション & デモンストレーション 様々なaとbの値でもきちんと密度関数とヒストグラムが一致している。
24.
24 REFERENCE • ベータ分布 (Wikipedia) https://ja.wikipedia.org/wiki/ベータ分布 •
全ての確率はコイン投げに通ず http://www.slideshare.net/matsukenbook/japanr-55839355 • 順序統計量 http://mcm-www.jwu.ac.jp/~konno/pdf/statha18.pdf • 本スライドで使ったPythonコード https://github.com/matsuken92/Qiita_Contents/blob/master/General/beta-distribution- analysis.ipynb
25.
25 EOF
Download