Movatterモバイル変換


[0]ホーム

URL:


hoxo_m, profile picture
Uploaded byhoxo_m
37,195 views

階層モデルの分散パラメータの事前分布について

基礎からのベイズ統計学入門 輪読会#4 LT資料http://stats-study.connpass.com/event/27129/

Embed presentation

【論論⽂文紹介】  階層モデルの分散パラメータの事前分布について2016/03/11@hoxo_̲m1
本⽇日紹介する論論⽂文•  “Prior distributions for varianceparameters in hierarchical models”•  (階層モデルの分散パラメータの事前分布)•  by Andrew Gelman•  Bayesian Analysis 2006https://projecteuclid.org/euclid.ba/13403710482
論論⽂文概要•  【背景】階層モデルの分散パラメータの事前分布として、⼀一般的に逆ガンマ分布が使⽤用されている。•  【結論論】逆ガンマ分布は使ってはいけない。グループ数が⼤大きいときは⼀一様分布を、  ⼩小さいときは弱い情報を持たせた半コーシー分布を使うのが良良い。3
この論論⽂文を読んだ理理由•  ベイズモデルにおいて事前分布の選択は重要である。•  にもかかわらず、(⾃自分は)あんまりよく分からずに適当に使っている。•  Stan  のマニュアルに事前分布について、最低限これ読んどけ的な論論⽂文が3つ紹介されている。•  そのうちの⼀一つ。4
論論⽂文著者について•  Andrew Gelman– コロンビア⼤大学教授– 実践的ベイジアン– ⽶米国統計学会の賞を3回受賞– 応⽤用統計学の巨⼈人– Stan の開発者https://en.wikipedia.org/wiki/Andrew_Gelman5
発表の流流れ1.  背景、使⽤用モデル2.  ⽤用語説明3.  理理論論的考察4.  実際のデータに適⽤用5.  結論論6
1.  背景•  階層モデルの各パラメータに対して事前分布を与える必要がある。•  本論論⽂文では階層分散パラメータに対してどのような事前分布を使えば良良いかを調査した。7
階層モデル•  この論論⽂文では、次のモデルに議論論を絞る•  データ  yij は正規分布に従うが、平均値はグループごとに異異なる。•  グループごとの平均値の分散  σα2e basic hierarchical modelork with a simple two-level normal model of data yij with groupyij ∼ N(µ + αj, σ2y), i = 1, . . . , nj, j = 1, . . . , Jαj ∼ N(0, σ2α), j = 1, . . . , J.discuss other hierarchical models in Section 7.2.(1) has three hyperparameters—µ, σy, and σα—but in this papernly with the last of these. Typically, enough data will be availd σy that one can use any reasonable noninformative prior distri(µ, σy) ∝ 1 or p(µ, log σy) ∝ 1.noninformative prior distributions for σα have been suggested8
•  この論論⽂文では、階層分散パラメータ  σα の事前分布をどうすればいいかを考える。http://www.slideshare.net/simizu706/ss-38292230・・・集団ごとに平均値を持つ。その分散が  σα29
発表の流流れ1.  背景、使⽤用モデル2.  ⽤用語説明3.  理理論論的考察4.  実際のデータに適⽤用5.  結論論10
2.  ⽤用語説明•  基本的な⽤用語および次の 3 つを説明する。(2-1) 条件付き共役事前分布(2-2) Improper な事前分布(2-3) 弱情報事前分布11
ベイズの定理理•  事後分布は尤度度と事前分布をかけたものに⽐比例例する12
共役事前分布•  共役事前分布尤度度関数に対して、事前分布と事後分布が同じ分布族に属するとき、これらを共役分布と⾔言い、このときの事前分布を共役事前分布と⾔言う。•  例例:⼆二項分布  →  ベータ分布13
(2-1)  条件付き共役事前分布•  条件付き共役事前分布パラメータが複数ある場合、特定のパラメータに着⽬目し、それ以外を固定した尤度度関数に対して共役となるような事前分布を、そのパラメータに対する条件付き共役事前分布という。•  分散に着⽬目した正規分布  →  逆ガンマ分布Normal(σ ; µ) → InvGamma(α, β)http://d.hatena.ne.jp/teramonagi/20141011/141299127514
(2-1)  条件付き共役事前分布•  階層分散パラメータ  σα  には、シンプルな共役分布は無いHill(1965), Tiao & Tan(1965)•  なので、条件付き共役事前分布を使う15
無情報事前分布•  事後分布にできるだけ影響しないような事前分布•  事前知識識が無い場合は無情報事前分布を使う•  簡単そうに⾒見見えて、実は難しい概念念http://ibisforest.org/index.php?無情報事前分布16
無情報事前分布•  例例:⼆二項分布に対して、Beta(1, 1)  は⼀一⾒見見して無情報であるhttp://www.eeso.ges.kyoto-u.ac.jp/emm/?page_id=52917
無情報事前分布•  これはある解釈のもとでは正しいが、    変数変換により偏りが⽣生じてしまう•  真に無情報と⾔言えるのは、Beta(0, 0) ?•  しかし、これは improper である•  無情報には様々な解釈がある変数変換に強い無情報事前分布として  Jeffreys事前分布 Beta(0.5, 0.5) が有名http://ibisforest.org/index.php?Jeffreys事前分布18
(2-2) Improper な事前分布•  ベイズの定理理において、事前分布を定数倍しても事後分布に影響はない•  すなわち、事前分布の積分は 1 でなくて良良い•  さらに進めて、積分が発散するものを考える•  積分が発散するとき  improper  な分布と呼ぶhttps://en.wikipedia.org/wiki/Prior_probability#Improper_priors19
(2-2) Improper な事前分布•  例例:⼀一様分布   Uniform(-‐‑‒∞, ∞)逆ガンマ分布    InvGamma(0, 0)ベータ分布 Beta(0, 0)•  ある意味、理理想的な無情報事前分布•  ただし、improper な事前分布を使うと、事後分布も improper となる可能性がある20
(2-2) Improper な事前分布•  ソフトウェアの制約により、improper  な事前分布が使えない(※BUGSの場合。Stanでは使える)•  Improper な事前分布の極限表現を使う。•  例例:⼀一様分布   Uniform(-A, A), A →  ⼤大逆ガンマ分布    InvGamma(ε, ε), ε  →  ⼩小
(2-3) 弱情報事前分布•  無情報事前分布に近いが、少しだけ情報を持っている事前分布•  実際、我々はどんな問題に対しても多少は事前知識識を持っている•  例例:  成⼈人⼥女女性の平均⾝身⻑⾧長について、少なくとも 1m〜~2m の間に⼊入っているだろう22
(2-3) 弱情報事前分布•  成⼈人⼥女女性の平均⾝身⻑⾧長について、少なくとも  1m 〜~ 2m の間に⼊入っているだろうNormal(1.5, 0.3)23
論論⽂文の流流れ①•  階層分散パラメータの事前分布として、良良いものを⾒見見つけたい。•  無情報事前分布として、improper  な事前分布の極限表現を調べる。•  評価基準:•  事後分布に対する影響が少ない•  結論論①:⼀一様分布が良良い。24
論論⽂文の流流れ②•  グループ数が⼩小さい場合、⼀一様分布では  事後分布への影響が⼤大きい。•  弱情報事前分布を使うことを考える。•  ⼀一様分布に弱情報を持たせても、事後分布への影響は⼤大きいまま。•  弱情報事前分布として、条件付き共役である半コーシー分布を使うと良良い。25
発表の流流れ1.  背景、使⽤用モデル2.  ⽤用語説明3.  理理論論的考察4.  実際のデータに適⽤用5.  結論論26
3.  理理論論的考察•  階層ベイズモデルの階層分散パラメータ  σα に対して、どんな無情報事前分布を  使⽤用したらいいかについて考察する。lly-conjugate family. We propose a half-t model and demonstranformative prior distribution and as a component in a hierarchicarameters.e basic hierarchical modelork with a simple two-level normal model of data yij with groupyij ∼ N(µ + αj, σ2y), i = 1, . . . , nj, j = 1, . . . , Jαj ∼ N(0, σ2α), j = 1, . . . , J.discuss other hierarchical models in Section 7.2.(1) has three hyperparameters—µ, σy, and σα—but in this papernly with the last of these. Typically, enough data will be availd σy that one can use any reasonable noninformative prior distri(µ, σ ) ∝ 1 or p(µ, log σ ) ∝ 1.27
逆ガンマ分布•  σα 〜~ InvGamma(ε, ε)•  条件付き共役事前分布•  昔からよく使われている•  事後分布が  ε  の値に影響される•  結論論:使えない28
逆ガンマ分布•  σα 〜~ InvGamma(ε, ε)σα0ε → 0 としても⼭山が残るε = 0.01ε = 0.05ε = 0.129
⼀一様分布•  σα 〜~ Uniform(0, A)•  先ほどのような問題が発⽣生しないので良良い•  ただし、J=1,2 のとき事後分布が improper•  J  が⼩小さいとき、miscalibration が⼤大きい•  結論論:J が⼤大きいなら使える30
⼀一様分布•  σα 〜~ Uniform(0, A)σα0 A31
半コーシー分布•  σα 〜~ HalfCauchy(A)•  コーシー分布の正の範囲だけ•  条件付き共役事前分布•  σα = 0  で最⼤大値を取り、なだらかに減少•  弱情報事前分布•  J  が⼩小さい場合に良良さそう32
半コーシー分布•  σα 〜~ HalfCauchy(A)A = 5A = 25σα0なだらかに減少33
発表の流流れ1.  背景、使⽤用モデル2.  ⽤用語説明3.  理理論論的考察4.  実際のデータに適⽤用5.  結論論34
4.  実際のデータに適⽤用•  8-schools データ•  8 つの学校で⾏行行われた共通テストの点数•  階層モデルにより学校間の得点差をモデル化•  σα  に対して無情報事前分布を適⽤用してみるlly-conjugate family. We propose a half-t model and demonstranformative prior distribution and as a component in a hierarchicarameters.e basic hierarchical modelork with a simple two-level normal model of data yij with groupyij ∼ N(µ + αj, σ2y), i = 1, . . . , nj, j = 1, . . . , Jαj ∼ N(0, σ2α), j = 1, . . . , J.discuss other hierarchical models in Section 7.2.(1) has three hyperparameters—µ, σy, and σα—but in this papernly with the last of these. Typically, enough data will be availd σy that one can use any reasonable noninformative prior distri35
http://www.slideshare.net/simizu706/ss-38292230・・・•  集団  =  学校•  個⼈人  =  テストの点数•  学校ごとに平均点が異異なる•  学校ごとの平均点の分散が  σα236
8-schools  逆ガンマ分布•  左:  ε = 1,  右:  ε = 0.001•  ε  によって事後分布が⼤大きく異異なる 52330nσα0 5 10 15 20 25 308 schools: posterior on σα giveninv−gamma (1, 1) prior on σα2σα0 5 10 15 20 25 308 schools: posterior on σα giveninv−gamma (.001, .001) prior on σα2osterior simulations of the between-school standard deviation,37
8-schools  逆ガンマ分布•  逆ガンマ分布にはピークがあり、ε を変更更するとピークが移動する。•  このピークの位置に依存して事後分布が変わってしまう。•  ε  をどれだけ⼩小さくしても、この状況は変わらない(⼗十分⼩小さな  ε  が存在しない)•  無情報事前分布としては不不適切切38
8-schools ⼀一様分布•  σα 〜~ Uniform(0, A)•  事後分布は  A  の⼤大きさに依存しない。Andrew Gelmanσα0 5 10 15 20 25 308 schools: posterior on σα givenuniform prior on σασα0 5 10 158 schools: posteinv−gamma (1,39
8-schools  ⼀一様分布•  逆ガンマ分布とは異異なり、⼗十分⼤大きな  A  を選べば、事後分布には影響しない。•  無情報事前分布として良良い。•  σα ≦ 20  にだいたい収まっている。•  J=8 ではこれ以上の推定は困難。(注:今は推定の良良さではなく、無情報事前分布としての良良さを調べている)40
3-schools データ  •  グループ数が少ない場合はどうなるか?•  8-schools データのうち最初の3つを抽出•  J=3 に対して無情報事前分布を適⽤用する41
3-schools ⼀一様分布•  σα 〜~ Uniform(0, A)•  事後分布が⾮非常に⻑⾧長い裾を引いている。24 Prior distributions for variance paσα0 50 100 150 2003 schools: posterior on σα givenuniform prior on σα03Figure 2: Histograms of posterior simulations of th42
3-schools  ⼀一様分布•  事後分布が⾮非常に⻑⾧長い裾を引いている。•  事前分布の影響が残っている。•  無情報  =  事後分布に影響しない•  無情報事前分布として不不適切切43
3-schools  弱情報事前分布•  3-schools 問題では、improper な⼀一様分布は、無情報事前分布として使えない。•  弱い事前情報を考える。•  テストの点数は 200 〜~ 800点、平均は500点程度度なので、標準偏差は 300  以下となる可能性が⾼高い。•  A=300 としてみる。44
3-schools 弱情報事前分布•  σα 〜~ Uniform(0, 300)•  ⼀一様分布に弱い情報を持たせても、裾が⻑⾧長いまま。524 Prior distributions for variance paramσα0 50 100 150 2003 schools: posterior on σα givenuniform prior on σα03 schhalFigure 2: Histograms of posterior simulations of the b45
3-schools  弱情報事前分布•  半コーシー分布に弱い情報を持たせる•  σα 〜~ HalfCauchy(25)•  95% の領領域で  σα < 300 となるσα0 30046
3-schools  半コーシー分布  •  σα 〜~ HalfCauchy(25)•  半コーシーでは、右裾が抑えられるvariance parameters in hierarchical models00nσα0 50 100 150 2003 schools: posterior on σα givenhalf−Cauchy (25) prior on σαulations of the between-school standard deviation,47
発表の流流れ1.  背景、使⽤用モデル2.  ⽤用語説明3.  理理論論的考察4.  実際のデータに適⽤用5.  結論論48
5.  結論論•  階層モデルの階層分散パラメータについて、無情報事前分布として何が良良いかを調べた。•  グループ数 J > 5 の場合は A を⼗十分⼤大きくした⼀一様分布 Uniform(0, A) が良良い。•  J = 3,4,5 の場合は半コーシー分布が良良い。•  逆ガンマ分布は使ってはダメ。49

Recommended

PPTX
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章
PPTX
NagoyaStat#7 StanとRでベイズ統計モデリング(アヒル本)4章の発表資料
PPTX
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
PDF
階層ベイズによるワンToワンマーケティング入門
PDF
ベイズ統計入門
PDF
Rの高速化
PPTX
StanとRでベイズ統計モデリングに関する読書会(Osaka.stan) 第四章
PDF
これからの仮説検証・モデル評価
PDF
Stan超初心者入門
PDF
階層ベイズとWAIC
PPTX
MCMCでマルチレベルモデル
PDF
基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法
PDF
ベイズモデリングと仲良くするために
PDF
Chapter9 一歩進んだ文法(前半)
PDF
Cmdstanr入門とreduce_sum()解説
PDF
変分推論法(変分ベイズ法)(PRML第10章)
PDF
あなたの心にBridgeSampling
PDF
2 4.devianceと尤度比検定
PDF
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)
PPTX
パターン認識と機械学習(PRML)第2章 確率分布 2.3 ガウス分布
PDF
pymcとpystanでベイズ推定してみた話
PDF
質的変数の相関・因子分析
PDF
深層生成モデルと世界モデル
PDF
RStanとShinyStanによるベイズ統計モデリング入門
PPTX
ベイズファクターとモデル選択
PDF
2 6.ゼロ切断・過剰モデル
PDF
グラフィカルモデル入門
PDF
Stanコードの書き方 中級編
PPT
C:\D Drive\Prml\プレゼン\パターン認識と機械学習2 4章 D0703
PDF
Prml2.1 2.2,2.4-2.5

More Related Content

PPTX
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章
PPTX
NagoyaStat#7 StanとRでベイズ統計モデリング(アヒル本)4章の発表資料
PPTX
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
PDF
階層ベイズによるワンToワンマーケティング入門
PDF
ベイズ統計入門
PDF
Rの高速化
PPTX
StanとRでベイズ統計モデリングに関する読書会(Osaka.stan) 第四章
PDF
これからの仮説検証・モデル評価
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章
NagoyaStat#7 StanとRでベイズ統計モデリング(アヒル本)4章の発表資料
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
階層ベイズによるワンToワンマーケティング入門
ベイズ統計入門
Rの高速化
StanとRでベイズ統計モデリングに関する読書会(Osaka.stan) 第四章
これからの仮説検証・モデル評価

What's hot

PDF
Stan超初心者入門
PDF
階層ベイズとWAIC
PPTX
MCMCでマルチレベルモデル
PDF
基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法
PDF
ベイズモデリングと仲良くするために
PDF
Chapter9 一歩進んだ文法(前半)
PDF
Cmdstanr入門とreduce_sum()解説
PDF
変分推論法(変分ベイズ法)(PRML第10章)
PDF
あなたの心にBridgeSampling
PDF
2 4.devianceと尤度比検定
PDF
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)
PPTX
パターン認識と機械学習(PRML)第2章 確率分布 2.3 ガウス分布
PDF
pymcとpystanでベイズ推定してみた話
PDF
質的変数の相関・因子分析
PDF
深層生成モデルと世界モデル
PDF
RStanとShinyStanによるベイズ統計モデリング入門
PPTX
ベイズファクターとモデル選択
PDF
2 6.ゼロ切断・過剰モデル
PDF
グラフィカルモデル入門
PDF
Stanコードの書き方 中級編
Stan超初心者入門
階層ベイズとWAIC
MCMCでマルチレベルモデル
基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法
ベイズモデリングと仲良くするために
Chapter9 一歩進んだ文法(前半)
Cmdstanr入門とreduce_sum()解説
変分推論法(変分ベイズ法)(PRML第10章)
あなたの心にBridgeSampling
2 4.devianceと尤度比検定
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)
パターン認識と機械学習(PRML)第2章 確率分布 2.3 ガウス分布
pymcとpystanでベイズ推定してみた話
質的変数の相関・因子分析
深層生成モデルと世界モデル
RStanとShinyStanによるベイズ統計モデリング入門
ベイズファクターとモデル選択
2 6.ゼロ切断・過剰モデル
グラフィカルモデル入門
Stanコードの書き方 中級編

Similar to 階層モデルの分散パラメータの事前分布について

PPT
C:\D Drive\Prml\プレゼン\パターン認識と機械学習2 4章 D0703
PDF
Prml2.1 2.2,2.4-2.5
PDF
PRML2.1 2.2
PPTX
Introduction to Statistical Estimation (統計的推定入門)
PDF
統計的因果推論 勉強用 isseing333
PDF
Draftall
PDF
PRML2.3.8~2.5 Slides in charge
PDF
Zansa0130presentation
 
PDF
2012-1110「マルチレベルモデルのはなし」(censored)
PDF
反応時間データをどう分析し図示するか
PDF
PRML_titech 2.3.1 - 2.3.7
PDF
第4回DARM勉強会 (多母集団同時分析)
PDF
星野「調査観察データの統計科学」第1&2章
PDF
事前分布との出会い
PDF
Rm20150520 6key
PDF
2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」
PDF
ベイズ入門
 
PDF
[PRML] パターン認識と機械学習(第2章:確率分布)
PPTX
ベイズ統計学の概論的紹介
C:\D Drive\Prml\プレゼン\パターン認識と機械学習2 4章 D0703
Prml2.1 2.2,2.4-2.5
PRML2.1 2.2
Introduction to Statistical Estimation (統計的推定入門)
統計的因果推論 勉強用 isseing333
Draftall
PRML2.3.8~2.5 Slides in charge
Zansa0130presentation
 
2012-1110「マルチレベルモデルのはなし」(censored)
反応時間データをどう分析し図示するか
PRML_titech 2.3.1 - 2.3.7
第4回DARM勉強会 (多母集団同時分析)
星野「調査観察データの統計科学」第1&2章
事前分布との出会い
Rm20150520 6key
2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」
ベイズ入門
 
[PRML] パターン認識と機械学習(第2章:確率分布)
ベイズ統計学の概論的紹介

More from hoxo_m

PDF
Shinyユーザのための非同期プログラミング入門
 
PDF
Prophet入門【理論編】Facebookの時系列予測ツール
 
PDF
Prophet入門【R編】Facebookの時系列予測ツール
 
PDF
機械学習のためのベイズ最適化入門
 
PDF
学習係数
 
PDF
Prophet入門【Python編】Facebookの時系列予測ツール
 
PDF
AJAXサイトの情報をWebスクレイピング
 
PPTX
高速なガンマ分布の最尤推定法について
 
PDF
経験過程
 
PDF
確率論基礎
 
PDF
シンギュラリティを知らずに機械学習を語るな
 
PDF
非制約最小二乗密度比推定法 uLSIF を用いた外れ値検出
 
PDF
トピックモデルの評価指標 Perplexity とは何なのか?
 
PDF
トピックモデルの評価指標 Coherence 研究まとめ #トピ本
 
PDF
トピックモデルによる統計的潜在意味解析読書会 3.7 評価方法 - 3.9 モデル選択 #トピ本
 
PDF
協調フィルタリング入門
 
PDF
データの不備を統計的に見抜く (Gelman’s secret weapon)
 
PDF
カップルが一緒にお風呂に入る割合をベイズ推定してみた
 
PDF
Stan で欠測データの相関係数を推定してみた
 
PDF
チェビシェフの不等式
 
Shinyユーザのための非同期プログラミング入門
 
Prophet入門【理論編】Facebookの時系列予測ツール
 
Prophet入門【R編】Facebookの時系列予測ツール
 
機械学習のためのベイズ最適化入門
 
学習係数
 
Prophet入門【Python編】Facebookの時系列予測ツール
 
AJAXサイトの情報をWebスクレイピング
 
高速なガンマ分布の最尤推定法について
 
経験過程
 
確率論基礎
 
シンギュラリティを知らずに機械学習を語るな
 
非制約最小二乗密度比推定法 uLSIF を用いた外れ値検出
 
トピックモデルの評価指標 Perplexity とは何なのか?
 
トピックモデルの評価指標 Coherence 研究まとめ #トピ本
 
トピックモデルによる統計的潜在意味解析読書会 3.7 評価方法 - 3.9 モデル選択 #トピ本
 
協調フィルタリング入門
 
データの不備を統計的に見抜く (Gelman’s secret weapon)
 
カップルが一緒にお風呂に入る割合をベイズ推定してみた
 
Stan で欠測データの相関係数を推定してみた
 
チェビシェフの不等式
 

階層モデルの分散パラメータの事前分布について


[8]ページ先頭

©2009-2025 Movatter.jp