arXiv探訪

興味の赴くままに数学するだけ

ベイズ統計になんでベイズの名前がついているのか分からない

小ネタ

ベイズの定理は確率論の定理で、確率{ P }と事象{ A, B }に対して、{ P }の条件付き確率{ P( \vert ) }に関して

{ P( B )P( A \vert B )=P( A )P( B \vert A ) }

が成り立つというもので、条件付き確率の定義から従うほぼ自明な結果である。測度論的には面倒かもしれないが、深く考えないとする。

一方、所謂ベイズ統計で用いられるパラメータ分布の更新(所謂ベイズ更新)は、モデル{ p( x \vert w ) }及び事前分布{ \phi( w ) }及びデータセット{ \lbrace X_{1}, \dotsc, X_{n} \rbrace }から事後分布を

{ \displaystyle \psi( w \vert X^{n} )\propto\prod_{i=1}^{n}p( X_{i} \vert w )\cdot \phi( w ) }

で定義するというものである。定義なんだから他に事後分布の定義方法があってもいいし、例えば逆温度{ \beta }を使ったりする。

違うでしょ。似てるかもしれないけど別物でしょ。上は定理だけど下は定義でしょ。連想で名前付けることはあるけど、下で上の{ P }にあたるものは何よ? 勝手に名前使われたらベイズさん怒ると思うんだが。