ベイズ推定=Bayesian Inferenceという言葉に接したのは3度目だ。Venture Capitalistをやっていた時に、或る起業者が「ウチはBayesian Probabilityで計算して株価予測のコンサルをしています。」と言った。慌てて百科事典でBayesianを引き、何か事象が起きた時、それ以降の確率が変わるという趣旨だと知った。しかし事象と株価の関係性は人が決めねばならぬから、株価予測が良くなる訳ではないので、投資は止めた。
米大教授の友人が送って呉れた著書には、Bayesianの章があった。そして今回は別稿の量子力学との関連だった。18世紀の英聖職者で数学者の Thomas Bayesが発明した概念だという。具体例で見てみよう。
75歳以上の高齢者は、3年に1度の運転免許更新の度に実地と机上のテストを受ける。人口の高齢化と共に高齢運転者の事故が増加して社会問題化している。高齢運転者に衰えを自覚させ自発的に免許返納を促すのが主目的で、成績がよほど悪い人は別として、普通は免許更新を妨げない。高齢運転者が1年間に死亡事故を起こす確率はおよそ p(事)=10^(-4)、つまり1万分の1である。事故率は若者の方が高いが、死亡事故率はアクセル/ブレーキの踏み間違い(並べて置く方が悪い!!)などで高齢者の方が高い。以上は事実で以下は仮定だ。試験成績が悪かったが更新したという確率を P(悪)=5%、死亡事故を起こした人を母数として試験成績が悪かった人の割合つまり確率を p(悪/事)=30% と仮定して以下の話を進める。
Bayesが発表した公式に上記を当てはめると、
p(事|悪)p(悪)=P(悪|事)p(事)
両辺に或る人口を掛算すれば、両辺は共に成績が悪くて死亡事故を起こした人数の推定値になるから、この公式は納得できる。この公式から、試験成績が悪かった人が死亡事故を起こす確率は
p(事|悪)=P(悪|事)p(事)/p(悪)
=0.3 x 10^(-4)/0.05 = 6 x 10^(-4)
となる。p(事)=10^(-4)を事前確率、試験成績が悪かったという事実を算入した事後確率が p(事|悪)= 6 x 10^(-4) で、6倍ということだ(数値は私が勝手に入れたので、6倍は事実から得た倍率ではない)。
データが得られる場合には
p(悪)=p(悪|事)p(事) + p(悪|〜事)p(〜事)
のように展開してp(悪)を計算する公式もある。但し「〜事」は死亡事故を起こさなかった人を意味する。
こういう推定の仕方をベイズ推定=Bayesian Inferenceと言い、ベイズ確率=Bayesian Probabilityを元にして推定する。
ベイズ確率は、私共が高校以来習って来た数学的確率と違う点がある。宝籤抽選会で10区画に分けた円盤を回して矢で射る仕掛けで言うと、無限回試行すれば10区画は同じ頻度で当たるから、各区画に当たる確率は1/10と考えるように習って来た。無限回試行しなくても、その機構から推察して無限回試行すればそうなるはずという推察も許容する。従って数学的確率は「頻度主義」だという。観測者が誰であれ、例え居なくても、確率は1/10であり、確率は人間界と無関係に定まる。
ベイズ確率は、矢を発射したり、刺さった矢を読み取ったりする行為主体が、仕掛けと一緒に行為を行った際に、行為主体がどのように期待するかその期待値がベイズ確率であるとするから主観主義だ。常識ある行為主体であれば1/10を期待するだろうから、この場合答は同じだ。しかしもしかして偶数より奇数が出易いとか思う主観もあるかも知れない。
今我々が当然だと思うように教育されてきた頻度主義の数学的確率は、19世紀に起こった考え方で、その前は18世紀に起こった主観主義のベイズ確率が主流だったそうだ。一旦頻度主義に塗り替えられた後、近年またベイズ確率が見直されて来たという。最大要因は量子力学との協働で、その他人間主義の高まりに応じてそうなっているという。
量子ベイズ確率=Quantum Bayesian Probabilityがそれで、別編のQBism[kju:bizm]とかQBistという言葉の語源になっている。 以上