% ベイズ推定

\documentclass{jsarticle}
\pagestyle{myheadings}
\markright{tmt's math page}
\def\baselinestretch{1.33}

\begin{document}

\noindent\textbf{ベイズ推定}

まず、『マスペディア 1000/Richard Elwes 著(宮本寿代 訳)/(株)ディスカヴァー・トゥエンティワン』からの引用を要約した形で載せよう\footnote{詳細は『797 偽陽性』の項を参照のこと。}。

『ある人が、ある病気の感染の有無を調べる検査を受けた場合、
\begin{center}
\begin{tabular}{lrr}
感染の有無$\backslash$検査の結果 & 陽性($Y$) & 陰性 \\ \hline
感染している($X$) & $99$\% & $1$\% \\
感染していない & $5$\% & $95$\% \\
\end{tabular}
\end{center}
のような割合で判定される。病気は極めて珍しく、感染者は人口の$0.03$\%という。いま、任意に選ばれたハロルドが検査を受けて陽性だったとしたら、ハロルドが\.本\-\.当\-\.に感染している確率 $P(X|Y)$ はいくらだろうか。

これはベイズの定理より次のようにして答が出る。
\[\begin{array}{lclcl}
P(Y) &=& 0.99\times0.0003 + 0.05\times0.9997 &=& 0.050282 \\
P(X|Y) &=& P(Y|X)\times\displaystyle\frac{P(X)}{P(Y)} = 0.99\times\displaystyle\frac{0.0003}{0.005295} &=& 0.056
\end{array}\]
ハロルドが感染している確率は$0.6$\%を少し下回るくらいだ\footnote{$2$番目の式に代入された値と答はおそらく誤植で、$P(X|Y) = \dots = 0.99\times\frac{0.0003}{ 0.050282} = 0.00596635$が正しいはずである。}。

だから検査精度の高さに関わらず、無作為に選ばれた人が検査を受けた結果が陽性でも、大部分は感染していないのである。』$\dots$と、このような内容が書かれている。

さて、このことから「$陽性 = 感染$のような直観」に反することが生じても、なんら不思議ではないことがわかる。ということで、ここからが本題だ。このトピックの本当の題は「ベイズ推定(人は都合よく解釈する)」である。

感染症が大流行している最中に、ある人が感染の有無を調べた結果、陽性であったとする。この人が上のようなベイズ推定の話を聞いたことがあり、なおかつ感染症の目立った症状がなかったら、おそらく『$\dots$結果が陽性でも、大部分は感染していない$\dots$』という部分に注目して、自分は偽陽性、つまり感染していないと``都合よく''判断するだろう。で、実際は感染していて周りに感染させるのだ。

いいですか、このベイズ推定の話は『$\dots$無作為に選ばれた人が検査を受けた$\dots$』と書いてあるよね。その上、『$\dots$病気は極めて珍しく、感染者は人口の$0.03$\%という。$\dots$』とも書いてある。だから、『感染する人が極端に少ない状況で無作為検査をすれば、偽陽性である可能性が高い』と言っているのであって、「$陽性 = 感染$のような直観」に反する話じゃないのだよ。感染症が流行しているときは、相応の人が感染していて、検査は理由があって自ら受けるものである。この例とは逆の状況にある。なのに自分に都合よい部分だけ切り取ったらだめだろう。

さらに付け加えるなら、この例は直観に反していないと思う。『感染の可能性が$0.03$\%』と『偽陽性の可能性が$5$\%』を直観で比べたら、$0.03$\%と$5$\%じゃ$100$倍以上偽陽性の可能性が高いんじゃないの? だからこの場合の直観とは「$陽性 = 偽陽性$」ではないかな? むしろ直観が正しい。物事を正しく理解するのって簡単じゃない。

\end{document}