ラプラスの確率
私たちが何かの確率というとき、それが意味するのは「何かの起こりやすさの度合いを数字で表現したもの」ということではないでしょうか。しかし確率という概念を厳密に考えようとすると様々な考え方があり、それぞれに一長一短があります。
確率に関する最も古典的な考え方はラプラス(Laplace)によるものです。
\frac{X}{N}
\end{equation*}と定義する。ただし、\(N\)個の結果はすべて同じ程度の確かさ(equally likely)で起こるものとする。
いくつか具体例を提示します。
「サイコロを\(1\)回投げる」という実験において起こり得るすべての結果を並べると、\begin{equation*}
1,2,3,4,5,6
\end{equation*}となるため、\(N=6\)となります。サイコロに歪みがなければこの\(6\)個の結果は同じ程度の確かさで出現するものと推測できます。また、この\(6\)個の結果の中でも、問題としている「奇数の目が出る」という現象が起こる結果を並べると、\begin{equation*}
1,3,5
\end{equation*}となるため、\(X=3\)となります。したがって、ラプラスの確率によると、「サイコロを\(1\)回投げたときに奇数の目が出る確率」は、\begin{equation*}
\frac{X}{N}=\frac{3}{6}=\frac{1}{2}
\end{equation*}となります。
もう少し複雑な例を考えましょう。
「サイコロを\(2\)回投げる」という実験において起こり得るすべての結果を並べると、\begin{align*}
& (1,1),\ (1,2),\ (1,3),\ (1,4),\ (1,5),\ (1,6), \\
& (2,1),\ (2,2),\ (2,3),\ (2,4),\ (2,5),\ (2,6), \\
& (3,1),\ (3,2),\ (3,3),\ (3,4),\ (3,5),\ (3,6), \\
& (4,1),\ (4,2),\ (4,3),\ (4,4),\ (4,5),\ (4,6), \\
& (5,1),\ (5,2),\ (5,3),\ (5,4),\ (5,5),\ (5,6), \\
& (6,1),\ (6,2),\ (6,3),\ (6,4),\ (6,5),\ (6,6)
\end{align*}となるため、\(N=36\)となります。ただし、\(\left( i,j\right) \)はサイコロを\(2\)回投げたときに「\(1\)回目に\(i\)、\(2\)回目に\(j\)が出る」という結果に対応しています。また、この\(36\)個の結果の中でも、問題としている「奇数の目が出る」という現象が起こる結果を並べると、\begin{align*}
& (1,1),\ (1,2),\ (1,3),\ (1,4),\ (1,5),\ (1,6), \\
& (2,1),\ (2,3),\ (2,5), \\
& (3,1),\ (3,2),\ (3,3),\ (3,4),\ (3,5),\ (3,6), \\
& (4,1),\ (4,3),\ (4,5), \\
& (5,1),\ (5,2),\ (5,3),\ (5,4),\ (5,5),\ (5,6), \\
& (6,1),\ (6,3),\ (6,5)
\end{align*}となるため、\(X=27\)となります。したがって、ラプラスの確率によると、「サイコロを\(2\)回投げたときに奇数の目が出る確率」は、\begin{equation*}
\frac{X}{N}=\frac{27}{36}=\frac{3}{4}
\end{equation*}となります。
ラプラスの確率の良い所は、上の例のように、頭の中で結果を数え上げることにより確率を求められるという点です。その一方で、「実験や観察によって起こりうるすべての結果が同程度の確かさで出現する」という仮定が必要であり、仮定の根拠をどこに求めればよいか明確ではないという問題があります。先の例のように、「さいころが歪みなく作られているならば、すべての面が同じ確かさで出るだろう」という常識的な判断でしか仮定を根拠づけることができません。この仮定が成り立たない場合には、ラプラスの確率にもとづいて求めた確率は誤りということになってしまいます。
頻度による確率
確率に関する2つ目の考え方は頻度による確率です。ラプラスの確率では頭の中で結果を数え上げることで確率を理論的に求めましたが、頻度による確率では実験を通じて確率を経験的に求めます。
\frac{x}{n}
\end{equation*}を相対頻度(relative frequency)と呼ぶ。\(n\)を限りなく増やしたときに\(\frac{x}{n}\)がある値に限りなく近づくならば、つまり、\begin{equation*}
\lim_{n\rightarrow \infty }\frac{x}{n}=\alpha
\end{equation*}が成り立つならば、極限である\(\alpha \)をその現象が起こる確率とする。
先ほどと同じ例を使って具体的に考えます。
実際にサイコロを\(3\)回投げてそのうち\(1\)回だけ奇数が出たとします。つまり、\begin{equation*}
\frac{x}{n}=\frac{1}{3}
\end{equation*}です。\(3\)回では少ないので、\(100\)回投げてそのうち\(46\)回だけ奇数が出たとします。つまり、\begin{equation*}
\frac{x}{n}=\frac{46}{100}
\end{equation*}です。さらにこのような実験を何万回と繰り返したときに仮に相対頻度\(\frac{x}{n}\)が\(\frac{1}{2}\)に限りなく近づくならば、「サイコロを\(1\)回投げたときに奇数の目が出る確率」を\(\frac{1}{2}\)とする、ということです。
頻度による確率の良いところは、そこから得られる値は実際の経験に裏付けられたものなので、ラプラスの確率で問題となった「同様に確からしい」という根拠があいまいな仮定を必要としないという点です。
とは言え、頻度による確率は実験の回数が変わると変わってしまうという問題があります。例えば、先の例において\(3\)回の実験から求める確率は\(\frac{1}{3}\)でしたが、\(100\)回では\(\frac{46}{100}\)です。たとえ実験を何万回と繰り返した場合でも相対頻度\(\frac{x}{n}\)はある値に近づくだけであり、特定の値に留まるわけではありません。
また、同じ回数の実験を繰り返し行った場合に、毎回同じ結果が得られるという保証もありません。例えば、サイコロを\(1\)万回投げる実験を\(2\)セット行ったとき、\(1\)セット目と\(2\)セット目とでは奇数の目が同じ回数ずつ出るとは限りません。
ビュッフォンの針
以上の2つ以外にも確率の考え方はありますが、今回の話に関係あるのはこの2つだけです。前置きが長くなりましたが本題に入りましょう。18世紀のフランスの学者ビュッフォン(Buffon)が考えた以下の問題から話を始めます。
下図中の4本の平行な黒い線は床に引いた線、それ以外の短い線は床に落とした針をそれぞれ表しています。青い線は床の線と交差する針です。下図には7本の針が描かれており、その中の4本が床の線と交わっているため、頻度による確率にしたがうならば、上の問題に対する答えは\(\frac{4}{7}\)となります。とは言え、たった7回では実験として少なすぎます。精度を高めようとすれば針を何百回、何千回、さらには何万回と床に投げた上で、針と床の線が交わった回数を数える必要があります。興味と時間があれば試してみてください。
続いて、この問題をラプラスの確率のもとで考えてみましょう。問題を考えやすくするために以下のように定式化します。
床に描かれた平行な線の間隔\(d\)よりも短い長さ\(L\)の針を用意しているため、針が2本以上の直線と交わることはありません。実は、床に落とした個々の針は、その針の中心から最も近い直線までの最短距離\(x\)(下図のオレンジの線)と、直線に対する針の傾き\(\alpha \)(下図の紫の角度)の2つの情報によって特定できます。つまり、値の組\(\left( \alpha ,x\right) \)が与えられれば床に落とした1本の針を特定できますし、逆に、針を1本落とすと値の組\(\left( \alpha ,x\right) \)が1つだけ得られます。
では、\(\alpha \)と\(x\)はそれぞれどのような値を取り得るでしょうか。\(x\)は針の中心から最も近い線までの最短距離ですので、針の中心が何らかの直線の上にくる場合に\(x=0\)で最小になり、針の中心が隣り合う2本の直線のちょうど真ん中にくる場合に\(x=\frac{d}{2}\)で最大になります。つまり、\(x\)の変域は、\begin{equation*}
0\leq x\leq \frac{d}{2}
\end{equation*}です。続いて\(\alpha \)の範囲ですが、針と線が平行の場合に\(\alpha =0,\pi \)となり、これらが\(\alpha \)の最小と最大です。つまり、\(\alpha \)の変域は、\begin{equation*}
0\leq \alpha \leq \pi
\end{equation*}です。値の組\(\left( \alpha ,x\right) \)が取り得る値の範囲を下図のオレンジの領域(境界を含む)として図示しました。
床に落とした針の位置と向きを表す\(\left( \alpha ,x\right) \)は必ずオレンジの領域上の1つの点として表されます。したがって、ラプラスの確率で言う「実験や観察によって起こり得るすべての結果」は上の図のオレンジの領域の面積\(\frac{d\pi }{2}\)で表されます。
続いて、この領域の中から「針がいずれかの直線と交差する」という現象が起こるような領域を見つける必要があります。針と直線が交わる条件を上の図を使って考えます。\(x\)と\(AC\)の長さを比べたとき、\(x\leq AC\)が成り立つ場合には針と直線が交わります。では、\(AC\)の長さをどのように求めればよいでしょうか。三角形\(ABC\)の辺である\(AB\)の長さは針の長さ\(L\)の半分\(\frac{L}{2}\)です。さらに、角\(ABC\)の大きさは\(\alpha \)と同じですので、\(\sin \alpha =\frac{AC}{AB}\)という関係から、\begin{eqnarray*}
AC &=&\sin \alpha \times AB \\
&=&\sin \alpha \times \frac{L}{2}
\end{eqnarray*}となります。したがって、針と直線が交わる条件\(x\leq AC\)は、\begin{equation*}
x\leq \sin \alpha \times \frac{L}{2}
\end{equation*}となります。この条件を満たす領域を先ほどの図の上に描いたのが下図の黄色い領域です。
この領域の面積は、\begin{align*}
\int_{0}^{\pi }\left( \frac{L}{2}\cdot \sin \alpha \right) d\alpha & =\frac{L}{2}\int_{0}^{\pi }\sin \alpha \ d\alpha \\
& =\frac{L}{2}\left[ -\cos \alpha \right] _{0}^{\pi } \\
& =\frac{L}{2}\{(-\cos \pi )-(-\cos 0)\} \\
& =\frac{L}{2}\{1-(-1)\} \\
& =L
\end{align*}となります。
議論をまとめましょう。「床に針を投げる」という実験によって起こり得るすべての結果はオレンジの領域の面積\(\frac{d\pi }{2}\)で表され、さらにその中でも「針がいずれかの直線と交わる」という現象が起こるような結果は黄色の領域の面積\(L\)で表されます。したがって、「針がいずれかの直線と交わる」ことのラプラスの確率は、\begin{equation*}
\frac{L}{\frac{d\pi }{2}}=\frac{2L}{d\pi }
\end{equation*}となります。
モンテ・カルロ法
ビュッフォンの針を頻度の確率とラプラスの確率、それぞれのアプローチから考えました。繰り返しになりますが、ビュッフォンの針を頻度の確率で考えることとは、針を何百回、何千回、さらに何万回と床に投げて、針と床の線が交わった回数を数えることを意味します。一方、ラプラスの確率のもとでは、針と床の線が交わる確率\(p\)は、\begin{equation*}
p=\frac{2L}{d\pi }
\end{equation*}となります。ただし、\(L\)は針の長さ、\(d\)は床に引かれた線の間隔であり、\(L<d\)という関係が成り立ちます。
興味深いのは、上の確率には円周率\(\pi \)が含まれているという点です。そこでこれを円周率について解くと、\begin{equation*}
\pi =\frac{2L}{dp}
\end{equation*}となります。
針の長さ\(L\)と床に引かれた平行線の間隔\(d\)は自分で決められます。さらに、針と床の線が交わる確率\(p\)を頻度による確率として求めます。つまり、針を繰り返し投げて\(p\)を求めるということです。すると上の式の右辺の要素がすべて明らかになるため、結果として円周率\(\pi\)が求まります。つまり、ビュッフォンの針の解を頻度による確率として求めることは、同時に円周率を頻度による確率として求めることにもなります。針を繰り返し投げることで円周率を経験的に求めることができるのです。
ビュッフォンやラプラスの時代には実際に針を床に落とす必要がありましたが、現在はこのような作業をコンピュータ上で仮想的に行うことができます。針が床にランダムに落ちる様子を、コンピュータは乱数を使って疑似的に再現できるからです。
乱数を使って問題を解く手法をモンテ・カルロ法(Monte Carlo method)と呼びます。現在のモンテカルロ法は非常に洗練されたものですが、その発想の起源を辿るとラプラスに行きつきます。ビュッフォンの針に対してラプラスが新たな光を差し込むことでモンテ・カルロ法のもととなる考えが生まれたのです。