WIIS

代表的な確率分布

二項分布とポアソン分布の関係

目次

前のページ:

ポアソン分布

次のページ:

連続型の一様分布

Mailで保存
Xで共有

二項分布とポアソン分布

二項分布とポアソン分布について簡単に復習した上で、両者の関係について解説します。

2通りの結果だけが起こり得る試行をベルヌーイ試行と呼びます。ベルヌーイ試行において起こり得る2通りの結果を便宜上、「成功」と「失敗」と呼びます。ベルヌーイ試行を有限\(n\in \mathbb{N} \)回繰り返し行う状況を想定した場合、その標本空間は、\begin{equation*}\Omega =\left\{ \omega =\left( \omega _{1},\cdots ,\omega _{n}\right) \ |\
\forall i\in \left\{ 1,\cdots ,n\right\} :\omega _{i}\in \left\{ \text{成功},\text{失敗}\right\} \right\}
\end{equation*}となります。ベルヌーイ試行を\(n\)回繰り返し行った場合に「成功」が起こる合計回数を特定する確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値域は、\begin{equation*}X\left( \Omega \right) =\left\{ 0,1,2,\cdots ,n\right\}
\end{equation*}です。特に、毎回のベルヌーイ試行において「成功」が起こる確率が\(p\in \left[ 0,1\right] \)であり、なおかつ、各回のベルヌーイ試行が独立である場合、\(X\)の確率分布を特定する確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
\dbinom{n}{x}p^{x}\left( 1-p\right) ^{n-x} & \left( if\ x\in X\left( \Omega
\right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めます。ただし、\(\dbinom{n}{x}\)は\(n\)個から\(x\)個を選ぶ場合の組合せの個数であり、\begin{equation*}\binom{n}{x}=\frac{n!}{\left( n-x\right) !x!}
\end{equation*}です。このとき、確率変数\(X\)は試行パラメーター\(n\)と成功パラメーター\(p\)の二項分布にしたがうといい、そのことを、\begin{equation*}X\sim B_{i}\left( n,p\right)
\end{equation*}で表記します。\(X\)の期待値と分散はそれぞれ、\begin{eqnarray*}E\left( X\right) &=&np \\
\mathrm{Var}\left( X\right) &=&np\left( 1-p\right)
\end{eqnarray*}と定まります。

「一定時間内にある出来事が起こる回数を記録する」という試行の標本空間は、\begin{equation*}
\Omega =\left\{ 0,1,2,\cdots \right\} =\mathbb{Z} _{+}
\end{equation*}です。一定時間内にその出来事が起こる回数を特定する確率変数\(X:\Omega \rightarrow \mathbb{R} \)の値域は、\begin{equation*}X\left( \Omega \right) =\left\{ 0,1,2,\cdots \right\} =\mathbb{Z} _{+}
\end{equation*}です。一定時間内にその出来事が起こる確率が\(\lambda >0\)である場合、言い換えると一定時間内においてその出来事が起こる平均回数が\(\lambda \)である場合、\(X\)の確率分布を特定する確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cc}
\dfrac{\lambda ^{x}}{x!}e^{-\lambda } & \left( if\ x\in X\left( \Omega
\right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}を定めます。このとき、確率変数\(X\)はパラメータ\(\lambda \)のポアソン分布にしたがうといい、そのことを、\begin{equation*}X\sim P_{oisson}\left( \lambda \right)
\end{equation*}で表記します。\(X\)の期待値と分散はそれぞれ、\begin{eqnarray*}E\left( X\right) &=&\lambda \\
\mathrm{Var}\left( X\right) &=&\lambda
\end{eqnarray*}と定まります。

 

二項分布とポアソン分布の関係

確率変数\(X\)が試行パラメーター\(n\in \mathbb{N} \)と成功パラメーター\(p\in \left[ 0,1\right] \)の二項分布にしたがうものとします。つまり、\begin{equation*}X\sim B_{i}\left( n,p\right)
\end{equation*}が成り立つということです。二項分布が想定している状況とは、各回において「成功」が起こる確率が\(p\)であるようなベルヌーイ試行を、独立に、有限\(n\)回繰り返すというものです。では、以下のような状況を想定すると\(X\)の確率分布はどうなるでしょうか。

1つ目の想定は、「成功」が起こる確率が極めて小さいベルヌーイ試行を繰り返し行うというというものです。究極的には、成功パラメーター\(p\in \left[ 0,1\right] \)が\(0\)に限りなく近い状況を想定することを意味します。

2つ目の想定は、ベルヌーイ試行を膨大な回数繰り返すというものです。究極的には、試行パラメータ\(n\in \mathbb{R} \)が限りなく大きくなる状況を想定することを意味します。

3つ目の想定は、以上の2つの想定を踏まえてもなお、試行パラメータ\(n\)と成功パラメータ\(p\)の積\(np\)が有限な実数として定まるというものです。二項分布にしたがう確率変数\(X\)の期待値は\(np\)であるため、これは、ベルヌーイ試行をいくら繰り返しても確率変数\(X\)の期待値が有限な実数にとどまることを意味します。

確率変数\(X\)の期待値を、\begin{equation*}E\left( X\right) =\lambda
\end{equation*}で表記します。\(X\)は二項分布にしたがうため、\begin{equation*}\lambda =np
\end{equation*}ですが、先の想定より\(\lambda \)は有限な実数であるため、\begin{eqnarray}p &=&\frac{\lambda }{n} \quad \cdots (1) \\
1-p &=&1-\frac{\lambda }{n} \quad \cdots (2)
\end{eqnarray}とすることができます。このとき、\(X\)の確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)が\(x\in X\left( \Omega \right) \)を満たすそれぞれの\(x\in \mathbb{R} \)に対して定める値は、\begin{eqnarray*}f_{X}\left( x\right) &=&\dbinom{n}{x}p^{x}\left( 1-p\right) ^{n-x}\quad
\because X\sim B_{i}\left( n,p\right) \\
&=&\frac{n!}{x!\left( n-x\right) !}\left( \frac{\lambda }{n}\right)
^{x}\left( 1-\frac{\lambda }{n}\right) ^{n-x}\quad \because \left( 1\right)
,\left( 2\right) \\
&=&\frac{n\left( n-1\right) \cdots \left( n-x+1\right) }{x!}\cdot \frac{\lambda ^{x}}{n^{x}}\cdot \left( 1-\frac{\lambda }{n}\right) ^{n}\cdot
\left( 1-\frac{\lambda }{n}\right) ^{-x} \\
&=&\frac{n\left( n-1\right) \cdots \left( n-\left( x-1\right) \right) }{x!n^{x}}\cdot \frac{\lambda ^{x}}{\left( 1-\frac{\lambda }{n}\right) ^{x}}\cdot \left( 1-\frac{\lambda }{n}\right) ^{n} \\
&=&\frac{\frac{n}{n}\cdot \frac{\left( n-1\right) }{n}\cdots \frac{\left(
n-\left( x-1\right) \right) }{n}}{x!}\cdot \frac{\lambda ^{x}}{\left( 1-\frac{\lambda }{n}\right) ^{x}}\cdot \left( 1-\frac{\lambda }{n}\right) ^{n}
\\
&=&\frac{1\cdot \left( 1-\frac{1}{n}\right) \cdots \left( 1-\frac{x-1}{n}\right) }{x!\left( 1-\frac{\lambda }{n}\right) ^{x}}\cdot \lambda ^{x}\cdot
\left( 1-\frac{\lambda }{n}\right) ^{n}
\end{eqnarray*}すなわち、\begin{equation*}
f_{X}\left( x\right) =\frac{1\cdot \left( 1-\frac{1}{n}\right) \cdots \left(
1-\frac{x-1}{n}\right) }{x!\left( 1-\frac{\lambda }{n}\right) ^{x}}\cdot
\lambda ^{x}\cdot \left( 1-\frac{\lambda }{n}\right) ^{n}
\end{equation*}となります。2つ目の想定を踏まえた上で\(n\rightarrow +\infty \)の場合の極限をとると、\begin{eqnarray*}\lim_{n\rightarrow +\infty }f_{X}\left( x\right) &=&\lim_{n\rightarrow
+\infty }\left[ \frac{1\cdot \left( 1-\frac{1}{n}\right) \cdots \left( 1-\frac{x-1}{n}\right) }{x!\left( 1-\frac{\lambda }{n}\right) ^{x}}\cdot
\lambda ^{x}\cdot \left( 1-\frac{\lambda }{n}\right) ^{n}\right] \\
&=&\frac{1\cdot \left( 1-0\right) \cdots \left( 1-0\right) }{x!\left(
1-0\right) ^{x}}\cdot \lambda ^{x}\cdot e^{-\lambda }\quad \because
\lim_{n\rightarrow +\infty }\left( 1-\frac{\lambda }{n}\right)
^{n}=e^{-\lambda } \\
&=&\frac{\lambda ^{x}}{x!}e^{-\lambda }
\end{eqnarray*}を得ますが、これはポアソン分布の確率質量関数が\(x\)に対して定める値と一致します。

以上の議論より、「成功」が滅多に起こらないようなベルヌーイ試行を膨大な回数繰り返す場合には、「成功」の合計回数を表す確率変数\(X\)は二項分布にしたがうだけでなく、その確率分布はパラメーター\(np\)のポアソン分布に限りなく近づくことが明らかになりました。以上の事実にはどのような利点があるのでしょうか。

二項分布の確率密度関数は、\begin{equation*}
f_{X}\left( x\right) =\left\{
\begin{array}{cl}
\dbinom{n}{x}p^{x}\left( 1-p\right) ^{n-x} & \left( if\ x\in X\left( \Omega
\right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}ですが、試行パラメータ\(n\)が大きい場合、これを具体的に計算するのは面倒です。一方、成功パラメータ\(p\)が十分小さく、試行パラメータ\(n\)が十分大きい場合には、先の議論より、二項分布の代わりにポアソン分布の確率密度関数\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cc}
\dfrac{\lambda ^{x}}{x!}e^{-\lambda } & \left( if\ x\in X\left( \Omega
\right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}を利用できます。こちらの計算は簡単です。

例(二項分布とポアソン分布の関係)
ある工場で製造された電球の\(5\)パーセントは不良品であるものとします。この工場で製造された\(100\)個の電球を検品したときに、不良品が\(5\)個である確率を求めます。まずは、二項分布を用いて考えます。与えられた条件のもとで不良品の個数を特定する確率変数\(X\)はパラメータ\(n=100\)と\(p=0.05\)の二項分布にしたがいます。つまり、\begin{equation*}X\sim Bi\left( 100,0.05\right)
\end{equation*}です。\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\left\{ 0,1,2,\cdots ,100\right\}
\end{equation*}であるとともに、\(X\)の確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cl}
\dbinom{100}{x}\left( \frac{5}{100}\right) ^{x}\left( \frac{95}{100}\right)
^{100-x} & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めます。したがって、検品した\(100\)個のうちの\(5\)個が不良品である確率は、\begin{eqnarray*}f_{X}\left( 5\right) &=&\dbinom{100}{5}\left( \frac{5}{100}\right)
^{5}\left( \frac{95}{100}\right) ^{100-5} \\
&=&0.18002
\end{eqnarray*}であり、およそ\(18\)パーセントであることが明らかになりました。続いて、ポアソン分布を用いて考えます。成功パラメータ\(p=0.05\)は小さく、試行パラメータ\(n=100\)は大きいため、先の議論より、この確率変数\(X\)の確率分布はパラメータが、\begin{eqnarray*}np &=&100\cdot 0.05 \\
&=&5
\end{eqnarray*}であるようなポアソン分布によって表現できそうです。つまり、\(X\)の確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cc}
\dfrac{5^{x}}{x!}e^{-5} & \left( if\ x\in X\left( \Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}を定めるということです。この場合、検品した\(100\)個のうちの\(5\)個が不良品である確率は、\begin{eqnarray*}f_{X}\left( 5\right) &=&\dfrac{5^{5}}{5!}e^{-5} \\
&=&0.17547
\end{eqnarray*}であり、およそ\(17.5\)パーセントであることが明らかになりました。試行パラメータ\(n\)を増やすほど、すなわち検品の個数を増やすほど、両者の差はさらに縮まります。

関連知識

前のページ:

ポアソン分布

次のページ:

連続型の一様分布

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員専用コンテンツです
ログイン】【会員登録