リーマンゼータ関数
\(s>1\)を満たす定数\(s\in \mathbb{R} \)を任意に選んだとき、以下の無限級数\begin{equation*}\sum_{n=1}^{+\infty }\frac{1}{n^{s}}
\end{equation*}は有限な実数へ収束します。
以上の命題は\(s>1\)を満たす任意の\(s\in \mathbb{R} \)に関して成立するため、それぞれの\(s\in \left(1,+\infty \right) \)に対して、\begin{equation*}\zeta \left( s\right) =\sum_{n=1}^{+\infty }\frac{1}{n^{s}}
\end{equation*}を値として定める関数\begin{equation*}
\zeta :\mathbb{R} \supset \left( 1,+\infty \right) \rightarrow \mathbb{R} \end{equation*}が定義可能です。これをリーマンゼータ関数(Riemann zeta function)と呼びます。
ゼータ分布の確率質量関数
確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に対して確率変数\(X:\Omega\rightarrow \mathbb{R} \)が定義されており、その値域が、\begin{equation*}X\left( \Omega \right) =\mathbb{N} \end{equation*}であるものとします。つまり、\(X\)は任意の自然数を値としてとり得るということです。その上で、\(X\)の確率分布を描写する確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値が、\(s>1\)を満たす定数\(s\in \mathbb{R} \)を用いて、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cc}
\dfrac{1}{x^{s}\cdot \zeta \left( s\right) } & \left( if\ x\in X\left(
\Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}と表されるものとします。ただし、\(\zeta :\mathbb{R} \supset \left( 1,+\infty \right) \rightarrow \mathbb{R} \)はリーマンゼータ関数です。以上の条件が満たされる場合、確率変数\(X\)はパラメータ\(s\)のゼータ分布(Zeta distribution with parameter \(s\))またはリーマンゼータ分布(Rimann Zeta distribution)にしたがうと言い、そのことを、\begin{equation*}X\sim \mathrm{Zeta}\left( s\right)
\end{equation*}で表記します。
パラメータ\(s\)の値が\(2\)のゼータ分布にしたがう確率変数\(X\)の確率質量関数のグラフを上に描きました。グラフの形状から明らかであるように、\(x=1\)が起こる確率が最も大きく、\(x\)の値が大きくなるにつれて、その値が起こる確率は急激に減少します。ただし、\(x\)の値がどれほど大きくなっても、その値が起こる確率はゼロにはなりません。このような事情を踏まえると、ゼータ分布は稀に極端な値が観測される現象をモデル化する上で有用であると言えます。上のグラフではパラメータ\(s\)の値が\(2\)の場合を図示しましたが、\(s\)を大きくするほど、より小さい\(x\)の値に確率が集中するようになります。
\begin{array}{cc}
\dfrac{1}{x^{1.1}\cdot \zeta \left( 1.1\right) } & \left( if\ x\in X\left(
\Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}となります。したがって、最頻出する単語(順位\(1\))が文章中に出現する確率は、\begin{equation*}f_{X}\left( 1\right) =\dfrac{1}{1^{1.1}\cdot \zeta \left( 1.1\right) }=0.09447
\end{equation*}であり、次に頻出する単語(順位\(2\))が文章中に出現する確率は、\begin{equation*}f_{X}\left( 2\right) =\dfrac{1}{2^{1.1}\cdot \zeta \left( 1.1\right) }=0.04076
\end{equation*}です。以降についても同様です。つまり、英語で書かれた文章ではごく一部の単語が高い確率で登場する一方で、大部分の単語はほとんど登場しません。
\begin{array}{cc}
\dfrac{1}{x^{2}\cdot \zeta \left( 2\right) } & \left( if\ x\in X\left(
\Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}となります。したがって、もっともアクセスが多いWebサイト(順位\(1\))へのアクセス割合は、\begin{equation*}f_{X}\left( 1\right) =\dfrac{1}{1^{2}\cdot \zeta \left( 2\right) }=0.60793
\end{equation*}であり、次にアクセスが多いWebサイト(順位\(2\))へのアクセス割合は、\begin{equation*}f_{X}\left( 2\right) =\dfrac{1}{2^{2}\cdot \zeta \left( 2\right) }=0.15198
\end{equation*}です。以降についても同様です。つまり、インターネットではごく一部のWebサイトが多くのアクセスを得る一方で、大部分のWebサイトへのアクセスはごくわずかです。
ゼータ分布にしたがう確率変数の確率質量関数が確率質量関数としての性質を満たすことを確認しておきます。
\end{equation*}である場合には、確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)は、\begin{eqnarray*}&&\left( a\right) \ \forall x\in \mathbb{R} :f_{X}\left( x\right) \geq 0 \\
&&\left( b\right) \ \sum_{x\in X\left( \Omega \right) }f_{X}\left( x\right)
=1
\end{eqnarray*}をともに満たす。
ゼータ分布の分布関数
ゼータ分布にしたがう確率変数の分布関数は以下の通りです。
\end{equation*}である場合には、分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}F_{X}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<1\right) \\
\dfrac{1}{\zeta \left( s\right) }\sum\limits_{m=1}^{x}\dfrac{1}{m^{s}} &
\left( if\ x\geq 1\right)
\end{array}\right.
\end{equation*}を定める。ただし、\begin{equation*}
\zeta \left( s\right) =\sum_{n=1}^{+\infty }\frac{1}{n^{s}}
\end{equation*}である。
\end{equation*}であるということです。この場合、先の命題より、分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}F_{X}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<1\right) \\
\dfrac{1}{\zeta \left( 1.1\right) }\sum\limits_{m=1}^{x}\dfrac{1}{m^{1.1}}
& \left( if\ x\geq 1\right)
\end{array}\right.
\end{equation*}を定めます。ただし、\begin{equation*}
\zeta \left( 1.1\right) =\sum_{n=1}^{+\infty }\frac{1}{n^{1.1}}=10.584
\end{equation*}です。
\end{equation*}であるということです。この場合、先の命題より、分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}F_{X}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<1\right) \\
\dfrac{1}{\zeta \left( 2\right) }\sum\limits_{m=1}^{x}\dfrac{1}{m^{2}} &
\left( if\ x\geq 1\right)
\end{array}\right.
\end{equation*}を定めます。ただし、\begin{equation*}
\zeta \left( 2\right) =\sum_{n=1}^{+\infty }\frac{1}{n^{2}}=\frac{1}{6}\pi
^{2}
\end{equation*}です。
ゼータ分布にしたがう確率変数の期待値
ゼータ分布にしたがう確率変数の期待値は以下の通りです。
\end{equation*}である場合には、\(X\)の期待値は、\begin{equation*}E\left( X\right) =\frac{\zeta \left( s-1\right) }{\zeta \left( s\right) }
\end{equation*}となる。ただし、\begin{eqnarray*}
\zeta \left( s\right) &=&\sum_{n=1}^{+\infty }\frac{1}{n^{s}} \\
\zeta \left( s-1\right) &=&\sum_{n=1}^{+\infty }\frac{1}{n^{s-1}}
\end{eqnarray*}である。
上の命題ではパラメータが\(2\)より大きい状況を想定しています。\(1<s<2\)の場合には期待値が有限な実数として定まりません。なぜなら、この場合、\(\zeta \left( s\right) \)は有限な実数として定まる一方で、\(\zeta \left( s-1\right) \)は有限な実数として定まらず、ゆえに\(\frac{\zeta \left( s-1\right) }{\zeta \left(s\right) }\)すなわち\(E\left( X\right) \)もまた有限な実数として定まらないからです。
ゼータ分布にしたがう確率変数の分散
ゼータ分布にしたがう確率変数の期待値は以下の通りです。
\end{equation*}である場合には、\(X\)の分散は、\begin{equation*}\mathrm{Var}\left( X\right) =\frac{\zeta \left( s-2\right) }{\zeta \left(
s\right) }-\left[ \frac{\zeta \left( s-1\right) }{\zeta \left( s\right) }\right] ^{2}
\end{equation*}となる。ただし、\begin{eqnarray*}
\zeta \left( s\right) &=&\sum_{n=1}^{+\infty }\frac{1}{n^{s}} \\
\zeta \left( s-1\right) &=&\sum_{n=1}^{+\infty }\frac{1}{n^{s-1}} \\
\zeta \left( s-2\right) &=&\sum_{n=1}^{+\infty }\frac{1}{n^{s-2}}
\end{eqnarray*}である。
上の命題ではパラメータが\(3\)より大きい状況を想定しています。\(1<s<3\)の場合には期待値が有限な実数として定まりません。なぜなら、この場合、\(\zeta \left( s\right) \)と\(\zeta \left( s-1\right) \)は有限な実数として定まる一方で、\(\zeta \left( s-2\right) \)は有限な実数として定まらず、ゆえに\(\frac{\zeta \left(s-2\right) }{\zeta \left( s\right) }-\left[ \frac{\zeta \left( s-1\right) }{\zeta \left( s\right) }\right] ^{2}\)すなわち\(\mathrm{Var}\left( X\right) \)もまた有限な実数として定まらないからです。
ゼータ分布のモーメント母関数
ゼータ分布にしたがう確率変数はモーメント母関数を持ちません。
\end{equation*}である場合には、\(X\)のモーメント母関数は存在しない。
ゼータ分布の特性関数
ゼータ分布にしたがう確率変数の特性関数は以下の通りです。
\end{equation*}である場合には、\(X\)の特性関数\(\varphi _{X}:\mathbb{R} \rightarrow \mathbb{C} \)はそれぞれの\(t\in \mathbb{R} \)に対して、\begin{equation*}\phi _{X}\left( t\right) =\dfrac{1}{\zeta \left( s\right) }\sum_{x=1}^{+\infty }\frac{e^{itx}}{x^{s}}
\end{equation*}を定める。ただし、ただし、\begin{equation*}
\zeta \left( s\right) =\sum_{n=1}^{+\infty }\frac{1}{n^{s}}
\end{equation*}である。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】