WIIS

代表的な確率分布

ゼータ分布(リーマンゼータ分布)

目次

Mailで保存
Xで共有

リーマンゼータ関数

\(s>1\)を満たす定数\(s\in \mathbb{R} \)を任意に選んだとき、以下の無限級数\begin{equation*}\sum_{n=1}^{+\infty }\frac{1}{n^{s}}
\end{equation*}は有限な実数へ収束します。

命題(リーマンゼータ関数の根拠)
\(s>1\)を満たす\(s\in \mathbb{R} \)を任意に選んだとき、\begin{equation*}\sum_{n=1}^{+\infty }\frac{1}{n^{s}}\in \mathbb{R} \end{equation*}が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

以上の命題は\(s>1\)を満たす任意の\(s\in \mathbb{R} \)に関して成立するため、それぞれの\(s\in \left(1,+\infty \right) \)に対して、\begin{equation*}\zeta \left( s\right) =\sum_{n=1}^{+\infty }\frac{1}{n^{s}}
\end{equation*}を値として定める関数\begin{equation*}
\zeta :\mathbb{R} \supset \left( 1,+\infty \right) \rightarrow \mathbb{R} \end{equation*}が定義可能です。これをリーマンゼータ関数(Riemann zeta function)と呼びます。

 

ゼータ分布の確率質量関数

確率空間\(\left( \Omega ,\mathcal{F},P\right) \)に対して確率変数\(X:\Omega\rightarrow \mathbb{R} \)が定義されており、その値域が、\begin{equation*}X\left( \Omega \right) =\mathbb{N} \end{equation*}であるものとします。つまり、\(X\)は任意の自然数を値としてとり得るということです。その上で、\(X\)の確率分布を描写する確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値が、\(s>1\)を満たす定数\(s\in \mathbb{R} \)を用いて、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cc}
\dfrac{1}{x^{s}\cdot \zeta \left( s\right) } & \left( if\ x\in X\left(
\Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}と表されるものとします。ただし、\(\zeta :\mathbb{R} \supset \left( 1,+\infty \right) \rightarrow \mathbb{R} \)はリーマンゼータ関数です。以上の条件が満たされる場合、確率変数\(X\)はパラメータ\(s\)のゼータ分布(Zeta distribution with parameter \(s\))またはリーマンゼータ分布(Rimann Zeta distribution)にしたがうと言い、そのことを、\begin{equation*}X\sim \mathrm{Zeta}\left( s\right)
\end{equation*}で表記します。

図:ゼータ分布(s=2)の確率質量関数
図:ゼータ分布(s=2)の確率質量関数

パラメータ\(s\)の値が\(2\)のゼータ分布にしたがう確率変数\(X\)の確率質量関数のグラフを上に描きました。グラフの形状から明らかであるように、\(x=1\)が起こる確率が最も大きく、\(x\)の値が大きくなるにつれて、その値が起こる確率は急激に減少します。ただし、\(x\)の値がどれほど大きくなっても、その値が起こる確率はゼロにはなりません。このような事情を踏まえると、ゼータ分布は稀に極端な値が観測される現象をモデル化する上で有用であると言えます。上のグラフではパラメータ\(s\)の値が\(2\)の場合を図示しましたが、\(s\)を大きくするほど、より小さい\(x\)の値に確率が集中するようになります。

例(ゼータ分布の確率質量関数)
英語で書かれた文章中に登場する英単語の出現頻度に順位をつけた上で、「選んだ単語の順位を特定する」という試行の結果を確率変数\(X:\Omega\rightarrow \mathbb{R} \)として整理します。つまり、\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\mathbb{N} \end{equation*}であるとともに、単語\(\omega \in \Omega \)が属する出現頻度の順位が\(X\left( \omega \right) \in \mathbb{N} \)であるということです。この場合、確率変数\(X\)はパラメータ\(s\)の値が\(1.1\)から\(1.2\)のゼータ分布にしたがうと言われています。\(s=1.1\)を採用する場合、確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値は、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cc}
\dfrac{1}{x^{1.1}\cdot \zeta \left( 1.1\right) } & \left( if\ x\in X\left(
\Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}となります。したがって、最頻出する単語(順位\(1\))が文章中に出現する確率は、\begin{equation*}f_{X}\left( 1\right) =\dfrac{1}{1^{1.1}\cdot \zeta \left( 1.1\right) }=0.09447
\end{equation*}であり、次に頻出する単語(順位\(2\))が文章中に出現する確率は、\begin{equation*}f_{X}\left( 2\right) =\dfrac{1}{2^{1.1}\cdot \zeta \left( 1.1\right) }=0.04076
\end{equation*}です。以降についても同様です。つまり、英語で書かれた文章ではごく一部の単語が高い確率で登場する一方で、大部分の単語はほとんど登場しません。

例(ゼータ分布の確率質量関数)
インターネット上のWebサイトへのアクセス数に順位をつけた上で、「選んだWebサイトの順位を特定する」という試行の結果を確率変数\(X:\Omega \rightarrow \mathbb{R} \)として整理します。つまり、\(X\)の値域は、\begin{equation*}X\left( \Omega \right) =\mathbb{N} \end{equation*}であるとともに、Webサイト\(\omega \in \Omega \)のアクセス数の順位が\(X\left( \omega \right) \in \mathbb{N} \)であるということです。この場合、確率変数\(X\)はパラメータ\(s\)の値が\(1.1\)から\(2.0\)のゼータ分布にしたがうと言われています。\(s=2\)を採用する場合、確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)がそれぞれの\(x\in \mathbb{R} \)に対して定める値は、\begin{equation*}f_{X}\left( x\right) =\left\{
\begin{array}{cc}
\dfrac{1}{x^{2}\cdot \zeta \left( 2\right) } & \left( if\ x\in X\left(
\Omega \right) \right) \\
0 & \left( if\ x\not\in X\left( \Omega \right) \right)
\end{array}\right.
\end{equation*}となります。したがって、もっともアクセスが多いWebサイト(順位\(1\))へのアクセス割合は、\begin{equation*}f_{X}\left( 1\right) =\dfrac{1}{1^{2}\cdot \zeta \left( 2\right) }=0.60793
\end{equation*}であり、次にアクセスが多いWebサイト(順位\(2\))へのアクセス割合は、\begin{equation*}f_{X}\left( 2\right) =\dfrac{1}{2^{2}\cdot \zeta \left( 2\right) }=0.15198
\end{equation*}です。以降についても同様です。つまり、インターネットではごく一部のWebサイトが多くのアクセスを得る一方で、大部分のWebサイトへのアクセスはごくわずかです。

ゼータ分布にしたがう確率変数の確率質量関数が確率質量関数としての性質を満たすことを確認しておきます。

命題(ゼータ分布の確率質量関数)
確率変数\(X\)がパラメータ\(s\in \left( 1,+\infty \right) \)のゼータ分布にしたがう場合、すなわち、\begin{equation*}X\sim \mathrm{Zeta}\left( s\right)
\end{equation*}である場合には、確率質量関数\(f_{X}:\mathbb{R} \rightarrow \mathbb{R} \)は、\begin{eqnarray*}&&\left( a\right) \ \forall x\in \mathbb{R} :f_{X}\left( x\right) \geq 0 \\
&&\left( b\right) \ \sum_{x\in X\left( \Omega \right) }f_{X}\left( x\right)
=1
\end{eqnarray*}をともに満たす。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

 

ゼータ分布の分布関数

ゼータ分布にしたがう確率変数の分布関数は以下の通りです。

命題(ゼータ分布の分布関数)
確率変数\(X\)がパラメータ\(s\in \left( 1,+\infty \right) \)のゼータ分布にしたがう場合、すなわち、\begin{equation*}X\sim \mathrm{Zeta}\left( s\right)
\end{equation*}である場合には、分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}F_{X}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<1\right) \\
\dfrac{1}{\zeta \left( s\right) }\sum\limits_{m=1}^{x}\dfrac{1}{m^{s}} &
\left( if\ x\geq 1\right)
\end{array}\right.
\end{equation*}を定める。ただし、\begin{equation*}
\zeta \left( s\right) =\sum_{n=1}^{+\infty }\frac{1}{n^{s}}
\end{equation*}である。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(ゼータ分布の分布関数)
確率変数\(X\)がパラメータ\(1.1\)のゼータ分布にしたがうものとします。つまり、\begin{equation*}X\sim \mathrm{Zeta}\left( 1.1\right)
\end{equation*}であるということです。この場合、先の命題より、分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}F_{X}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<1\right) \\
\dfrac{1}{\zeta \left( 1.1\right) }\sum\limits_{m=1}^{x}\dfrac{1}{m^{1.1}}
& \left( if\ x\geq 1\right)
\end{array}\right.
\end{equation*}を定めます。ただし、\begin{equation*}
\zeta \left( 1.1\right) =\sum_{n=1}^{+\infty }\frac{1}{n^{1.1}}=10.584
\end{equation*}です。

例(ゼータ分布の分布関数)
確率変数\(X\)がパラメータ\(2\)のゼータ分布にしたがうものとします。つまり、\begin{equation*}X\sim \mathrm{Zeta}\left( 2\right)
\end{equation*}であるということです。この場合、先の命題より、分布関数\(F_{X}:\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}F_{X}\left( x\right) =\left\{
\begin{array}{cl}
0 & \left( if\ x<1\right) \\
\dfrac{1}{\zeta \left( 2\right) }\sum\limits_{m=1}^{x}\dfrac{1}{m^{2}} &
\left( if\ x\geq 1\right)
\end{array}\right.
\end{equation*}を定めます。ただし、\begin{equation*}
\zeta \left( 2\right) =\sum_{n=1}^{+\infty }\frac{1}{n^{2}}=\frac{1}{6}\pi
^{2}
\end{equation*}です。

 

ゼータ分布にしたがう確率変数の期待値

ゼータ分布にしたがう確率変数の期待値は以下の通りです。

命題(ゼータ分布にしたがう確率変数の期待値)
確率変数\(X\)がパラメータ\(s\in \left( 2,+\infty \right) \)のゼータ分布にしたがう場合、すなわち、\begin{equation*}X\sim \mathrm{Zeta}\left( s\right)
\end{equation*}である場合には、\(X\)の期待値は、\begin{equation*}E\left( X\right) =\frac{\zeta \left( s-1\right) }{\zeta \left( s\right) }
\end{equation*}となる。ただし、\begin{eqnarray*}
\zeta \left( s\right) &=&\sum_{n=1}^{+\infty }\frac{1}{n^{s}} \\
\zeta \left( s-1\right) &=&\sum_{n=1}^{+\infty }\frac{1}{n^{s-1}}
\end{eqnarray*}である。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

上の命題ではパラメータが\(2\)より大きい状況を想定しています。\(1<s<2\)の場合には期待値が有限な実数として定まりません。なぜなら、この場合、\(\zeta \left( s\right) \)は有限な実数として定まる一方で、\(\zeta \left( s-1\right) \)は有限な実数として定まらず、ゆえに\(\frac{\zeta \left( s-1\right) }{\zeta \left(s\right) }\)すなわち\(E\left( X\right) \)もまた有限な実数として定まらないからです。

 

ゼータ分布にしたがう確率変数の分散

ゼータ分布にしたがう確率変数の期待値は以下の通りです。

命題(ゼータ分布にしたがう確率変数の期待値)
確率変数\(X\)がパラメータ\(s\in \left( 3,+\infty \right) \)のゼータ分布にしたがう場合、すなわち、\begin{equation*}X\sim \mathrm{Zeta}\left( s\right)
\end{equation*}である場合には、\(X\)の分散は、\begin{equation*}\mathrm{Var}\left( X\right) =\frac{\zeta \left( s-2\right) }{\zeta \left(
s\right) }-\left[ \frac{\zeta \left( s-1\right) }{\zeta \left( s\right) }\right] ^{2}
\end{equation*}となる。ただし、\begin{eqnarray*}
\zeta \left( s\right) &=&\sum_{n=1}^{+\infty }\frac{1}{n^{s}} \\
\zeta \left( s-1\right) &=&\sum_{n=1}^{+\infty }\frac{1}{n^{s-1}} \\
\zeta \left( s-2\right) &=&\sum_{n=1}^{+\infty }\frac{1}{n^{s-2}}
\end{eqnarray*}である。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

上の命題ではパラメータが\(3\)より大きい状況を想定しています。\(1<s<3\)の場合には期待値が有限な実数として定まりません。なぜなら、この場合、\(\zeta \left( s\right) \)と\(\zeta \left( s-1\right) \)は有限な実数として定まる一方で、\(\zeta \left( s-2\right) \)は有限な実数として定まらず、ゆえに\(\frac{\zeta \left(s-2\right) }{\zeta \left( s\right) }-\left[ \frac{\zeta \left( s-1\right) }{\zeta \left( s\right) }\right] ^{2}\)すなわち\(\mathrm{Var}\left( X\right) \)もまた有限な実数として定まらないからです。

 

ゼータ分布のモーメント母関数

ゼータ分布にしたがう確率変数はモーメント母関数を持ちません。

命題(ゼータ分布のモーメント母関数)
確率変数\(X\)がパラメータ\(s\in \left( 1,+\infty \right) \)のゼータ分布にしたがう場合、すなわち、\begin{equation*}X\sim \mathrm{Zeta}\left( s\right)
\end{equation*}である場合には、\(X\)のモーメント母関数は存在しない。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

 

ゼータ分布の特性関数

ゼータ分布にしたがう確率変数の特性関数は以下の通りです。

命題(ゼータ分布の特性関数)
確率変数\(X\)がパラメータ\(s\in \left( 1,+\infty \right) \)のゼータ分布にしたがう場合、すなわち、\begin{equation*}X\sim \mathrm{Zeta}\left( s\right)
\end{equation*}である場合には、\(X\)の特性関数\(\varphi _{X}:\mathbb{R} \rightarrow \mathbb{C} \)はそれぞれの\(t\in \mathbb{R} \)に対して、\begin{equation*}\phi _{X}\left( t\right) =\dfrac{1}{\zeta \left( s\right) }\sum_{x=1}^{+\infty }\frac{e^{itx}}{x^{s}}
\end{equation*}を定める。ただし、ただし、\begin{equation*}
\zeta \left( s\right) =\sum_{n=1}^{+\infty }\frac{1}{n^{s}}
\end{equation*}である。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員専用コンテンツです
ログイン】【会員登録