検索
Close this search box.

完備情報の静学ゲーム

純粋戦略集合が可算集合である場合の混合戦略と期待利得

Mailで保存
Xで共有

純粋戦略集合が可算集合である場合の混合戦略

問題としている戦略的状況が完備情報の静学ゲームであるとともに、それが戦略型ゲーム\begin{equation*}
G=\left( I,\left\{ S_{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in
I}\right)
\end{equation*}として記述されているものとします。ただし、\(I\)はプレイヤー集合、\(S_{i}\)はプレイヤー\(i\in I\)の純粋戦略集合、\(u_{i}:S_{I}\rightarrow \mathbb{R} \)はプレイヤー\(i\)の利得関数です。

純粋戦略集合が有限集合である状況を想定した上で混合戦略と期待利得について解説しましたが、純粋戦略集合が可算集合である場合、混合戦略はどのように定義され、また期待利得はどのように計算されるのでしょうか。

プレイヤー\(i\in I\)の純粋戦略が可算集合\begin{equation*}S_{i}=\left\{ s_{i1},s_{i2},\cdots \right\}
\end{equation*}である状況を想定します。この場合、プレイヤー\(i\)の混合戦略とは、\(S_{i}\)に属するそれぞれの純粋戦略\(s_{ij}\ \left( j\in \mathbb{N} \right) \)に対して、それが選ばれる確率\begin{equation*}\sigma _{i}\left( s_{ij}\right) \in \mathbb{R} \end{equation*}を指定する写像\begin{equation*}
\sigma _{i}:S_{i}\rightarrow \mathbb{R} \end{equation*}として定義されます。ただし、\(\sigma _{i}\)は以下の性質\begin{eqnarray*}&&\left( a\right) \ \forall j\in \mathbb{N} :\sigma _{i}\left( s_{ij}\right) \geq 0 \\
&&\left( b\right) \ \sum_{j=1}^{+\infty }\sigma _{i}\left( s_{ij}\right) =1
\end{eqnarray*}をともに満たす必要があります。条件\(\left(a\right) \)は、プレイヤー\(i\)が混合戦略\(\sigma _{i}\)のもとでそれぞれの純粋戦略を選ぶ確率が非負の実数であることを意味します。条件\(\left( b\right) \)は、混合戦略\(\sigma _{i}\)のもとでそれぞれの純粋が選ばれる確率からなる無限級数の和をとると\(1\)になることを意味します。

プレイヤー\(i\)の混合戦略集合は、以上の条件を満たす混合戦略からなる集合\begin{equation*}\Delta \left( S_{i}\right) =\left\{ \sigma _{i}:S_{i}\rightarrow \mathbb{R} \ |\ \sum_{j=1}^{+\infty }\sigma _{i}\left( s_{ij}\right) =1\wedge \forall
j\in \mathbb{N} :\sigma _{i}\left( s_{ij}\right) \geq 0\right\}
\end{equation*}です。プレイヤー\(i\)の混合戦略\(\sigma _{i}:S_{i}\rightarrow \mathbb{R} \)を確率の列\begin{equation*}\sigma _{i}=\left( \sigma _{i}\left( s_{i1}\right) ,\sigma _{i}\left(
s_{i2}\right) ,\cdots \right)
\end{equation*}と同一視できるため、プレイヤー\(i\)の混合戦略集合を、\begin{equation*}\Delta \left( S_{i}\right) =\left\{ \sigma _{i}\in \mathbb{R} ^{\infty }\ |\ \sum_{j=1}^{+\infty }\sigma _{i}\left( s_{ij}\right) =1\wedge
\forall j\in \mathbb{N} :\sigma _{i}\left( s_{ij}\right) \geq 0\right\}
\end{equation*}と表現することもできます。

例(混合戦略)
プレイヤー\(i\in I\)の純粋戦略集合が、\begin{equation*}S_{i}=\mathbb{N} =\left\{ 1,2,\cdots \right\}
\end{equation*}であるものとします。これは可算集合です。写像\(\sigma _{i}:S_{i}\rightarrow \mathbb{R} \)はそれぞれの\(n\in S_{i}\)に対して、\begin{equation*}\sigma _{i}\left( n\right) =\left( \frac{1}{2}\right) ^{n}
\end{equation*}を定めるものとします。つまり、\(\sigma _{i}\)のもとでは自然数\(n\)を確率\(\left( \frac{1}{2}\right) ^{n}\)で選ぶということです。明らかに、\begin{equation*}\forall n\in S_{i}:\sigma _{i}\left( n\right) \geq 0
\end{equation*}が成り立ちます。さらに、\begin{eqnarray*}
\sum_{n=1}^{+\infty }\sigma _{i}\left( n\right) &=&\sum_{n=1}^{+\infty
}\left( \frac{1}{2}\right) ^{n} \\
&=&\lim_{N\rightarrow +\infty }\sum_{n=1}^{N}\left( \frac{1}{2}\right) ^{n}
\\
&=&\lim_{N\rightarrow +\infty }\left[ 1-\left( \frac{1}{2}\right) ^{N}\right] \\
&=&1-0 \\
&=&1
\end{eqnarray*}が成り立ちます。したがって\(\sigma _{i}\)は混合戦略としての要件を満たします。つまり、\begin{equation*}\sigma _{i}\in \Delta \left( S_{i}\right)
\end{equation*}が成り立ちます。

例(混合戦略ではない写像)
プレイヤー\(i\in I\)の純粋戦略集合が、\begin{equation*}S_{i}=\mathbb{N} =\left\{ 1,2,\cdots \right\}
\end{equation*}であるものとします。これは可算集合です。写像\(\sigma _{i}:S_{i}\rightarrow \mathbb{R} \)はそれぞれの\(n\in S_{i}\)に対して定める確率が、\(c>0\)を満たす定数\(c\in \mathbb{R} \)を用いて、\begin{equation*}\sigma _{i}\left( n\right) =c
\end{equation*}と表されるものとします。つまり、\(\sigma _{i}\)のもとではすべての自然数が等しい確率\(c\)で選ばれるということです。明らかに、\begin{equation*}\forall n\in S_{i}:\sigma _{i}\left( n\right) \geq 0
\end{equation*}が成り立ちます。その一方で、\begin{eqnarray*}
\sum_{n=1}^{+\infty }\sigma _{i}\left( n\right) &=&\sum_{n=1}^{+\infty }c \\
&=&\lim_{N\rightarrow +\infty }\sum_{n=1}^{N}c \\
&=&\lim_{N\rightarrow +\infty }Nc \\
&=&+\infty
\end{eqnarray*}となるため、\(\sigma _{i}\)は混合戦略としての要件を満たしません。つまり、\begin{equation*}\sigma _{i}\not\in \Delta \left( S_{i}\right)
\end{equation*}が成り立ちます。

 

純粋戦略集合が可算集合である場合の期待利得

任意のプレイヤー\(i\in I\)の純粋戦略集合が可算集合\begin{equation*}S_{i}=\left\{ s_{i1},s_{i2},\cdots \right\} =\left\{ s_{ij_{i}}\right\}
_{j_{i}=1}^{+\infty }
\end{equation*}である状況を想定します。この場合、プレイヤー\(i\)の期待利得関数\(F_{i}:\Delta \left( S_{I}\right) \rightarrow \mathbb{R} \)が全員の混合戦略の組\(\sigma _{I}\in \Delta \left( S_{I}\right) \)に対して定める期待利得は、\begin{eqnarray*}F_{i}\left( \sigma _{I}\right) &=&\sum_{s_{I}\in S_{I}}\left[ \sigma
_{I}\left( s_{I}\right) \times u_{i}\left( s_{I}\right) \right] \\
&=&\sum_{j_{1}=1}^{+\infty }\cdots \sum_{j_{n}=1}^{+\infty }\left[ \sigma
_{1}\left( s_{1j_{1}}\right) \times \cdots \times \sigma _{n}\left(
s_{nj_{n}}\right) \times u_{i}\left( s_{1j_{1}},\cdots ,s_{nj_{n}}\right) \right] \quad \because I=\left\{ 1,\cdots ,n\right\} \text{の場合}
\end{eqnarray*}という多重無限級数になります。

例(期待利得が収束する場合)
戦略型ゲーム\(G\)のプレイヤー集合が、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}であり、純粋戦略集合が、\begin{equation*}
S_{1}=S_{2}=\mathbb{N} =\left\{ 1,2,\cdots \right\}
\end{equation*}であり、プレイヤー\(i\in I\)の混合戦略\(\sigma _{i}:S_{i}\rightarrow \mathbb{R} \)はそれぞれの\(n\in S_{i}\)に対して、\begin{equation*}\sigma _{i}\left( n\right) =\left( \frac{1}{2}\right) ^{n}
\end{equation*}を定めるものとします。先に示したように\(\sigma _{i}\)は混合戦略としての要件を満たします。さらに、プレイヤー\(i\in I\)の利得関数\(u_{i}:S_{I}\rightarrow \mathbb{R} \)はそれぞれの\(s_{I}\in S_{I}\)に対して、\begin{equation*}u_{i}\left( s_{I}\right) =s_{1}+s_{2}
\end{equation*}を定めるものとします。混合戦略の組\(\sigma_{I}\in \Delta \left( S_{I}\right) \)を任意に選んだとき、プレイヤー\(1\)の期待利得は、\begin{eqnarray*}u_{1}\left( \sigma _{I}\right) &=&\sum_{s_{1}\in S_{1}}\sum_{s_{2}\in S_{2}}
\left[ \sigma _{I}\left( s_{1},s_{2}\right) \times u_{1}\left(
s_{1},s_{2}\right) \right] \\
&=&\sum_{i=1}^{+\infty }\sum_{j=1}^{+\infty }\left( \frac{1}{2}\right)
^{i}\left( \frac{1}{2}\right) ^{j}\left( i+j\right) \\
&=&\sum_{i=1}^{+\infty }\sum_{j=1}^{+\infty }\left( \frac{1}{2}\right)
^{i}\left( \frac{1}{2}\right) ^{j}i+\sum_{i=1}^{+\infty }\sum_{j=1}^{+\infty
}\left( \frac{1}{2}\right) ^{i}\left( \frac{1}{2}\right) ^{j}j \\
&=&\sum_{i=1}^{+\infty }\left( \frac{1}{2}\right) ^{i}i\sum_{j=1}^{+\infty
}\left( \frac{1}{2}\right) ^{j}+\sum_{i=1}^{+\infty }\left( \frac{1}{2}\right) ^{i}\sum_{j=1}^{+\infty }\left( \frac{1}{2}\right) ^{j}j \\
&=&\sum_{i=1}^{+\infty }\left( \frac{1}{2}\right) ^{i}i+\sum_{j=1}^{+\infty
}\left( \frac{1}{2}\right) ^{j}j \\
&=&2+2 \\
&=&4
\end{eqnarray*}となります。プレイヤー\(2\)についても同様です。

純粋戦略集合が可算集合である場合の期待利得は無限級数であるため、有限な和に収束するとは限りません。

例(期待利得が発散する場合)
戦略型ゲーム\(G\)のプレイヤー集合が、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}であり、純粋戦略集合が、\begin{equation*}
S_{1}=S_{2}=\mathbb{N} =\left\{ 1,2,\cdots \right\}
\end{equation*}であり、プレイヤー\(i\in I\)の混合戦略\(\sigma _{i}:S_{i}\rightarrow \mathbb{R} \)はそれぞれの\(n\in S_{i}\)に対して、\begin{equation*}\sigma _{i}\left( n\right) =\left( \frac{1}{2}\right) ^{n}
\end{equation*}を定めるものとします。先に示したように\(\sigma _{i}\)は混合戦略としての要件を満たします。さらに、プレイヤー\(i\in I\)の利得関数\(u_{i}:S_{I}\rightarrow \mathbb{R} \)はそれぞれの\(s_{I}\in S_{I}\)に対して、\begin{equation*}u_{i}\left( s_{I}\right) =2^{s_{1}+s_{2}}
\end{equation*}を定めるものとします。混合戦略の組\(\sigma_{I}\in \Delta \left( S_{I}\right) \)を任意に選んだとき、プレイヤー\(1\)の期待利得は、\begin{eqnarray*}u_{1}\left( \sigma _{I}\right) &=&\sum_{s_{1}\in S_{1}}\sum_{s_{2}\in S_{2}}
\left[ \sigma _{I}\left( s_{1},s_{2}\right) \times u_{1}\left(
s_{1},s_{2}\right) \right] \\
&=&\sum_{i=1}^{+\infty }\sum_{j=1}^{+\infty }\left( \frac{1}{2}\right)
^{i}\left( \frac{1}{2}\right) ^{j}2^{i+j} \\
&=&\sum_{i=1}^{+\infty }\sum_{j=1}^{+\infty }\left( \frac{1}{2}\right)
^{i+j}2^{i+j} \\
&=&\sum_{i=1}^{+\infty }\sum_{j=1}^{+\infty }1 \\
&=&+\infty
\end{eqnarray*}となります。プレイヤー\(2\)についても同様です。

 

期待利得が収束するための条件:利得関数の有界性

純粋戦略集合が可算集合である場合の期待利得は無限級数であるため、有限な和に収束するとは限らないことが明らかになりました。期待利得が無限大になる状況を許容すると分析が困難になります。期待効用が有限な値として定まることを保証するためにはモデルに対して一定の制約を設ける必要があります。

純粋戦略集合が可算集合である場合においても、任意のプレイヤー\(i\in I\)の利得関数\(u_{i}:S_{I}\rightarrow \mathbb{R} \)が有界である場合には、すなわち、\begin{equation*}\exists M>0,\ \forall s_{I}\in S_{I}:\left\vert u_{i}\left( s_{I}\right)
\right\vert \leq M
\end{equation*}が成り立つことを仮定すれば、期待利得関数は有限な和に収束します。実際、この場合、任意の\(\sigma _{I}\in\Delta \left( S_{I}\right) \)において、\begin{eqnarray*}\left\vert F_{i}\left( \sigma _{I}\right) \right\vert &=&\left\vert
\sum_{s_{I}\in S_{I}}\left[ \sigma _{I}\left( s_{I}\right) \times
u_{i}\left( s_{I}\right) \right] \right\vert \\
&=&\left\vert \sum_{j_{1}=1}^{+\infty }\cdots \sum_{j_{n}=1}^{+\infty }\left[
\sigma _{1}\left( s_{1j_{1}}\right) \times \cdots \times \sigma _{n}\left(
s_{nj_{n}}\right) \times u_{i}\left( s_{1j_{1}},\cdots ,s_{nj_{n}}\right) \right] \right\vert \quad \because I=\left\{ 1,\cdots ,n\right\} \text{の場合} \\
&\leq &\sum_{j_{1}=1}^{+\infty }\cdots \sum_{j_{n}=1}^{+\infty }\left[
\sigma _{1}\left( s_{1j_{1}}\right) \times \cdots \times \sigma _{n}\left(
s_{nj_{n}}\right) \times \left\vert u_{i}\left( s_{1j_{1}},\cdots
,s_{nj_{n}}\right) \right\vert \right] \quad \because \text{三角不等式} \\
&\leq &\sum_{j_{1}=1}^{+\infty }\cdots \sum_{j_{n}=1}^{+\infty }\left[
\sigma _{1}\left( s_{1j_{1}}\right) \times \cdots \times \sigma _{n}\left(
s_{nj_{n}}\right) \times M\right] \quad \because u_{i}\text{は有界} \\
&=&M\sum_{j_{1}=1}^{+\infty }\sigma _{1}\left( s_{1j_{1}}\right) \times
\cdots \times \sum_{j_{n}=1}^{+\infty }\sigma _{n}\left( s_{nj_{n}}\right)
\\
&=&M \\
&<&+\infty
\end{eqnarray*}となるため、\(F_{i}\left( \sigma_{I}\right) \)は有限値として確定します。

 

期待利得が収束するための条件:有限の台

純粋戦略集合が可算集合である場合においても、任意のプレイヤー\(i\in I\)の混合戦略\(\sigma _{i}:\Delta \left( S_{I}\right) \rightarrow \mathbb{R} \)の台が有限集合である場合には、すなわち\(\sigma _{i}\)のもとで正の確率が割り当てられる純粋戦略からなる集合\begin{equation*}\left\{ j\in \mathbb{N} \ |\ \sigma _{i}\left( s_{ij}\right) >0\right\}
\end{equation*}が有限集合である場合には、期待利得関数は有限な和に収束します。実際、この場合、\(\sigma _{I}\in \Delta \left( S_{I}\right) \)のもとで、\begin{equation*}\forall i\in I,\ \exists K_{i}\in \mathbb{N} ,\ \forall j_{i}\in \mathbb{N} :\left[ j_{i}>K_{i}\Rightarrow \sigma _{i}\left( s_{ij_{i}}\right) =0\right] \end{equation*}が成り立つため、\begin{eqnarray*}
F_{i}\left( \sigma _{I}\right) &=&\sum_{s_{I}\in S_{I}}\left[ \sigma
_{I}\left( s_{I}\right) \times u_{i}\left( s_{I}\right) \right] \\
&=&\sum_{j_{1}=1}^{+\infty }\cdots \sum_{j_{n}=1}^{+\infty }\left[ \sigma
_{1}\left( s_{1j_{1}}\right) \times \cdots \times \sigma _{n}\left(
s_{nj_{n}}\right) \times u_{i}\left( s_{1j_{1}},\cdots ,s_{nj_{n}}\right) \right] \quad \because I=\left\{ 1,\cdots ,n\right\} \text{の場合} \\
&=&\sum_{j_{1}=1}^{K_{1}}\cdots \sum_{j_{n}=1}^{K_{n}}\left[ \sigma
_{1}\left( s_{1j_{1}}\right) \times \cdots \times \sigma _{n}\left(
s_{nj_{n}}\right) \times u_{i}\left( s_{1j_{1}},\cdots ,s_{nj_{n}}\right) \right] \end{eqnarray*}となりますが、これは有限個の実数の積と和であるため\(F_{i}\left( \sigma_{I}\right) \)は有限値として確定します。

 

確率空間を用いた混合戦略と期待利得の解釈

混合戦略とは何らかの純粋戦略をランダムに選択する意思決定に相当します。これは標本点をランダムに抽出するという確率論の考え方そのものです。そこで、純粋戦略集合が可算集合である状況における混合戦略を確率空間を用いて表現し、期待利得を導出するプロセスを解説します。

プレイヤー集合を、\begin{equation*}
I=\left\{ 1,\cdots ,n\right\}
\end{equation*}とします。プレイヤー\(i\in I\)の純粋戦略集合が可算集合\begin{equation*}S_{i}=\left\{ s_{i1},s_{i2},\cdots \right\} =\left\{ s_{ij_{i}}\right\}
_{j_{i}=1}^{+\infty }
\end{equation*}であるものとします。その上で、プレイヤー\(i\)の意思決定を確率空間\begin{equation*}\left( \Omega _{i},\mathcal{F}_{i},P_{i}\right)
\end{equation*}として定式化します。

まず、標本空間\(\Omega _{i}\)としてプレイヤーの純粋戦略集合\begin{equation*}\Omega _{i}=S_{i}
\end{equation*}を採用します。

標本空間\(\Omega _{i}\)すなわち純粋戦略集合\(S_{i}\)は可算集合であるため、事象空間\(\mathcal{F}_{i}\)として\(S_{i}\)のベキ集合\begin{equation*}\mathcal{F}_{i}=2^{S_{i}}
\end{equation*}を採用できます。

混合戦略\(\sigma _{i}:S_{i}\rightarrow \mathbb{R} \)を便宜的に集合関数\(\sigma _{i}:2^{S_{i}}\rightarrow \mathbb{R} \)とみなした場合、これは確率論の公理に相当する性質\begin{eqnarray*}&&\left( a\right) \ \forall j_{i}\in \mathbb{N} :\sigma _{i}\left( \left\{ s_{ij_{i}}\right\} \right) \geq 0 \\
&&\left( b\right) \ \sum_{j_{i}=1}^{+\infty }\sigma \left( \left\{
s_{ij_{i}}\right\} \right) =1 \\
&&\left( c\right) \ \forall A\in 2^{S_{i}}:\sigma \left( A\right)
=\sum_{s_{ij_{i}}\in A}P\left( \left\{ s_{ij_{i}}\right\} \right)
\end{eqnarray*}を満たすため、確率測度\(P_{i}\)として混合戦略\begin{equation*}P_{i}=\sigma _{i}
\end{equation*}を採用します。

以上の要領で定義された確率空間\begin{equation*}
\left( S_{i},2^{S_{i}},\sigma _{i}\right)
\end{equation*}をプレイヤー\(i\)の混合戦略と同一視します。

例(確率空間としての混合戦略)
戦略型ゲーム\(G\)においてプレイヤー\(i\in I\)の純粋戦略集合が、\begin{equation*}S_{i}=\mathbb{N} =\left\{ 1,2,\cdots \right\}
\end{equation*}であるものとします。混合戦略\(\sigma _{i}:2^{\mathbb{N} }\rightarrow \mathbb{R} \)はそれぞれの\(A\in 2^{\mathbb{N} }\)に対して、\begin{equation*}\sigma _{i}\left( A\right) =\sum_{s_{i}\in A}\frac{1}{2^{s_{i}}}
\end{equation*}を定めるものとします。このとき、任意の\(n\in S_{i}\)に対して、\begin{eqnarray*}\sigma _{i}\left( \left\{ n\right\} \right) &=&\sum_{s_{i}\in \left\{
n\right\} }\frac{1}{2^{s_{i}}} \\
&=&\frac{1}{2^{n}} \\
&\geq &0
\end{eqnarray*}であるとともに、\begin{eqnarray*}
\sigma _{i}\left( S_{i}\right) &=&\sum_{s_{i}\in S_{i}}\frac{1}{2^{s_{i}}}
\\
&=&\sum_{n=1}^{+\infty }\frac{1}{2^{n}} \\
&=&1
\end{eqnarray*}が成り立つため、\(\sigma _{i}\)は混合戦略としての要件を満たしています。

それぞれのプレイヤー\(i\in I\)に関する確率空間\begin{equation*}\left( S_{i},2^{S_{i}},\sigma _{i}\right)
\end{equation*}が先の要領で与えられた状況を想定します。ここから直積確率空間\begin{equation*}
\left( S_{I},2^{S_{I}},\sigma _{I}\right)
\end{equation*}を定義します。ただし、\begin{equation*}
S_{I}=S_{1}\times \cdots \times S_{n}
\end{equation*}はプレイヤーたちの純粋戦略集合の直積です。これは有限個の可算集合どうしの直積であるため可算集合であり、ゆえに事象空間としてそのベキ集合\begin{equation*}
2^{S_{I}}=2^{S_{1}\times \cdots \times S_{n}}
\end{equation*}を採用できます。さらに、プレイヤーたちが互いに独立に戦略を選ぶという非協力ゲームの前提にもとづき、確率測度は直積測度\begin{equation*}
\sigma _{I}=\sigma _{1}\times \cdots \times \sigma _{n}
\end{equation*}であり、純粋戦略からなる組\begin{equation*}
s_{I}=\left( s_{1},\cdots ,s_{n}\right) \in S_{1}\times \cdots \times S_{n}
\end{equation*}を任意に選んだとき、以下の関係\begin{equation*}
\sigma _{I}\left( \left\{ s_{I}\right\} \right) =\sigma _{1}\left( \left\{
s_{1}\right\} \right) \times \cdots \times \sigma _{n}\left( \left\{
s_{n}\right\} \right)
\end{equation*}が成り立ちます。

以上の確率空間\(\left( \Omega ,\mathcal{F},P\right) \)を踏まえると、プレイヤー\(i\)の利得関数\(u_{i}\)は確率変数\begin{equation*}u_{i}:\Omega \rightarrow \mathbb{R} \end{equation*}として定義されます。\(u_{i}\)は確率変数としての条件\begin{equation*}\forall B\in \mathfrak{B}\left( \mathbb{R} \right) :u_{i}^{-1}\left( B\right) \in \mathcal{F}
\end{equation*}を満たす必要があります。\(\mathfrak{B}\left( \mathbb{R} \right) \)は\(\mathbb{R} \)上のボレル集合族です。ただし、\(\mathcal{F}=2^{S_{1}\times\cdots \times S_{n}}\)ゆえに先の条件は常に満たされるため、任意の写像\(u_{i}:\Omega\rightarrow \mathbb{R} \)が確率変数になり得ることに注意してください。

それぞれのプレイヤー\(i\in I\)の利得関数は確率変数\begin{equation*}u_{i}:S_{I}\rightarrow \mathbb{R} \end{equation*}として定義されます。\(u_{i}\)は確率変数としての条件\begin{equation*}\forall B\in \mathfrak{B}\left( \mathbb{R} \right) :u_{i}^{-1}\left( B\right) \in 2^{S_{I}}
\end{equation*}を満たす必要があります。\(\mathfrak{B}\left( \mathbb{R} \right) \)は\(\mathbb{R} \)上のボレル集合族です。ただし、事象集合が\(2^{S_{I}}\)であることから先の条件は常に満たされるため、任意の写像\(u_{i}:S_{I}\rightarrow \mathbb{R} \)が利得関数になり得ることに注意してください。

混合戦略の組\(\sigma _{I}\)のもとでプレイヤー\(i\)が直面する期待利得\(F_{i}\left( \sigma_{I}\right) \)は、\(\sigma _{I}\)に相当する確率測度のもとでの確率変数\(u_{i}\)の期待値に他ならず、ゆえに、\begin{eqnarray*}F_{i}\left( \sigma _{I}\right) &=&\int_{S_{I}}u_{i}\left( s_{I}\right)
d\sigma _{I}\left( s_{I}\right) \\
&=&\int_{S_{1}\times \cdots \times S_{n}}u_{i}\left( s_{1},\cdots
,s_{n}\right) d\sigma _{I}\left( s_{1},\cdots ,s_{n}\right) \\
&=&\int_{S_{n}}\cdots \left( \int_{S_{1}}u_{i}\left( s_{1},\cdots
,s_{n}\right) d\sigma _{1}\left( s_{1}\right) \right) \cdots d\sigma
_{n}\left( s_{n}\right) \quad \because \text{フビニの定理} \\
&=&\sum_{j_{n}=1}^{+\infty }\cdots \left( \sum_{j_{1}=1}^{+\infty
}u_{i}\left( s_{1},\cdots ,s_{n}\right) \times \sigma _{1}\left( \left\{
s_{1j_{1}}\right\} \right) \right) \cdots \sigma _{n}\left( \left\{
s_{nj_{n}}\right\} \right)
\end{eqnarray*}を得ます。以上の結果は期待効用の定義と整合的です。

例(期待利得)
戦略型ゲーム\(G\)において、プレイヤー集合が、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}であり、純粋戦略集合が、\begin{equation*}
S_{1}=S_{2}=\mathbb{N} =\left\{ 1,2,\cdots \right\}
\end{equation*}であるものとします。任意のプレイヤー\(i\in I\)の混合戦略\(\sigma _{i}:2^{\mathbb{N} }\rightarrow \mathbb{R} \)はそれぞれの\(A\in 2^{\mathbb{N} }\)に対して、\begin{equation*}\sigma _{i}\left( A\right) =\sum_{s_{i}\in A}\frac{1}{2^{s_{i}}}
\end{equation*}を定めるものとします。プレイヤー\(1\)の利得関数が、\begin{equation*}u_{1}\left( s_{1},s_{2}\right) =s_{1}+s_{2}
\end{equation*}である場合に、2人がともに先の混合戦略を採用した場合\(\left( \sigma_{1},\sigma _{2}\right) \)にプレイヤー\(1\)が直面する期待利得は、\begin{eqnarray*}F_{1}\left( \sigma _{1},\sigma _{2}\right) &=&\int_{S_{1}\times
S_{2}}u_{1}\left( s_{1},s_{2}\right) d\sigma _{I}\left( s_{1},s_{2}\right)
\\
&=&\int_{S_{2}}\left( \int_{S_{1}}\left( s_{1}+s_{2}\right) d\sigma
_{1}\left( s_{1}\right) \right) d\sigma _{2}\left( s_{2}\right) \\
&=&\sum_{s_{2}=1}^{+\infty }\left( \sum_{s_{1}=1}^{+\infty }\left(
s_{1}+s_{2}\right) \frac{1}{2^{s_{1}}}\right) \frac{1}{2^{s_{2}}} \\
&=&\sum_{s_{2}=1}^{+\infty }\frac{1}{2^{s_{2}}}\left(
\sum_{s_{1}=1}^{+\infty }s_{1}\frac{1}{2^{s_{1}}}+s_{2}\sum_{s_{1}=1}^{+\infty }\frac{1}{2^{s_{1}}}\right) \\
&=&\sum_{s_{2}=1}^{+\infty }\frac{1}{2^{s_{2}}}\left( 2+s_{2}\right) \\
&=&2\sum_{s_{2}=1}^{+\infty }\frac{1}{2^{s_{2}}}+\sum_{s_{2}=1}^{+\infty
}s_{2}\frac{1}{2^{s_{2}}} \\
&=&2+2 \\
&=&4
\end{eqnarray*}となります。

 

演習問題

問題(混合戦略の定義)
戦略型ゲーム\(G\)において、プレイヤー\(i\in I\)の純粋戦略集合が、\begin{equation*}S_{i}=\mathbb{N} =\left\{ 1,2,\cdots \right\}
\end{equation*}であるとともに、混合戦略\(\sigma _{i}\in \Delta \left( S_{i}\right) \)が以下の条件\begin{equation*}\forall n\in S_{i}:\sigma _{i}\left( n\right) =\frac{1}{3}\left( \frac{2}{3}\right) ^{n-1}
\end{equation*}を満たすものとします。以下の問いに答えて下さい。

  1. \(\sigma _{i}\)が混合戦略としての条件を満たすことを示してください。
  2. \(\sigma _{i}\)のもとでプレイヤー\(i\)が\(n\)以下の戦略を選ぶ確率を求めてください。
解答を見る

会員専用コンテンツです
ログイン】【会員登録

問題(期待利得の導出)
戦略型ゲーム\(G\)において、プレイヤー集合が、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}であり、純粋戦略集合が、\begin{equation*}
S_{1}=S_{2}=\mathbb{N} =\left\{ 1,2,\cdots \right\}
\end{equation*}であり、任意のプレイヤー\(i\in I\)の混合戦略\(\sigma _{i}\in \Delta \left( S_{i}\right) \)が、\begin{equation*}\forall n\in S_{i}:\sigma _{i}\left( n\right) =\left( \frac{1}{2}\right) ^{n}
\end{equation*}を満たすものとします。以下の問いに答えてください。

  1. プレイヤー\(1\)の利得関数が、\begin{equation*}u_{1}\left( s_{1},s_{2}\right) =s_{1}s_{2}\end{equation*}を満たすものとします。先の混合戦略の組\(\left( \sigma _{1},\sigma _{2}\right) \)のもとでのプレイヤー\(1\)の期待利得\(F_{1}\left( \sigma _{1},\sigma _{2}\right) \)を求めてください。
  2. プレイヤー\(1\)の利得関数が、\begin{equation*}u_{1}\left( s_{1},s_{2}\right) =3^{s_{1}+s_{2}}\end{equation*}を満たすものとします。先の混合戦略の組\(\left( \sigma _{1},\sigma _{2}\right) \)のもとでのプレイヤー\(1\)の期待利得\(F_{1}\left( \sigma _{1},\sigma _{2}\right) \)を求めてください。
解答を見る

会員専用コンテンツです
ログイン】【会員登録

問題(投資ゲーム)
2つの企業\(1,2\)が次世代製品の開発競争をしています。各社は投資額として任意の自然数\(n\in \mathbb{N} \)を選ぶことができます。\(n\)を選ぶことは\(n\)億円の投資に相当します。両者は相手の投資額を観察できない状態で自社の投資額を選択します。投資額が大きい方の企業が市場を独占し\(2^{n}\)億円の利益を得ますが投資額\(n\)を支払う必要があります。投資額が小さい方の企業は投資額\(n\)だけを失います。投資額が同じ場合には利益\(2^{n}\)を折半します。両社ともこれまでの経験則から、高い投資ほどリスクを感じ、\begin{equation*}\sigma _{i}\left( n\right) =\left( \frac{1}{2}\right) ^{n}
\end{equation*}という確率で投資額を決定するものとします。以下の問いに答えてください。

  1. この状況を戦略型ゲーム\(G\)として定式化してください。
  2. 先の混合戦略の組\(\left( \sigma _{1},\sigma _{2}\right) \)のもとでの企業\(1\)の期待利得\(F_{1}\left( \sigma _{1},\sigma _{2}\right) \)を計算してください。
  3. 問2の結果を解釈してください。
解答を見る

会員専用コンテンツです
ログイン】【会員登録

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

WIISでは、年齢・性別・学歴・職業・社会的立場などにかかわらず、すべてのユーザーが「学ぶ人」として対等であると考えています。ここは、知識を競う場所ではなく、互いに尊重し合いながら理解を深めていく場です。安心して思考し、質問し、考え続けられる環境を、みなさんと一緒につくっていきたいと考えています。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

会員専用コンテンツです
ログイン】【会員登録