教材一覧
教材一覧
教材検索
STATIC GAME OF COMPLETE INFORMATION

完備情報の静学ゲームにおける期待利得

目次

Share on twitter
Twitterで共有
Share on email
メールで共有

クジとしての混合戦略の組

完備情報の静学ゲームを戦略型ゲーム\(G=\left( I,\{S_{i}\}_{i\in I},\{u_{i}\}_{i\in I}\right) \)として表現したとき、すべてのプレイヤーの純粋戦略の組\(s_{I}=\left( s_{i}\right) _{i\in I}\)に対してゲームのルールは結果を 1 つずつ定めます。したがって、プレイヤーたちの純粋戦略からなるそれぞれの組\(s_{I}\)を、ゲームにおいて起こり得る結果と同一視しても一般性は失われません。このような事情を踏まえると、すべてのプレイヤーが純粋戦略を採用する場合には、それぞれのプレイヤー\(i\)は純粋戦略の組どうしを比較する\(S_{I}\)上の選好関係\(\succsim _{i}\)を持っているものとみなすことができます。

一方、プレイヤーたちが混合戦略を採用する場合には話がやや複雑になります。なぜなら、その場合にもゲームのルールは相変わらず純粋戦略の組に対して結果を 1 つずつ定めるものの、プレイヤーたちが選ぶ混合戦略の組\(\sigma _{I}=\left( \sigma _{i}\right) _{i\in I}\)に対して、そのときに実際に実現する 1 つの純粋戦略の組\(s_{I}\)を事前に確定できないからです。ただ、混合戦略の組\(\sigma _{I}\)のもとで、それぞれの純戦略の組\(s_{I}\)が起こる確率を特定することはできます。具体的には、プレイヤー\(i\)が混合戦略\(\sigma _{i}\)のもとで純粋戦略\(s_{i}\)を選ぶ確率は\(\sigma _{i}(s_{i})\)ですから、混合戦略の組\(\sigma _{I}\)のもとで純粋戦略の組\(s_{I}\)が実現する確率は、\begin{equation*}
\sigma _{I}\left( s_{I}\right) =\prod_{i\in I}\sigma _{i}\left( s_{i}\right)
\end{equation*}となります。特に、プレイヤー集合が有限集合\(I=\left\{ 1,\cdots ,n\right\} \)である場合には、\begin{equation*}
\sigma _{I}\left( s_{I}\right) =\sigma _{1}(s_{1})\times \cdots \times
\sigma _{n}(s_{n})
\end{equation*}となります。

以上を踏まえると、混合戦略の組\(\sigma _{I}\)が与えられたとき、純戦略のそれぞれの組\(s_{I}\in S_{I}\)に対して、それが実現する確率\(\sigma _{I}\left( s_{I}\right) \)を定める確率関数\(\sigma _{I}:S_{I}\rightarrow \mathbb{R}\)が定義可能です。これをクジ(lottery)と呼びます。確率関数の定義より、\(\sigma _{I}\)は以下の性質を満たします。\begin{eqnarray*}
&&\left( a\right) \ \forall s_{I}\in S_{I}:0\leq \sigma _{I}\left(
s_{I}\right) \leq 1 \\
&&\left( b\right) \ \sum\limits_{s_{I}\in S_{I}}\sigma _{I}\left(
s_{I}\right) =1
\end{eqnarray*}

条件\(\left( a\right) \)は、クジ\(\sigma _{I}\)のもとでそれぞれの純粋戦略の組\(s_{I}\)が実現する確率は\(0\)以上\(1\)以下であることを意味します。条件\(\left( b\right) \)は、クジ\(\sigma _{I}\)のもとでそれぞれの純粋戦略の組が実現する確率を特定し、それらの総和をとると\(1\)になることを意味します。

例(クジとしての混合戦略の組)
以下の利得行列によって表される完備情報の静学ゲームについて考えます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 4,4 & 0,2 \\ \hline
B & 2,0 & 1,1 \\ \hline
\end{array}$$

表:利得行列

このゲームにおいて起こり得る結果は\(\left( U,L\right) ,\left( U,R\right) ,\left( B,L\right) ,\left( B,R\right) \)の4 通りです。それぞれのプレイヤー\(1,2\)の混合戦略\(\sigma _{1},\sigma _{2}\)を、\begin{eqnarray*}
\sigma _{1} &=&\left( \sigma _{1}\left( U\right) ,\sigma _{1}\left( B\right)
\right) =\left( \sigma _{1},1-\sigma _{1}\right) \quad \left( 0\leq \sigma
_{1}\leq 1\right) \\
\sigma _{2} &=&\left( \sigma _{2}\left( L\right) ,\sigma _{2}\left( R\right)
\right) =\left( \sigma _{2},1-\sigma _{2}\right) \quad \left( 0\leq \sigma
_{2}\leq 1\right)
\end{eqnarray*}で表します。2 人が混合戦略を採用する場合には、2 人の純粋戦略の各組が選ばれる確率は以下の表のように与えられます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & \sigma _{1}\sigma _{2} & \sigma _{1}(1-\sigma _{2}) \\ \hline
B & (1-\sigma _{1})\sigma _{2} & (1-\sigma _{1})(1-\sigma _{2}) \\
\hline
\end{array}$$

表:純粋戦略の各組が選ばれる確率

繰り返しになりますが、ゲームのルールはそれぞれの純粋戦略の組\(s_{I}\)に対して結果を 1 つずつ定めます。ただ、プレイヤーたちが混合戦略を採用する場合、どの純粋戦略の組が実際に実現するかを事前に確定することはできないため、プレイヤーたちは不確実な状況に直面します。そこで、そのような状況をクジ\(\sigma _{I}\)を用いて表現します。クジ\(\sigma _{I}\)とは、それぞれの純粋戦略の組\(s_{I}\)が起こる確率\(\sigma _{I}\left( s_{I}\right) \)、すなわち\(s_{I}\)に対応する結果が起こる確率を特定しますが、これは混合戦略の組\(\sigma _{I}=\left( \sigma _{i}\right) _{i\in I}\)のもとでプレイヤーたちが直面する不確実な状況を表しています。つまり、混合戦略の組が与えられればそれに対して 1 つのクジが定まります。

 

期待利得関数

クジが変化すればプレイヤーたちは以前とは異なる不確実な状況に直面するため、プレイヤーたちが混合戦略を採用する場合、それぞれのプレイヤーはクジどうしを比較する選好を持っているものと考えるべきです。さらに言えば、混合戦略の組が与えられればそれに対して 1 つのクジが定まるため、結局、プレイヤーがクジを比較する選好を、混合戦略の組どうしを比較する\(\Delta \left( S_{I}\right) \)上の選好関係と同一視しても一般性は失われません。

具体的には、戦略型ゲーム\(G\)において表される不完備情報の静学ゲームにおいてプレイヤーたちが混合戦略を採用するとき、プレイヤー\(i\)が直面し得る不確実な状況どうしを比較する選好関係は、混合戦略のすべての組からなる集合\(\Delta \left( S_{I}\right) \)上の二項関係\(\succsim _{i}\)として定式化されます。その上で、2 つの混合戦略の組\(\sigma _{I},\sigma _{I}^{\prime }\in \Delta \left( S_{I}\right) \)に対して\(\sigma _{I}\succsim _{i}\sigma _{I}^{\prime }\)が成り立つ場合には、プレイヤー\(i\)は\(\sigma _{I}\)のもとで直面する不確実な状況を、\(\sigma _{I}^{\prime }\)のもとで直面する不確実な状況以上に好ましいと考えているものと解釈します。

プレイヤー\(i\)が不確実な状況どうしを比較する\(\Delta \left( S_{I}\right) \)上の選好関係\(\succsim _{i}\)が与えられたとき、それに対して関数\(F_{i}:\Delta \left( S_{I}\right) \rightarrow \mathbb{R} \)が存在して、任意の混合戦略の組\(\sigma _{I},\sigma _{I}^{\prime }\in \Delta \left( S_{I}\right) \)に対して、\begin{equation*}
\sigma _{I}\succsim _{i}\sigma _{I}^{\prime }\ \Leftrightarrow \ F_{i}\left(
\sigma _{I}\right) \geq F_{i}\left( \sigma _{I}^{\prime }\right)
\end{equation*}という関係が成り立つ場合には、\(F_{i}\)のことを\(\succsim _{i}\)を表す期待利得関数(expected utility function)と呼びます。さらに、プレイヤー\(i\)の期待利得関数\(F_{i}\)が混合戦略の組\(\sigma _{I}\)に対して定める値\(F_{i}\left( \sigma _{I}\right) \)を、プレイヤー\(i\)が\(\sigma _{I}\)から得る期待利得(expected utility)と呼びます。

プレイヤーがクジどうしを比較する選好関係\(\succsim _{i}\)に対して、それを表す期待利得関数\(F_{i}\)は存在する場合には、それぞれのクジ\(\sigma _{I}\in \delta \left( S_{i}\right) \)に対して、\begin{equation*}
F_{i}\left( \sigma _{I}\right) =\sum_{s_{I}\in S_{I}}\left[ \sigma
_{I}\left( s_{I}\right) \cdot u_{i}(s_{I})\right] =\sum_{s_{I}\in S_{I}}\left[ \left( \prod\limits_{j\in I}\sigma _{j}(s_{j})\right) \cdot
u_{i}(s_{I})\right] \end{equation*}という関係が成り立ちます。特に、プレイヤー集合が有限集合\(I=\left\{ 1,\cdots ,n\right\} \)である場合には、\begin{equation*}
F_{i}\left( \sigma _{I}\right) =\sum_{\left( s_{1},\cdots ,s_{n}\right) \in
S_{1}\times \cdots \times S_{n}}[\sigma _{1}(s_{1})\times \cdots \times
\sigma _{n}(s_{n})\times u_{i}(s_{1},\cdots ,s_{n})] \end{equation*}となります。ただし、\(u_{i}:S_{I}\rightarrow \mathbb{R} \)はプレイヤー\(i\)が純粋戦略の組どうしを比較する利得関数です。

期待利得関数の意味について考えましょう。まず、プレイヤーたちが混合戦略を採用する場合、プレイヤーたちが選ぶ混合戦略の組\(\sigma _{I}\)が得られます。プレイヤー\(i\)が混合戦略\(\sigma _{i}\)のもとで純粋戦略\(s_{i}\)を選ぶ確率は\(\sigma _{i}(s_{i})\)ですから、混合戦略の組\(\sigma _{I}\)のもとで純粋戦略の組\(s_{I}\)が実現する確率は\(\sigma _{I}\left( s_{I}\right) =\prod_{j\in I}\sigma _{j}(s_{j})\)と特定されます。さらに、この\(s_{I}\)においてプレイヤー\(i\)は利得\(u_{i}(s_{I})\)を得るため、\(\sigma _{I}\)のもとでプレイヤー\(i\)が\(s_{I}\)から得る利得の期待値は\(\sigma _{I}\left( s_{I}\right) \cdot u_{i}(s_{I})\)となります。これを\(S_{I}\)に属するすべての純粋戦略の組\(s_{I}\)に関して導出した上で総和をとれば、\(\sigma _{I}\)のもとでのプレイヤー\(i\)の期待利得が\(\sum_{s_{I}\in S_{I}}\left[ \sigma _{I}\left( s_{I}\right) \cdot u_{i}(s_{I})\right]\)として得られます。これはプレイヤー\(i\)が混合戦略の組\(\sigma _{I}\)から得る期待利得に他なりません。

例(期待利得)
繰り返しになりますが、以下の利得行列によって表される完備情報の静学ゲームについて考えます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 4,4 & 0,2 \\ \hline
B & 2,0 & 1,1 \\ \hline
\end{array}$$

表:利得行列

このゲームにおいて起こり得る結果は\(\left( U,L\right) ,\left( U,R\right) ,\left( B,L\right) ,\left( B,R\right) \)の4 通りです。それぞれのプレイヤー\(1,2\)の混合戦略\(\sigma _{1},\sigma _{2}\)を、\begin{eqnarray*}
\sigma _{1} &=&\left( \sigma _{1}\left( U\right) ,\sigma _{1}\left( B\right)
\right) =\left( \sigma _{1},1-\sigma _{1}\right) \quad \left( 0\leq \sigma
_{1}\leq 1\right) \\
\sigma _{2} &=&\left( \sigma _{2}\left( L\right) ,\sigma _{2}\left( R\right)
\right) =\left( \sigma _{2},1-\sigma _{2}\right) \quad \left( 0\leq \sigma
_{2}\leq 1\right)
\end{eqnarray*}で表します。2 人が混合戦略を採用する場合には、2 人の純粋戦略の各組が選ばれる確率は以下の表のように与えられます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & \sigma _{1}\sigma _{2} & \sigma _{1}(1-\sigma _{2}) \\ \hline
B & (1-\sigma _{1})\sigma _{2} & (1-\sigma _{1})(1-\sigma _{2}) \\
\hline
\end{array}$$

表:純粋戦略の各組が選ばれる確率

上の2つの表より、混合戦略の組\(\left( \sigma _{1},\sigma _{2}\right) \)におけるプレイヤー\(1\)の期待利得は、\begin{align*}
F_{2}(\sigma _{1},\sigma _{2})& =4\sigma _{1}\sigma _{2}+0\sigma
_{1}(1-\sigma _{2})+2(1-\sigma _{1})\sigma _{2}+1(1-\sigma _{1})(1-\sigma
_{2}) \\
& =4\sigma _{1}\sigma _{2}+2(1-\sigma _{1})\sigma _{2}+(1-\sigma
_{1})(1-\sigma _{2}) \\
& =3\sigma _{1}\sigma _{2}-\sigma _{1}+\sigma _{2}+1
\end{align*}であり、プレイヤー\(2\)の期待利得は、\begin{align*}
F_{1}(\sigma _{1},\sigma _{2})& =4\sigma _{1}\sigma _{2}+2\sigma
_{1}(1-\sigma _{2})+0(1-\sigma _{1})\sigma _{2}+1(1-\sigma _{1})(1-\sigma
_{2}) \\
& =4\sigma _{1}\sigma _{2}+2\sigma _{1}(1-\sigma _{2})+(1-\sigma
_{1})(1-\sigma _{2}) \\
& =3\sigma _{1}\sigma _{2}+\sigma _{1}-\sigma _{2}+1
\end{align*}となります。したがって、例えば、プレイヤー\(1\)が混合戦略\(\sigma _{1}=(\frac{1}{2},\frac{1}{2})\)を選び、プレイヤー\(2\)が混合戦略\(\sigma _{2}=(\frac{1}{3},\frac{2}{3})\)を選ぶとき、この混合戦略の組\(\left( \sigma _{1},\sigma _{2}\right) \)における両者の期待利得は、\begin{align*}
F_{1}(\sigma _{1},\sigma _{2})& =3\cdot \frac{1}{2}\cdot \frac{1}{3}-\frac{1}{2}+\frac{1}{3}+1=\frac{4}{3} \\
F_{2}(\sigma _{1},\sigma _{2})& =3\cdot \frac{1}{2}\cdot \frac{1}{3}+\frac{1}{2}-\frac{1}{3}+1=\frac{5}{3}
\end{align*}となります。

クジを比較する選好を表現する期待利得関数が存在するための条件や期待利得関数の性質などについては場を改めて詳しく解説します。とりあえず以降では、プレイヤーがクジどうしを比較する評価体系は期待利得関数によって表現されるものと仮定します。

 

演習問題

問題(混合戦略と期待利得)
2 人のプレイヤー\(1,2\)はそれぞれ\(A\)と\(B\)のどちらか一方の文字を選び、それを相手に見せないようにしながら紙に記します。二人とも書き終わったら、紙を開いて二人が書いた文字を確認します。二人が書いた文字が同じである場合、\(1\)は\(2\)に対して\(1\)万円を支払います。逆に、二人が書いた文字が異なる場合、\(2\)が\(1\)に対して\(1\)万円を支払います。二人とも、このゲームから得られる金額を最大化するものと仮定します。

  1. 以上の状況を戦略型ゲームとして定式化してください。
  2. それぞれのプレイヤーの混合戦略と期待利得を定式化してください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(混合戦略と期待利得)
警察がスピード違反のドライバーを検挙しようとしています。覆面パトカーを出動させれば違反ドライバーを必ず検挙できますが、出動には費用がかかります。一方、警察がスピード違反を放置した場合、警察に寄せられる苦情への対処や、事故が起きた場合の対処など、覆面パトカーの出動費用よりも大きな費用がかかります。ドライバーに関しては、検挙されない限り、スピード違反をした方がより望ましいものとします。ただ、検挙されると多額の罰金が課されるため、その場合にはスピード違反しない方がましです。

  1. 以上の状況を戦略型ゲームとして表現してください。
  2. 警察が「\(\frac{1}{2}\)の確率で覆面パトカーを出動させる」という混合戦略を採用し、ドライバーが「確率\(\frac{2}{3}\)でスピード違反する」という混合戦略を採用するとき、それらの混合戦略の組のもとで両者が直面する期待利得をそれぞれ求めてください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

次回は混合拡張について解説します。

Share on twitter
Twitterで共有
Share on email
メールで共有
DISCUSSION

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録

RELATED KNOWLEDGE

関連知識

混合戦略
戦略型ゲームの混合拡張

完備情報の静学ゲームにおいてプレイヤーたちが純戦略を選択する状況は戦略型ゲームとして表現できます。一方、プレイヤーたちが混合戦略を選択する状況は戦略型ゲームを拡張した混合拡張と呼ばれる概念として表現できます。

展開型ゲーム
純粋戦略のもとでのノードへの到達可能性と期待利得

自然が参加する展開型ゲームにおいてプレイヤーたちが純粋戦略を採用する場合、最終的にどの頂点に到達するかを確定することはできないため、プレイヤーは自身が直面する期待利得を基準に意思決定を行うことになります。

完備情報の静学ゲーム