完備情報の静学ゲームにおいてプレイヤーたちが純戦略を選択する状況は戦略型ゲームとして表現できます。一方、プレイヤーたちが混合戦略を選択する状況は戦略型ゲームを拡張した混合拡張と呼ばれる概念として表現できます。
< 前のページ
次のページ >

戦略型ゲームの混合拡張

完備情報の静学ゲームにおいてそれぞれのプレイヤー\(i\in I\)が純粋戦略\(s_{i}\in S_{i}\)を採用する場合、ゲームのルールはプレイヤーたちが選択する純粋戦略の組\(s_{I}\in S_{I}\)に対して結果を 1 つずつ定めます。したがって、それぞれのプレイヤー\(i\)は純粋戦略の組どうしを比較する\(S_{I}\)上の選好関係\(\succsim _{i}\)、もしくはそれを表現する効用関数\(u_{i}:S_{I}\rightarrow \mathbb{R} \)を持っているものとみなされます。以上の状況は戦略型ゲーム\begin{equation*}
G=\left( I,\{S_{i}\}_{i\in I},\{u_{i}\}_{i\in I}\right)
\end{equation*}として表現されます。

戦略型ゲームについて復習する

一方、プレイヤーたちが混合戦略を採用する場合、どの純粋戦略の組が実際に実現するかを事前に確定することはできないため、プレイヤーたちは不確実な状況に直面します。そこで、そのような状況をクジ\(\sigma _{I}:S_{I}\rightarrow \mathbb{R} \)を用いて表現します。これは、プレイヤーたちが選択する混合戦略の組が\(\sigma _{I}=\left( \sigma _{i}\right) _{i\in I}\)であるときに、それぞれの純粋戦略の組\(s_{I}\in S_{I}\)に対して、それが起こる確率\(\sigma _{I}\left( s_{I}\right) \in \mathbb{R} \)を特定する関数です。

混合戦略の組が与えられればそれに対して 1 つのクジが定まります。クジが変化すればプレイヤーたちは以前とは異なる不確実な状況に直面するため、プレイヤーたちが混合戦略を採用する場合、それぞれのプレイヤーはクジどうしを比較する上の選好関係を持っているものと考えるべきです。さらに言えば、混合戦略の組が与えられればそれに対して 1 つのクジが定まるため、結局、プレイヤーがクジを比較する選好を、混合戦略の組どうしを比較する\(\Delta \left( S_{I}\right) \)上の選好関係、もしくはそれを表す期待効用関数\(F_{i}:\Delta \left( S_{I}\right) \rightarrow \mathbb{R} \)として表現できます。ただし、期待効用関数がそれぞれの混合戦略の組\(\sigma _{I}\in \Delta \left( S_{I}\right) \)に対して定める期待利得は、\begin{equation*}
F_{i}\left( \sigma _{I}\right) =\sum_{s_{I}\in S_{I}}\left[ \sigma
_{I}\left( s_{I}\right) \cdot u_{i}(s_{I})\right] =\sum_{s_{I}\in S_{I}}\left[ \left( \prod\limits_{j\in I}\sigma _{j}(s_{j})\right) \cdot
u_{i}(s_{I})\right] \end{equation*}となります。

以上を踏まえると、混合戦略を採用するプレイヤーたちが直面する戦略的状況は、\begin{equation*}
G^{\ast }=(I,\{\Delta \left( S_{i}\right) \}_{i\in I},\{F_{i}\}_{i\in I})
\end{equation*}として表現されますが、これを戦略型ゲーム\(G\)の混合拡張(mixed extension)と呼びます。

例(混合拡張)
2 人がジャンケンを 1 回だけ行う状況を戦略型ゲーム\(G=\left( I,\left\{ S_{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in I}\right) \)として定式化します。プレイヤー集合は\(I=\{1,2\}\)であり、それぞれのプレイヤー\(i\in I\)の行動集合は\(A_{i}=\{R,P,S\}\)です。ただし、\(R\)はグー(Rock)、\(P\)はパー(Paper)、\(S\)はチョキ(Scissors)を表します。それぞれのプレイヤー\(i\)の利得関数\(u_{i}\)としては典型的なものは「自分が勝つ」「あいこ」「相手が勝つ」の順番で好むという条件を満たす関数です。このような状況は、例えば、以下の利得行列として表されます。それぞれのプレイヤー\(i\)の純粋戦略集合は\(S_{i}=A_{i}\)であり、その要素である\(R,P,S\)が純粋戦略です。

$$\begin{array}{cccc}
\hline
1\backslash 2 & R & P & S \\ \hline
R & 0,0 & -1,1 & 1,-1 \\ \hline
P & 1,-1 & 0,0 & -1,1 \\ \hline
S & -1,1 & 1,-1 & 0,0 \\ \hline
\end{array}$$

表:利得行列

それぞれのプレイヤー\(i\)が混合戦略\(\sigma _{i}\)を選ぶ場合、それは、\begin{eqnarray*}
\sigma _{1} &=&\left( \sigma _{1}\left( R\right) ,\sigma _{1}\left( P\right)
,\sigma _{1}\left( S\right) \right) \in \mathbb{R} ^{3} \\
\sigma _{2} &=&\left( \sigma _{2}\left( R\right) ,\sigma _{2}\left( P\right)
,\sigma _{2}\left( S\right) \right) \in \mathbb{R} ^{3}
\end{eqnarray*}という 3 次元ベクトルとして表現されます。ただし、このベクトルの任意の成分は\(0\)以上\(1\)以下の実数であり、すべての成分の和は\(1\)です。そのような条件を満たすべての\(\sigma _{i}\)からなる集合がプレイヤー\(i\)の混合戦略集合\(\Delta \left( S_{i}\right) \)です。混合戦略の組\(\left( \sigma _{1},\sigma _{2}\right) \)のもとでそれぞれの純粋戦略の組が起こる確率は、

$$\begin{array}{cccc}
\hline
1\backslash 2 & R & P & S \\ \hline
R & \sigma _{1}\left( R\right) \sigma _{2}\left( R\right) & \sigma _{1}\left( R\right) \sigma _{2}\left( P\right) & \sigma _{1}\left( R\right) \sigma _{2}\left( S\right) \\ \hline
P & \sigma _{1}\left( P\right) \sigma _{2}\left( R\right) & \sigma _{1}\left( P\right) \sigma _{2}\left( P\right) & \sigma _{1}\left( P\right) \sigma _{2}\left( S\right) \\ \hline
S & \sigma _{1}\left( S\right) \sigma _{2}\left( R\right) & \sigma _{1}\left( S\right) \sigma _{2}\left( P\right) & \sigma _{1}\left( S\right) \sigma _{2}\left( S\right) \\ \hline
\end{array}$$

表:それぞれの結果が起こる確率

であるため、プレイヤー\(i\)の期待利得関数\(F_{i}\)がそれぞれの混合戦略の組\(\left( \sigma _{1},\sigma _{2}\right) \)に対して定める期待利得は、\begin{eqnarray*}
F_{1}\left( \sigma _{1},\sigma _{2}\right) &=&\prod\limits_{\left(
s_{1},s_{2}\right) \in S_{1}\times S_{2}}\sigma _{1}\left( s_{1}\right)
\sigma _{2}\left( s_{2}\right) u_{1}\left( s_{1},s_{2}\right) \\
&=&-\sigma _{1}\left( R\right) \sigma _{2}\left( P\right) +\sigma _{1}\left(
R\right) \sigma _{2}\left( S\right) +\sigma _{1}\left( P\right) \sigma
_{2}\left( R\right) \\
&&-\sigma _{1}\left( P\right) \sigma _{2}\left( S\right) -\sigma _{1}\left(
S\right) \sigma _{2}\left( R\right) +\sigma _{1}\left( S\right) \sigma
_{2}\left( P\right) \\
F_{2}\left( \sigma _{1},\sigma _{2}\right) &=&\prod\limits_{\left(
s_{1},s_{2}\right) \in S_{1}\times S_{2}}\sigma _{1}\left( s_{1}\right)
\sigma _{2}\left( s_{2}\right) u_{2}\left( s_{1},s_{2}\right) \\
&=&\sigma _{1}\left( R\right) \sigma _{2}\left( P\right) -\sigma _{1}\left(
R\right) \sigma _{2}\left( S\right) -\sigma _{1}\left( P\right) \sigma
_{2}\left( R\right) \\
&&+\sigma _{1}\left( P\right) \sigma _{2}\left( S\right) +\sigma _{1}\left(
S\right) \sigma _{2}\left( R\right) -\sigma _{1}\left( S\right) \sigma
_{2}\left( P\right)
\end{eqnarray*}となります。こうして\(G\)の混合拡張\(G^{\ast }=\left( I,\left\{ \Delta \left( S_{i}\right) \right\} _{i\in I},\left\{ F_{i}\right\} _{i\in I}\right) \)が得られます。

 

混合拡張における意思決定

戦略型ゲーム\(G\)によって表現される戦略的状況が完備情報の静学ゲームであるとき、\(G\)の要素であるプレイヤー集合\(I\)、任意のプレイヤー\(i\in I\)の純粋戦略集合\(S_{i}\)、そして任意のプレイヤー\(i\)の利得関数\(u_{i}\)はいずれもプレイヤーたちの共有知識です。したがって、これらの要素から間接的に定義される任意のプレイヤー\(i\)の混合戦略集合\(\Delta \left( S_{i}\right) \)と期待利得関数\(F_{i}\)もまたプレイヤーたちの共有知識となります。つまり、完備情報の静学ゲームにおいてプレイヤーたちが混合戦略を採用するとき、その状況を描写する混合拡張\(G^{\ast }\)の要素はいずれもプレイヤーたちの共有知識となります。また、ゲームの静学性より、プレイヤーたちは以下の手順で意思決定を行います。

  1. それぞれのプレイヤー\(i\)は自身の混合戦略集合\(\Delta \left( S_{i}\right) \)の中から特定の混合戦略\(\sigma _{i}\)を選択する。その際、他のプレイヤーたちが選択する混合戦略の組\(\sigma _{-i}\)を観察できない。
  2. プレイヤーたちが選択した混合戦略の組\(\sigma _{I}=\left( \sigma _{i},\sigma _{-i}\right) \)にもとづいて純粋戦略の組\(s_{I}\)が 1 つだけランダムに選ばれ、さらに、その\(s_{I}\)に対してゲームのルールが 1 つの結果を定める。
  3. そのゲームの結果から、それぞれのプレイヤー\(i\)は利得\(u_{i}\left( s_{I}\right) \)を得る。

混合拡張\(G^{\ast }\)を構成するすべての要素はプレイヤーたちの共有知識であるものの、それぞれのプレイヤー\(i\)は自分が意思決定を行う際に、他のプレイヤーたちが選択する混合戦略からなる組\(\sigma _{-i}\)を観察することはできません。したがって、それぞれのプレイヤー\(i\)は、それぞれの混合戦略の組\(\sigma _{I}=\left( \sigma _{i},\sigma _{-i}\right) \)において自分が得られる期待利得\(F_{i}\left( \sigma _{I}\right) \)を比較した上で、何らかの混合戦略\(\sigma _{i}\)を選びます。さらに、全員の混合戦略が出そろった後、その確率分布にもとづいて特定の純戦略の組\(s_{I}\)が実現し、それぞれのプレイヤー\(i\)は利得\(u_{i}\left( s_{I}\right) \)を得ます。それぞれのプレイヤー\(i\)が意思決定を行う際に参照するのは期待利得\(F_{i}\left( \sigma _{I}\right) \)ですが、ゲームの終了時に実際に得るのは利得\(u_{i}\left( s_{I}\right) \)であることに注意してください。

混合拡張におけるプレイヤーの意思決定を混合戦略として定式化しましたが、そもそもプレイヤーはどのような行動原理のもとで意思決定を行うのでしょうか。次回は期待効用仮説について解説します。
次へ進む 質問・コメント(プレミアム会員限定) 演習問題(プレミアム会員限定)

Share on facebook
Share on twitter
Share on email
< 前のページ
次のページ >

プレミアム会員サービス

ユーザー名とメールアドレスを入力して有料(500円/月)のプレミアム会員へアップグレードすることにより、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題、解答など)へのアクセスが可能に。
会員サービス
ログイン

プレミアム会員だけが質問やコメントを投稿・閲覧できます。

完備情報の静学ゲーム
アカウント
ログイン