WIIS

完備情報の動学ゲーム

展開型ゲームにおける純粋戦略と期待利得

目次

Mailで保存
Xで共有

完備情報の動学ゲームにおける戦略

問題としている戦略的状況が完備情報の動学ゲームであるとともに、それが展開型ゲーム\begin{equation*}
\Gamma =\left( I\cup \left\{ 0\right\} ,A,X,>,a,\mathcal{H},i,p,\left\{
u_{i}\right\} _{i\in I}\right)
\end{equation*}として記述されているものとします。ただし、\(I\cup \left\{ 0\right\} \)は自然に相当するプレイヤー\(0\)を含めたプレイヤー集合、\(A\)は行動集合、\(\left( X,>\right) \)はゲームの木、\(a:X\backslash \left\{ x_{0}\right\} \rightarrow A\)はそれぞれの手番へ到達する直前に選択される行動を特定する写像、\(\mathcal{H}\)は情報分割、\(i:\mathcal{H}\rightarrow I\cup \left\{ 0\right\} \)はそれぞれの情報集合において意思決定を行うプレイヤーを特定する写像、\(p:\mathcal{H}_{0}\times A\rightarrow \left[0,1\right] \)は自然による意思決定を記述する確率分布、\(u_{i}:Z\rightarrow \mathbb{R} \)はプレイヤー\(i\)の利得関数です。

展開型ゲーム\(\Gamma \)におけるそれぞれのプレイヤーの意思決定をどのように定式化すればよいでしょうか。プレイヤーの意思決定は戦略(strategy)と呼ばれる概念を用いて表現します。

一般に、プレイヤーの戦略とは、プレイヤーがゲーム中に意志決定を行うそれぞれの局面において、そこで与えられた情報と行動を踏まえた上でどの行動を選ぶかをあらかじめ包括的に定める行動計画として定義されます。以上を踏まえた上で、完備情報の動学ゲームにおける戦略とは何であるかを以下で説明します。

プレイヤーたちが順番に意思決定を行う動学ゲームでは、プレイヤーの戦略とは、自分とは異なるタイミングで意志決定を行う他のプレイヤーたちの選択の結果として実現し得るすべての経路を想定した上で、各経路において自分がどのような行動を選ぶかをあらかじめ包括的に定める行動計画に相当します。ただし、ゲームの木の定義より、個々のノードとそこへ至る経路は1対1で対応するため、プレイヤーは自身が直面し得るそれぞれのノードに対して、そこで自分が選択するであろう行動をあらかじめ定めておけば、それは完全な行動計画になります。ただし、プレイヤーは自身が意思決定を行う前のノードにおいて他のプレイヤーが選択した行動を観察できるとは限らないため、実際には、ノードを単位とする行動計画を立案することはできず、情報集合を単位とする行動計画を立案せざるを得ません。

ゲームのルールが共有知識ではない不完備情報ゲームでは、プレイヤーはゲームのルールについて確かな認識を持っていません。したがって、そこでのプレイヤーの戦略とは、実現し得るルールのあらゆる状態を想定した上で、それぞれの状態において自分がどのような行動を選ぶかをあらかじめ包括的に定める行動計画に相当します。一方、ゲームのルールが共有知識である完備情報ゲームでは、すべてのプレイヤーはゲームのルールについて確かな認識を持っているため、それぞれのプレイヤーは実現し得る複数の状態を想定する必要がありません。

以上を踏まると、完備情報の動学ゲームが展開型ゲーム\(\Gamma \)として表現されている場合、それぞれのプレイヤーの戦略とは、自身が直面し得るそれぞれの情報集合に対して、そこで自分が選択するであろう行動をあらかじめ包括的に定める行動計画に相当します。

 

展開型ゲームにおける純粋戦略

展開型ゲーム\(\Gamma \)においてプレイヤー\(i\in I\)が意思決定を行う可能性のある情報集合からなる集合族は、\begin{equation*}\mathcal{H}_{i}=\left\{ H\in \mathcal{H}\ |\ i\left( H\right) =i\right\}
\end{equation*}です。プレイヤー\(i\)の情報集合\(H\in \mathcal{H}_{i}\)を任意に選んだとき、そこでプレイヤー\(i\)が選択可能な行動からなる集合は、\begin{equation*}A\left( H\right) =\left\{ A\left( x\right) \ |\ x\in H\right\}
\end{equation*}であるため、プレイヤー\(i\)がこのゲーム\(\Gamma \)において選択し得るすべての行動からなる集合は、\begin{equation*}A_{i}=\bigcup_{H\in \mathcal{H}_{i}}A\left( H\right)
\end{equation*}となります。

以上を踏まえた上で、プレイヤー\(i\)のそれぞれの情報集合\(H\in \mathcal{H}_{i} \)に対して、そこでプレイヤー\(i\)が選択する行動\(s_{i}\left( H\right) \in A_{i}\)を1つずつ指定する写像\begin{equation*}s_{i}:\mathcal{H}_{i}\rightarrow A_{i}
\end{equation*}をプレイヤー\(i\)の純粋戦略(pure strategy)と呼びます。ただし、それぞれの情報集合において選ばれる行動はそこで選択可能なものでなければならないため、純粋戦略\(s_{i}\)は以下の条件\begin{equation*}\forall H\in \mathcal{H}_{i}:s_{i}\left( H\right) \in A\left( H\right)
\end{equation*}を満たす必要があります。

純粋戦略はプレイヤーが直面し得る「すべての」情報集合に対して行動を1つずつ定めるものでなければなりません。自分が実際に到達するであろうと思われる情報集合に対して行動を1つずつ定めただけでは、その行動計画は純粋戦略としての要件を満たしません。自分が実際には到達しないであろうと思われるような情報集合に対しても、そこで自分が選択するであろう行動をあらかじめ定める必要があります。戦略とは、客観的に起こり得るすべてのシナリオに対して、そこで自分が選ぶであろう行動を包括的に記述した行動計画だからです。

すべてのプレイヤーの純粋戦略からなる組を、\begin{equation*}
s_{I}=\left( s_{i}\right) _{i\in I}
\end{equation*}で表記し、プレイヤー\(i\)以外のプレイヤーたちの純粋戦略からなる組を、\begin{equation*}s_{-i}=\left( s_{j}\right) _{j\in I\backslash \left\{ i\right\} }
\end{equation*}で表記します。\(s_{I}=\left(s_{i},s_{-i}\right) \)です。

繰り返しになりますが、展開型ゲーム\(\Gamma \)におけるプレイヤー\(i\)の純粋戦略\(s_{i}:\mathcal{H}_{i}\rightarrow A_{i}\)は、自身のそれぞれの情報集合\(H\in \mathcal{H}_{i}\)に対して、そこで自分が選択する行動\(s_{i}\left(H\right) \in A_{i}\)を1つずつ定める行動計画です。プレイヤー\(i\)が情報集合\(H\)において選択可能なすべての行動からなる集合が\(A\left( H\right) \)であることを踏まえると、プレイヤー\(i\)が選択可能なすべての純粋戦略からなる集合を、\begin{equation*}S_{i}=\prod_{H\in \mathcal{H}_{i}}A\left( H\right)
\end{equation*}と表現できます。これをプレイヤー\(i\)の純粋戦略集合(pure strategy set)や戦略集合(strategy set)、もしくは戦略空間(strategy space)などと呼びます。\(s_{i}\in S_{i}\)です。

すべてのプレイヤーの純粋戦略集合の直積を、\begin{equation*}
S_{I}=\prod_{i\in I}S_{i}
\end{equation*}で表記し、プレイヤー\(i\)以外のプレイヤーたちの純粋戦略集合の直積を、\begin{equation*}S_{-i}=\prod_{j\in I\backslash \left\{ i\right\} }S_{i}
\end{equation*}で表記します。\(s_{I}\in S_{I}\)かつ\(s_{-i}\in S_{-i}\)です。

例(展開型ゲームにおける純粋戦略)
以下のゲームの木によって表現される展開型ゲーム\(\Gamma \)について考えます。

図:展開型ゲーム
図:展開型ゲーム

プレイヤー\(1\)の純粋戦略を定式化します。プレイヤー\(1\)の情報集合からなる集合族は、\begin{equation*}\mathcal{H}_{1}=\left\{ \left\{ x_{0}\right\} \right\}
\end{equation*}です。情報集合\(\left\{x_{0}\right\} \)において選択可能な行動からなる集合は、\begin{equation*}A\left( \left\{ x_{0}\right\} \right) =\left\{ a_{11},a_{22}\right\}
\end{equation*}であるため、ゲーム全体におけるプレイヤー\(1\)の行動集合は、\begin{equation*}A_{1}=A\left( \left\{ x_{0}\right\} \right) =\left\{ a_{11},a_{22}\right\}
\end{equation*}です。プレイヤー\(1\)は2つの純粋戦略を持ちます。1つ目は、「情報集合\(\left\{ x_{0}\right\} \)において行動\(a_{11}\)を選ぶ」という純粋戦略であり、これは、\begin{equation*}s_{11}\left( \left\{ x_{0}\right\} \right) =a_{11}
\end{equation*}を満たす\(s_{11}:\mathcal{H}_{1}\rightarrow A_{1}\)として表現されます。2つ目は、「情報集合\(\left\{ x_{0}\right\} \)において行動\(a_{22}\)を選ぶ」という純粋戦略であり、これは、\begin{equation*}s_{12}\left( \left\{ x_{0}\right\} \right) =a_{22}
\end{equation*}を満たす\(s_{12}:\mathcal{H}_{1}\rightarrow A_{1}\)として表現されます。プレイヤー\(1\)の純粋戦略集合は、\begin{equation*}S_{1}=\left\{ s_{11},s_{12}\right\}
\end{equation*}です。ただし、これを、それぞれの純粋戦略のもとで選ばれる行動からなる集合と同一視しても一般性は失われないため、\begin{eqnarray*}
S_{1} &=&A\left( \left\{ x_{0}\right\} \right) \\
&=&\left\{ a_{11},a_{22}\right\}
\end{eqnarray*}という関係が成り立ちます。続いて、プレイヤー\(2\)の純粋戦略を定式化します。プレイヤー\(2\)の情報集合からなる集合族は、\begin{equation*}\mathcal{H}_{2}=\left\{ \left\{ x_{1}\right\} ,\left\{ x_{2}\right\} \right\}
\end{equation*}です。情報集合\(\left\{x_{1}\right\} \)において選択可能な行動からなる集合は、\begin{equation*}A\left( \left\{ x_{1}\right\} \right) =\left\{ a_{21},a_{22}\right\}
\end{equation*}であり、情報集合\(\left\{x_{2}\right\} \)において選択可能な行動からなる集合は、\begin{equation*}A\left( \left\{ x_{2}\right\} \right) =\left\{ a_{21},a_{22}\right\}
\end{equation*}であるため、ゲーム全体におけるプレイヤー\(2\)の行動集合は、\begin{equation*}A_{2}=A\left( \left\{ x_{1}\right\} \right) \cup A\left( \left\{
x_{2}\right\} \right) =\left\{ a_{21},a_{22}\right\}
\end{equation*}です。プレイヤー\(1\)は4つの純粋戦略を持ちます。1つ目は、「両方の情報集合\(\left\{ x_{1}\right\},\left\{ x_{2}\right\} \)において行動\(a_{21}\)を選ぶ」という純粋戦略であり、これは、\begin{equation*}\left( s_{21}\left( \left\{ x_{1}\right\} \right) ,s_{21}\left( \left\{
x_{2}\right\} \right) \right) =\left( a_{21},a_{21}\right)
\end{equation*}を満たす\(s_{21}:\mathcal{H}_{2}\rightarrow A_{2}\)として表現されます。2つ目は、「情報集合\(\left\{ x_{1}\right\} \)では行動\(a_{21}\)を選ぶが情報集合\(\left\{x_{2}\right\} \)では行動\(a_{22}\)を選ぶ」という純粋戦略であり、これは、\begin{equation*}\left( s_{22}\left( \left\{ x_{1}\right\} \right) ,s_{22}\left( \left\{
x_{2}\right\} \right) \right) =\left( a_{21},a_{22}\right)
\end{equation*}を満たす\(s_{22}:\mathcal{H}_{2}\rightarrow A_{2}\)として表現されます。3つ目は、「情報集合\(\left\{ x_{1}\right\} \)では行動\(a_{22}\)を選ぶが情報集合\(\left\{x_{2}\right\} \)では行動\(a_{21}\)を選ぶ」という純粋戦略であり、これは、\begin{equation*}\left( s_{23}\left( \left\{ x_{1}\right\} \right) ,s_{23}\left( \left\{
x_{2}\right\} \right) \right) =\left( a_{22},a_{21}\right)
\end{equation*}を満たす\(s_{23}:\mathcal{H}_{2}\rightarrow A_{2}\)として表現されます。4つ目は、「両方の情報集合\(\left\{ x_{1}\right\} ,\left\{x_{2}\right\} \)において行動\(a_{22}\)を選ぶ」という純粋戦略であり、これは、\begin{equation*}\left( s_{22}\left( \left\{ x_{1}\right\} \right) ,s_{22}\left( \left\{
x_{2}\right\} \right) \right) =\left( a_{22},a_{22}\right)
\end{equation*}を満たす\(s_{24}:\mathcal{H}_{2}\rightarrow A_{2}\)として表現されます。プレイヤー\(2\)の純粋戦略集合は、\begin{equation*}S_{2}=\left\{ s_{21},s_{22},s_{23},s_{24}\right\}
\end{equation*}です。ただし、これを、それぞれの純粋戦略のもとで選ばれる行動の組からなる集合と同一視しても一般性は失われないため、\begin{eqnarray*}
S_{2} &=&A\left( \left\{ x_{1}\right\} \right) \times A\left( \left\{
x_{2}\right\} \right) \\
&=&\left\{ \left( a_{21},a_{21}\right) ,\left( a_{21},a_{22}\right) ,\left(
a_{22},a_{21}\right) ,\left( a_{22},a_{22}\right) \right\}
\end{eqnarray*}という関係が成り立ちます。

例(展開型ゲームにおける純粋戦略)
以下のゲームの木によって表現される展開型ゲーム\(\Gamma \)について考えます。

図:展開型ゲーム
図:展開型ゲーム

プレイヤー\(1\)の純粋戦略を定式化します。プレイヤー\(1\)の情報集合からなる集合族は、\begin{equation*}\mathcal{H}_{1}=\left\{ \left\{ x_{0}\right\} \right\}
\end{equation*}です。情報集合\(\left\{x_{0}\right\} \)において選択可能な行動からなる集合は、\begin{equation*}A\left( \left\{ x_{0}\right\} \right) =\left\{ a_{11},a_{22}\right\}
\end{equation*}であるため、ゲーム全体におけるプレイヤー\(1\)の行動集合は、\begin{equation*}A_{1}=A\left( \left\{ x_{0}\right\} \right) =\left\{ a_{11},a_{22}\right\}
\end{equation*}です。プレイヤー\(1\)は2つの純粋戦略を持ちます。1つ目は、「情報集合\(\left\{ x_{0}\right\} \)において行動\(a_{11}\)を選ぶ」という純粋戦略であり、これは、\begin{equation*}s_{11}\left( \left\{ x_{0}\right\} \right) =a_{11}
\end{equation*}を満たす\(s_{11}:\mathcal{H}_{1}\rightarrow A_{1}\)として表現されます。2つ目は、「情報集合\(\left\{ x_{0}\right\} \)において行動\(a_{22}\)を選ぶ」という純粋戦略であり、これは、\begin{equation*}s_{12}\left( \left\{ x_{0}\right\} \right) =a_{22}
\end{equation*}を満たす\(s_{12}:\mathcal{H}_{1}\rightarrow A_{1}\)として表現されます。プレイヤー\(1\)の純粋戦略集合は、\begin{equation*}S_{1}=\left\{ s_{11},s_{12}\right\}
\end{equation*}です。ただし、これを、それぞれの純粋戦略のもとで選ばれる行動からなる集合と同一視しても一般性は失われないため、\begin{eqnarray*}
S_{1} &=&A\left( \left\{ x_{0}\right\} \right) \\
&=&\left\{ a_{11},a_{22}\right\}
\end{eqnarray*}という関係が成り立ちます。続いて、プレイヤー\(2\)の純粋戦略を定式化します。プレイヤー\(2\)の情報集合からなる集合族は、\begin{equation*}\mathcal{H}_{2}=\left\{ \left\{ x_{1},x_{2}\right\} \right\}
\end{equation*}です。情報集合\(\left\{x_{1},x_{2}\right\} \)において選択可能な行動からなる集合は、\begin{equation*}A\left( \left\{ x_{1},x_{2}\right\} \right) =\left\{ a_{21},a_{22}\right\}
\end{equation*}であるため、ゲーム全体におけるプレイヤー\(2\)の行動集合は、\begin{equation*}A_{2}=A\left( \left\{ x_{1},x_{2}\right\} \right) =\left\{
a_{21},a_{22}\right\}
\end{equation*}です。プレイヤー\(1\)は2つの純粋戦略を持ちます。1つ目は、「情報集合\(\left\{ x_{1},x_{2}\right\} \)において行動\(a_{21}\)を選ぶ」という純粋戦略であり、これは、\begin{equation*}s_{21}\left( \left\{ x_{1},x_{2}\right\} \right) =a_{21}
\end{equation*}を満たす\(s_{21}:\mathcal{H}_{2}\rightarrow A_{2}\)として表現されます。2つ目は、「情報集合\(\left\{ x_{1},x_{2}\right\} \)において行動\(a_{22}\)を選ぶ」という純粋戦略であり、これは、\begin{equation*}s_{22}\left( \left\{ x_{1},x_{2}\right\} \right) =a_{22}
\end{equation*}を満たす\(s_{22}:\mathcal{H}_{2}\rightarrow A_{2}\)として表現されます。プレイヤー\(2\)の純粋戦略集合は、\begin{equation*}S_{2}=\left\{ s_{21},s_{22}\right\}
\end{equation*}です。ただし、これを、それぞれの純粋戦略のもとで選ばれる行動からなる集合と同一視しても一般性は失われないため、\begin{eqnarray*}
S_{2} &=&A\left( \left\{ x_{1},x_{2}\right\} \right) \\
&=&\left\{ a_{21},a_{22}\right\}
\end{eqnarray*}という関係が成り立ちます。

例(展開型ゲームにおける純粋戦略)
以下のゲームの木によって表現される展開型ゲーム\(\Gamma \)について考えます。

図:展開型ゲーム
図:展開型ゲーム

プレイヤー\(1\)の純粋戦略を定式化します。プレイヤー\(1\)の情報集合からなる集合族は、\begin{equation*}\mathcal{H}_{1}=\left\{ \left\{ x_{1}\right\} ,\left\{ x_{2}\right\} \right\}
\end{equation*}です。情報集合\(\left\{x_{1}\right\} \)において選択可能な行動からなる集合は、\begin{equation*}A\left( \left\{ x_{1}\right\} \right) =\left\{ a_{11},a_{22}\right\}
\end{equation*}であり、情報集合\(\left\{x_{2}\right\} \)において選択可能な行動からなる集合は、\begin{equation*}A\left( \left\{ x_{2}\right\} \right) =\left\{ a_{13},a_{14}\right\}
\end{equation*}であるため、ゲーム全体におけるプレイヤー\(1\)の行動集合は、\begin{equation*}A_{1}=A\left( \left\{ x_{1}\right\} \right) \cup A\left( \left\{
x_{2}\right\} \right) =\left\{ a_{11},a_{22},a_{13},a_{14}\right\}
\end{equation*}です。プレイヤー\(1\)は4つの純粋戦略を持ちます。1つ目は、「情報集合\(\left\{ x_{1}\right\} \)では行動\(a_{11}\)を選び情報集合\(\left\{ x_{2}\right\} \)では行動\(a_{13}\)を選ぶ」という純粋戦略であり、これは、\begin{equation*}\left( s_{11}\left( \left\{ x_{1}\right\} \right) ,s_{11}\left( \left\{
x_{2}\right\} \right) \right) =\left( a_{11},a_{13}\right)
\end{equation*}を満たす\(s_{11}:\mathcal{H}_{1}\rightarrow A_{1}\)として表現されます。2つ目は、「情報集合\(\left\{ x_{1}\right\} \)では行動\(a_{11}\)を選び情報集合\(\left\{x_{2}\right\} \)では行動\(a_{14}\)を選ぶ」という純粋戦略であり、これは、\begin{equation*}\left( s_{12}\left( \left\{ x_{1}\right\} \right) ,s_{12}\left( \left\{
x_{2}\right\} \right) \right) =\left( a_{11},a_{14}\right)
\end{equation*}を満たす\(s_{12}:\mathcal{H}_{1}\rightarrow A_{1}\)として表現されます。3つ目は、「情報集合\(\left\{ x_{1}\right\} \)では行動\(a_{12}\)を選び情報集合\(\left\{x_{2}\right\} \)では行動\(a_{13}\)を選ぶ」という純粋戦略であり、これは、\begin{equation*}\left( s_{13}\left( \left\{ x_{1}\right\} \right) ,s_{13}\left( \left\{
x_{2}\right\} \right) \right) =\left( a_{12},a_{13}\right)
\end{equation*}を満たす\(s_{13}:\mathcal{H}_{1}\rightarrow A_{1}\)として表現されます。4つ目は、「情報集合\(\left\{ x_{1}\right\} \)では行動\(a_{12}\)を選び情報集合\(\left\{x_{2}\right\} \)では行動\(a_{14}\)を選ぶ」という純粋戦略であり、これは、\begin{equation*}\left( s_{14}\left( \left\{ x_{1}\right\} \right) ,s_{14}\left( \left\{
x_{2}\right\} \right) \right) =\left( a_{12},a_{14}\right)
\end{equation*}を満たす\(s_{14}:\mathcal{H}_{1}\rightarrow A_{1}\)として表現されます。プレイヤー\(1\)の純粋戦略集合は、\begin{equation*}S_{1}=\left\{ s_{11},s_{12},s_{13},s_{14}\right\}
\end{equation*}です。ただし、これを、それぞれの純粋戦略のもとで選ばれる行動の組からなる集合と同一視しても一般性は失われないため、\begin{eqnarray*}
S_{1} &=&A\left( \left\{ x_{1}\right\} \right) \times A\left( \left\{
x_{2}\right\} \right) \\
&=&\left\{ \left( a_{11},a_{13}\right) ,\left( a_{11},a_{14}\right) ,\left(
a_{12},a_{13}\right) ,\left( a_{12},a_{14}\right) \right\}
\end{eqnarray*}という関係が成り立ちます。続いて、プレイヤー\(2\)の純粋戦略を定式化します。プレイヤー\(2\)の情報集合からなる集合族は、\begin{equation*}\mathcal{H}_{2}=\left\{ \left\{ x_{3},x_{4}\right\} ,\left\{
x_{5},x_{6}\right\} \right\}
\end{equation*}です。情報集合\(\left\{x_{3},x_{4}\right\} \)において選択可能な行動からなる集合は、\begin{equation*}A\left( \left\{ x_{3},x_{4}\right\} \right) =\left\{ a_{21},a_{22}\right\}
\end{equation*}であり、情報集合\(\left\{x_{5},x_{6}\right\} \)において選択可能な行動からなる集合は、\begin{equation*}A\left( \left\{ x_{5},x_{6}\right\} \right) =\left\{ a_{23},a_{24}\right\}
\end{equation*}であるため、ゲーム全体におけるプレイヤー\(2\)の行動集合は、\begin{equation*}A_{2}=A\left( \left\{ x_{3},x_{4}\right\} \right) \cup A\left( \left\{
x_{5},x_{6}\right\} \right) =\left\{ a_{21},a_{22},a_{23},a_{24}\right\}
\end{equation*}です。プレイヤー\(2\)は4つの純粋戦略を持ちます。1つ目は、「情報集合\(\left\{ x_{3},x_{4}\right\} \)では行動\(a_{21}\)を選び情報集合\(\left\{ x_{5},x_{6}\right\} \)では行動\(a_{23} \)を選ぶ」という純粋戦略であり、これは、\begin{equation*}\left( s_{21}\left( \left\{ x_{3},x_{4}\right\} \right) ,s_{21}\left(
\left\{ x_{5},x_{6}\right\} \right) \right) =\left( a_{21},a_{23}\right)
\end{equation*}を満たす\(s_{21}:\mathcal{H}_{2}\rightarrow A_{2}\)として表現されます。2つ目は、「情報集合\(\left\{ x_{3},x_{4}\right\} \)では行動\(a_{21} \)を選び情報集合\(\left\{x_{5},x_{6}\right\} \)では行動\(a_{24}\)を選ぶ」という純粋戦略であり、これは、\begin{equation*}\left( s_{22}\left( \left\{ x_{3},x_{4}\right\} \right) ,s_{22}\left(
\left\{ x_{5},x_{6}\right\} \right) \right) =\left( a_{21},a_{24}\right)
\end{equation*}を満たす\(s_{22}:\mathcal{H}_{2}\rightarrow A_{2}\)として表現されます。3つ目は、「情報集合\(\left\{ x_{3},x_{4}\right\} \)では行動\(a_{22} \)を選び情報集合\(\left\{x_{5},x_{6}\right\} \)では行動\(a_{23}\)を選ぶ」という純粋戦略であり、これは、\begin{equation*}\left( s_{23}\left( \left\{ x_{3},x_{4}\right\} \right) ,s_{23}\left(
\left\{ x_{5},x_{6}\right\} \right) \right) =\left( a_{22},a_{23}\right)
\end{equation*}を満たす\(s_{23}:\mathcal{H}_{2}\rightarrow A_{2}\)として表現されます。4つ目は、「情報集合\(\left\{ x_{3},x_{4}\right\} \)では行動\(a_{22} \)を選び情報集合\(\left\{x_{5},x_{6}\right\} \)では行動\(a_{24}\)を選ぶ」という純粋戦略であり、これは、\begin{equation*}\left( s_{24}\left( \left\{ x_{3},x_{4}\right\} \right) ,s_{24}\left(
\left\{ x_{5},x_{6}\right\} \right) \right) =\left( a_{22},a_{24}\right)
\end{equation*}を満たす\(s_{24}:\mathcal{H}_{2}\rightarrow A_{2}\)として表現されます。プレイヤー\(2\)の純粋戦略集合は、\begin{equation*}S_{2}=\left\{ s_{21},s_{22},s_{23},s_{24}\right\}
\end{equation*}です。ただし、これを、それぞれの純粋戦略のもとで選ばれる行動の組からなる集合と同一視しても一般性は失われないため、\begin{eqnarray*}
S_{2} &=&A\left( \left\{ x_{3},x_{4}\right\} \right) \times A\left( \left\{
x_{5},x_{6}\right\} \right) \\
&=&\left\{ \left( a_{21},a_{23}\right) ,\left( a_{21},a_{24}\right) ,\left(
a_{22},a_{23}\right) ,\left( a_{22},a_{24}\right) \right\}
\end{eqnarray*}という関係が成り立ちます。

 

ノードへの到達可能性

展開型ゲーム\(\Gamma \)においてプレイヤーたちが選択する純粋戦略からなる組が\(s_{I}\in S_{I}\)である場合にゲームがノード\(x\in X\)へ到達する確率を、\begin{equation*}P\left( x|s_{I}\right)
\end{equation*}で表記します。頂点\(z\in Z\)もまたノードであるため、純粋戦略の組\(s_{I}\)のもとで頂点\(z\)へ到達する確率は、\begin{equation*}P\left( z|s_{I}\right)
\end{equation*}と表記されます。この確率をどのように導出すればよいのでしょうか。順番に解説します。

初期点\(x_{0}\in X\)からノード\(x\)への経路が、\begin{equation*}x_{0}\rightarrow x_{1}\rightarrow \cdots \rightarrow x_{n-1}\rightarrow
x_{n}\rightarrow x
\end{equation*}であるものとします。ゲームの木は根付有向木であるため上の経路は一意的です。具体的には、ノード\(x\)の直前に起こる手番\(x_{n}\)は一意的であり、そこで意思決定を行うプレイヤー\(i\left(x_{n}\right) \)は行動\(a\left( x\right) \)を選択します。同様に、手番\(x_{n}\)の直前に起こる手番\(x_{n-1}\)は一意的であり、そこで意思決定を行うプレイヤー\(i\left( x_{n-1}\right) \)は行動\(a\left( x_{n}\right) \)を選択します。それ以前の手番についても同様であり、結局、手番\(x_{1}\)の直前に起こる手番\(x_{0}\)すなわち初期点は一意的であるため、そこで意思決定を行うプレイヤー\(i\left( x_{0}\right) \)は行動\(a\left( x_{1}\right) \)を選択します。以上を踏まえると、純粋戦略の組\(s_{I}\)のもとでノード\(x\)へ到達する確率\(P\left( x|s_{I}\right) \)を求めるためには、ノード\(x\)への経路上にあるそれぞれの手番\(x_{m}\ \left( m=0,\cdots ,n\right) \)において、そこで意思決定を行うプレイヤー\(i\left( x_{m}\right) \)が自身の純粋戦略\(s_{i\left( x_{m}\right) }\)のもとで行動\(a\left( x_{m}\right) \)を選択する確率をとった上で、それらの確率の積をとればよいということになります。

初期点とは異なるノード\(x\in X\backslash \left\{ x_{0}\right\} \)と、それより前(直前とは限らない)に起こる手番\(x^{\prime }\in X\backslash Z\)をそれぞれ任意に選びます。手番\(x^{\prime }\)において意思決定を行うプレイヤーは\(i\left( x^{\prime }\right) \)です。ゲームの木は根付有向木であるため、ノード\(x\)へ到達するために手番\(x^{\prime }\)においてプレイヤー\(i\left( x^{\prime }\right) \)が選択する必要のある行動は一意的であるため、それを、\begin{equation*}a_{i\left( x^{\prime }\right) }\left( x^{\prime }\rightarrow x\right)
\end{equation*}で表記します。

初期点とは異なるノード\(x\in X\backslash \left\{ x_{0}\right\} \)への経路が、\begin{equation*}x_{0}\rightarrow x_{1}\rightarrow \cdots \rightarrow x_{n-1}\rightarrow
x_{n}\rightarrow x
\end{equation*}であるとき、この経路上にある\(n+1\)個の手番\(x_{0},x_{1},\cdots ,x_{n-1},x_{n}\)の中でも、プレイヤー\(i\)が意思決定を行う手番の個数を\(L_{i}^{x}\ \left( \leq n+1\right) \)で表記します。その上で、それらの手番を初期点\(x_{0}\)から近い順に、\begin{equation}x_{i}^{1},\ x_{i}^{2},\cdots ,\ x_{i}^{L_{i}^{x}} \quad \cdots (2)
\end{equation}と表記します。ゲームがノード\(x\)へ到達するためには、プレイヤー\(i\)は以上の\(L_{i}^{x}\)個の手番において、以下の行動\begin{equation}a_{i}\left( x_{i}^{1}\rightarrow x\right) ,\ a_{i}\left(
x_{i}^{2}\rightarrow x\right) ,\cdots ,\ a_{i}\left(
x_{i}^{L_{i}^{x}}\rightarrow x\right) \quad \cdots (3)
\end{equation}をそれぞれ選ぶ必要があります。プレイヤー\(i\)が自身の純粋戦略\(s_{i}\)のもとで、\(\left( 2\right) \)中のすべての手番において\(\left( 3\right) \)中の行動をいずれも選択する確率を、\begin{equation*}P\left( x|s_{i}\right)
\end{equation*}で表記します。特に、プレイヤー\(i\)が自然である場合には、すなわち\(i=0\)である場合には、自然が自身の行動を規定する確率分布\(p:\mathcal{H}_{0}\times A\rightarrow \left[ 0,1\right] \)のもとで\(\left( 2\right) \)中のすべての手番において\(\left(3\right) \)中の行動をいずれも選択する確率を、\begin{equation*}P\left( x|p\right)
\end{equation*}で表記します。

以上の表記を利用すると、純粋戦略の組\(s_{I}\)および自然の行動を規定する確率分布\(p\)のもとでゲームがノード\(x\)へ到達する確率を、\begin{equation*}P\left( x|s_{I}\right) =P\left( x|p\right) \cdot \prod_{i\in I}P\left(
x|s_{i}\right)
\end{equation*}と表現できます。ただし、ゲームのプレイヤーの中に自然が含まれない場合には、\begin{equation*}
P\left( x|p\right) =1
\end{equation*}とみなし、したがって、この場合には、\begin{equation*}
P\left( x|s_{I}\right) =\prod_{i\in I}P\left( x|s_{i}\right)
\end{equation*}となります。

純粋戦略の組\(s_{I}\in S_{I}\)のもとでゲームがノード\(x\in X\)へ到達する可能性が正である場合には、すなわち、\begin{equation*}P\left( x|s_{I}\right) >0
\end{equation*}が成り立つ場合には、\(x\)\(s_{I}\)のもとで到達可能(reachable)であると言います。また、プレイヤー\(i\in I\)の純粋戦略\(s_{i}\in S_{i}\)に対して、他のプレイヤーたちの純粋戦略の組\(s_{-i}\in S_{-i}\)が存在して、それらの組\(s_{I}=\left( s_{i},s_{-i}\right) \)のもとでノード\(x\in X\)が到達可能である場合には、すなわち、\begin{equation*}\exists s_{-i}\in S_{-i}:P\left( x|s_{I}\right) >0
\end{equation*}が成り立つ場合には、\(x\)\(s_{i}\)のもとで到達可能(reachable)であると言います。

情報集合\(H\in \mathcal{H}\)の中に、純粋戦略の組\(s_{I}\in S_{I}\)のもとで到達可能であるようなノードが存在する場合には、すなわち、\begin{equation*}\exists x\in H:P\left( x|s_{I}\right) >0
\end{equation*}が成り立つ場合には、\(H\)\(s_{I}\)のもとで到達可能(reachable)であると言います。また、プレイヤー\(i\)の純粋戦略\(s_{i}\in S_{i}\)に対して、他のプレイヤーたちの純粋戦略の組\(s_{-i}\in S_{-i}\)が存在して、それらの組\(s_{I}=\left( s_{i},s_{-i}\right) \)のもとで情報集合\(H\in \mathcal{H}\)が到達可能である場合には、すなわち、\begin{equation*}\exists x\in H,\ \exists s_{-i}\in S_{-i}:P\left( x|s_{I}\right) >0
\end{equation*}が成り立つ場合には、\(H\)\(s_{i}\)のもとで到達可能(reachable)であると言います。

例(ノードへの到達可能性)
以下のゲームの木によって表現される展開型ゲーム\(\Gamma \)について考えます。

図:展開型ゲーム
図:展開型ゲーム

プレイヤー\(1\)の純粋戦略集合は、\begin{eqnarray*}S_{1} &=&A\left( \left\{ x_{0}\right\} \right) \\
&=&\left\{ \left( a_{11}\right) ,\left( a_{12}\right) \right\}
\end{eqnarray*}であり、プレイヤー\(2\)の純粋戦略集合は、\begin{eqnarray*}S_{2} &=&A\left( \left\{ x_{1}\right\} \right) \times A\left( \left\{
x_{2}\right\} \right) \\
&=&\left\{ \left( a_{21},a_{21}\right) ,\left( a_{21},a_{22}\right) ,\left(
a_{22},a_{21}\right) ,\left( a_{22},s_{22}\right) \right\}
\end{eqnarray*}です。以下の純粋戦略の組\begin{equation*}
s_{I}=\left( \left( a_{11}\right) ,\left( a_{21},a_{21}\right) \right)
\end{equation*}のもとでゲームがそれぞれのノードへ到達する確率は、\begin{eqnarray*}
P\left( x_{1}|s_{I}\right) &=&P\left( x_{1}|\left( a_{11}\right) \right) =1
\\
P\left( x_{2}|s_{I}\right) &=&P\left( x_{2}|\left( a_{11}\right) \right) =0
\\
P\left( z_{1}|s_{I}\right) &=&P\left( z_{1}|\left( a_{11}\right) \right)
\cdot P\left( z_{1}|\left( a_{21},a_{21}\right) \right) =1\cdot 1=1 \\
P\left( z_{2}|s_{I}\right) &=&P\left( z_{2}|\left( a_{11}\right) \right)
\cdot P\left( z_{2}|\left( a_{21},a_{21}\right) \right) =1\cdot 0=0 \\
P\left( z_{3}|s_{I}\right) &=&P\left( z_{3}|\left( a_{11}\right) \right)
\cdot P\left( z_{3}|\left( a_{21},a_{21}\right) \right) =0\cdot 1=0 \\
P\left( z_{4}|s_{I}\right) &=&P\left( z_{4}|\left( a_{11}\right) \right)
\cdot P\left( z_{4}|\left( a_{21},a_{21}\right) \right) =0\cdot 0=0
\end{eqnarray*}となります。つまり、先の\(s_{I}\)のもとで到達可能なノードは\(x_{1}\)と\(z_{1}\)であり、到達可能な情報集合は\(\left\{x_{0}\right\} \)と\(\left\{ x_{1}\right\} \)です。他の純粋戦略の組についても同様に考えます(演習問題)。

例(ノードへの到達可能性)
以下のゲームの木によって表現される展開型ゲーム\(\Gamma \)について考えます。

図:展開型ゲーム
図:展開型ゲーム

プレイヤー\(1\)の純粋戦略集合は、\begin{eqnarray*}S_{1} &=&A\left( \left\{ x_{0}\right\} \right) \\
&=&\left\{ \left( a_{11}\right) ,\left( a_{12}\right) \right\}
\end{eqnarray*}であり、プレイヤー\(2\)の純粋戦略集合は、\begin{eqnarray*}S_{2} &=&A\left( \left\{ x_{1},x_{2}\right\} \right) \\
&=&\left\{ \left( a_{21}\right) ,\left( a_{22}\right) \right\}
\end{eqnarray*}です。以下の純粋戦略の組\begin{equation*}
s_{I}=\left( \left( a_{11}\right) ,\left( a_{21}\right) \right)
\end{equation*}のもとでゲームがそれぞれのノードへ到達する確率は、\begin{eqnarray*}
P\left( x_{1}|s_{I}\right) &=&P\left( x_{1}|\left( a_{11}\right) \right) =1
\\
P\left( x_{2}|s_{I}\right) &=&P\left( x_{2}|\left( a_{11}\right) \right) =0
\\
P\left( z_{1}|s_{I}\right) &=&P\left( z_{1}|\left( a_{11}\right) \right)
\cdot P\left( z_{1}|\left( a_{21}\right) \right) =1\cdot 1=1 \\
P\left( z_{2}|s_{I}\right) &=&P\left( z_{2}|\left( a_{11}\right) \right)
\cdot P\left( z_{2}|\left( a_{21}\right) \right) =1\cdot 0=0 \\
P\left( z_{3}|s_{I}\right) &=&P\left( z_{3}|\left( a_{11}\right) \right)
\cdot P\left( z_{3}|\left( a_{21}\right) \right) =0\cdot 1=0 \\
P\left( z_{4}|s_{I}\right) &=&P\left( z_{4}|\left( a_{11}\right) \right)
\cdot P\left( z_{4}|\left( a_{21}\right) \right) =0\cdot 0=0
\end{eqnarray*}となります。つまり、先の\(s_{I}\)のもとで到達可能なノードは\(x_{1}\)と\(z_{1}\)であり、到達可能な情報集合は\(\left\{x_{1},x_{2}\right\} \)です。他の純粋戦略の組についても同様に考えます(演習問題)。

例(ノードへの到達可能性)
以下のゲームの木によって表現される展開型ゲーム\(\Gamma \)について考えます。

図:展開型ゲーム
図:展開型ゲーム

プレイヤー\(1\)の純粋戦略集合は、\begin{eqnarray*}S_{1} &=&A\left( \left\{ x_{1}\right\} \right) \times A\left( \left\{
x_{2}\right\} \right) \\
&=&\left\{ \left( a_{11},a_{13}\right) ,\left( a_{11},a_{14}\right) ,\left(
a_{12},a_{13}\right) ,\left( a_{12},a_{14}\right) \right\}
\end{eqnarray*}であり、プレイヤー\(2\)の純粋戦略集合は、\begin{eqnarray*}S_{2} &=&A\left( \left\{ x_{3},x_{4}\right\} \right) \times A\left( \left\{
x_{5},x_{6}\right\} \right) \\
&=&\left\{ \left( a_{21},a_{23}\right) ,\left( a_{21},a_{24}\right) ,\left(
a_{22},a_{23}\right) ,\left( a_{22},s_{24}\right) \right\}
\end{eqnarray*}です。自然による確率分布は、\begin{equation*}
p\left( \left\{ x_{0}\right\} ,a_{01}\right) =p\left( \left\{ x_{0}\right\}
,a_{02}\right) =\frac{1}{2}
\end{equation*}であるものとします。以下の純粋戦略の組\begin{equation*}
s_{I}=\left( \left( a_{11},a_{13}\right) ,\left( a_{21},a_{23}\right) \right)
\end{equation*}のもとでゲームがそれぞれのノードへ到達する確率は、\begin{eqnarray*}
P\left( x_{1}|s_{I}\right) &=&P\left( x_{1}|p\right) =\frac{1}{2} \\
P\left( x_{2}|s_{I}\right) &=&P\left( x_{2}|p\right) =\frac{1}{2} \\
P\left( x_{3}|s_{I}\right) &=&P\left( x_{3}|p\right) \cdot P\left(
x_{3}|\left( a_{11},a_{13}\right) \right) =\frac{1}{2}\cdot 1=\frac{1}{2} \\
P\left( x_{4}|s_{I}\right) &=&P\left( x_{4}|p\right) \cdot P\left(
x_{4}|\left( a_{11},a_{13}\right) \right) =\frac{1}{2}\cdot 0=0 \\
P\left( x_{5}|s_{I}\right) &=&P\left( x_{5}|p\right) \cdot P\left(
x_{5}|\left( a_{11},a_{13}\right) \right) =\frac{1}{2}\cdot 1=\frac{1}{2} \\
P\left( x_{6}|s_{I}\right) &=&P\left( x_{6}|p\right) \cdot P\left(
x_{6}|\left( a_{11},a_{13}\right) \right) =\frac{1}{2}\cdot 0=0 \\
P\left( z_{1}|s_{I}\right) &=&P\left( z_{1}|p\right) \cdot P\left(
z_{1}|\left( a_{11},a_{13}\right) \right) \cdot P\left( z_{1}|\left(
a_{21},a_{23}\right) \right) =\frac{1}{2}\cdot 1\cdot 1=\frac{1}{2} \\
P\left( z_{2}|s_{I}\right) &=&P\left( z_{2}|p\right) \cdot P\left(
z_{2}|\left( a_{11},a_{13}\right) \right) \cdot P\left( z_{2}|\left(
a_{21},a_{23}\right) \right) =\frac{1}{2}\cdot 1\cdot 0=0 \\
P\left( z_{3}|s_{I}\right) &=&P\left( z_{3}|p\right) \cdot P\left(
z_{3}|\left( a_{11},a_{13}\right) \right) \cdot P\left( z_{3}|\left(
a_{21},a_{23}\right) \right) =\frac{1}{2}\cdot 0\cdot 1=0 \\
P\left( z_{4}|s_{I}\right) &=&P\left( z_{4}|p\right) \cdot P\left(
z_{4}|\left( a_{11},a_{13}\right) \right) \cdot P\left( z_{4}|\left(
a_{21},a_{23}\right) \right) =\frac{1}{2}\cdot 0\cdot 0=0 \\
P\left( z_{5}|s_{I}\right) &=&P\left( z_{5}|p\right) \cdot P\left(
z_{5}|\left( a_{11},a_{13}\right) \right) \cdot P\left( z_{5}|\left(
a_{21},a_{23}\right) \right) =\frac{1}{2}\cdot 1\cdot 1=\frac{1}{2} \\
P\left( z_{6}|s_{I}\right) &=&P\left( z_{6}|p\right) \cdot P\left(
z_{6}|\left( a_{11},a_{13}\right) \right) \cdot P\left( z_{6}|\left(
a_{21},a_{23}\right) \right) =\frac{1}{2}\cdot 1\cdot 0=0 \\
P\left( z_{7}|s_{I}\right) &=&P\left( z_{7}|p\right) \cdot P\left(
z_{7}|\left( a_{11},a_{13}\right) \right) \cdot P\left( z_{7}|\left(
a_{21},a_{23}\right) \right) =\frac{1}{2}\cdot 0\cdot 1=0 \\
P\left( z_{8}|s_{I}\right) &=&P\left( z_{8}|p\right) \cdot P\left(
z_{8}|\left( a_{11},a_{13}\right) \right) \cdot P\left( z_{8}|\left(
a_{21},a_{23}\right) \right) =\frac{1}{2}\cdot 0\cdot 0=0
\end{eqnarray*}となります。つまり、先の\(s_{I}\)のもとで到達可能なノードは\(x_{1},x_{2},x_{3},x_{5},z_{1},z_{5}\)であり、到達可能な情報集合は\(\left\{ x_{1}\right\} ,\left\{ x_{2}\right\} ,\left\{ x_{3},x_{4}\right\},\left\{ x_{5},x_{6}\right\} \)です。

 

純粋戦略の組のもとでプレイヤーが直面する期待利得

展開型ゲーム\(\Gamma \)においてプレイヤーたちが純粋戦略の組\(s_{I}\)を選ぶと、ゲームが頂点\(z\)へ到達する確率が、\begin{equation*}P\left( z|s_{I}\right) =P\left( z|p\right) \cdot \prod_{i\in I}P\left(
z|s_{i}\right)
\end{equation*}として導出されます。特に、プレイヤー集合が有限集合\(I=\left\{ 1,\cdots,n\right\} \)である場合には、\begin{equation*}P\left( z|s_{I}\right) =P\left( z|p\right) \times P\left( z|s_{1}\right)
\times \cdots \times P\left( z|s_{n}\right)
\end{equation*}となります。以上を踏まえると、純粋戦略の組\(s_{I}\)が与えられたとき、それぞれの頂点\(z\in Z\)に対して、ゲームがそこへ到達する確率\(P\left( z|s_{I}\right) \)を特定する確率関数\begin{equation*}P\left( \cdot |s_{I}\right) :Z\rightarrow \mathbb{R} \end{equation*}が定義可能です。これをクジ(lottery)と呼びます。確率関数の定義より、\(P\left( \cdot |s_{I}\right) \)は以下の2つの性質\begin{eqnarray*}&&\left( a\right) \ \forall z\in Z:0\leq P\left( z|s_{I}\right) \leq 1 \\
&&\left( b\right) \ \sum_{z\in Z}P\left( z|s_{I}\right) =1
\end{eqnarray*}を満たします。条件\(\left( a\right) \)は、純粋戦略\(s_{I}\)のもとでゲームが頂点\(z\)へ到達する確率は\(0 \)以上\(1\)以下であることを意味します。条件\(\left( b\right) \)は、純粋戦略\(s_{I}\)のもとでゲームがそれぞれの頂点へ到達する確率を特定し、それらの総和をとると\(1\)になることを意味します。

自然が参加する展開型ゲーム\(\Gamma \)においてプレイヤーたちが純粋戦略の組\(s_{I}\)を採用する場合、最終的にどの頂点に到達するかを確定することはできないため、プレイヤーたちは不確実な状況に直面します。そこで、そのような状況をクジ\(P\left( \cdot |s_{I}\right) \)として表現します。クジ\(P\left( \cdot |s_{I}\right) \)は純粋戦略\(s_{I}\)のもとでゲームがそれぞれの頂点\(z\)へ到達する確率\(P\left(z|s_{I}\right) \)を特定しますが、これは純粋戦略\(s_{I}\)のもとでプレイヤーたちが直面する不確実な状況を表しています。

クジが変化すればプレイヤーたちは以前とは異なる不確実な状況に直面するため、プレイヤーたちが純粋戦略を採用する場合、それぞれのプレイヤーはクジどうしを比較する選好を持っているものと考えるべきです。さらに言えば、純粋戦略の組\(s_{I}\)が与えられればそれに対して1つのクジ\(P\left( \cdot |s_{I}\right) \)が定まるため、結局、プレイヤーがクジを比較する選好を、純粋戦略の組どうしを比較する\(S_{I}\)上の選好関係と同一視しても一般性は失われません。具体的には、展開型ゲーム\(\Gamma \)においてプレイヤーたちが純粋戦略を採用する場合、プレイヤー\(i\)が直面し得る不確実な状況どうしを比較する選好関係は、純粋戦略のすべての組からなる集合\(S_{I}\)上の二項関係\(\succsim _{i}\)として定式化されます。具体的には、任意の2つの組\(s_{I},s_{I}^{\prime }\in S_{I}\)に対して、\begin{equation*}s_{I}\succsim _{i}s_{I}^{\prime }\Leftrightarrow i\text{はクジ}P\left( \cdot |s_{I}\right) \text{をクジ}P\left(
\cdot |s_{I}^{\prime }\right) \text{以上に好む}
\end{equation*}という条件を満たすものとして\(\succsim _{i}\)を定義します。つまり、比較対象として2つのクジ\(P\left( \cdot |s_{I}\right) ,P\left( \cdot |s_{I}^{\prime}\right) \)を提示されたとき、プレイヤー\(i\)がクジ\(P\left( \cdot |s_{I}\right) \)のもとで直面する不確実な状況をクジ\(P\left( \cdot |s_{I}^{\prime }\right) \)のもとで直面する不確実な状況以上に好むとき、そしてその場合にのみ\(s_{I}\succsim _{i}s_{I}^{\prime }\)が成り立つものとして\(\succsim_{i}\)を底意義するということです。ただし、\(P\left( \cdot |s_{I}\right) \)を\(P\left( \cdot |s_{I}^{\prime }\right) \)以上に好むとは、\(P\left(\cdot |s_{I}\right) \)を\(P\left( \cdot |s_{I}^{\prime }\right) \)よりも好むか、または\(P\left( \cdot |s_{I}\right) \)と\(P\left( \cdot |s_{I}^{\prime }\right) \)を同じ程度好むことを意味します。

プレイヤー\(i\)が不確実な状況どうしを比較する\(S_{I}\)上の選好関係\(\succsim _{i}\)が与えられたとき、任意の2つの組\(s_{I},s_{I}^{\prime }\in S_{I}\)に対して、以下の関係\begin{equation*}s_{I}\succsim _{i}s_{I}^{\prime }\Leftrightarrow U_{i}\left( s_{I}\right)
\geq U_{i}\left( s_{I}^{\prime }\right)
\end{equation*}を満たす関数\begin{equation*}
U_{i}:S_{I}\rightarrow \mathbb{R} \end{equation*}が存在する場合には、これを\(\succsim _{i}\)を表現する期待利得関数(expected utility function)と呼びます。さらに、プレイヤー\(i\)の期待利得関数\(U_{i}\)が純粋戦略の組\(s_{I}\)に対して定める値\(U_{i}\left(s_{I}\right) \)を、プレイヤー\(i\)が\(s_{I}\)から得る期待利得(expected utility)と呼びます。

展開型ゲーム\(\Gamma \)においてプレイヤー\(i\)は結果どうしを比較する利得関数\(u_{i}:Z\rightarrow \mathbb{R} \)を持っています。つまり、ゲームにおいて頂点\(z\in Z\)が実現した場合、プレイヤー\(i\)は利得\(u_{i}\left( z\right) \)を得るということです。さて、展開型ゲーム\(\Gamma \)においてプレイヤーたちが純粋戦略の組\(s_{I}\)を選ぶ場合、その状況はクジ\(P\left( \cdot |s_{I}\right) :Z\rightarrow \mathbb{R} \)として表現されます。この場合、ゲームは確率\(P\left( z|s_{I}\right) \)で頂点\(z\)へ到達し、その頂点においてプレイヤー\(i\)は利得\(u_{i}\left( z\right) \)を得るため、\(s_{I}\)のもとでプレイヤー\(i\)が\(z\)から得る利得の期待値は\(P\left(z|s_{I}\right) \cdot u_{i}\left( z\right) \)となります。これをすべての頂点\(z\)に関して導出した上で総和をとれば、\(s_{I}\)のもとでプレイヤー\(i\)が直面する期待利得\begin{equation*}U_{i}\left( s_{I}\right) =\sum_{z\in Z}\left[ P\left( z|s_{I}\right) \cdot
u_{i}\left( z\right) \right] \end{equation*}が得られます。

例(期待利得)
以下のゲームの木によって表現される展開型ゲーム\(\Gamma \)について考えます。

図:展開型ゲーム
図:展開型ゲーム

プレイヤー\(1\)の純粋戦略集合は、\begin{eqnarray*}S_{1} &=&A\left( \left\{ x_{0}\right\} \right) \\
&=&\left\{ \left( a_{11}\right) ,\left( a_{12}\right) \right\}
\end{eqnarray*}であり、プレイヤー\(2\)の純粋戦略集合は、\begin{eqnarray*}S_{2} &=&A\left( \left\{ x_{1}\right\} \right) \times A\left( \left\{
x_{2}\right\} \right) \\
&=&\left\{ \left( a_{21},a_{21}\right) ,\left( a_{21},a_{22}\right) ,\left(
a_{22},a_{21}\right) ,\left( a_{22},s_{22}\right) \right\}
\end{eqnarray*}です。先に示したように、以下の純粋戦略の組\begin{equation*}
s_{I}=\left( \left( a_{11}\right) ,\left( a_{21},a_{21}\right) \right)
\end{equation*}のもとでゲームがそれぞれの頂点へ到達する確率は、\begin{eqnarray*}
P\left( z_{1}|s_{I}\right) &=&1 \\
P\left( z_{2}|s_{I}\right) &=&0 \\
P\left( z_{3}|s_{I}\right) &=&0 \\
P\left( z_{4}|s_{I}\right) &=&0
\end{eqnarray*}です。したがって、この\(s_{I}\)においてプレイヤー\(1\)が直面する期待利得は、\begin{eqnarray*}U_{1}\left( s_{I}\right) &=&\sum_{i=1}^{4}\left[ P\left( z_{i}|s_{I}\right)
\cdot u_{1}\left( z_{i}\right) \right] \\
&=&p\left( z_{1}|s_{I}\right) \cdot u_{1}\left( z_{1}\right) \\
&=&1\cdot 2 \\
&=&2
\end{eqnarray*}であり、プレイヤー\(2\)が直面する期待利得は、\begin{eqnarray*}U_{2}\left( s_{I}\right) &=&\sum_{i=1}^{4}\left[ P\left( z_{i}|s_{I}\right)
\cdot u_{2}\left( z_{i}\right) \right] \\
&=&p\left( z_{1}|s_{I}\right) \cdot u_{2}\left( z_{1}\right) \\
&=&1\cdot 1 \\
&=&1
\end{eqnarray*}です。他の純粋戦略の組についても同様に考えます(演習問題)。

例(期待利得)
以下のゲームの木によって表現される展開型ゲーム\(\Gamma \)について考えます。

図:展開型ゲーム
図:展開型ゲーム

プレイヤー\(1\)の純粋戦略集合は、\begin{eqnarray*}S_{1} &=&A\left( \left\{ x_{0}\right\} \right) \\
&=&\left\{ \left( a_{11}\right) ,\left( a_{12}\right) \right\}
\end{eqnarray*}であり、プレイヤー\(2\)の純粋戦略集合は、\begin{eqnarray*}S_{2} &=&A\left( \left\{ x_{1},x_{2}\right\} \right) \\
&=&\left\{ \left( a_{21}\right) ,\left( a_{22}\right) \right\}
\end{eqnarray*}です。先に示したように、以下の純粋戦略の組\begin{equation*}
s_{I}=\left( \left( a_{11}\right) ,\left( a_{21}\right) \right)
\end{equation*}のもとでゲームがそれぞれの頂点へ到達する確率は、\begin{eqnarray*}
P\left( z_{1}|s_{I}\right) &=&1 \\
P\left( z_{2}|s_{I}\right) &=&0 \\
P\left( z_{3}|s_{I}\right) &=&0 \\
P\left( z_{4}|s_{I}\right) &=&0
\end{eqnarray*}です。したがって、この\(s_{I}\)においてプレイヤー\(1\)が直面する期待利得は、\begin{eqnarray*}U_{1}\left( s_{I}\right) &=&\sum_{i=1}^{4}\left[ P\left( z_{i}|s_{I}\right)
\cdot u_{1}\left( z_{i}\right) \right] \\
&=&p\left( z_{1}|s_{I}\right) \cdot u_{1}\left( z_{1}\right) \\
&=&1\cdot 2 \\
&=&2
\end{eqnarray*}であり、プレイヤー\(2\)が直面する期待利得は、\begin{eqnarray*}U_{2}\left( s_{I}\right) &=&\sum_{i=1}^{4}\left[ P\left( z_{i}|s_{I}\right)
\cdot u_{2}\left( z_{i}\right) \right] \\
&=&p\left( z_{1}|s_{I}\right) \cdot u_{2}\left( z_{1}\right) \\
&=&1\cdot 1 \\
&=&1
\end{eqnarray*}です。他の純粋戦略の組についても同様に考えます(演習問題)。

例(期待利得)
以下のゲームの木によって表現される展開型ゲーム\(\Gamma \)について考えます。

図:展開型ゲーム
図:展開型ゲーム

プレイヤー\(1\)の純粋戦略集合は、\begin{eqnarray*}S_{1} &=&A\left( \left\{ x_{1}\right\} \right) \times A\left( \left\{
x_{2}\right\} \right) \\
&=&\left\{ \left( a_{11},a_{13}\right) ,\left( a_{11},a_{14}\right) ,\left(
a_{12},a_{13}\right) ,\left( a_{12},a_{14}\right) \right\}
\end{eqnarray*}であり、プレイヤー\(2\)の純粋戦略集合は、\begin{eqnarray*}S_{2} &=&A\left( \left\{ x_{3},x_{4}\right\} \right) \times A\left( \left\{
x_{5},x_{6}\right\} \right) \\
&=&\left\{ \left( a_{21},a_{23}\right) ,\left( a_{21},a_{24}\right) ,\left(
a_{22},a_{23}\right) ,\left( a_{22},s_{24}\right) \right\}
\end{eqnarray*}です。自然による確率分布は、\begin{equation*}
p\left( \left\{ x_{0}\right\} ,a_{01}\right) =p\left( \left\{ x_{0}\right\}
,a_{02}\right) =\frac{1}{2}
\end{equation*}であるものとします。先に示したように、以下の純粋戦略の組\begin{equation*}
s_{I}=\left( \left( a_{11},a_{13}\right) ,\left( a_{21},a_{23}\right) \right)
\end{equation*}のもとでゲームがそれぞれの頂点へ到達する確率は、\begin{eqnarray*}
P\left( z_{1}|s_{I}\right) &=&\frac{1}{2} \\
P\left( z_{2}|s_{I}\right) &=&0 \\
P\left( z_{3}|s_{I}\right) &=&0 \\
P\left( z_{4}|s_{I}\right) &=&0 \\
P\left( z_{5}|s_{I}\right) &=&\frac{1}{2} \\
P\left( z_{6}|s_{I}\right) &=&0 \\
P\left( z_{7}|s_{I}\right) &=&0 \\
P\left( z_{8}|s_{I}\right) &=&0
\end{eqnarray*}したがって、この\(s_{I}\)においてプレイヤー\(1\)が直面する期待利得は、\begin{eqnarray*}U_{1}\left( s_{I}\right) &=&\sum_{i=1}^{8}\left[ P\left( z_{i}|s_{I}\right)
\cdot u_{1}\left( z_{i}\right) \right] \\
&=&p\left( z_{1}|s_{I}\right) \cdot u_{1}\left( z_{1}\right) +p\left(
z_{5}|s_{I}\right) \cdot u_{1}\left( z_{5}\right) \\
&=&\frac{1}{2}\cdot 2+\frac{1}{2}\cdot 4 \\
&=&3
\end{eqnarray*}であり、プレイヤー\(1\)が直面する期待利得は、\begin{eqnarray*}U_{2}\left( s_{I}\right) &=&\sum_{i=1}^{8}\left[ P\left( z_{i}|s_{I}\right)
\cdot u_{2}\left( z_{i}\right) \right] \\
&=&p\left( z_{1}|s_{I}\right) \cdot u_{2}\left( z_{1}\right) +p\left(
z_{5}|s_{I}\right) \cdot u_{2}\left( z_{5}\right) \\
&=&\frac{1}{2}\cdot 1+\frac{1}{2}\cdot 1 \\
&=&1
\end{eqnarray*}です。他の純粋戦略の組についても同様に考えます(演習問題)。

 

展開型ゲームの戦略型

展開型ゲーム\(\Gamma \)のプレイヤーの中に自然が含まれない場合、プレイヤーたちが選択する純粋戦略の組\(s_{I}\in S_{I}\)が定まれば、その場合に実際に実現する結果は一意的に定まります。一方、プレイヤーの中に自然が含まれる場合、自然はランダムに意思決定を行うため、自然以外のプレイヤーたちが選択する純粋戦略の組\(s_{I}\in S_{I}\)が定まっても、その場合に実際に実現する結果は一意的に定まりません。その場合にプレイヤーたちが直面する不確実な状況をクジ\(P\left( \cdot |s_{I}\right) :Z\rightarrow \mathbb{R} \)として表現しました。これは、プレイヤーたちが選択する純粋戦略の組が\(s_{I}\in S_{I}\)であるときに、ゲームがそれぞれの頂点\(z\in Z\)へ到達する確率\(P\left(z|s_{I}\right) \)を特定する関数です。

純粋戦略の組が与えられればそれに対して1つのクジが定まります。クジが変化すればプレイヤーたちは以前とは異なる不確実な状況に直面するため、プレイヤーたちが純粋戦略を採用する場合、プレイヤーはクジどうしを比較する選好関係を持っているものとみなしました。さらに、純粋戦略の組が与えられればそれに対して1つのクジが定まるため、結局、プレイヤー\(i\in I\)がクジを比較する選好を、純粋戦略の組どうしを比較する\(S_{I}\)上の選好関係\(\succsim _{i}\)もしくはそれを表現する期待利得関数\(U_{i}:S_{I}\rightarrow \mathbb{R} \)として表現できます。ただし、期待利得関数\(U_{i}\)が純粋戦略の組\(s_{I}\in S_{I}\)に対して定める期待利得は、\begin{equation*}U_{i}\left( s_{I}\right) =\sum_{z\in Z}\left[ P\left( z|s_{I}\right) \cdot
u_{i}\left( z\right) \right] \end{equation*}となります。

以上を踏まえると、展開型ゲーム\(\Gamma \)において純粋戦略を採用するプレイヤーたちが直面する戦略的状況は、以下のような戦略型ゲーム\begin{equation*}G\left( \Gamma \right) =\left( I,\left\{ S_{i}\right\} _{i\in I},\left\{
U_{i}\right\} _{i\in I}\right)
\end{equation*}として表現されます。ただし、\(I\)はプレイヤー集合、\(S_{i}\)はプレイヤー\(i\)の純粋戦略集合、\(U_{i}:S_{I}\rightarrow \mathbb{R} \)はプレイヤー\(i\)の期待利得関数です。これを展開型ゲーム\(\Gamma \)の戦略型(strategic form)や標準化(normalization)などと呼びます。

例(展開型ゲームの戦略型)
以下のゲームの木によって表現される展開型ゲーム\(\Gamma \)について考えます。

図:展開型ゲーム
図:展開型ゲーム

プレイヤー\(1\)の純粋戦略集合は、\begin{eqnarray*}S_{1} &=&A\left( \left\{ x_{0}\right\} \right) \\
&=&\left\{ \left( a_{11}\right) ,\left( a_{12}\right) \right\}
\end{eqnarray*}であり、プレイヤー\(2\)の純粋戦略集合は、\begin{eqnarray*}S_{2} &=&A\left( \left\{ x_{1}\right\} \right) \times A\left( \left\{
x_{2}\right\} \right) \\
&=&\left\{ \left( a_{21},a_{21}\right) ,\left( a_{21},a_{22}\right) ,\left(
a_{22},a_{21}\right) ,\left( a_{22},s_{22}\right) \right\}
\end{eqnarray*}です。先に示したように、以下の純粋戦略の組\begin{equation*}
\left( \left( a_{11}\right) ,\left( a_{21},a_{21}\right) \right)
\end{equation*}のもとでそれぞれのプレイヤーが直面する期待利得は、\begin{eqnarray*}
U_{1}\left( \left( a_{11}\right) ,\left( a_{21},a_{21}\right) \right) &=&2 \\
U_{2}\left( \left( a_{11}\right) ,\left( a_{21},a_{21}\right) \right) &=&1
\end{eqnarray*}です。他の純粋戦略の組についても期待利得行列を計算することにより、この展開型ゲーム\(\Gamma \)の戦略型\(G\left( \Gamma \right) \)が以下の利得行列として得られます。

$$\begin{array}{ccccc}
\hline
1\backslash 2 & \left( a_{21},a_{21}\right) & \left( a_{21},a_{22}\right) & \left( a_{22},a_{21}\right) & \left( a_{22},s_{22}\right) \\ \hline
\left( a_{11}\right) & 2,1 & 2,1 & 1,2 & 1,2 \\ \hline
\left( a_{12}\right) & 3,1 & 3,1 & 1,3 & 1,3 \\ \hline
\end{array}$$

例(展開型ゲームの戦略型)
以下のゲームの木によって表現される展開型ゲーム\(\Gamma \)について考えます。

図:展開型ゲーム
図:展開型ゲーム

プレイヤー\(1\)の純粋戦略集合は、\begin{eqnarray*}S_{1} &=&A\left( \left\{ x_{0}\right\} \right) \\
&=&\left\{ \left( a_{11}\right) ,\left( a_{12}\right) \right\}
\end{eqnarray*}であり、プレイヤー\(2\)の純粋戦略集合は、\begin{eqnarray*}S_{2} &=&A\left( \left\{ x_{1},x_{2}\right\} \right) \\
&=&\left\{ \left( a_{21}\right) ,\left( a_{22}\right) \right\}
\end{eqnarray*}です。先に示したように、以下の純粋戦略の組\begin{equation*}
\left( \left( a_{11}\right) ,\left( a_{21}\right) \right)
\end{equation*}のもとでそれぞれのプレイヤーが直面する期待利得は、\begin{eqnarray*}
U_{1}\left( \left( a_{11}\right) ,\left( a_{21}\right) \right) &=&2 \\
U_{2}\left( \left( a_{11}\right) ,\left( a_{21}\right) \right) &=&1
\end{eqnarray*}です。他の純粋戦略の組についても期待利得行列を計算することにより、この展開型ゲーム\(\Gamma \)の戦略型\(G\left( \Gamma \right) \)が以下の利得行列として得られます。

$$\begin{array}{ccc}
\hline
1\backslash 2 & \left( a_{21}\right) & \left( a_{22}\right) \\ \hline
\left( a_{11}\right) & 2,1 & 0,0 \\ \hline
\left( a_{12}\right) & -1,1 & 3,2 \\ \hline
\end{array}$$

例(展開型ゲームの戦略型)
以下のゲームの木によって表現される展開型ゲーム\(\Gamma \)について考えます。

図:展開型ゲーム
図:展開型ゲーム

プレイヤー\(1\)の純粋戦略集合は、\begin{eqnarray*}S_{1} &=&A\left( \left\{ x_{1}\right\} \right) \times A\left( \left\{
x_{2}\right\} \right) \\
&=&\left\{ \left( a_{11},a_{13}\right) ,\left( a_{11},a_{14}\right) ,\left(
a_{12},a_{13}\right) ,\left( a_{12},a_{14}\right) \right\}
\end{eqnarray*}であり、プレイヤー\(2\)の純粋戦略集合は、\begin{eqnarray*}S_{2} &=&A\left( \left\{ x_{3},x_{4}\right\} \right) \times A\left( \left\{
x_{5},x_{6}\right\} \right) \\
&=&\left\{ \left( a_{21},a_{23}\right) ,\left( a_{21},a_{24}\right) ,\left(
a_{22},a_{23}\right) ,\left( a_{22},s_{24}\right) \right\}
\end{eqnarray*}です。自然による確率分布は、\begin{equation*}
p\left( \left\{ x_{0}\right\} ,a_{01}\right) =p\left( \left\{ x_{0}\right\}
,a_{02}\right) =\frac{1}{2}
\end{equation*}であるものとします。先に示したように、以下の純粋戦略の組\begin{equation*}
\left( \left( a_{11},a_{13}\right) ,\left( a_{21},a_{23}\right) \right)
\end{equation*}のもとでそれぞれのプレイヤーが直面する期待利得は、\begin{eqnarray*}
U_{1}\left( \left( a_{11},a_{13}\right) ,\left( a_{21},a_{23}\right) \right)
&=&3 \\
U_{2}\left( \left( a_{11},a_{13}\right) ,\left( a_{21},a_{23}\right) \right)
&=&1
\end{eqnarray*}です。他の純粋戦略の組についても期待利得行列を計算することにより、この展開型ゲーム\(\Gamma \)の戦略型\(G\left( \Gamma \right) \)が以下の利得行列として得られます。

$$\begin{array}{ccccc}
\hline
1\backslash 2 & \left( a_{21},a_{23}\right) & \left( a_{21},a_{24}\right) & \left( a_{22},a_{23}\right) & \left( a_{22},s_{24}\right) \\ \hline
\left( a_{11},a_{13}\right) & 3,1 & \frac{3}{2},\frac{5}{2} & \frac{5 }{2},\frac{3}{2} & 1,3 \\ \hline
\left( a_{11},a_{14}\right) & \frac{7}{2},1 & \frac{3}{2},3 & 3,\frac{3}{2} & 1,3 \\ \hline
\left( a_{12},a_{13}\right) & \frac{7}{2},1 & 2,\frac{5}{2} & \frac{5}{2},2 & 1,\frac{7}{2} \\ \hline
\left( a_{12},a_{14}\right) & 4,1 & 2,3 & 3,2 & 1,4 \\ \hline
\end{array}$$

本来、展開型ゲーム\(\Gamma \)はプレイヤーたちが順番に意思決定を行う動学ゲームを記述するモデルです。ただ、プレイヤーたちが展開型ゲーム\(\Gamma \)において純粋戦略を選択することは、自身が直面し得るそれぞれの情報集合においてどの行動を選択するか、その包括的な行動計画をあらかじめ立てた上でゲームに臨むことを意味します。展開型ゲーム\(\Gamma \)の開始時点においてプレイヤーたちはそのような行動計画を表明します。ゲームの開始後には先の行動計画を変更できず、自身が先に表明した行動計画にもとづいて意思決定を行います。つまり、展開型ゲームにおいてプレイヤーたちが純粋戦略を採用する状況は、プレイヤーたちが純粋戦略を同時に表明する静学ゲームと解釈できるため、そこでの戦略的状況を戦略型ゲーム\(G\left( \Gamma \right) \)として表現できるということです。

展開型ゲーム\(\Gamma \)においてプレイヤーたちが純粋戦略を選択する状況を戦略型ゲーム\(G\left( \Gamma \right) \)として表現するとき、ゲームの完備性より、\(G\left( \Gamma \right) \)を構成するすべての要素はプレイヤーたちの共有知識です。また、ゲームの静学性より、プレイヤーたちは以下の手順で意思決定を行います。

  1. それぞれのプレイヤー\(i\)は自身の純粋戦略集合\(S_{i}\)の中から特定の純粋戦略\(s_{i}\)を選択する。その際、他のプレイヤーたちが選択する純粋戦略の組\(s_{-i}\)を観察できない。
  2. プレイヤーたちが選択した純粋戦略の組\(s_{I}=\left( s_{i},s_{-i}\right) \)のもとでのクジ\(P\left( \cdot |s_{I}\right) \)にもとづいて実際に実現する頂点\(z\)が1つだけランダムに選ばれる。
  3. 実現した頂点\(z\)からそれぞれのプレイヤー\(i\)は利得\(u_{i}\left( z\right) \)を得る。

戦略型ゲーム\(G\left( \Gamma \right) \)を構成するすべての要素はプレイヤーたちの共有知識であるものの、それぞれのプレイヤー\(i\)は意思決定を行う際に、他のプレイヤーたちが選択する純粋戦略\(s_{-i}\)を観察できません。したがって、それぞれのプレイヤー\(i\)は、それぞれの純粋戦略の組\(s_{I}=\left( s_{i},s_{-i}\right) \)において自身が直面する期待利得\(U_{i}\left( s_{I}\right) \)どうしを比較した上で、何らかの純粋戦略\(s_{i}\)を選びます。さらに、全員の純粋戦略\(s_{I}\)が出そろった後、その場合のクジ\(P\left( \cdot |s_{I}\right) \)にもとづいてある1つの頂点\(z\)がランダムに選ばれ、それぞれのプレイヤー\(i\)は利得\(u_{i}\left(z\right) \)を得ます。それぞれのプレイヤー\(i\)が意思決定を行う際に参照するのは期待利得\(U_{i}\left( s_{I}\right) \)ですが、ゲームの終了時に実際に得るのは利得\(u_{i}\left( z\right) \)であることに注意してください。

展開型ゲーム\(\Gamma \)を戦略型ゲーム\(G\left( \Gamma \right) \)へ変換することにより、もとの動学ゲームをあたかも静学ゲームであるかのように分析できるようになります。その反面、展開型ゲーム\(\Gamma \)はプレイヤーが順番に意思決定を行うというゲームの動学的側面を正確に記述するモデルであるため、それを戦略型ゲームへ変換してしまうと、行動の順番を考慮しながら行われるプレイヤーの意思決定を丁寧に分析できなくなってしまう恐れがあります。この点については場を改めて詳しく解説します。

 

期待効用仮説

展開型ゲーム\(\Gamma \)においてプレイヤーたちが純粋戦略を採用する場合、その戦略的状況は\(\Gamma \)の戦略型\begin{equation*}G\left( \Gamma \right) =\left( I,\left\{ S_{i}\right\} _{i\in I},\left\{
U_{i}\right\} _{i\in I}\right)
\end{equation*}として記述されます。ただし、\(I\)はプレイヤー集合、\(S_{i}\)はプレイヤー\(i\)の純粋戦略集合、\(U_{i}:S_{I}\rightarrow \mathbb{R} \)はプレイヤー\(i\)の期待利得関数です。

本来、展開型ゲーム\(\Gamma \)はプレイヤーたちが順番に意思決定を行う動学ゲームを記述するモデルです。ただ、プレイヤーたちが展開型ゲーム\(\Gamma \)において純粋戦略を選択することは、自身が直面し得るそれぞれの情報集合においてどの行動を選択するか、その包括的な行動計画をあらかじめ立てた上でゲームに臨むことを意味します。展開型ゲーム\(\Gamma \)の開始時点においてプレイヤーたちはそのような行動計画を表明します。ゲームの開始後には先の行動計画を変更できず、自身が先に表明した行動計画にもとづいて意思決定を行います。つまり、展開型ゲームにおいてプレイヤーたちが純粋戦略を採用する状況は、プレイヤーたちが純粋戦略を同時に表明する静学ゲームと解釈できるため、そこでの戦略的状況を戦略型ゲーム\(G\left( \Gamma \right) \)として表現できるということです。

展開型ゲーム\(\Gamma \)においてプレイヤーたちが純粋戦略を選択する状況を戦略型ゲーム\(G\left( \Gamma \right) \)として表現するとき、ゲームの完備性より、\(G\left( \Gamma \right) \)を構成するすべての要素はプレイヤーたちの共有知識です。また、ゲームの静学性より、プレイヤーたちは以下の手順で意思決定を行います。

  1. それぞれのプレイヤー\(i\)は自身の純粋戦略集合\(S_{i}\)の中から特定の純粋戦略\(s_{i}\)を選択する。その際、他のプレイヤーたちが選択する純粋戦略の組\(s_{-i}\)を観察できない。
  2. プレイヤーたちが選択した純粋戦略の組\(s_{I}=\left( s_{i},s_{-i}\right) \)のもとでのクジ\(P\left( \cdot |s_{I}\right) \)にもとづいて実際に実現する頂点\(z\)が1つだけランダムに選ばれる。
  3. 実現した頂点\(z\)からそれぞれのプレイヤー\(i\)は利得\(u_{i}\left( z\right) \)を得る。

戦略型ゲーム\(G\left( \Gamma \right) \)を構成するすべての要素はプレイヤーたちの共有知識であるものの、それぞれのプレイヤー\(i\)は意思決定を行う際に、他のプレイヤーたちが選択する純粋戦略\(s_{-i}\)を観察できません。したがって、それぞれのプレイヤー\(i\)は、それぞれの純粋戦略の組\(s_{I}=\left( s_{i},s_{-i}\right) \)において自身が直面する期待利得\(U_{i}\left( s_{I}\right) \)どうしを比較した上で、何らかの純粋戦略\(s_{i}\)を選びます。さらに、全員の純粋戦略\(s_{I}\)が出そろった後、その場合のクジ\(P\left( \cdot |s_{I}\right) \)にもとづいてある1つの頂点\(z\)がランダムに選ばれ、それぞれのプレイヤー\(i\)は利得\(u_{i}\left(z\right) \)を得ます。それぞれのプレイヤー\(i\)が意思決定を行う際に参照するのは期待利得\(U_{i}\left( s_{I}\right) \)ですが、ゲームの終了時に実際に得るのは利得\(u_{i}\left( z\right) \)であることに注意してください。

展開型ゲーム\(\Gamma \)の戦略型\(G\left( \Gamma \right) \)においてそれぞれのプレイヤー\(i\)は自身の純粋戦略集合\(S_{i}\)の中から特定の純粋戦略\(s_{i}\)を選択することが想定されています。では、プレイヤーたちはどのような原理にもとづいて意思決定を行うのでしょうか。戦略型ゲーム\(G\left( \Gamma \right) \)や純粋戦略などの概念は、ゲームのルールやプレイヤーに与えられる選択肢を定式化したものであり、プレイヤーたちの行動原理については何も言っていません。プレイヤーたちの行動原理については、別途、規程する必要があります。

ゲーム理論では、ゲームに参加するプレイヤーはそれぞれ明確な目的を持ち、その目的を達成するために最適な戦略を選択するものと仮定します。この意味においてプレイヤーは合理的(rational)です。さらに、多くの場合、プレイヤーの目的は自己の利得の最大化であるものと仮定します。つまり、ゲームに参加するプレイヤーは自分の利得の最大化をめざすという意味において利己的(selfish)です。なお、合理性と利己性を総称して合理性と呼ぶこともあります。

展開型ゲーム\(\Gamma \)においてプレイヤーたちが純粋戦略を採用する場合、それぞれのプレイヤーは二重の意味での不確実性に直面します。1つ目は、他のプレイヤーたちが選択する純粋戦略を事前に観察できないという意味での不確実性です。もう1つは、プレイヤーの中に自然が存在する場合、自然はランダムに意思決定を行うため、自然以外のプレイヤーたちが選択する純粋戦略が定まった場合でも、その場合に実際に起こる結果は一意的に定まらないという意味での不確実性です。このような二重の意味に直面するそれぞれのプレイヤーは、自身の期待利得を指標に意思決定を行います。

以上を踏まえると、プレイヤーたちが純粋戦略を採用する場合の合理性とは、自己の期待利得を最大化するために最適な純粋戦略を選択することとして表現されます。これを期待効用仮説(expected utility hypothesis)と呼びます。期待効用仮説が実際に成り立つことを保証するためには、展開型ゲーム\(\Gamma \)の戦略型\(G\left( \Gamma\right) \)に関して、少なくとも以下を要求する必要があります。

  1. それぞれのプレイヤー\(i\in I\)は、自分がプレーしている戦略型ゲーム\(G\left( \Gamma \right) \)において起こり得るすべての結果を把握している。具体的には、展開型ゲーム\(\Gamma \)の頂点集合\(Z\)を把握するに十分な情報収集力を持っている。
  2. それぞれのプレイヤー\(i\in I\)は、ゲームにおいて起こり得るそれぞれの結果\(z\in Z\)から自身が得る利得\(u_{i}\left(z\right) \in \mathbb{R} \)を把握するとともに、プレイヤーたちが戦略する純粋戦略の組\(s_{I}\in S_{I}\)と自然による意思決定を記述する確率分布\(p\)に対して、その場合にそれぞれの頂点が\(z\in Z\)が実現する確率\(P\left( z|s_{I}\right) \)や、その場合に自身が直面する期待利得\begin{equation*}U_{i}\left( s_{I}\right) =\sum_{z\in Z}\left[ P\left( z|s_{I}\right) \cdot u_{i}\left( z\right) \right] \end{equation*}を計算する能力を持っており、その上で、自身の期待利得を最大化するような純粋戦略\(s_{i}\in S_{i}\)を特定するに十分な知能を持っていることを要求する。

完備情報の動学ゲームを展開型ゲーム\(\Gamma \)やその戦略型\(G\left( \Gamma \right) \)として定式化するとき、そのすべての要素はプレイヤーたちの共有知識とみなされます。一方、プレイヤーの合理性は\(\Gamma \)や\(G\left( \Gamma \right) \)の要素ではないため、「プレイヤーたちが合理的である」という事実は、プレイヤーたちの共有知識であるとは限りません。ゲーム理論では多くの場合、プレイヤーの合理性は相互知識であるものと仮定した上で分析を行います。つまり、すべてのプレイヤーが合理的であることをすべてのプレイヤーが知っていることを仮定します。プレイヤーの合理性を共有知識と仮定する場合もあります。つまり、すべてのプレイヤーが合理的であることをすべてのプレイヤーが知っており、なおかつ、その事実をすべてのプレイヤーが知っており、\(\cdots \)、という仮定を無限に積み重ねるということです。後ほど明らかになるように、プレイヤーたちの合理性を共有知識とみなすか、相互知識とみなすか、その仮定の強さによって得られる結論も変わってくるため、注意が必要です。

 

純粋戦略均衡

展開型ゲーム\(\Gamma \)の戦略型\(G\left( \Gamma \right) \)に直面したそれぞれのプレイヤー\(i\)は、期待効用仮説のもとで、自身が選択可能な純粋戦略集合\(S_{i}\)の中から自身の期待利得を最大化する純粋戦略を選ぶものと仮定します。このような純粋戦略を\(s_{i}^{\ast }\)で表し、これをプレイヤー\(i\)の最適戦略(best strategy)と呼びます。

プレイヤーたちが最適戦略を選ぶ目的は自身の期待利得の最大化ですが、最適戦略の具体的な内容は展開型ゲーム\(\Gamma \)やその戦略型\(G\left( \Gamma \right) \)の要素とは別に外生的に定義する必要があります。つまり、ゲームの分析家は最適戦略の意味をあらかじめ規定した上で、そこで規定された最適戦略の概念のもとでプレイヤーたちが具体的にどのように振る舞い、そこからどのような結果がもたらされるかを分析するということです。したがって、同じゲーム\(G\left( \Gamma \right) \)を分析対象とする場合でも、異なる最適戦略の概念のもとでは異なる分析結果が得られます。分析家がどのような最適戦略の概念を採用するかは非常に重要な問題です。

展開型ゲーム\(\Gamma \)の戦略型\(G\left( \Gamma \right) \)における最適戦略の意味を定義することとは、それぞれの戦略型ゲーム\(G\left( \Gamma \right) \)に対して、そこでの最適戦略の組\(s_{I}^{\ast }=(s_{i}^{\ast })_{i\in I}\in S_{I}\)を定める概念を特定することを意味します。そこで、そのような概念を均衡概念(equilibrium concept)や解の概念(solution concept)などと呼びます。また、均衡概念がそれぞれの戦略型ゲーム\(G\left( \Gamma \right) \)に対して定める最適戦略の組\(s_{I}^{\ast }\)を\(G\left( \Gamma \right) \)の均衡(equilibrium)や純粋戦略均衡(pure strategy equilibrium)などと呼び、均衡\(s_{I}^{\ast }\)を構成するプレイヤー\(i\)の最適戦略\(s_{i}^{\ast }\)を\(i\)の均衡戦略(equilibrium strategy)と呼びます。さらに、戦略型ゲーム\(G\left( \Gamma \right) \)の均衡が\(s_{I}^{\ast }\)であるとき、それぞれの頂点\(z\in Z\)が実現する確率を規定する確率分布が定まります。そのような確率分布が\(G\left( \Gamma \right) \)の均衡結果に相当します。その上で、均衡結果からプレイヤーたちが得る期待利得の組を\(U^{\ast }=(U_{i}(s_{I}^{\ast }))_{i\in I}\in \mathbb{R} ^{n}\)で表します。

ある均衡概念が外生的に与えられたとき、その均衡概念のもとで、任意の戦略型ゲーム\(G\left( \Gamma \right) \)に対して純粋戦略均衡は存在するとは限りません。また、純粋戦略均衡が存在する場合にも、それは一意的に定まるとは限りません。したがって、展開型ゲーム\(\Gamma \)の戦略型\(G\left( \Gamma \right) \)を分析対象とするとき、純粋均衡概念とは、それぞれの戦略型ゲーム\(G\left( \Gamma \right) \)に対してそこでの純粋戦略均衡を定める対応として定式化されます。

 

演習問題

問題(到達可能性)
以下のゲームの木によって表現される展開型ゲーム\(\Gamma \)について考えます。

図:展開型ゲーム
図:展開型ゲーム

純粋戦略の組\begin{equation*}
s_{I}=\left( \left( a_{12}\right) ,\left( a_{21},a_{21}\right) \right)
\end{equation*}のもとでゲームがそれぞれのノードへ到達する確率を求めた上で、到達可能なノードと情報集合を特定してください。さらに、\(s_{I}\)のもとでそれぞれのプレイヤーが直面する期待利得を求めてください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(到達可能性)
以下のゲームの木によって表現される展開型ゲーム\(\Gamma \)について考えます。

図:展開型ゲーム
図:展開型ゲーム

純粋戦略の組\begin{equation*}
\left( \left( a_{12}\right) ,\left( a_{21}\right) \right)
\end{equation*}のもとでゲームがそれぞれのノードへ到達する確率を求めた上で、到達可能なノードと情報集合を特定してください。さらに、\(s_{I}\)のもとでそれぞれのプレイヤーが直面する期待利得を求めてください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(到達可能性)
以下のゲームの木によって表現される展開型ゲーム\(\Gamma \)について考えます。

図:展開型ゲーム
図:展開型ゲーム

自然による確率分布は、\begin{equation*}
p\left( \left\{ x_{0}\right\} ,a_{01}\right) =p\left( \left\{ x_{0}\right\}
,a_{02}\right) =\frac{1}{2}
\end{equation*}であるものとします。純粋戦略の組\begin{equation*}
s_{I}=\left( \left( a_{12},a_{14}\right) ,\left( a_{22},a_{23}\right)
\right)
\end{equation*}のもとでゲームがそれぞれのノードへ到達する確率を求めた上で、到達可能なノードと情報集合を特定してください。さらに、\(s_{I}\)のもとでそれぞれのプレイヤーが直面する期待利得を求めてください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(展開型ゲームにおける純粋戦略)
2人のプレイヤー\(1,2\)が\(500\)円硬貨を1枚ずつ持っています。まず、プレイヤー\(1\)は相手に見られないようにしながら、表か裏のどちらか一方の面を上にして自分の硬貨を置きます。続いて、プレイヤー\(2\)もまた表か裏のどちらか一方の面を上にして自分の硬貨を置きます。結果を観察し、2枚の硬貨の面が一致する場合にはプレイヤー\(1\)が硬貨を2枚とも得られる一方で、2枚の硬貨の面が異なる場合にはプレイヤー\(2\)が硬貨を2枚とも得られます。プレイヤーが得る金額を利得とみなします。以上の状況は以下のような展開型ゲームとして表現されます。

図:展開型ゲーム
図:展開型ゲーム

このゲームにおけるそれぞれのプレイヤーの純粋戦略集合を特定してください。さらに、それぞれの頂点について、ゲームがその頂点が到達するためにプレイヤーたちが選ぶべき純粋戦略の組をそれぞれ特定してください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(展開型ゲームにおける純粋戦略)
2人の子供\(1,2\)がプレイヤーです。目の前に2枚のクッキーがあります。まず、子供\(1\)は以下の3つの選択肢の中から1つを相手に提案します。\begin{eqnarray*}&&\left( a\right) \ \text{自分が2枚のクッキーを独り占めする} \\
&&\left( b\right) \ \text{2人でクッキーを1枚ずつ分ける} \\
&&\left( c\right) \ \text{相手にクッキーを2枚ともあげる}
\end{eqnarray*}続いて、子供\(2\)が提案を受け入れるかどうか決定します。子供\(2\)が相手の提案を受け入れる場合には、提案通りにクッキーを2人でわけます。子供\(2\)が相手の提案を受け入れない場合には、2人ともクッキーをもらえません。自分が得るクッキーの枚数を利得とみなします。以上の状況は以下のような展開型ゲームとして表現されます。

図:展開型ゲーム
図:展開型ゲーム

ただし、\begin{eqnarray*}
a_{11} &=&\text{自分が2枚のクッキーを独り占めする。} \\
a_{12} &=&\text{2人でクッキーを1枚ずつ分ける} \\
a_{13} &=&\text{相手にクッキーを2枚ともあげる} \\
a_{21} &=&\text{相手からの提案を受け入れる} \\
a_{22} &=&\text{相手からの提案を受け入れない}
\end{eqnarray*}です。このゲームにおけるそれぞれのプレイヤーの純粋戦略集合を特定してください。さらに、それぞれの頂点について、ゲームがその頂点が到達するためにプレイヤーたちが選ぶべき純粋戦略の組をそれぞれ特定してください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員専用コンテンツです
ログイン】【会員登録