非対称的な利得構造を持つ囚人のジレンマ
これまではプレイヤーたちが同一の利得関数を持つ囚人のジレンマについて考えてきましたが、状況を少し一般化して、プレイヤーたちが異なる利得関数を持つ場合の囚人のジレンマについて考えます。ただ、非対称的な利得構造について考える際にも、囚人のジレンマの特徴である、(1) 裏切り戦略の組\(\left( D,D\right) \)がゲームの強支配戦略均衡である一方で、(2) プレイヤーたちは協調戦略の組\(\left( C,C\right) \)において裏切り戦略の組\(\left( D,D\right) \)の場合よりも大きな利得を得られる、という2点を担保する必要があります。そこで、以下の利得行列によって表されるゲームについて考えます。
$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & C & D \\ \hline
C & b_{1},b_{2} & d_{1},a_{2} \\ \hline
D & a_{1},d_{2} & c_{1},c_{2} \\ \hline
\end{array}$$
ただし、表中の利得の間には、\begin{eqnarray*}
&&\left( A_{1}\right) \ a_{1}>b_{1},\quad c_{1}>d_{1} \\
&&\left( A_{2}\right) \ a_{2}>b_{2},\quad c_{2}>d_{2} \\
&&\left( A_{3}\right) \ b_{1}>c_{1},\quad b_{2}>c_{2}
\end{eqnarray*}という関係がすべて成り立つものとします。条件\(\left( A_{1}\right) \)が成り立つことは、プレイヤー\(1\)にとって裏切り戦略\(D\)が強支配戦略であることを意味し、条件\(\left( A_{2}\right) \)が成り立つことは、プレイヤー\(2\)にとって裏切り戦略\(D\)が強支配戦略であることを意味します。したがって、\(\left( A_{1}\right) \)と\(\left( A_{2}\right) \)が成り立つ場合、裏切り戦略の組\(\left( D,D\right) \)が強支配戦略均衡となります。さらに、条件\(\left( A_{3}\right) \)が成り立つことは、双方とも協調戦略の組\(\left( C,C\right) \)において裏切り戦略の組\(\left( D,D\right) \)の場合よりも大きな利得を得られることを意味します。したがって、以上の3つの条件が成り立つ限りにおいて、このゲームは囚人のジレンマであると言えます。
$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & C & D \\ \hline
C & 5,4 & 1,6 \\ \hline
D & 7,0 & 3,2 \\ \hline
\end{array}$$
ゲームの強支配戦略均衡である\(\left( D,D\right) \)においてプレイヤー\(1\)は利得\(3\)を、プレイヤー\(2\)は利得\(2\)を得ますが、それとは別の純粋戦略の組\(\left( C,C\right) \)においてプレイヤー\(1\)はより大きい利得\(5\)を、プレイヤー\(2\)もまたより大きい利得\(4\)を得られます。
弱い囚人のジレンマ
繰り返しになりますが、非対称的な利得構造を持つ囚人のジレンマを以下の利得行列
$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & C & D \\ \hline
C & b_{1},b_{2} & d_{1},a_{2} \\ \hline
D & a_{1},d_{2} & c_{1},c_{2} \\ \hline
\end{array}$$
によって表現しました。ただし、表中の利得の間には以下の3つの条件\begin{eqnarray*}
\left( A_{1}\right) \ a_{1} &>&b_{1},\quad c_{1}>d_{1} \\
\left( A_{2}\right) \ a_{2} &>&b_{2},\quad c_{2}>d_{2} \\
\left( A_{3}\right) \ b_{1} &>&c_{1},\quad b_{2}>c_{2}
\end{eqnarray*}が成り立ちます。
上の3つの条件それぞれにおいて、一方の不等号\(>\)を等号\(=\)に入れ替えると何が起こるでしょうか。そのような利得構造を持つゲームを弱い囚人のジレンマ(weak prisoner’s dilemma)と呼ぶことがあります。具体例の1つとして、\begin{eqnarray*}
&&\left( B_{1}\right) \ a_{1}=b_{1},\quad c_{1}>d_{1} \\
&&\left( B_{2}\right) \ a_{2}=b_{2},\quad c_{2}>d_{2} \\
&&\left( B_{3}\right) \ b_{1}=c_{1},\quad b_{2}>c_{2}
\end{eqnarray*}が成り立つ場合について考えます。この場合、双方にとって裏切り戦略\(D\)はもはや強支配戦略ではなく弱支配戦略であるため、裏切り戦略の組\(\left( D,D\right) \)は強支配戦略均衡ではなく弱支配戦略均衡となります。したがって、この均衡が実現することを理論的に予測するためには、プレイヤーたちの合理性だけでなく警戒心の仮定もまた必要です。\(b_{2}>c_{2}\)より、プレイヤー\(2\)は依然として均衡である裏切り戦略の組\(\left( D,D\right) \)よりも協調戦略の組\(\left( C,C\right) \)においてより大きな利得を得られます。一方、\(b_{1}=c_{1}\)より、プレイヤー\(1\)にとって両者は無差別です。
$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & C & D \\ \hline
C & 5,4 & 1,4 \\ \hline
D & 5,0 & 5,0 \\ \hline
\end{array}$$
プレイヤー\(1\)にとって裏切り戦略\(D\)は弱支配戦略であり、プレイヤー\(2\)にとって裏切り戦略\(D\)は弱支配戦略です。したがって、\(\left( D,D\right) \)は弱支配戦略均衡です。プレイヤー\(2\)にとって協調戦略の組\(\left( C,D\right) \)は均衡\(\left( D,D\right) \)よりも望ましいですが、プレイヤー\(1\)にとって両者は無差別です。
共有知識の囚人のジレンマ
繰り返しになりますが、非対称的な利得構造を持つ囚人のジレンマを以下の利得行列
$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & C & D \\ \hline
C & b_{1},b_{2} & d_{1},a_{2} \\ \hline
D & a_{1},d_{2} & c_{1},c_{2} \\ \hline
\end{array}$$
によって表現しました。ただし、表中の利得の間には以下の3つの条件\begin{eqnarray*}
&&\left( A_{1}\right) \ a_{1}>b_{1},\quad c_{1}>d_{1} \\
&&\left( A_{2}\right) \ a_{2}>b_{2},\quad c_{2}>d_{2} \\
&&\left( A_{3}\right) \ b_{1}>c_{1},\quad b_{2}>c_{2}
\end{eqnarray*}が成り立ちます。
上の条件\(\left( A_{1}\right) ,\left( A_{2}\right) \)のどちらか一方について、2つある不等式のうちの最初の方を削除したら何が起こるでしょうか。そのような利得構造を持つゲームを共有知識の囚人のジレンマ(common knowledge prisoner’s dilemma)と呼ぶことがあります。具体例の1つとして、\begin{eqnarray*}
&&\left( C_{1}\right) \ c_{1}>d_{1} \\
&&\left( C_{2}\right) \ a_{2}>b_{2},\quad c_{2}>d_{2} \\
&&\left( C_{3}\right) \ b_{1}>c_{1},\quad b_{2}>c_{2}
\end{eqnarray*}が成り立つ場合について考えます。この場合、プレイヤー\(1\)にとって裏切り戦略\(D\)が強支配戦略であることは明らかではないため、裏切り戦略の組\(\left( D,D\right) \)は強支配戦略均衡ではありません。そこで、プレイヤーの合理性が共有知識であることを仮定した上で、強支配される戦略の逐次消去を用いてゲームを解いてみましょう。
初期ゲーム\(G\)におけるそれぞれのプレイヤーの純粋戦略集合は、\begin{equation*}
S_{1}=S_{2}=\left\{ C,D\right\}
\end{equation*}です。条件\(\left( C_{2}\right) \)より、初期ゲーム\(G\)においてプレイヤー\(2\)は純粋戦略\(D\)によって強支配される純粋戦略\(C\)を持ちます。したがって、その戦略を消去すると、第1期のゲーム\(G_{1}\)におけるそれぞれのプレイヤーの純粋戦略集合は、\begin{equation*}
S_{1}^{1}=\left\{ C,D\right\} ,\quad S_{2}^{1}=\left\{ D\right\}
\end{equation*}となります。条件\(\left( C_{1}\right) \)より、第1期のゲーム\(G\)においてプレイヤー\(1\)は純粋戦略\(D\)によって強支配される純粋戦略\(C\)を持ちます。したがって、その戦略を消去すると、第2期のゲーム\(G_{2}\)におけるそれぞれのプレイヤーの純粋戦略集合は、\begin{equation*}
S_{1}^{2}=S_{2}^{2}=\left\{ D\right\}
\end{equation*}となるため、ゲームは純粋戦略によって強支配される戦略の逐次消去によって解くことができ、その解は\(\left( D,D\right) \)となります。さらに条件\(\left( C_{3}\right) \)より、逐次消去による解\(\left( D,D\right) \)とは別の純粋戦略の組\(\left( C,C\right) \)において両者はより大きな利得を得られます。
次回は軍拡競争が囚人のジレンマとしての側面を持つことを解説します。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】