非対称的な利得構造を持つ囚人のジレンマ

非対称的な囚人のジレンマ

これまではプレイヤーたちが同一の利得関数を持つ囚人のジレンマについて考えてきましたが、状況を少し一般化して、プレイヤーたちが異なる利得関数を持つ場合の囚人のジレンマについて考えます。ただ、非対称的な利得構造について考える際にも、囚人のジレンマの特徴である、(1) 裏切り戦略の組$\left( D,D\right) $が狭義の支配戦略均衡である一方で、(2) プレイヤーたちは均衡ではない協調戦略の組$\left( C,C\right) $において均衡である裏切り戦略の組$\left( D,D\right) $の場合よりも大きな利得を得られる、という2点を担保する必要があります。そこで、以下の利得行列によって表される戦略型ゲーム$G$について考えます。

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & C & D \\ \hline
C & b_{1},b_{2} & d_{1},a_{2} \\ \hline
D & a_{1},d_{2} & c_{1},c_{2} \\ \hline
\end{array}$$

表：非対称的な囚人のジレンマ

ただし、表中の利得の間には、\begin{eqnarray*}
&&\left( A_{1}\right) \ a_{1}>b_{1}\wedge c_{1}>d_{1} \\
&&\left( A_{2}\right) \ a_{2}>b_{2}\wedge c_{2}>d_{2} \\
&&\left( A_{3}\right) \ b_{1}>c_{1}\wedge b_{2}>c_{2}
\end{eqnarray*}などの関係が成り立つものとします。条件$\left( A_{1}\right) $が成り立つことは、プレイヤー$1$にとって裏切り戦略$D$が狭義の支配戦略であることを意味し、条件$\left( A_{2}\right) $が成り立つことは、プレイヤー$2$にとって裏切り戦略$D$が狭義の支配戦略であることを意味します。したがって、$\left( A_{1}\right) $と$\left( A_{2}\right) $が成り立つ場合、裏切り戦略の組$\left( D,D\right) $が狭義の支配戦略均衡となります。さらに、条件$\left( A_{3}\right) $が成り立つことは、双方とも協調戦略の組$\left( C,C\right) $において裏切り戦略の組$\left( D,D\right) $の場合よりも大きな利得を得られることを意味します。したがって、以上の3つの条件が成り立つ限りにおいて、このゲームは囚人のジレンマであると言えます。

命題（非対称な囚人のジレンマの均衡）

戦略型ゲーム$G$のプレイヤー集合は$I=\left\{ 1,2\right\} $であり、それぞれのプレイヤー$i\in I$の純粋戦略集合は$S_{i}=\left\{ C,D\right\} $であり、利得関数$u_{i}:S_{1}\times S_{2}\rightarrow \mathbb{R} $は、\begin{eqnarray*}&&\left( A_{1}\right) \ a_{1}>b_{1}\wedge c_{1}>d_{1} \\
&&\left( A_{2}\right) \ a_{2}>b_{2}\wedge c_{2}>d_{2} \\
&&\left( A_{3}\right) \ b_{1}>c_{1}\wedge b_{2}>c_{2}
\end{eqnarray*}を満たす実数$a_{1},a_{2},b_{1},b_{2},c_{1},c_{2},d_{1},d_{2}\in \mathbb{R} $を用いて、以下の利得行列

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & C & D \\ \hline
C & b_{1},b_{2} & d_{1},a_{2} \\ \hline
D & a_{1},d_{2} & c_{1},c_{2} \\ \hline
\end{array}$$

表：利得行列

によって表現されているものとする。このゲーム$G$には狭義の支配戦略均衡が存在し、それは$\left( D,D\right) $である。

証明

プレミアム会員専用コンテンツです
【ログイン】【会員登録】

戦略型ゲーム$G$に狭義の支配戦略均衡が存在する場合、プレイヤーたちが合理的であるという事実が共有知識でない場合においても、それぞれのプレイヤーが合理的でありさえすれば、プレイヤーたちはその均衡をプレーします。非対称的な囚人のジレンマでは裏切り戦略の組$\left( D,D\right) $が狭義の支配戦略均衡であるため、それぞれのプレイヤーが合理的であれば、彼らは均衡$\left( D,D\right) $を実際にプレーすることが予測されます。

例（非対称的な囚人のジレンマ）

以下の利得行列で表されるゲームは非対称な囚人のジレンマとしての要件を満たしています。

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & C & D \\ \hline
C & 5,4 & 1,6 \\ \hline
D & 7,0 & 3,2 \\ \hline
\end{array}$$

表：囚人のジレンマ

ゲームの狭義の支配戦略均衡である裏切り戦略の組$\left( D,D\right) $においてプレイヤー$1$は利得$3$を、プレイヤー$2$は利得$2$を得ますが、それとは別の協調戦略の組$\left( C,C\right) $においてプレイヤー$1$はより大きい利得$5$を、プレイヤー$2$もまたより大きい利得$4$を得られます。

広義の囚人のジレンマ

繰り返しになりますが、非対称的な囚人のジレンマを以下の利得行列

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & C & D \\ \hline
C & b_{1},b_{2} & d_{1},a_{2} \\ \hline
D & a_{1},d_{2} & c_{1},c_{2} \\ \hline
\end{array}$$

表：非対称的な囚人のジレンマ

によって表現しました。ただし、表中の利得の間には以下の3つの条件\begin{eqnarray*}
&&\left( A_{1}\right) \ a_{1}>b_{1}\wedge c_{1}>d_{1} \\
&&\left( A_{2}\right) \ a_{2}>b_{2}\wedge c_{2}>d_{2} \\
&&\left( A_{3}\right) \ b_{1}>c_{1}\wedge b_{2}>c_{2}
\end{eqnarray*}が成り立ちます。

上の3つの条件それぞれにおいて、一方の不等号$>$を等号$=$に入れ替えると何が起こるでしょうか。そのような利得構造を持つゲームを広義の囚人のジレンマ（weakprisoner’s dilemma）と呼びます。具体例の1つとして、\begin{eqnarray*}
&&\left( A_{1}\right) \ a_{1}=b_{1}\wedge c_{1}>d_{1} \\
&&\left( A_{2}\right) \ a_{2}=b_{2}\wedge c_{2}>d_{2} \\
&&\left( A_{3}\right) \ b_{1}=c_{1}\wedge b_{2}>c_{2}
\end{eqnarray*}が成り立つ状況を想定します。この場合、2人にとって裏切り戦略$D$はもはや狭義の支配戦略ではなく広義の支配戦略であるため、裏切り戦略の組$\left( D,D\right) $は狭義の支配戦略均衡ではなく広義の支配戦略均衡となります。

命題（広義の囚人のジレンマの均衡）

戦略型ゲーム$G$のプレイヤー集合は$I=\left\{ 1,2\right\} $であり、それぞれのプレイヤー$i\in I$の純粋戦略集合は$S_{i}=\left\{ C,D\right\} $であり、利得関数$u_{i}:S_{1}\times S_{2}\rightarrow \mathbb{R} $は、\begin{eqnarray*}&&\left( A_{1}\right) \ a_{1}=b_{1}\wedge c_{1}>d_{1} \\
&&\left( A_{2}\right) \ a_{2}=b_{2}\wedge c_{2}>d_{2} \\
&&\left( A_{3}\right) \ b_{1}=c_{1}\wedge b_{2}>c_{2}
\end{eqnarray*}を満たす実数$a_{1},a_{2},b_{1},b_{2},c_{1},c_{2},d_{1},d_{2}\in \mathbb{R} $を用いて、以下の利得行列
$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & C & D \\ \hline
C & b_{1},b_{2} & d_{1},a_{2} \\ \hline
D & a_{1},d_{2} & c_{1},c_{2} \\ \hline
\end{array}$$

表：利得行列

によって表現されているものとする。このゲーム$G$には広義の支配戦略均衡が存在し、それは$\left( D,D\right) $である。

証明

プレミアム会員専用コンテンツです
【ログイン】【会員登録】

戦略型ゲーム$G$に広義の支配戦略均衡が存在する場合、均衡が実現することを理論的に予測するためには、プレイヤーたちの合理性だけでなく警戒心の仮定もまた必要です。広義の囚人のジレンマでは裏切り戦略の組$\left( D,D\right) $が広義の支配戦略均衡であるため、それぞれのプレイヤーが合理的かつ十分な警戒心を持っていれば、彼らは均衡$\left( D,D\right) $を実際にプレーすることが予測されます。

例（広義の囚人のジレンマ）

以下の利得行列で表されるゲームは広義の囚人のジレンマとしての要件を満たしています。

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & C & D \\ \hline
C & 5,4 & 1,4 \\ \hline
D & 5,0 & 5,0 \\ \hline
\end{array}$$

表：広義の囚人のジレンマ

プレイヤー$1$にとって裏切り戦略$D$は広義の支配戦略であり、プレイヤー$2$にとって裏切り戦略$D$は広義の支配戦略です。したがって、$\left( D,D\right) $は広義の支配戦略均衡です。プレイヤー$2$にとって協調戦略の組$\left( C,D\right) $は均衡$\left( D,D\right) $よりも望ましいですが、プレイヤー$1$にとって両者は無差別です。

共有知識の囚人のジレンマ

繰り返しになりますが、非対称的な利得構造を持つ囚人のジレンマを以下の利得行列

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & C & D \\ \hline
C & b_{1},b_{2} & d_{1},a_{2} \\ \hline
D & a_{1},d_{2} & c_{1},c_{2} \\ \hline
\end{array}$$

表：非対称的な囚人のジレンマ

上の条件$\left( A_{1}\right) ,\left( A_{2}\right) $のどちらか一方について、2つある不等式のうちの最初の方を削除したら何が起こるでしょうか。そのような利得構造を持つゲームを共有知識の囚人のジレンマ（common knowledge prisoner’s dilemma）と呼ぶことがあります。具体例の1つとして、\begin{eqnarray*}&&\left( C_{1}\right) \ c_{1}>d_{1} \\
&&\left( C_{2}\right) \ a_{2}>b_{2}\wedge c_{2}>d_{2} \\
&&\left( C_{3}\right) \ b_{1}>c_{1}\wedge b_{2}>c_{2}
\end{eqnarray*}が成り立つ場合について考えます。この場合、プレイヤー$1$にとって裏切り戦略$D$が狭義の支配戦略であることは明らかではないため、裏切り戦略の組$\left( D,D\right) $は狭義の支配戦略均衡ではありません。そこで、プレイヤーの合理性が共有知識であることを仮定した上で、狭義支配される戦略の逐次消去を用いてゲームを解いてみましょう。

命題（共有知識の囚人のジレンマの均衡）

戦略型ゲーム$G$のプレイヤー集合は$I=\left\{ 1,2\right\} $であり、それぞれのプレイヤー$i\in I$の純粋戦略集合は$S_{i}=\left\{ C,D\right\} $であり、利得関数$u_{i}:S_{1}\times S_{2}\rightarrow \mathbb{R} $は、\begin{eqnarray*}&&\left( C_{1}\right) \ c_{1}>d_{1} \\
&&\left( C_{2}\right) \ a_{2}>b_{2}\wedge c_{2}>d_{2} \\
&&\left( C_{3}\right) \ b_{1}>c_{1}\wedge b_{2}>c_{2}
\end{eqnarray*}を満たす実数$a_{2},b_{1},b_{2},c_{1},c_{2},d_{1},d_{2}\in \mathbb{R} $を用いて、以下の利得行列
$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & C & D \\ \hline
C & b_{1},b_{2} & d_{1},a_{2} \\ \hline
D & a_{1},d_{2} & c_{1},c_{2} \\ \hline
\end{array}$$

表：利得行列

によって表現されているものとする。このゲーム$G$は純粋戦略によって強支配される戦略の逐次消去によって解くことでき、その解は$\left( D,D\right) $である。

証明

プレミアム会員専用コンテンツです
【ログイン】【会員登録】

戦略型ゲーム$G$が純粋戦略によって狭義支配される戦略の逐次消去によって解くことができる場合、その解が実現することを理論的に予測するためには、プレイヤーたちの合理性が共有知識である必要があります。共有知識の囚人のジレンマでは裏切り戦略の組$\left(D,D\right) $が狭義支配される戦略の逐次消去の解であるため、それぞれのプレイヤーが合理的であることが共有知識であれば、彼らは$\left( D,D\right) $を実際にプレーすることが予測されます。

例（共有知識の囚人のジレンマ）

以下の利得行列で表されるゲームは広義の囚人のジレンマとしての要件を満たしています。

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & C & D \\ \hline
C & 5,5 & 2,6 \\ \hline
D & 3,3 & 4,4 \\ \hline
\end{array}$$

表：広義の囚人のジレンマ

プレイヤー$1$は支配戦略を持たないため、このゲームには支配戦略均衡は存在しません。一方、狭義支配される戦略の逐次消去を適用すると解$\left( D,D\right) $が得られます。ただ、両者にとって$\left( D,D\right) $よりも$\left( C,C\right) $のほうが望ましい結果です。

次回は軍拡競争が囚人のジレンマとしての側面を持つことを解説します。

WIIS

数学のコース

経済学のコース

アカウント

WIIS

ゲームの例

目次

関連知識

非対称的な囚人のジレンマ

広義の囚人のジレンマ

共有知識の囚人のジレンマ

関連知識

質問とコメント

LEARN MORE

さらに深く学びたい人のための会員サービス

論理

集合

実数

ユークリッド空間

微分積分

測度

確率