n人囚人のジレンマ

$n$人囚人のジレンマ

復習になりますが、囚人のジレンマは完備情報の静学ゲームであり、それを表現する戦略型ゲーム$G$のプレイヤー集合は$I=\left\{1,2\right\} $であり、それぞれのプレイヤー$i\in I$の純粋戦略集合は$S_{i}=\left\{ C,D\right\} $であり、利得関数$u_{i}:S_{1}\times S_{2}\rightarrow \mathbb{R} $は、\begin{equation*}a>b>c>d
\end{equation*}を満たす実数$a,b,c,d\in \mathbb{R} $を用いて、以下の利得行列
$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & C & D \\ \hline
C & b,b & d,a \\ \hline
D & a,d & c,c \\ \hline
\end{array}$$

表：利得行列

として表現されます。囚人のジレンマには2つのポイントがあります。1つ目は、このゲーム$G$では裏切り戦略の組$\left( D,D\right) $が狭義の支配戦略均衡になるという点です。2つ目は、この均衡$\left( D,D\right) $と比べた場合、均衡ではない協調戦略の組$\left( C,C\right) $において2人のプレイヤーはより多くの利得を得られるという点です。

囚人のジレンマは2人ゲームですが、これを3人以上のゲームへ拡張するためにはどうすればよいでしょうか。一般に、$n$人のプレイヤーが参加する囚人のジレンマを$n$人囚人のジレンマ（$n$-person prisoner’s dilemma）と呼びます。囚人のジレンマは$n$人囚人のジレンマの特別なケース（$n=2$）です。

$n$人囚人のジレンマを表す戦略型ゲーム$G$のプレイヤー集合は$I=\left\{1,\cdots ,n\right\} $であり、それぞれのプレイヤー$i\in I$の純粋戦略集合は$S_{i}=\left\{C,D\right\} $です。ただし、$C$は協調戦略であり、$D$は裏切り戦略です。問題は、それぞれのプレイヤー$i$の利得関数$u_{i}:S_{I}\rightarrow \mathbb{R} $をどのように記述するかです。

囚人のジレンマの本質の1つは、それぞれのプレイヤーにとって、裏切り戦略$D$が協調戦略$C$を狭義支配するという点です。つまり、他のプレイヤーたちの行動がどのようなものであれ、自分は裏切り戦略$D$を選んだ方が、協調戦略$C$を選ぶ場合よりも常により大きい利得を得られるという点が重要です。それぞれのプレイヤーが自分を除く$n-1$人のプレイヤーを個人として区別しないのであれば、これは、自分を除く$n-1$人のプレイヤーの中の何人が協調戦略$C$を選ぶかに関わらず、自分は裏切り戦略$D$を選んだ方が、協調戦略$C$を選ぶ場合よりも常に大きい利得を得られることとして言い換え可能です。そこで、プレイヤー$i$を除く$n-1$人のプレイヤーの中で協調戦略$C$を選ぶ人数が$c\ \left( =0,1,\cdots ,n-1\right) $であるときにプレイヤー$i$が純粋戦略$s_{i}\in S_{i}$を選ぶことで得られる利得を$u_{i}\left( s_{i},c\right) $で表記するのであれば、プレイヤー$i$にとって裏切り戦略$D$が協調戦略$C$を狭義支配することは、\begin{equation}\forall c\in \left\{ 0,1,\cdots ,n-1\right\} :u_{i}\left( D,c\right)
>u_{i}\left( C,c\right) \quad \cdots (1)
\end{equation}が成り立つこととして表現できます。以上の条件が任意のプレイヤー$i\in I$について成り立つものと定めます。

囚人のジレンマのもう1つの本質は、全員が協調戦略$C$を選ぶことは均衡ではないものの、仮にそれが実現すれば、均衡にしたがって全員が裏切り戦略$D$を選ぶ場合よりも全員がより大きな利得を得られるという点です。これは、任意のプレイヤー$i\in I$について、\begin{equation}u_{i}\left( C,n-1\right) >u_{i}\left( D,0\right) \quad \cdots (2)
\end{equation}が成り立つこととして表現可能です。

例（囚人のジレンマ）

囚人のジレンマの定義より、プレイヤー$1$の利得関数$u_{1}:S_{1}\times S_{2}\rightarrow \mathbb{R} $は、\begin{equation*}u_{1}\left( D,C\right) >u_{1}\left( C,C\right) >u_{1}\left( D,D\right)
>u_{1}\left( C,D\right)
\end{equation*}を満たします。囚人のジレンマは$n$人囚人のジレンマの特別なケース（$n=2$）であるため、そこでのプレイヤーの利得関数もまた上の条件$\left( 1\right) ,\left( 2\right) $を満たすはずです。まず、プレイヤー$1$の利得関数$u_{1}$に関して条件$\left( 1\right) $が成り立つこととは、\begin{eqnarray*}&&\left( a\right) \ u_{1}\left( D,C\right) >u_{1}\left( C,C\right) \\
&&\left( b\right) \ u_{1}\left( D,D\right) >u_{1}\left( C,D\right)
\end{eqnarray*}がともに成り立つことを意味し、条件$\left(2\right) $が成り立つこととは、\begin{equation*}\left( c\right) \ u_{1}\left( C,C\right) >u_{1}\left( D,D\right)
\end{equation*}が成り立つことを意味します。$\left( a\right) ,\left( b\right),\left( c\right) $より、\begin{equation*}u_{1}\left( D,C\right) >u_{1}\left( C,C\right) >u_{1}\left( D,D\right)
>u_{1}\left( C,D\right)
\end{equation*}が成り立ちますが、これは囚人のジレンマの定義に他なりません。プレイヤー$2$の利得関数についても同様です。つまり、$n=2$であるとき、$n$人囚人のジレンマのプレイヤーの利得関数に関して$\left( 1\right) ,\left( 2\right) $が成り立つことは、それが囚人のジレンマであるための必要十分条件です。

例（3人囚人のジレンマ）

3人囚人のジレンマを表す戦略型ゲーム$G$のプレイヤー集合は$I=\left\{1,2,3\right\} $であり、それぞれのプレイヤー$i\in I$の純粋戦略集合は$S_{i}=\left\{C,D\right\} $です。プレイヤー$1$の利得関数$u_{1}:S_{1}\times S_{2}\times S_{3}\rightarrow \mathbb{R} $に関して関して条件$\left( 1\right) $が成り立つことは、\begin{eqnarray*}&&\left( a\right) \ u_{1}\left( D,C,C\right) >u_{1}\left( C,C,C\right) \\
&&\left( b\right) \ u_{1}\left( D,C,D\right) =u_{1}\left( D,D,C\right)
>u_{1}\left( C,D,C\right) =u_{1}\left( C,C,D\right) \\
&&\left( c\right) \ u_{1}\left( D,D,D\right) >u_{1}\left( C,D,D\right)
\end{eqnarray*}がすべて成り立つことを意味します。ただし、$\left( b\right) $中の等号は、プレイヤー$1$が他の2人のプレイヤーを個人として区別しないという仮定を反映しています。また、条件$\left( 2\right) $が成り立つことは、\begin{equation*}\left( d\right) \ u_{1}\left( C,C,C\right) >u_{1}\left( D,D,D\right)
\end{equation*}が成り立つことを意味します。$\left( a\right) ,\left( c\right),\left( d\right) $より、\begin{equation*}u_{1}\left( D,C,C\right) >u_{1}\left( C,C,C\right) >u_{1}\left( D,D,D\right)
>u_{1}\left( C,D,D\right)
\end{equation*}が成り立ちます。つまり、2人の相手がともに$C$を選ぶ場合に自分が得る利得と、2人の相手がともに$D$を選ぶ場合に自分が得る利得の間には順序が定まりますが、それらの場合と、2人の相手の一方だけが$C$を選ぶ場合に自分が得る利得の間には順序が定められていません。それらの間の順序も定めるためには、条件$\left( 1\right) ,\left( 2\right) $とは異なる新たな条件が必要です。

最後の例が示唆するように、プレイヤーが3人以上の場合には、先に定めた条件$\left(1\right) ,\left( 2\right) $とは別の条件が必要です。そこで、それぞれのプレイヤー$i\in I$について、自分が裏切り戦略$D$を選んだ場合の利得$u_{i}\left(D,c\right) $と、自分が協調戦略$C$を選んだ場合の利得$u_{i}\left( C,c\right) $はともに、$c$に関する狭義単調増加関数であるものと定めます。つまり、自分が協調戦略$C$と裏切り戦略$D$のどちらを選ぶ場合においても、自分以外のプレイヤーたちの中で協調戦略$C$を選ぶ者の人数が多ければ多いほど、自分はより多くの利得を得られることを仮定するということです。

例（囚人のジレンマ）

例（3人囚人のジレンマ）

以上が$n$人囚人のジレンマの定義です。改めて整理すると、$n$人囚人のジレンマとは、以下の条件を満たす戦略型ゲーム$G$によって表現される完備情報の静学ゲームです。まず、プレイヤー集合は$I=\left\{ 1,\cdots ,n\right\} $であり、それぞれのプレイヤー$i\in I$の純粋戦略集合は$S_{i}=\left\{ C,D\right\} $です。ただし、$C$は協調戦略であり、$D$は裏切り戦略です。それぞれのプレイヤー$i$の利得関数は、自分が選ぶ純粋戦略$s_{i}\in S_{i}$と、自分以外の$n-1$人のプレイヤーの中で協調戦略$C$を選ぶ人数$c\in \left\{ 0,1,\cdots,n-1\right\} $を変数として持つ関数$u_{i}:S_{i}\times \left\{ 0,1,\cdots ,n-1\right\}\rightarrow \mathbb{R} $であり、以下の条件\begin{eqnarray*}&&\left( a\right) \ \forall c\in \left\{ 0,1,\cdots ,n-1\right\}
:u_{i}\left( D,c\right) >u_{i}\left( C,c\right) \\
&&\left( b\right) \ u_{i}\left( C,n-1\right) >u_{i}\left( D,0\right) \\
&&\left( c\right) \ u_{i}\left( D,c\right) \text{と}u_{i}\left(
C,c\right) \text{は}c\text{に関する狭義単調増加関数}
\end{eqnarray*}をすべて満たすものとして定義されます。

$n$人囚人のジレンマの均衡

通常の囚人のジレンマと同様、$n$人囚人のジレンマにおいても、すべてのプレイヤーが裏切り戦略を選ぶことが狭義の支配戦略均衡になります。

命題（n人囚人のジレンマの狭義の支配戦略均衡）

戦略型ゲーム$G$のプレイヤー集合は$I=\left\{ 1,\cdots,n\right\} $であり、それぞれのプレイヤー$i\in I$の純粋戦略集合は$S_{i}=\left\{ C,D\right\} $であり、利得関数$u_{i}:S_{i}\times \left\{ 0,1,\cdots ,n-1\right\} \rightarrow \mathbb{R} $は以下のすべての条件\begin{eqnarray*}&&\left( a\right) \ \forall c\in \left\{ 0,1,\cdots ,n-1\right\}
:u_{i}\left( D,c\right) >u_{i}\left( C,c\right) \\
&&\left( b\right) \ u_{i}\left( C,n-1\right) >u_{i}\left( D,0\right) \\
&&\left( c\right) \ u_{i}\left( D,c\right) \text{と}u_{i}\left(
C,c\right) \text{は}c\text{に関する狭義単調増加関数}
\end{eqnarray*}を満たすものとする。ただし、$c$はプレイヤー$i$を除く$n-1$人のプレイヤーの中で協調戦略$C$を選ぶ人数である。このゲーム$G$には狭義の支配戦略均衡が存在し、それはすべてのプレイヤーが$D$を選ぶことである。

証明

プレミアム会員専用コンテンツです
【ログイン】【会員登録】

一般に、戦略型ゲーム$G$に狭義の支配戦略均衡が存在する場合には一意的であるため、裏切り戦略の組は$n$人囚人のジレンマにおける唯一の狭義の支配戦略均衡です。

プレイヤーが混合戦略を採用する場合にはどうなるでしょうか。一般に、戦略型ゲーム$G$に狭義の支配戦略均衡が存在することと、$G$の混合拡張$G^{\ast }$に狭義の支配戦略均衡が存在することは必要十分であるとともに、両者は一致します。したがって、裏切り戦略の組は混合戦略の範囲においても狭義の支配戦略均衡です。

戦略型ゲーム$G$に狭義の支配戦略均衡が存在する場合、プレイヤーたちが合理的であるという事実が共有知識でない場合においても、それぞれのプレイヤーが合理的でありさえすれば、プレイヤーたちはその均衡をプレーします。$n$人囚人のジレンマでは裏切り戦略の組が狭義の支配戦略均衡であるため、それぞれのプレイヤーが合理的であれば、彼らはその均衡を実際にプレーすることが予測されます。

$n$人囚人のジレンマにおいてそれぞれのプレイヤーは、他のプレイヤーたちが選択する行動がいかなるものであっても、自分は自白$D$したほうが黙秘$C$する場合よりもより大きな利得を得られます（$D$が$C$を狭義支配する）。したがって、プレイヤーが合理的である限りにおいて自白$D$を選びます。しかし、全員が自白$D$を選んだ場合に自分が得る利得は、全員が黙秘を選んだときに自分が得る利得よりも小さくなってしまいます。他のプレイヤーたちにとっても事情は同じであるため、自分だけでなく他のプレイヤーたちにとっても全員が$C$を選ぶことは全員が$D$を選ぶことよりも望ましいはずです。つまり、それぞれのプレイヤーが自己の利得を最大化するために行動する場合、得られる結果は他のプレイヤーにとってだけでなく自分にとっても最適なものにならないという意味において、$n$人囚人のジレンマは興味深い例になっています。

演習問題

問題（3人囚人のジレンマ）

ある戦略型ゲーム$G$のプレイヤー集合は$I=\left\{1,2,3\right\} $であり、それぞれのプレイヤー$i\in I$の純粋戦略集合は$S_{i}=\left\{C,D\right\} $です。プレイヤーの利得関数は以下の条件を満たすものとします。このゲームが3人囚人のジレンマであることを示してください。

全員が$C$を選ぶ場合、全員が利得$3$を得る。
2人が$C$を選び$1$人が$D$を選ぶ場合、$C$を選んだプレイヤーは利得$2$を得て、$D$を選んだプレイヤーは利得$4$を得る。
1人が$C$を選び$2$人が$D$を選ぶ場合、$C$を選んだプレイヤーは利得$1$を得て、$D$を選んだプレイヤーは利得$3$を得る。
全員が$D$を選ぶ場合、全員が利得$2$を得る。

解答を見る

プレミアム会員専用コンテンツです
【ログイン】【会員登録】

問題（n人囚人のジレンマ）

$n$人囚人のジレンマであるような現実の事例を具体的に提示してください。

次回はプレイヤーたちが異なる利得関数を持つ場合の囚人のジレンマについて解説します。

WIIS

数学のコース

経済学のコース

アカウント

WIIS

ゲームの例

目次

関連知識

\(n\)人囚人のジレンマ

\(n\)人囚人のジレンマの均衡

演習問題

関連知識

質問とコメント

LEARN MORE

さらに深く学びたい人のための会員サービス

論理

集合

実数

ユークリッド空間

微分積分

測度

確率