教材一覧
教材一覧
教材検索
EXAMPLES OF GAMES

n人囚人のジレンマ

目次

Share on twitter
Twitterで共有
Share on email
メールで共有

\(n\)人囚人のジレンマ

復習になりますが、囚人のジレンマは完備情報の静学ゲームであり、それを表現する戦略型ゲーム\(G\)のプレイヤー集合は\(I=\left\{1,2\right\} \)であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は\(S_{i}=\left\{ C,D\right\} \)であり、利得関数\(u_{i}:S_{1}\times S_{2}\rightarrow \mathbb{R} \)は、\begin{equation*}a>b>c>d
\end{equation*}を満たす実数\(a,b,c,d\in \mathbb{R} \)を用いて、以下の利得行列
$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & C & D \\ \hline
C & b,b & d,a \\ \hline
D & a,d & c,c \\ \hline
\end{array}$$

表:利得行列

として表現されます。囚人のジレンマには2つのポイントがあります。1つ目は、このゲーム\(G\)では裏切り戦略の組\(\left( D,D\right) \)が狭義の支配戦略均衡になるという点です。2つ目は、この均衡\(\left( D,D\right) \)と比べた場合、均衡ではない協調戦略の組\(\left( C,C\right) \)において2人のプレイヤーはより多くの利得を得られるという点です。

囚人のジレンマは2人ゲームですが、これを3人以上のゲームへ拡張するためにはどうすればよいでしょうか。一般に、\(n\)人のプレイヤーが参加する囚人のジレンマを\(n\)人囚人のジレンマ(\(n\)-person prisoner’s dilemma)と呼びます。囚人のジレンマは\(n\)人囚人のジレンマの特別なケース(\(n=2\))です。

\(n\)人囚人のジレンマを表す戦略型ゲーム\(G\)のプレイヤー集合は\(I=\left\{1,\cdots ,n\right\} \)であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は\(S_{i}=\left\{C,D\right\} \)です。ただし、\(C\)は協調戦略であり、\(D\)は裏切り戦略です。問題は、それぞれのプレイヤー\(i\)の利得関数\(u_{i}:S_{I}\rightarrow \mathbb{R} \)をどのように記述するかです。

囚人のジレンマの本質の1つは、それぞれのプレイヤーにとって、裏切り戦略\(D\)が協調戦略\(C\)を狭義支配するという点です。つまり、他のプレイヤーたちの行動がどのようなものであれ、自分は裏切り戦略\(D\)を選んだ方が、協調戦略\(C\)を選ぶ場合よりも常により大きい利得を得られるという点が重要です。それぞれのプレイヤーが自分を除く\(n-1\)人のプレイヤーを個人として区別しないのであれば、これは、自分を除く\(n-1\)人のプレイヤーの中の何人が協調戦略\(C\)を選ぶかに関わらず、自分は裏切り戦略\(D\)を選んだ方が、協調戦略\(C\)を選ぶ場合よりも常に大きい利得を得られることとして言い換え可能です。そこで、プレイヤー\(i\)を除く\(n-1\)人のプレイヤーの中で協調戦略\(C\)を選ぶ人数が\(c\ \left( =0,1,\cdots ,n-1\right) \)であるときにプレイヤー\(i\)が純粋戦略\(s_{i}\in S_{i}\)を選ぶことで得られる利得を\(u_{i}\left( s_{i},c\right) \)で表記するのであれば、プレイヤー\(i\)にとって裏切り戦略\(D\)が協調戦略\(C\)を狭義支配することは、\begin{equation}\forall c\in \left\{ 0,1,\cdots ,n-1\right\} :u_{i}\left( D,c\right)
>u_{i}\left( C,c\right) \quad \cdots (1)
\end{equation}が成り立つこととして表現できます。以上の条件が任意のプレイヤー\(i\in I\)について成り立つものと定めます。

囚人のジレンマのもう1つの本質は、全員が協調戦略\(C\)を選ぶことは均衡ではないものの、仮にそれが実現すれば、均衡にしたがって全員が裏切り戦略\(D\)を選ぶ場合よりも全員がより大きな利得を得られるという点です。これは、任意のプレイヤー\(i\in I\)について、\begin{equation}u_{i}\left( C,n-1\right) >u_{i}\left( D,0\right) \quad \cdots (2)
\end{equation}が成り立つこととして表現可能です。

例(囚人のジレンマ)
囚人のジレンマの定義より、プレイヤー\(1\)の利得関数\(u_{1}:S_{1}\times S_{2}\rightarrow \mathbb{R} \)は、\begin{equation*}u_{1}\left( D,C\right) >u_{1}\left( C,C\right) >u_{1}\left( D,D\right)
>u_{1}\left( C,D\right)
\end{equation*}を満たします。囚人のジレンマは\(n\)人囚人のジレンマの特別なケース(\(n=2\))であるため、そこでのプレイヤーの利得関数もまた上の条件\(\left( 1\right) ,\left( 2\right) \)を満たすはずです。まず、プレイヤー\(1\)の利得関数\(u_{1}\)に関して条件\(\left( 1\right) \)が成り立つこととは、\begin{eqnarray*}&&\left( a\right) \ u_{1}\left( D,C\right) >u_{1}\left( C,C\right) \\
&&\left( b\right) \ u_{1}\left( D,D\right) >u_{1}\left( C,D\right)
\end{eqnarray*}がともに成り立つことを意味し、条件\(\left(2\right) \)が成り立つこととは、\begin{equation*}\left( c\right) \ u_{1}\left( C,C\right) >u_{1}\left( D,D\right)
\end{equation*}が成り立つことを意味します。\(\left( a\right) ,\left( b\right),\left( c\right) \)より、\begin{equation*}u_{1}\left( D,C\right) >u_{1}\left( C,C\right) >u_{1}\left( D,D\right)
>u_{1}\left( C,D\right)
\end{equation*}が成り立ちますが、これは囚人のジレンマの定義に他なりません。プレイヤー\(2\)の利得関数についても同様です。つまり、\(n=2\)であるとき、\(n\)人囚人のジレンマのプレイヤーの利得関数に関して\(\left( 1\right) ,\left( 2\right) \)が成り立つことは、それが囚人のジレンマであるための必要十分条件です。
例(3人囚人のジレンマ)
3人囚人のジレンマを表す戦略型ゲーム\(G\)のプレイヤー集合は\(I=\left\{1,2,3\right\} \)であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は\(S_{i}=\left\{C,D\right\} \)です。プレイヤー\(1\)の利得関数\(u_{1}:S_{1}\times S_{2}\times S_{3}\rightarrow \mathbb{R} \)に関して関して条件\(\left( 1\right) \)が成り立つことは、\begin{eqnarray*}&&\left( a\right) \ u_{1}\left( D,C,C\right) >u_{1}\left( C,C,C\right) \\
&&\left( b\right) \ u_{1}\left( D,C,D\right) =u_{1}\left( D,D,C\right)
>u_{1}\left( C,D,C\right) =u_{1}\left( C,C,D\right) \\
&&\left( c\right) \ u_{1}\left( D,D,D\right) >u_{1}\left( C,D,D\right)
\end{eqnarray*}がすべて成り立つことを意味します。ただし、\(\left( b\right) \)中の等号は、プレイヤー\(1\)が他の2人のプレイヤーを個人として区別しないという仮定を反映しています。また、条件\(\left( 2\right) \)が成り立つことは、\begin{equation*}\left( d\right) \ u_{1}\left( C,C,C\right) >u_{1}\left( D,D,D\right)
\end{equation*}が成り立つことを意味します。\(\left( a\right) ,\left( c\right),\left( d\right) \)より、\begin{equation*}u_{1}\left( D,C,C\right) >u_{1}\left( C,C,C\right) >u_{1}\left( D,D,D\right)
>u_{1}\left( C,D,D\right)
\end{equation*}が成り立ちます。つまり、2人の相手がともに\(C\)を選ぶ場合に自分が得る利得と、2人の相手がともに\(D\)を選ぶ場合に自分が得る利得の間には順序が定まりますが、それらの場合と、2人の相手の一方だけが\(C\)を選ぶ場合に自分が得る利得の間には順序が定められていません。それらの間の順序も定めるためには、条件\(\left( 1\right) ,\left( 2\right) \)とは異なる新たな条件が必要です。

最後の例が示唆するように、プレイヤーが3人以上の場合には、先に定めた条件\(\left(1\right) ,\left( 2\right) \)とは別の条件が必要です。そこで、それぞれのプレイヤー\(i\in I\)について、自分が裏切り戦略\(D\)を選んだ場合の利得\(u_{i}\left(D,c\right) \)と、自分が協調戦略\(C\)を選んだ場合の利得\(u_{i}\left( C,c\right) \)はともに、\(c\)に関する狭義単調増加関数であるものと定めます。つまり、自分が協調戦略\(C\)と裏切り戦略\(D\)のどちらを選ぶ場合においても、自分以外のプレイヤーたちの中で協調戦略\(C\)を選ぶ者の人数が多ければ多いほど、自分はより多くの利得を得られることを仮定するということです。

例(囚人のジレンマ)
囚人のジレンマの定義より、プレイヤー\(1\)の利得関数\(u_{1}:S_{1}\times S_{2}\rightarrow \mathbb{R} \)は、\begin{equation*}u_{1}\left( D,C\right) >u_{1}\left( C,C\right) >u_{1}\left( D,D\right)
>u_{1}\left( C,D\right)
\end{equation*}を満たします。囚人のジレンマは\(n\)人囚人のジレンマの特別なケース(\(n=2\))であるため、そこでのプレイヤーの利得関数もまた先の単調性の条件を満たすはずです。まず、プレイヤー\(1\)の利得関数\(u_{1}\)に関して単調性の条件が成り立つことは、\begin{eqnarray*}u_{1}\left( D,C\right) &>&u_{1}\left( D,D\right) \\
u_{1}\left( C,C\right) &>&u_{1}\left( C,D\right)
\end{eqnarray*}がともに成り立つことを意味しますが、これは先の囚人のジレンマの定義と整合的です。プレイヤー\(2\)の利得関数についても同様です。
例(3人囚人のジレンマ)
3人囚人のジレンマを表す戦略型ゲーム\(G\)のプレイヤー集合は\(I=\left\{1,2,3\right\} \)であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は\(S_{i}=\left\{C,D\right\} \)です。プレイヤー\(1\)の利得関数\(u_{1}:S_{1}\times S_{2}\times S_{3}\rightarrow \mathbb{R} \)に関して先の単調性の条件が成り立つことは、\begin{eqnarray*}u_{1}\left( D,C,C\right) &>&u_{1}\left( D,D,C\right) =u_{1}\left(
D,C,D\right) >u_{1}\left( D,C,C\right) \\
u_{1}\left( C,C,C\right) &>&u_{1}\left( C,D,C\right) =u_{1}\left(
C,C,D\right) >u_{1}\left( C,C,C\right)
\end{eqnarray*}がともに成り立つことを意味します。ただし、上の条件中の等号は、プレイヤー\(1\)が他の2人のプレイヤーを個人として区別しないという仮定を反映しています。プレイヤー\(2,3\)の利得関数についても同様です。

以上が\(n\)人囚人のジレンマの定義です。改めて整理すると、\(n\)人囚人のジレンマとは、以下の条件を満たす戦略型ゲーム\(G\)によって表現される完備情報の静学ゲームです。まず、プレイヤー集合は\(I=\left\{ 1,\cdots ,n\right\} \)であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は\(S_{i}=\left\{ C,D\right\} \)です。ただし、\(C\)は協調戦略であり、\(D\)は裏切り戦略です。それぞれのプレイヤー\(i\)の利得関数は、自分が選ぶ純粋戦略\(s_{i}\in S_{i}\)と、自分以外の\(n-1\)人のプレイヤーの中で協調戦略\(C\)を選ぶ人数\(c\in \left\{ 0,1,\cdots,n-1\right\} \)を変数として持つ関数\(u_{i}:S_{i}\times \left\{ 0,1,\cdots ,n-1\right\}\rightarrow \mathbb{R} \)であり、以下の条件\begin{eqnarray*}&&\left( a\right) \ \forall c\in \left\{ 0,1,\cdots ,n-1\right\}
:u_{i}\left( D,c\right) >u_{i}\left( C,c\right) \\
&&\left( b\right) \ u_{i}\left( C,n-1\right) >u_{i}\left( D,0\right) \\
&&\left( c\right) \ u_{i}\left( D,c\right) \text{と}u_{i}\left(
C,c\right) \text{は}c\text{に関する狭義単調増加関数}
\end{eqnarray*}をすべて満たすものとして定義されます。

 

\(n\)人囚人のジレンマの均衡

通常の囚人のジレンマと同様、\(n\)人囚人のジレンマにおいても、すべてのプレイヤーが裏切り戦略を選ぶことが狭義の支配戦略均衡になります。

命題(n人囚人のジレンマの狭義の支配戦略均衡)
戦略型ゲーム\(G\)のプレイヤー集合は\(I=\left\{ 1,\cdots,n\right\} \)であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は\(S_{i}=\left\{ C,D\right\} \)であり、利得関数\(u_{i}:S_{i}\times \left\{ 0,1,\cdots ,n-1\right\} \rightarrow \mathbb{R} \)は以下のすべての条件\begin{eqnarray*}&&\left( a\right) \ \forall c\in \left\{ 0,1,\cdots ,n-1\right\}
:u_{i}\left( D,c\right) >u_{i}\left( C,c\right) \\
&&\left( b\right) \ u_{i}\left( C,n-1\right) >u_{i}\left( D,0\right) \\
&&\left( c\right) \ u_{i}\left( D,c\right) \text{と}u_{i}\left(
C,c\right) \text{は}c\text{に関する狭義単調増加関数}
\end{eqnarray*}を満たすものとする。ただし、\(c\)はプレイヤー\(i\)を除く\(n-1\)人のプレイヤーの中で協調戦略\(C\)を選ぶ人数である。このゲーム\(G\)には狭義の支配戦略均衡が存在し、それはすべてのプレイヤーが\(D\)を選ぶことである。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

一般に、戦略型ゲーム\(G\)に狭義の支配戦略均衡が存在する場合には一意的であるため、裏切り戦略の組は\(n\)人囚人のジレンマにおける唯一の狭義の支配戦略均衡です。

プレイヤーが混合戦略を採用する場合にはどうなるでしょうか。一般に、戦略型ゲーム\(G\)に狭義の支配戦略均衡が存在することと、\(G\)の混合拡張\(G^{\ast }\)に狭義の支配戦略均衡が存在することは必要十分であるとともに、両者は一致します。したがって、裏切り戦略の組は混合戦略の範囲においても狭義の支配戦略均衡です。

戦略型ゲーム\(G\)に狭義の支配戦略均衡が存在する場合、プレイヤーたちが合理的であるという事実が共有知識でない場合においても、それぞれのプレイヤーが合理的でありさえすれば、プレイヤーたちはその均衡をプレーします。\(n\)人囚人のジレンマでは裏切り戦略の組が狭義の支配戦略均衡であるため、それぞれのプレイヤーが合理的であれば、彼らはその均衡を実際にプレーすることが予測されます。

\(n\)人囚人のジレンマにおいてそれぞれのプレイヤーは、他のプレイヤーたちが選択する行動がいかなるものであっても、自分は自白\(D\)したほうが黙秘\(C\)する場合よりもより大きな利得を得られます(\(D\)が\(C\)を狭義支配する)。したがって、プレイヤーが合理的である限りにおいて自白\(D\)を選びます。しかし、全員が自白\(D\)を選んだ場合に自分が得る利得は、全員が黙秘を選んだときに自分が得る利得よりも小さくなってしまいます。他のプレイヤーたちにとっても事情は同じであるため、自分だけでなく他のプレイヤーたちにとっても全員が\(C\)を選ぶことは全員が\(D\)を選ぶことよりも望ましいはずです。つまり、それぞれのプレイヤーが自己の利得を最大化するために行動する場合、得られる結果は他のプレイヤーにとってだけでなく自分にとっても最適なものにならないという意味において、\(n\)人囚人のジレンマは興味深い例になっています。

 

演習問題

問題(3人囚人のジレンマ)
ある戦略型ゲーム\(G\)のプレイヤー集合は\(I=\left\{1,2,3\right\} \)であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は\(S_{i}=\left\{C,D\right\} \)です。プレイヤーの利得関数は以下の条件を満たすものとします。このゲームが3人囚人のジレンマであることを示してください。

  1. 全員が\(C\)を選ぶ場合、全員が利得\(3\)を得る。
  2. 2人が\(C\)を選び\(1\)人が\(D\)を選ぶ場合、\(C\)を選んだプレイヤーは利得\(2\)を得て、\(D\)を選んだプレイヤーは利得\(4\)を得る。
  3. 1人が\(C\)を選び\(2\)人が\(D\)を選ぶ場合、\(C\)を選んだプレイヤーは利得\(1\)を得て、\(D\)を選んだプレイヤーは利得\(3\)を得る。
  4. 全員が\(D\)を選ぶ場合、全員が利得\(2\)を得る。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(n人囚人のジレンマ)
\(n\)人囚人のジレンマであるような現実の事例を具体的に提示してください。

次回はプレイヤーたちが異なる利得関数を持つ場合の囚人のジレンマについて解説します。

Share on twitter
Twitterで共有
Share on email
メールで共有
RELATED KNOWLEDGE

関連知識

囚人のジレンマ

囚人のジレンマ

囚人のジレンマとして広く知られるゲームの最も基本的なモデルを紹介し、それを戦略型ゲームとして定式化した上で、その均衡を分析します。

クールノー競争

戦略型ゲーム(標準型ゲーム)

完備情報の静学ゲームを記述するためにはプレイヤー、行動、結果、利得などをそれぞれ具体的に特定する必要があります。それらの要素を記述する方法はいくつか存在しますが、ここでは戦略型ゲームと呼ばれるモデルについて解説します。

囚人のジレンマ

非対称的な利得構造を持つ囚人のジレンマ

これまではプレイヤーたちが同一の利得関数を持つ囚人のジレンマについて考えてきましたが、状況を少し一般化して、プレイヤーたちが異なる利得関数を持つ場合の囚人のジレンマについて考えます。

囚人のジレンマ

囚人のジレンマの例:軍拡競争

冷戦期に行われた米ソ間の軍拡競争は囚人のジレンマとしての側面を持っていることを解説した上で、そこでのナッシュ均衡を求めます。

ベイジアンゲーム

ベイジアンゲームにおける支配戦略均衡

ベイジアンゲームにおいてプレイヤーがある純粋戦略を選ぶとき、自身を含めた全員のタイプや他のプレイヤーたちの行動、信念に関わらず利得を常に最大化できるならば、そのような戦略を支配純粋戦略と呼びます。支配純粋戦略の組を支配純粋戦略均衡と呼びます。

支配戦略均衡

狭義の支配戦略均衡

戦略型ゲームにおける純粋戦略の組を構成する戦略がいずれも狭義の支配戦略である場合、そのような戦略の組を狭義の支配戦略均衡と呼びます。

支配戦略均衡

広義の支配戦略均衡

戦略型ゲームにおける純粋戦略の組を構成する戦略がいずれも広義の支配戦略である場合、そのような戦略の組を広義の支配戦略均衡と呼びます。

事後均衡

事後均衡と支配戦略均衡の関係

ベイジアンゲームにおいて事後均衡は支配戦略均衡でもありますが、その逆は成立するとは限りません。ただ、私的価値モデルにおいて事後均衡が一定の条件を満たす場合、それは支配戦略均衡になることが保証されます。

DISCUSSION

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録

ゲームの例