囚人のジレンマは2人ゲームですが、これを3人以上に拡張するとどのようなモデルになるでしょうか。n人囚人のジレンマと呼ばれるゲームについて解説します。

囚人のジレンマ

復習になりますが、囚人のジレンマとは以下の利得行列
$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & C & D \\ \hline
C & b,b & d,a \\ \hline
D & a,d & c,c \\ \hline
\end{array}$$

表:囚人のジレンマ

によって定義される完備情報の静学ゲームです。ただし、表中の\(a,b,c,d\)は利得を表しており、これらの間には、\begin{equation*}
a>b>c>d
\end{equation*}という関係が成り立つものとします。\(a>b\)と\(c>d\)が成り立つことは、相手が協調と裏切りのどちらを選ぶ場合においても、自分は裏切ったほうがよいことを意味します。したがって、囚人のジレンマでは、裏切り戦略の組\(\left( D,D\right) \)が強支配戦略均衡になります。また、\(b>c\)が成り立つことは、仮に、均衡ではない協調戦略の組\(\left( C,C\right) \)を実現できれば、均衡\(\left( D,D\right) \)が実現する場合よりも双方はより大きい利得を得られることを意味します。しかし、実際には\(\left( D,D\right) \)が強支配戦略均衡であるため、プレイヤーたちの合理性が相互知識や共有知識であることを仮定せずとも、それぞれのプレイヤーが合理的でありさえすれば、均衡\(\left( D,D\right) \)が実際にプレーされることになります。

 

\(n\)人囚人のジレンマ

囚人のジレンマは\(2\)人ゲームですが、これを\(3\)人以上のゲームへ拡張するためにはどうすればよいでしょうか。一般に、\(n\)人のプレイヤーが参加する囚人のジレンマを\(n\)人囚人のジレンマ(\(n\)-person prisoner’s dilemma)と呼びます。囚人のジレンマは\(n\)人囚人のジレンマの特別なケース(\(n=2\))です。

\(n\)人囚人のジレンマを表す戦略型ゲーム\(G\)のプレイヤー集合は\(I=\left\{ 1,2,\cdots ,n\right\} \)であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は\(S_{i}=\left\{ C,D\right\} \)です。ただし、\(C\)は協調戦略であり、\(D\)は裏切り戦略です。問題は、それぞれのプレイヤー\(i\)の利得関数\(u_{i}:S_{I}\rightarrow \mathbb{R}\)をどのように記述するかです。

囚人のジレンマの本質の1つは、それぞれのプレイヤーにとって、裏切り戦略\(D\)が協調戦略\(C\)を強支配するという点です。つまり、他のプレイヤーたちの行動がどのようなものであれ、自分は裏切り戦略\(D\)を選んだ方が、協調戦略\(C\)を選ぶ場合よりも大きい利得を得られるという点が重要です。それぞれのプレイヤーが自分を除く\(n-1\)人のプレイヤーを個人として区別しないのであれば、これは、自分を除く\(n-1\)人のプレイヤーの中の何人が協調戦略\(C\)を選ぶかに関わらず、自分は裏切り戦略\(D\)を選んだ方が、協調戦略\(C\)を選ぶ場合よりも大きい利得を得られることとして言い換え可能です。そこで、プレイヤー\(i\)を除く\(n-1\)人のプレイヤーの中で協調戦略\(C\)を選ぶ人数が\(c\in \left\{ 1,2,n-1\right\} \)であるとき、プレイヤー\(i\)が純粋戦略\(s_{i}\in S_{i}\)を選んだときに得る利得を\(u_{i}\left( s_{i},c\right) \)で表すのであれば、プレイヤー\(i\)にとって裏切り戦略\(D\)が協調戦略\(C\)を強支配することを、\begin{equation}
\forall c\in \left\{ 0,1,\cdots ,n-1\right\} :u_{i}\left( D,c\right)
>u_{i}\left( C,c\right) \tag{1}
\end{equation}が成り立つこととして表現できます。以上の条件が任意のプレイヤー\(i\in I\)について成り立つものと定めます。

囚人のジレンマのもう1つの本質は、全員が協調戦略\(C\)を選ぶことは均衡ではないものの、仮にそれが実現すれば、均衡にしたがって全員が裏切り戦略\(D\)を選ぶ場合よりも、全員がより大きな利得を得られるという点です。これは、任意のプレイヤー\(i\in I\)について、\begin{equation}
u_{i}\left( C,n-1\right) >u_{i}\left( D,0\right) \tag{2}
\end{equation}が成り立つこととして表現可能です。

例(囚人のジレンマ)
囚人のジレンマの定義より、プレイヤー\(1\)の利得関数\(u_{1}:S_{1}\times S_{2}\rightarrow \mathbb{R}\)は、\begin{equation*}
u_{1}\left( D,C\right) >u_{1}\left( C,C\right) >u_{1}\left( D,D\right)
>u_{1}\left( C,D\right)
\end{equation*}を満たします。囚人のジレンマは\(n\)人囚人のジレンマの特別なケース(\(n=2\))であるため、そこでのプレイヤーの利得関数もまた上の条件\(\left( 1\right) ,\left( 2\right) \)を満たすはずです。まず、プレイヤー\(1\)の利得関数\(u_{1}\)に関して条件\(\left( 1\right) \)が成り立つことは、\begin{eqnarray*}
&&\left( a\right) \ u_{1}\left( D,C\right) >u_{1}\left( C,C\right) \\
&&\left( b\right) \ u_{1}\left( D,D\right) >u_{1}\left( C,D\right)
\end{eqnarray*}がともに成り立つことを意味し、条件\(\left( 2\right) \)が成り立つことは、\begin{equation*}
\left( c\right) \ u_{1}\left( C,C\right) >u_{1}\left( D,D\right)
\end{equation*}が成り立つことを意味します。\(\left( a\right) ,\left( b\right) ,\left( c\right) \)より、\begin{equation*}
u_{1}\left( D,C\right) >u_{1}\left( C,C\right) >u_{1}\left( D,D\right)
>u_{1}\left( C,D\right)
\end{equation*}が成り立ちますが、これは先の囚人のジレンマの定義に他なりません。プレイヤー\(2\)の利得関数についても同様です。つまり、\(n=2\)であるとき、\(n\)人囚人のジレンマのプレイヤーの利得関数に関して\(\left( 1\right) ,\left( 2\right) \)が成り立つことは、それが囚人のジレンマであるための必要十分条件です。
例(3人囚人のジレンマ)
\(3\)人囚人のジレンマを表す戦略型ゲーム\(G\)のプレイヤー集合は\(I=\left\{ 1,2,3\right\} \)であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は\(S_{i}=\left\{ C,D\right\} \)です。プレイヤー\(1\)の利得関数\(u_{1}:S_{1}\times S_{2}\times S_{3}\rightarrow \mathbb{R}\)に関して関して条件\(\left( 1\right) \)が成り立つことは、\begin{eqnarray*}
&&\left( a\right) \ u_{1}\left( D,C,C\right) >u_{1}\left( C,C,C\right) \\
&&\left( b\right) \ u_{1}\left( D,C,D\right) =u_{1}\left( D,D,C\right)
>u_{1}\left( C,D,C\right) =u_{1}\left( C,C,D\right) \\
&&\left( c\right) \ u_{1}\left( D,D,D\right) >u_{1}\left( C,D,D\right)
\end{eqnarray*}がすべて成り立つことを意味します。ただし、\(\left( b\right) \)中の等号は、プレイヤー\(1\)が他のプレイヤー\(2,3\)を個人として区別しないという仮定を反映しています。また、条件\(\left( 2\right) \)が成り立つことは、\begin{equation*}
\left( d\right) \ u_{1}\left( C,C,C\right) >u_{1}\left( D,D,D\right)
\end{equation*}が成り立つことを意味します。\(\left( a\right) ,\left( c\right) ,\left( d\right) \)より、\begin{equation*}
u_{1}\left( D,C,C\right) >u_{1}\left( C,C,C\right) >u_{1}\left( D,D,D\right)
>u_{1}\left( C,D,D\right)
\end{equation*}が成り立ちます。つまり、相手がともに\(C\)を選ぶ場合に自分が得る利得と、相手がともに\(D\)を選ぶ場合に自分が得る利得の間には順序が定まりますが、それらの場合と、相手の一方だけが\(C\)を選ぶ場合に自分が得る利得の間には順序が定められていません。それらの間の順序も定めるためには、条件\(\left( 1\right) ,\left( 2\right) \)とは異なる新たな条件が必要です。

上の例が示唆するように、プレイヤーが\(3\)人以上の場合には、先に定めた条件\(\left( 1\right) ,\left( 2\right) \)とは別の条件が必要です。そこで、それぞれのプレイヤー\(i\in I\)について、自分が裏切り戦略\(D\)を選んだ場合の利得\(u_{i}\left( D,c\right) \)と、自分が協調戦略\(C\)を選んだ場合の利得\(u_{i}\left( C,c\right) \)はともに、\(c\)に関する単調増加関数であるものと定めます。つまり、自分が協調戦略\(C\)と裏切り戦略\(D\)のどちらを選ぶ場合においても、自分以外のプレイヤーたちの中で協調戦略\(C\)を選ぶ者の人数が多ければ多いほど、自分はより多くの利得を得られるということです。

例(囚人のジレンマ)
囚人のジレンマの定義より、プレイヤー\(1\)の利得関数\(u_{1}:S_{1}\times S_{2}\rightarrow \mathbb{R}\)は、\begin{equation*}
u_{1}\left( D,C\right) >u_{1}\left( C,C\right) >u_{1}\left( D,D\right)
>u_{1}\left( C,D\right)
\end{equation*}を満たします。囚人のジレンマは\(n\)人囚人のジレンマの特別なケース(\(n=2\))であるため、そこでのプレイヤーの利得関数もまた先の単調性の条件を満たすはずです。まず、プレイヤー\(1\)の利得関数\(u_{1}\)に関して単調性の条件が成り立つことは、\begin{eqnarray*}
u_{1}\left( D,C\right) &>&u_{1}\left( D,D\right) \\
u_{1}\left( C,C\right) &>&u_{1}\left( C,D\right)
\end{eqnarray*}がともに成り立つことを意味しますが、これは先の囚人のジレンマの定義と整合的です。プレイヤー\(2\)の利得関数についても同様です。
例(3人囚人のジレンマ)
\(3\)人囚人のジレンマを表す戦略型ゲーム\(G\)のプレイヤー集合は\(I=\left\{ 1,2,3\right\} \)であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は\(S_{i}=\left\{ C,D\right\} \)です。プレイヤー\(1\)の利得関数\(u_{1}:S_{1}\times S_{2}\times S_{3}\rightarrow \mathbb{R}\)に関して先の単調性の条件が成り立つことは、\begin{eqnarray*}
u_{1}\left( D,C,C\right) &>&u_{1}\left( D,D,C\right) =u_{1}\left(
D,C,D\right) >u_{1}\left( D,C,C\right) \\
u_{1}\left( C,C,C\right) &>&u_{1}\left( C,D,C\right) =u_{1}\left(
C,C,D\right) >u_{1}\left( C,C,C\right)
\end{eqnarray*}がともに成り立つことを意味します。ただし、上の条件中の等号は、プレイヤー\(1\)が他のプレイヤー\(2,3\)を個人として区別しないという仮定を反映しています。プレイヤー\(2,3\)の利得関数についても同様です。

以上が\(n\)人囚人のジレンマの定義です。改めて整理すると、\(n\)人囚人のジレンマとは、以下の条件を満たす戦略型ゲーム\(G=(I,\left\{ S_{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in I})\)によって表現される完備情報の静学ゲームです。まず、プレイヤー集合は\(I=\left\{ 1,2,\cdots ,n\right\} \)であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は\(S_{i}=\left\{ C,D\right\} \)です。ただし、\(C\)は協調戦略であり、\(D\)は裏切り戦略です。それぞれのプレイヤー\(i\)の利得関数\(u_{i}\)は自分が選ぶ純粋戦略\(s_{i}\in S_{i}\)と、自分を除く\(n-1\)人のプレイヤーの中で協調戦略\(C\)を選ぶ人数\(c\in \left\{ 1,2,n-1\right\} \)に依存する関数\(u_{i}\left( s_{i},c\right) \)であり、以下の条件\begin{eqnarray*}
&&\left( a\right) \ \forall c\in \left\{ 0,1,\cdots ,n-1\right\}
:u_{i}\left( D,c\right) >u_{i}\left( C,c\right) \\
&&\left( b\right) \ u_{i}\left( C,n-1\right) >u_{i}\left( D,0\right) \\
&&\left( c\right) \ u_{i}\left( D,c\right) \text{と}u_{i}\left(
C,c\right) \text{は}c\text{に関する単調増加関数}
\end{eqnarray*}をすべて満たすものとして定義されます。

 

\(n\)人囚人のジレンマの均衡

\(n\)人囚人のジレンマを表す戦略型ゲーム\(G\)のプレイヤー\(i\in I\)と、他のプレイヤーたちによる純粋戦略の組\(s_{-i}\in S_{-i}\)をそれぞれ任意に選びます。\(s_{-i}\)において協調戦略を選んでいるプレイヤーの人数を\(c\)で表すと、\(n\)人囚人のジレンマの定義より、\begin{equation}
u_{i}\left( D,c\right) >u_{i}\left( C,c\right) \tag{1}
\end{equation}が成り立ちます。以上を踏まえると、\begin{eqnarray*}
u_{i}\left( D,s_{-i}\right) &=&u_{i}\left( D,c\right) \quad \because c\text{の定義} \\
&>&u_{i}\left( C,c\right) \quad \because \left( 1\right) \\
&=&u_{i}\left( C,s_{-i}\right) \quad \because c\text{の定義}
\end{eqnarray*}が成り立ちます。したがって、プレイヤー\(i\)にとって、裏切り戦略\(D\)は協調戦略\(C\)を強支配します。プレイヤー\(i\)の純粋戦略は\(D\)と\(C\)だけであるため、これは\(D\)が強支配純粋戦略であることを意味します。同様の議論が任意のプレイヤーについて成り立つため、全員が協調戦略\(C\)を選ぶことが\(n\)人囚人のジレンマの強支配純粋戦略均衡になります。

命題(n人囚人のジレンマの均衡)
\(n\)人囚人のジレンマにおいて、すべてのプレイヤーが裏切り戦略\(D\)を選ぶことは強支配純粋戦略均衡である。
証明を見る(プレミアム会員限定)

\(n\)人囚人のジレンマにおいて、全員が均衡にしたがって裏切り戦略\(D\)を選ぶと、それぞれのプレイヤー\(i\)は利得\(u_{i}\left( C,n-1\right) \)を得ます。一方、全員が協調戦略\(C\)を選ぶと、プレイヤー\(i\)は利得\(u_{i}\left( D,0\right) \)を得ます。\(n\)人囚人のジレンマの定義より、\begin{equation*}
u_{i}\left( C,n-1\right) >u_{i}\left( D,0\right)
\end{equation*}が成り立つため、均衡ではない協調戦略\(C\)の組を実現できれば、均衡が実現する場合よりも双方はより大きい利得を得られます。しかし、実際には裏切り戦略\(D\)の組が強支配戦略均衡であるため、プレイヤーたちの合理性が相互知識や共有知識であることを仮定せずとも、それぞれのプレイヤーが合理的でありさえすれば、均衡である裏切り戦略\(D\)の組が実際にプレーされることになります。

次回は~について解説します。

次へ進む 質問・コメントを投稿する 演習問題(プレミアム会員限定)
Share on facebook
Share on twitter
Share on email
Share on print

ワイズをさらに活用するための会員サービス

ユーザー名とメールアドレスを入力して一般会員に無料登録すれば、質問やコメントを投稿できるようになります。さらに、有料(500円/月)のプレミアム会員へアップグレードすることにより、プレミアムコンテンツ(命題の証明や演習問題、解答など)にアクセスできます。
会員サービス

ディスカッションに参加しますか?

質問やコメントを投稿するためにはログインが必要です
ログイン

アカウント
ログイン