教材一覧
EXAMPLES OF GAMES

n人囚人のジレンマ

Share on twitter
Twitterで共有
Share on email
メールで共有

\(n\)人囚人のジレンマ

囚人のジレンマは2人ゲームですが、これを3人以上のゲームへ拡張するためにはどうすればよいでしょうか。一般に、\(n\)人のプレイヤーが参加する囚人のジレンマを\(n\)人囚人のジレンマ(\(n\)-person prisoner’s dilemma)と呼びます。囚人のジレンマは\(n\)人囚人のジレンマの特別なケース(\(n=2\))です。

\(n\)人囚人のジレンマを表す戦略型ゲーム\(G\)のプレイヤー集合は\(I=\left\{1,2,\cdots ,n\right\} \)であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は\(S_{i}=\left\{ C,D\right\} \)です。ただし、\(C\)は協調戦略であり、\(D\)は裏切り戦略です。問題は、それぞれのプレイヤー\(i\)の利得関数\(u_{i}:S_{I}\rightarrow \mathbb{R} \)をどのように記述するかです。

囚人のジレンマの本質の1つは、それぞれのプレイヤーにとって、裏切り戦略\(D\)が協調戦略\(C\)を強支配するという点です。つまり、他のプレイヤーたちの行動がどのようなものであれ、自分は裏切り戦略\(D\)を選んだ方が、協調戦略\(C\)を選ぶ場合よりも常により大きい利得を得られるという点が重要です。それぞれのプレイヤーが自分を除く\(n-1\)人のプレイヤーを個人として区別しないのであれば、これは、自分を除く\(n-1\)人のプレイヤーの中の何人が協調戦略\(C\)を選ぶかに関わらず、自分は裏切り戦略\(D\)を選んだ方が、協調戦略\(C\)を選ぶ場合よりも常に大きい利得を得られることとして言い換え可能です。そこで、プレイヤー\(i\)を除く\(n-1\)人のプレイヤーの中で協調戦略\(C\)を選ぶ人数が\(c\in \left\{ 0,1,\cdots ,n-1\right\} \)であるとき、プレイヤー\(i\)が純粋戦略\(s_{i}\in S_{i}\)を選んだときに得る利得を\(u_{i}\left( s_{i},c\right) \)で表すのであれば、プレイヤー\(i\)にとって裏切り戦略\(D\)が協調戦略\(C\)を強支配することは、\begin{equation}\forall c\in \left\{ 0,1,\cdots ,n-1\right\} :u_{i}\left( D,c\right)
>u_{i}\left( C,c\right) \quad \cdots (1)
\end{equation}が成り立つこととして表現できます。以上の条件が任意のプレイヤー\(i\in I\)について成り立つものと定めます。

囚人のジレンマのもう1つの本質は、全員が協調戦略\(C\)を選ぶことは均衡ではないものの、仮にそれが実現すれば、均衡にしたがって全員が裏切り戦略\(D\)を選ぶ場合よりも全員がより大きな利得を得られるという点です。これは、任意のプレイヤー\(i\in I\)について、\begin{equation}u_{i}\left( C,n-1\right) >u_{i}\left( D,0\right) \quad \cdots (2)
\end{equation}が成り立つこととして表現可能です。

例(囚人のジレンマ)
囚人のジレンマの定義より、プレイヤー\(1\)の利得関数\(u_{1}:S_{1}\times S_{2}\rightarrow \mathbb{R} \)は、\begin{equation*}u_{1}\left( D,C\right) >u_{1}\left( C,C\right) >u_{1}\left( D,D\right)
>u_{1}\left( C,D\right)
\end{equation*}を満たします。囚人のジレンマは\(n\)人囚人のジレンマの特別なケース(\(n=2\))であるため、そこでのプレイヤーの利得関数もまた上の条件\(\left( 1\right) ,\left( 2\right) \)を満たすはずです。まず、プレイヤー\(1\)の利得関数\(u_{1}\)に関して条件\(\left( 1\right) \)が成り立つことは、\begin{eqnarray*}&&\left( a\right) \ u_{1}\left( D,C\right) >u_{1}\left( C,C\right) \\
&&\left( b\right) \ u_{1}\left( D,D\right) >u_{1}\left( C,D\right)
\end{eqnarray*}がともに成り立つことを意味し、条件\(\left(2\right) \)が成り立つことは、\begin{equation*}\left( c\right) \ u_{1}\left( C,C\right) >u_{1}\left( D,D\right)
\end{equation*}が成り立つことを意味します。\(\left( a\right) ,\left( b\right),\left( c\right) \)より、\begin{equation*}u_{1}\left( D,C\right) >u_{1}\left( C,C\right) >u_{1}\left( D,D\right)
>u_{1}\left( C,D\right)
\end{equation*}が成り立ちますが、これは囚人のジレンマの定義に他なりません。プレイヤー\(2\)の利得関数についても同様です。つまり、\(n=2\)であるとき、\(n\)人囚人のジレンマのプレイヤーの利得関数に関して\(\left( 1\right) ,\left( 2\right) \)が成り立つことは、それが囚人のジレンマであるための必要十分条件です。
例(3人囚人のジレンマ)
3人囚人のジレンマを表す戦略型ゲーム\(G\)のプレイヤー集合は\(I=\left\{1,2,3\right\} \)であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は\(S_{i}=\left\{C,D\right\} \)です。プレイヤー\(1\)の利得関数\(u_{1}:S_{1}\times S_{2}\times S_{3}\rightarrow \mathbb{R} \)に関して関して条件\(\left( 1\right) \)が成り立つことは、\begin{eqnarray*}&&\left( a\right) \ u_{1}\left( D,C,C\right) >u_{1}\left( C,C,C\right) \\
&&\left( b\right) \ u_{1}\left( D,C,D\right) =u_{1}\left( D,D,C\right)
>u_{1}\left( C,D,C\right) =u_{1}\left( C,C,D\right) \\
&&\left( c\right) \ u_{1}\left( D,D,D\right) >u_{1}\left( C,D,D\right)
\end{eqnarray*}がすべて成り立つことを意味します。ただし、\(\left( b\right) \)中の等号は、プレイヤー\(1\)が他の2人のプレイヤーを個人として区別しないという仮定を反映しています。また、条件\(\left( 2\right) \)が成り立つことは、\begin{equation*}\left( d\right) \ u_{1}\left( C,C,C\right) >u_{1}\left( D,D,D\right)
\end{equation*}が成り立つことを意味します。\(\left( a\right) ,\left( c\right),\left( d\right) \)より、\begin{equation*}u_{1}\left( D,C,C\right) >u_{1}\left( C,C,C\right) >u_{1}\left( D,D,D\right)
>u_{1}\left( C,D,D\right)
\end{equation*}が成り立ちます。つまり、2人の相手がともに\(C\)を選ぶ場合に自分が得る利得と、2人の相手がともに\(D\)を選ぶ場合に自分が得る利得の間には順序が定まりますが、それらの場合と、2人の相手の一方だけが\(C\)を選ぶ場合に自分が得る利得の間には順序が定められていません。それらの間の順序も定めるためには、条件\(\left( 1\right) ,\left( 2\right) \)とは異なる新たな条件が必要です。

上の例が示唆するように、プレイヤーが3人以上の場合には、先に定めた条件\(\left( 1\right),\left( 2\right) \)とは別の条件が必要です。そこで、それぞれのプレイヤー\(i\in I\)について、自分が裏切り戦略\(D\)を選んだ場合の利得\(u_{i}\left( D,c\right) \)と、自分が協調戦略\(C\)を選んだ場合の利得\(u_{i}\left( C,c\right) \)はともに、\(c\)に関する狭義単調増加関数であるものと定めます。つまり、自分が協調戦略\(C\)と裏切り戦略\(D\)のどちらを選ぶ場合においても、自分以外のプレイヤーたちの中で協調戦略\(C\)を選ぶ者の人数が多ければ多いほど、自分はより多くの利得を得られるというということです。

例(囚人のジレンマ)
囚人のジレンマの定義より、プレイヤー\(1\)の利得関数\(u_{1}:S_{1}\times S_{2}\rightarrow \mathbb{R} \)は、\begin{equation*}u_{1}\left( D,C\right) >u_{1}\left( C,C\right) >u_{1}\left( D,D\right)
>u_{1}\left( C,D\right)
\end{equation*}を満たします。囚人のジレンマは\(n\)人囚人のジレンマの特別なケース(\(n=2\))であるため、そこでのプレイヤーの利得関数もまた先の単調性の条件を満たすはずです。まず、プレイヤー\(1\)の利得関数\(u_{1}\)に関して単調性の条件が成り立つことは、\begin{eqnarray*}u_{1}\left( D,C\right) &>&u_{1}\left( D,D\right) \\
u_{1}\left( C,C\right) &>&u_{1}\left( C,D\right)
\end{eqnarray*}がともに成り立つことを意味しますが、これは先の囚人のジレンマの定義と整合的です。プレイヤー\(2\)の利得関数についても同様です。
例(3人囚人のジレンマ)
3人囚人のジレンマを表す戦略型ゲーム\(G\)のプレイヤー集合は\(I=\left\{1,2,3\right\} \)であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は\(S_{i}=\left\{C,D\right\} \)です。プレイヤー\(1\)の利得関数\(u_{1}:S_{1}\times S_{2}\times S_{3}\rightarrow \mathbb{R} \)に関して先の単調性の条件が成り立つことは、\begin{eqnarray*}u_{1}\left( D,C,C\right) &>&u_{1}\left( D,D,C\right) =u_{1}\left(
D,C,D\right) >u_{1}\left( D,C,C\right) \\
u_{1}\left( C,C,C\right) &>&u_{1}\left( C,D,C\right) =u_{1}\left(
C,C,D\right) >u_{1}\left( C,C,C\right)
\end{eqnarray*}がともに成り立つことを意味します。ただし、上の条件中の等号は、プレイヤー\(1\)が他の2人のプレイヤーを個人として区別しないという仮定を反映しています。プレイヤー\(2,3\)の利得関数についても同様です。

以上が\(n\)人囚人のジレンマの定義です。改めて整理すると、\(n\)人囚人のジレンマとは、以下の条件を満たす戦略型ゲーム\(G=(I,\left\{S_{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in I})\)によって表現される完備情報の静学ゲームです。まず、プレイヤー集合は\(I=\left\{ 1,2,\cdots ,n\right\} \)であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は\(S_{i}=\left\{ C,D\right\} \)です。ただし、\(C\)は協調戦略であり、\(D\)は裏切り戦略です。それぞれのプレイヤー\(i\)の利得関数\(u_{i}\)は、自分が選ぶ純粋戦略\(s_{i}\in S_{i}\)と、自分以外の\(n-1\)人のプレイヤーの中で協調戦略\(C\)を選ぶ人数\(c\in \left\{ 0,1,\cdots,n-1\right\} \)を変数として持つ関数\(u_{i}\left( s_{i},c\right) \)であり、以下の条件\begin{eqnarray*}&&\left( a\right) \ \forall c\in \left\{ 0,1,\cdots ,n-1\right\}
:u_{i}\left( D,c\right) >u_{i}\left( C,c\right) \\
&&\left( b\right) \ u_{i}\left( C,n-1\right) >u_{i}\left( D,0\right) \\
&&\left( c\right) \ u_{i}\left( D,c\right) \text{と}u_{i}\left(
C,c\right) \text{は}c\text{に関する狭義単調増加関数}
\end{eqnarray*}をすべて満たすものとして定義されます。

 

\(n\)人囚人のジレンマの均衡

\(n\)人囚人のジレンマの定義より、すべてのプレイヤーが裏切り戦略を選ぶことが強支配純粋戦略均衡になることが示されます(演習問題にします)。ちなみに、強支配純粋戦略が存在する場合には一意的であるため、裏切り戦略の組は\(n\)人囚人のジレンマにおける一意的な強支配純粋戦略均衡です。

一般に、戦略型ゲーム\(G\)に強支配純粋戦略均衡が存在することと、\(G\)の混合拡張\(G^{\ast }\)に強支配混合戦略均衡が存在することは必要十分であるとともに、両者は一致します。したがって、裏切り戦略の組は\(n\)人囚人のジレンマにおける一意的な強支配混合戦略均衡でもあります。

命題(n人囚人のジレンマの強支配戦略均衡)
\(n\)人囚人のジレンマにおいて、すべてのプレイヤーが裏切り戦略\(D\)を選ぶことは唯一の強支配純粋戦略均衡である。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

\(n\)人囚人のジレンマは支配戦略均衡を持つことが明らかになりました。したがって、プレイヤーたちの合理性が相互知識や共有知識であることを仮定せずとも、それぞれのプレイヤーが合理的でありさえすれば、裏切り戦略の組が実際にプレーされることが理論的に予測されます。

戦略型ゲーム\(G\)に強支配純粋戦略均衡が存在する場合、それは狭義の純粋戦略ナッシュ均衡でもあります。同様に、\(G\)の混合拡張\(G^{\ast }\)に強支配混合戦略均衡が存在する場合、それは狭義の混合戦略ナッシュ均衡でもあります。したがって、裏切り戦略の組は\(n\)人囚人のジレンマにおける狭義の純粋戦略ナッシュ均衡であるとともに、狭義の混合戦略ナッシュ均衡でもあります。

命題(n人囚人のジレンマのナッシュ均衡)
\(n\)人囚人のジレンマにおいて、裏切り戦略の組はナッシュ均衡である。

\(n\)人囚人のジレンマにおいて、全員が均衡にしたがって裏切り戦略\(D\)を選ぶと、それぞれのプレイヤー\(i\)は利得\(u_{i}\left( D,0\right) \)を得ます。一方、全員が協調戦略\(C\)を選ぶ場合、プレイヤー\(i\)は利得\(u_{i}\left(C,n-1\right) \)を得ます。\(n\)人囚人のジレンマの定義より、\begin{equation*}u_{i}\left( C,n-1\right) >u_{i}\left( D,0\right)
\end{equation*}が成り立つため、均衡ではない協調戦略\(C\)の組を実現できれば、均衡が実現する場合よりも任意のプレイヤーはより大きい利得を得られます。しかし、実際には裏切り戦略の組が強支配戦略均衡であるため、均衡において全員にとって望ましくない結果が実現します。

 

演習問題

問題(3人囚人のジレンマ)
ある戦略型ゲーム\(G\)のプレイヤー集合は\(I=\left\{1,2,3\right\} \)であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は\(S_{i}=\left\{C,D\right\} \)です。プレイヤーの利得関数は以下の条件を満たすものとします。このゲームが3人囚人のジレンマであることを示してください。
  1. 全員が\(C\)を選ぶ場合、全員が利得\(3\)を得る。
  2. 2人が\(C\)を選び\(1\)人が\(D\)を選ぶ場合、\(C\)を選んだプレイヤーは利得\(2\)を得て、\(D\)を選んだプレイヤーは利得\(4\)を得る。
  3. 1人が\(C\)を選び\(2\)人が\(D\)を選ぶ場合、\(C\)を選んだプレイヤーは利得\(1\)を得て、\(D\)を選んだプレイヤーは利得\(3\)を得る。
  4. 全員が\(D\)を選ぶ場合、全員が利得\(2\)を得る。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(n人囚人のジレンマ)
\(n\)人囚人のジレンマであるような現実の事例を具体的に提示してください(コメント欄に投稿してください)。

次回はプレイヤーたちが異なる利得関数を持つ場合の囚人のジレンマについて解説します。

Share on twitter
Twitterで共有
Share on email
メールで共有
RELATED KNOWLEDGE

関連知識

囚人のジレンマ

囚人のジレンマ

囚人のジレンマとして広く知られるゲームの最も基本的なモデルを紹介し、それを戦略型ゲームとして定式化した上で、その均衡を分析します。

囚人のジレンマの例

非対称的な利得構造を持つ囚人のジレンマ

これまではプレイヤーたちが同一の利得関数を持つ囚人のジレンマについて考えてきましたが、状況を少し一般化して、プレイヤーたちが異なる利得関数を持つ場合の囚人のジレンマについて考えます。

囚人のジレンマの例

囚人のジレンマとしての軍拡競争

冷戦期に行われた米ソ間の軍拡競争は囚人のジレンマとしての側面を持っていることを解説した上で、そこでのナッシュ均衡を求めます。

囚人のジレンマの例

囚人のジレンマとしての価格競争

完全代替財を販売する企業の間で行われる価格競争は囚人のジレンマとしての側面を持っていることを解説した上で、そこでのナッシュ均衡を求めます。

囚人のジレンマの例

囚人のジレンマとしての広告競争

完全代替財を定価で販売する企業の間で行われる広告競争は囚人のジレンマとしての側面を持っていることを解説した上で、そこでのナッシュ均衡を求めます。

DISCUSSION

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録