教材一覧
EXAMPLES OF GAMES

非対称的な利得構造を持つ囚人のジレンマ

Share on twitter
Twitterで共有
Share on email
メールで共有

非対称的な利得構造を持つ囚人のジレンマ

これまではプレイヤーたちが同一の利得関数を持つ囚人のジレンマについて考えてきましたが、状況を少し一般化して、プレイヤーたちが異なる利得関数を持つ場合の囚人のジレンマについて考えます。ただ、非対称的な利得構造について考える際にも、囚人のジレンマの特徴である、(1) 裏切り戦略の組\(\left( D,D\right) \)がゲームの強支配戦略均衡である一方で、(2) プレイヤーたちは協調戦略の組\(\left( C,C\right) \)において裏切り戦略の組\(\left( D,D\right) \)の場合よりも大きな利得を得られる、という2点を担保する必要があります。そこで、以下の利得行列によって表されるゲームについて考えます。

$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & C & D \\ \hline
C & b_{1},b_{2} & d_{1},a_{2} \\ \hline
D & a_{1},d_{2} & c_{1},c_{2} \\ \hline
\end{array}$$

表:非対称的な囚人のジレンマ

ただし、表中の利得の間には、\begin{eqnarray*}
&&\left( A_{1}\right) \ a_{1}>b_{1},\quad c_{1}>d_{1} \\
&&\left( A_{2}\right) \ a_{2}>b_{2},\quad c_{2}>d_{2} \\
&&\left( A_{3}\right) \ b_{1}>c_{1},\quad b_{2}>c_{2}
\end{eqnarray*}という関係がすべて成り立つものとします。条件\(\left( A_{1}\right) \)が成り立つことは、プレイヤー\(1\)にとって裏切り戦略\(D\)が強支配戦略であることを意味し、条件\(\left( A_{2}\right) \)が成り立つことは、プレイヤー\(2\)にとって裏切り戦略\(D\)が強支配戦略であることを意味します。したがって、\(\left( A_{1}\right) \)と\(\left( A_{2}\right) \)が成り立つ場合、裏切り戦略の組\(\left( D,D\right) \)が強支配戦略均衡となります。さらに、条件\(\left( A_{3}\right) \)が成り立つことは、双方とも協調戦略の組\(\left( C,C\right) \)において裏切り戦略の組\(\left( D,D\right) \)の場合よりも大きな利得を得られることを意味します。したがって、以上の3つの条件が成り立つ限りにおいて、このゲームは囚人のジレンマであると言えます。

例(非対称な利得構造を持つ囚人のジレンマ)
以下の利得行列で表されるゲームは囚人のジレンマとしての要件を満たしています。
$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & C & D \\ \hline
C & 5,4 & 1,6 \\ \hline
D & 7,0 & 3,2 \\ \hline
\end{array}$$
表:囚人のジレンマ

ゲームの強支配戦略均衡である\(\left( D,D\right) \)においてプレイヤー\(1\)は利得\(3\)を、プレイヤー\(2\)は利得\(2\)を得ますが、それとは別の純粋戦略の組\(\left( C,C\right) \)においてプレイヤー\(1\)はより大きい利得\(5\)を、プレイヤー\(2\)もまたより大きい利得\(4\)を得られます。

 

弱い囚人のジレンマ

繰り返しになりますが、非対称的な利得構造を持つ囚人のジレンマを以下の利得行列

$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & C & D \\ \hline
C & b_{1},b_{2} & d_{1},a_{2} \\ \hline
D & a_{1},d_{2} & c_{1},c_{2} \\ \hline
\end{array}$$

表:非対称的な囚人のジレンマ

によって表現しました。ただし、表中の利得の間には以下の3つの条件\begin{eqnarray*}
\left( A_{1}\right) \ a_{1} &>&b_{1},\quad c_{1}>d_{1} \\
\left( A_{2}\right) \ a_{2} &>&b_{2},\quad c_{2}>d_{2} \\
\left( A_{3}\right) \ b_{1} &>&c_{1},\quad b_{2}>c_{2}
\end{eqnarray*}が成り立ちます。

上の3つの条件それぞれにおいて、一方の不等号\(>\)を等号\(=\)に入れ替えると何が起こるでしょうか。そのような利得構造を持つゲームを弱い囚人のジレンマ(weak prisoner’s dilemma)と呼ぶことがあります。具体例の1つとして、\begin{eqnarray*}
&&\left( B_{1}\right) \ a_{1}=b_{1},\quad c_{1}>d_{1} \\
&&\left( B_{2}\right) \ a_{2}=b_{2},\quad c_{2}>d_{2} \\
&&\left( B_{3}\right) \ b_{1}=c_{1},\quad b_{2}>c_{2}
\end{eqnarray*}が成り立つ場合について考えます。この場合、双方にとって裏切り戦略\(D\)はもはや強支配戦略ではなく弱支配戦略であるため、裏切り戦略の組\(\left( D,D\right) \)は強支配戦略均衡ではなく弱支配戦略均衡となります。したがって、この均衡が実現することを理論的に予測するためには、プレイヤーたちの合理性だけでなく警戒心の仮定もまた必要です。\(b_{2}>c_{2}\)より、プレイヤー\(2\)は依然として均衡である裏切り戦略の組\(\left( D,D\right) \)よりも協調戦略の組\(\left( C,C\right) \)においてより大きな利得を得られます。一方、\(b_{1}=c_{1}\)より、プレイヤー\(1\)にとって両者は無差別です。

例(弱い囚人のジレンマ)
以下の利得行列で表されるゲームは弱い囚人のジレンマとしての要件を満たしています。

$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & C & D \\ \hline
C & 5,4 & 1,4 \\ \hline
D & 5,0 & 5,0 \\ \hline
\end{array}$$

表:弱い囚人のジレンマ

プレイヤー\(1\)にとって裏切り戦略\(D\)は弱支配戦略であり、プレイヤー\(2\)にとって裏切り戦略\(D\)は弱支配戦略です。したがって、\(\left( D,D\right) \)は弱支配戦略均衡です。プレイヤー\(2\)にとって協調戦略の組\(\left( C,D\right) \)は均衡\(\left( D,D\right) \)よりも望ましいですが、プレイヤー\(1\)にとって両者は無差別です。

 

共有知識の囚人のジレンマ

繰り返しになりますが、非対称的な利得構造を持つ囚人のジレンマを以下の利得行列

$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & C & D \\ \hline
C & b_{1},b_{2} & d_{1},a_{2} \\ \hline
D & a_{1},d_{2} & c_{1},c_{2} \\ \hline
\end{array}$$

表:非対称的な囚人のジレンマ

によって表現しました。ただし、表中の利得の間には以下の3つの条件\begin{eqnarray*}
&&\left( A_{1}\right) \ a_{1}>b_{1},\quad c_{1}>d_{1} \\
&&\left( A_{2}\right) \ a_{2}>b_{2},\quad c_{2}>d_{2} \\
&&\left( A_{3}\right) \ b_{1}>c_{1},\quad b_{2}>c_{2}
\end{eqnarray*}が成り立ちます。

上の条件\(\left( A_{1}\right) ,\left( A_{2}\right) \)のどちらか一方について、2つある不等式のうちの最初の方を削除したら何が起こるでしょうか。そのような利得構造を持つゲームを共有知識の囚人のジレンマ(common knowledge prisoner’s dilemma)と呼ぶことがあります。具体例の1つとして、\begin{eqnarray*}
&&\left( C_{1}\right) \ c_{1}>d_{1} \\
&&\left( C_{2}\right) \ a_{2}>b_{2},\quad c_{2}>d_{2} \\
&&\left( C_{3}\right) \ b_{1}>c_{1},\quad b_{2}>c_{2}
\end{eqnarray*}が成り立つ場合について考えます。この場合、プレイヤー\(1\)にとって裏切り戦略\(D\)が強支配戦略であることは明らかではないため、裏切り戦略の組\(\left( D,D\right) \)は強支配戦略均衡ではありません。そこで、プレイヤーの合理性が共有知識であることを仮定した上で、強支配される戦略の逐次消去を用いてゲームを解いてみましょう。

初期ゲーム\(G\)におけるそれぞれのプレイヤーの純粋戦略集合は、\begin{equation*}
S_{1}=S_{2}=\left\{ C,D\right\}
\end{equation*}です。条件\(\left( C_{2}\right) \)より、初期ゲーム\(G\)においてプレイヤー\(2\)は純粋戦略\(D\)によって強支配される純粋戦略\(C\)を持ちます。したがって、その戦略を消去すると、第1期のゲーム\(G_{1}\)におけるそれぞれのプレイヤーの純粋戦略集合は、\begin{equation*}
S_{1}^{1}=\left\{ C,D\right\} ,\quad S_{2}^{1}=\left\{ D\right\}
\end{equation*}となります。条件\(\left( C_{1}\right) \)より、第1期のゲーム\(G\)においてプレイヤー\(1\)は純粋戦略\(D\)によって強支配される純粋戦略\(C\)を持ちます。したがって、その戦略を消去すると、第2期のゲーム\(G_{2}\)におけるそれぞれのプレイヤーの純粋戦略集合は、\begin{equation*}
S_{1}^{2}=S_{2}^{2}=\left\{ D\right\}
\end{equation*}となるため、ゲームは純粋戦略によって強支配される戦略の逐次消去によって解くことができ、その解は\(\left( D,D\right) \)となります。さらに条件\(\left( C_{3}\right) \)より、逐次消去による解\(\left( D,D\right) \)とは別の純粋戦略の組\(\left( C,C\right) \)において両者はより大きな利得を得られます。

次回は軍拡競争が囚人のジレンマとしての側面を持つことを解説します。

Share on twitter
Twitterで共有
Share on email
メールで共有
RELATED KNOWLEDGE

関連知識

囚人のジレンマ

囚人のジレンマ

囚人のジレンマとして広く知られるゲームの最も基本的なモデルを紹介し、それを戦略型ゲームとして定式化した上で、その均衡を分析します。

囚人のジレンマの例

n人囚人のジレンマ

囚人のジレンマは2人ゲームですが、これを3人以上に拡張するとどのようなモデルになるでしょうか。n人囚人のジレンマと呼ばれるゲームについて解説します。

囚人のジレンマの例

囚人のジレンマとしての軍拡競争

冷戦期に行われた米ソ間の軍拡競争は囚人のジレンマとしての側面を持っていることを解説した上で、そこでのナッシュ均衡を求めます。

囚人のジレンマの例

囚人のジレンマとしての価格競争

完全代替財を販売する企業の間で行われる価格競争は囚人のジレンマとしての側面を持っていることを解説した上で、そこでのナッシュ均衡を求めます。

囚人のジレンマの例

囚人のジレンマとしての広告競争

完全代替財を定価で販売する企業の間で行われる広告競争は囚人のジレンマとしての側面を持っていることを解説した上で、そこでのナッシュ均衡を求めます。

囚人のジレンマ

強支配純粋戦略均衡

あるプレイヤーの純粋戦略が別の純粋戦略を強支配すること、強支配純粋戦略、強支配純粋戦略均衡などについて解説します。

DISCUSSION

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録