非対称的な利得構造を持つ囚人のジレンマ

これまではプレイヤーたちが同一の利得関数を持つ囚人のジレンマについて考えてきましたが、状況を少し一般化して、プレイヤーたちが異なる利得関数を持つ場合の囚人のジレンマについて考えます。

非対称的な利得構造を持つ囚人のジレンマ

これまではプレイヤーたちが同一の利得関数を持つ囚人のジレンマについて考えてきましたが、状況を少し一般化して、プレイヤーたちが異なる利得関数を持つ場合の囚人のジレンマについて考えます。ただ、非対称的な利得構造について考える際にも、囚人のジレンマの特徴である、(1) 裏切り戦略の組\(\left( D,D\right) \)がゲームの強支配戦略均衡である一方で、(2) プレイヤーたちは協調戦略の組\(\left( C,C\right) \)において裏切り戦略の組\(\left( D,D\right) \)の場合よりも大きな利得を得られる、という2点を担保する必要があります。そこで、以下の利得行列によって表されるゲームについて考えます。

$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & C & D \\ \hline
C & b_{1},b_{2} & d_{1},a_{2} \\ \hline
D & a_{1},d_{2} & c_{1},c_{2} \\ \hline
\end{array}$$

表:非対称的な囚人のジレンマ

ただし、表中の利得の間には、\begin{eqnarray*}
&&\left( A_{1}\right) \ a_{1}>b_{1},\quad c_{1}>d_{1} \\
&&\left( A_{2}\right) \ a_{2}>b_{2},\quad c_{2}>d_{2} \\
&&\left( A_{3}\right) \ b_{1}>c_{1},\quad b_{2}>c_{2}
\end{eqnarray*}という関係がすべて成り立つものとします。条件\(\left( A_{1}\right) \)が成り立つことは、プレイヤー\(1\)にとって裏切り戦略\(D\)が強支配戦略であることを意味し、条件\(\left( A_{2}\right) \)が成り立つことは、プレイヤー\(2\)にとって裏切り戦略\(D\)が強支配戦略であることを意味します。したがって、\(\left( A_{1}\right) \)と\(\left( A_{2}\right) \)が成り立つ場合、裏切り戦略の組\(\left( D,D\right) \)が強支配戦略均衡となります。さらに、条件\(\left( A_{3}\right) \)が成り立つことは、双方とも協調戦略の組\(\left( C,C\right) \)において裏切り戦略の組\(\left( D,D\right) \)の場合よりも大きな利得を得られることを意味します。したがって、以上の3つの条件が成り立つ限りにおいて、このゲームは囚人のジレンマであると言えます。

例(非対称な利得構造を持つ囚人のジレンマ)
以下の利得行列で表されるゲームは囚人のジレンマとしての要件を満たしています。
$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & C & D \\ \hline
C & 5,4 & 1,6 \\ \hline
D & 7,0 & 3,2 \\ \hline
\end{array}$$
表:囚人のジレンマ

ゲームの強支配戦略均衡である\(\left( D,D\right) \)においてプレイヤー\(1\)は利得\(3\)を、プレイヤー\(2\)は利得\(2\)を得ますが、それとは別の純粋戦略の組\(\left( C,C\right) \)においてプレイヤー\(1\)はより大きい利得\(5\)を、プレイヤー\(2\)もまたより大きい利得\(4\)を得られます。

 

弱い囚人のジレンマ

繰り返しになりますが、非対称的な利得構造を持つ囚人のジレンマを以下の利得行列

$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & C & D \\ \hline
C & b_{1},b_{2} & d_{1},a_{2} \\ \hline
D & a_{1},d_{2} & c_{1},c_{2} \\ \hline
\end{array}$$

表:非対称的な囚人のジレンマ

によって表現しました。ただし、表中の利得の間には以下の3つの条件\begin{eqnarray*}
\left( A_{1}\right) \ a_{1} &>&b_{1},\quad c_{1}>d_{1} \\
\left( A_{2}\right) \ a_{2} &>&b_{2},\quad c_{2}>d_{2} \\
\left( A_{3}\right) \ b_{1} &>&c_{1},\quad b_{2}>c_{2}
\end{eqnarray*}が成り立ちます。

上の3つの条件それぞれにおいて、一方の不等号\(>\)を等号\(=\)に入れ替えると何が起こるでしょうか。そのような利得構造を持つゲームを弱い囚人のジレンマ(weak prisoner’s dilemma)と呼ぶことがあります。具体例の1つとして、\begin{eqnarray*}
&&\left( B_{1}\right) \ a_{1}=b_{1},\quad c_{1}>d_{1} \\
&&\left( B_{2}\right) \ a_{2}=b_{2},\quad c_{2}>d_{2} \\
&&\left( B_{3}\right) \ b_{1}=c_{1},\quad b_{2}>c_{2}
\end{eqnarray*}が成り立つ場合について考えます。この場合、双方にとって裏切り戦略\(D\)はもはや強支配戦略ではなく弱支配戦略であるため、裏切り戦略の組\(\left( D,D\right) \)は強支配戦略均衡ではなく弱支配戦略均衡となります。したがって、この均衡が実現することを理論的に予測するためには、プレイヤーたちの合理性だけでなく警戒心の仮定もまた必要です。\(b_{2}>c_{2}\)より、プレイヤー\(2\)は依然として均衡である裏切り戦略の組\(\left( D,D\right) \)よりも協調戦略の組\(\left( C,C\right) \)においてより大きな利得を得られます。一方、\(b_{1}=c_{1}\)より、プレイヤー\(1\)にとって両者は無差別です。

例(弱い囚人のジレンマ)
以下の利得行列で表されるゲームは弱い囚人のジレンマとしての要件を満たしています。

$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & C & D \\ \hline
C & 5,4 & 1,4 \\ \hline
D & 5,0 & 5,0 \\ \hline
\end{array}$$

表:弱い囚人のジレンマ

プレイヤー\(1\)にとって裏切り戦略\(D\)は弱支配戦略であり、プレイヤー\(2\)にとって裏切り戦略\(D\)は弱支配戦略です。したがって、\(\left( D,D\right) \)は弱支配戦略均衡です。プレイヤー\(2\)にとって協調戦略の組\(\left( C,D\right) \)は均衡\(\left( D,D\right) \)よりも望ましいですが、プレイヤー\(1\)にとって両者は無差別です。

 

共有知識の囚人のジレンマ

繰り返しになりますが、非対称的な利得構造を持つ囚人のジレンマを以下の利得行列

$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & C & D \\ \hline
C & b_{1},b_{2} & d_{1},a_{2} \\ \hline
D & a_{1},d_{2} & c_{1},c_{2} \\ \hline
\end{array}$$

表:非対称的な囚人のジレンマ

によって表現しました。ただし、表中の利得の間には以下の3つの条件\begin{eqnarray*}
&&\left( A_{1}\right) \ a_{1}>b_{1},\quad c_{1}>d_{1} \\
&&\left( A_{2}\right) \ a_{2}>b_{2},\quad c_{2}>d_{2} \\
&&\left( A_{3}\right) \ b_{1}>c_{1},\quad b_{2}>c_{2}
\end{eqnarray*}が成り立ちます。

上の条件\(\left( A_{1}\right) ,\left( A_{2}\right) \)のどちらか一方について、2つある不等式のうちの最初の方を削除したら何が起こるでしょうか。そのような利得構造を持つゲームを共有知識の囚人のジレンマ(common knowledge prisoner’s dilemma)と呼ぶことがあります。具体例の1つとして、\begin{eqnarray*}
&&\left( C_{1}\right) \ c_{1}>d_{1} \\
&&\left( C_{2}\right) \ a_{2}>b_{2},\quad c_{2}>d_{2} \\
&&\left( C_{3}\right) \ b_{1}>c_{1},\quad b_{2}>c_{2}
\end{eqnarray*}が成り立つ場合について考えます。この場合、プレイヤー\(1\)にとって裏切り戦略\(D\)が強支配戦略であることは明らかではないため、裏切り戦略の組\(\left( D,D\right) \)は強支配戦略均衡ではありません。そこで、プレイヤーの合理性が共有知識であることを仮定した上で、強支配される戦略の逐次消去を用いてゲームを解いてみましょう。

初期ゲーム\(G\)におけるそれぞれのプレイヤーの純粋戦略集合は、\begin{equation*}
S_{1}=S_{2}=\left\{ C,D\right\}
\end{equation*}です。条件\(\left( C_{2}\right) \)より、初期ゲーム\(G\)においてプレイヤー\(2\)は純粋戦略\(D\)によって強支配される純粋戦略\(C\)を持ちます。したがって、その戦略を消去すると、第1期のゲーム\(G_{1}\)におけるそれぞれのプレイヤーの純粋戦略集合は、\begin{equation*}
S_{1}^{1}=\left\{ C,D\right\} ,\quad S_{2}^{1}=\left\{ D\right\}
\end{equation*}となります。条件\(\left( C_{1}\right) \)より、第1期のゲーム\(G\)においてプレイヤー\(1\)は純粋戦略\(D\)によって強支配される純粋戦略\(C\)を持ちます。したがって、その戦略を消去すると、第2期のゲーム\(G_{2}\)におけるそれぞれのプレイヤーの純粋戦略集合は、\begin{equation*}
S_{1}^{2}=S_{2}^{2}=\left\{ D\right\}
\end{equation*}となるため、ゲームは純粋戦略によって強支配される戦略の逐次消去によって解くことができ、その解は\(\left( D,D\right) \)となります。さらに条件\(\left( C_{3}\right) \)より、逐次消去による解\(\left( D,D\right) \)とは別の純粋戦略の組\(\left( C,C\right) \)において両者はより大きな利得を得られます。

次回は軍拡競争が囚人のジレンマとしての側面を持つことを解説します。

次へ進む 質問・コメント(プレミアム会員限定) 演習問題(プレミアム会員限定)
Share on facebook
Share on twitter
Share on email

プレミアム会員になると、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。プレミアム会員の方は以下からログインしてください。

会員登録 | パスワードを忘れましたか?

有料のプレミアム会員になると、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

本サイトは MathJax を実装しているため、コメント文中で LaTex コマンドを利用することで美しい数式を入力できます。その際、インライン数式は\(数式\)で、ディスプレイ数式は$$数式$$という形式でそれぞれ入力してください。 例えば、\(ax^{2}+bx+c=0\)と入力すると\(ax^{2}+bx+c=0\)と表示され、$$ax^{2}+bx+c=0$$と入力すると$$ax^{2}+bx+c=0$$と表示されます。MathJax(LaTex)の文法については次のサイト( https://easy-copy-mathjax.xxxx7.com )などを参照してください。 紙に手書きした数式や図をカメラやスマホで撮影した上で、コメント欄に張り付けることもできます。その場合、コメント入力欄にある「ファイルを選択」ボタンをクリックした上で画像をアップロードしてください。アップロード可能な画像フォーマットは jpg, gif, png の 3 種類、ファイルサイズの上限は 5 MB です。PDF ファイルの添付も可能です。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員だけが質問やコメントを投稿・閲覧できます。