教材一覧
教材一覧
教材検索
EXAMPLES OF GAMES

非対称的な利得構造を持つ囚人のジレンマ

目次

Share on twitter
Twitterで共有
Share on email
メールで共有

非対称的な囚人のジレンマ

これまではプレイヤーたちが同一の利得関数を持つ囚人のジレンマについて考えてきましたが、状況を少し一般化して、プレイヤーたちが異なる利得関数を持つ場合の囚人のジレンマについて考えます。ただ、非対称的な利得構造について考える際にも、囚人のジレンマの特徴である、(1) 裏切り戦略の組\(\left( D,D\right) \)が狭義の支配戦略均衡である一方で、(2) プレイヤーたちは均衡ではない協調戦略の組\(\left( C,C\right) \)において均衡である裏切り戦略の組\(\left( D,D\right) \)の場合よりも大きな利得を得られる、という2点を担保する必要があります。そこで、以下の利得行列によって表される戦略型ゲーム\(G\)について考えます。

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & C & D \\ \hline
C & b_{1},b_{2} & d_{1},a_{2} \\ \hline
D & a_{1},d_{2} & c_{1},c_{2} \\ \hline
\end{array}$$

表:非対称的な囚人のジレンマ

ただし、表中の利得の間には、\begin{eqnarray*}
&&\left( A_{1}\right) \ a_{1}>b_{1}\wedge c_{1}>d_{1} \\
&&\left( A_{2}\right) \ a_{2}>b_{2}\wedge c_{2}>d_{2} \\
&&\left( A_{3}\right) \ b_{1}>c_{1}\wedge b_{2}>c_{2}
\end{eqnarray*}などの関係が成り立つものとします。条件\(\left( A_{1}\right) \)が成り立つことは、プレイヤー\(1\)にとって裏切り戦略\(D\)が狭義の支配戦略であることを意味し、条件\(\left( A_{2}\right) \)が成り立つことは、プレイヤー\(2\)にとって裏切り戦略\(D\)が狭義の支配戦略であることを意味します。したがって、\(\left( A_{1}\right) \)と\(\left( A_{2}\right) \)が成り立つ場合、裏切り戦略の組\(\left( D,D\right) \)が狭義の支配戦略均衡となります。さらに、条件\(\left( A_{3}\right) \)が成り立つことは、双方とも協調戦略の組\(\left( C,C\right) \)において裏切り戦略の組\(\left( D,D\right) \)の場合よりも大きな利得を得られることを意味します。したがって、以上の3つの条件が成り立つ限りにおいて、このゲームは囚人のジレンマであると言えます。

命題(非対称な囚人のジレンマの均衡)
戦略型ゲーム\(G\)のプレイヤー集合は\(I=\left\{ 1,2\right\} \)であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は\(S_{i}=\left\{ C,D\right\} \)であり、利得関数\(u_{i}:S_{1}\times S_{2}\rightarrow \mathbb{R} \)は、\begin{eqnarray*}&&\left( A_{1}\right) \ a_{1}>b_{1}\wedge c_{1}>d_{1} \\
&&\left( A_{2}\right) \ a_{2}>b_{2}\wedge c_{2}>d_{2} \\
&&\left( A_{3}\right) \ b_{1}>c_{1}\wedge b_{2}>c_{2}
\end{eqnarray*}を満たす実数\(a_{1},a_{2},b_{1},b_{2},c_{1},c_{2},d_{1},d_{2}\in \mathbb{R} \)を用いて、以下の利得行列

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & C & D \\ \hline
C & b_{1},b_{2} & d_{1},a_{2} \\ \hline
D & a_{1},d_{2} & c_{1},c_{2} \\ \hline
\end{array}$$

表:利得行列

によって表現されているものとする。このゲーム\(G\)には狭義の支配戦略均衡が存在し、それは\(\left( D,D\right) \)である。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

戦略型ゲーム\(G\)に狭義の支配戦略均衡が存在する場合、プレイヤーたちが合理的であるという事実が共有知識でない場合においても、それぞれのプレイヤーが合理的でありさえすれば、プレイヤーたちはその均衡をプレーします。非対称的な囚人のジレンマでは裏切り戦略の組\(\left( D,D\right) \)が狭義の支配戦略均衡であるため、それぞれのプレイヤーが合理的であれば、彼らは均衡\(\left( D,D\right) \)を実際にプレーすることが予測されます。

例(非対称的な囚人のジレンマ)
以下の利得行列で表されるゲームは非対称な囚人のジレンマとしての要件を満たしています。

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & C & D \\ \hline
C & 5,4 & 1,6 \\ \hline
D & 7,0 & 3,2 \\ \hline
\end{array}$$

表:囚人のジレンマ

ゲームの狭義の支配戦略均衡である裏切り戦略の組\(\left( D,D\right) \)においてプレイヤー\(1\)は利得\(3\)を、プレイヤー\(2\)は利得\(2\)を得ますが、それとは別の協調戦略の組\(\left( C,C\right) \)においてプレイヤー\(1\)はより大きい利得\(5\)を、プレイヤー\(2\)もまたより大きい利得\(4\)を得られます。

 

広義の囚人のジレンマ

繰り返しになりますが、非対称的な囚人のジレンマを以下の利得行列

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & C & D \\ \hline
C & b_{1},b_{2} & d_{1},a_{2} \\ \hline
D & a_{1},d_{2} & c_{1},c_{2} \\ \hline
\end{array}$$

表:非対称的な囚人のジレンマ

によって表現しました。ただし、表中の利得の間には以下の3つの条件\begin{eqnarray*}
&&\left( A_{1}\right) \ a_{1}>b_{1}\wedge c_{1}>d_{1} \\
&&\left( A_{2}\right) \ a_{2}>b_{2}\wedge c_{2}>d_{2} \\
&&\left( A_{3}\right) \ b_{1}>c_{1}\wedge b_{2}>c_{2}
\end{eqnarray*}が成り立ちます。

上の3つの条件それぞれにおいて、一方の不等号\(>\)を等号\(=\)に入れ替えると何が起こるでしょうか。そのような利得構造を持つゲームを広義の囚人のジレンマ(weakprisoner’s dilemma)と呼びます。具体例の1つとして、\begin{eqnarray*}
&&\left( A_{1}\right) \ a_{1}=b_{1}\wedge c_{1}>d_{1} \\
&&\left( A_{2}\right) \ a_{2}=b_{2}\wedge c_{2}>d_{2} \\
&&\left( A_{3}\right) \ b_{1}=c_{1}\wedge b_{2}>c_{2}
\end{eqnarray*}が成り立つ状況を想定します。この場合、2人にとって裏切り戦略\(D\)はもはや狭義の支配戦略ではなく広義の支配戦略であるため、裏切り戦略の組\(\left( D,D\right) \)は狭義の支配戦略均衡ではなく広義の支配戦略均衡となります。

命題(広義の囚人のジレンマの均衡)
戦略型ゲーム\(G\)のプレイヤー集合は\(I=\left\{ 1,2\right\} \)であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は\(S_{i}=\left\{ C,D\right\} \)であり、利得関数\(u_{i}:S_{1}\times S_{2}\rightarrow \mathbb{R} \)は、\begin{eqnarray*}&&\left( A_{1}\right) \ a_{1}=b_{1}\wedge c_{1}>d_{1} \\
&&\left( A_{2}\right) \ a_{2}=b_{2}\wedge c_{2}>d_{2} \\
&&\left( A_{3}\right) \ b_{1}=c_{1}\wedge b_{2}>c_{2}
\end{eqnarray*}を満たす実数\(a_{1},a_{2},b_{1},b_{2},c_{1},c_{2},d_{1},d_{2}\in \mathbb{R} \)を用いて、以下の利得行列
$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & C & D \\ \hline
C & b_{1},b_{2} & d_{1},a_{2} \\ \hline
D & a_{1},d_{2} & c_{1},c_{2} \\ \hline
\end{array}$$

表:利得行列

によって表現されているものとする。このゲーム\(G\)には広義の支配戦略均衡が存在し、それは\(\left( D,D\right) \)である。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

戦略型ゲーム\(G\)に広義の支配戦略均衡が存在する場合、均衡が実現することを理論的に予測するためには、プレイヤーたちの合理性だけでなく警戒心の仮定もまた必要です。広義の囚人のジレンマでは裏切り戦略の組\(\left( D,D\right) \)が広義の支配戦略均衡であるため、それぞれのプレイヤーが合理的かつ十分な警戒心を持っていれば、彼らは均衡\(\left( D,D\right) \)を実際にプレーすることが予測されます。

例(広義の囚人のジレンマ)
以下の利得行列で表されるゲームは広義の囚人のジレンマとしての要件を満たしています。

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & C & D \\ \hline
C & 5,4 & 1,4 \\ \hline
D & 5,0 & 5,0 \\ \hline
\end{array}$$

表:広義の囚人のジレンマ

プレイヤー\(1\)にとって裏切り戦略\(D\)は広義の支配戦略であり、プレイヤー\(2\)にとって裏切り戦略\(D\)は広義の支配戦略です。したがって、\(\left( D,D\right) \)は広義の支配戦略均衡です。プレイヤー\(2\)にとって協調戦略の組\(\left( C,D\right) \)は均衡\(\left( D,D\right) \)よりも望ましいですが、プレイヤー\(1\)にとって両者は無差別です。

 

共有知識の囚人のジレンマ

繰り返しになりますが、非対称的な利得構造を持つ囚人のジレンマを以下の利得行列

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & C & D \\ \hline
C & b_{1},b_{2} & d_{1},a_{2} \\ \hline
D & a_{1},d_{2} & c_{1},c_{2} \\ \hline
\end{array}$$

表:非対称的な囚人のジレンマ

によって表現しました。ただし、表中の利得の間には以下の3つの条件\begin{eqnarray*}
&&\left( A_{1}\right) \ a_{1}>b_{1}\wedge c_{1}>d_{1} \\
&&\left( A_{2}\right) \ a_{2}>b_{2}\wedge c_{2}>d_{2} \\
&&\left( A_{3}\right) \ b_{1}>c_{1}\wedge b_{2}>c_{2}
\end{eqnarray*}が成り立ちます。

上の条件\(\left( A_{1}\right) ,\left( A_{2}\right) \)のどちらか一方について、2つある不等式のうちの最初の方を削除したら何が起こるでしょうか。そのような利得構造を持つゲームを共有知識の囚人のジレンマ(common knowledge prisoner’s dilemma)と呼ぶことがあります。具体例の1つとして、\begin{eqnarray*}&&\left( C_{1}\right) \ c_{1}>d_{1} \\
&&\left( C_{2}\right) \ a_{2}>b_{2}\wedge c_{2}>d_{2} \\
&&\left( C_{3}\right) \ b_{1}>c_{1}\wedge b_{2}>c_{2}
\end{eqnarray*}が成り立つ場合について考えます。この場合、プレイヤー\(1\)にとって裏切り戦略\(D\)が狭義の支配戦略であることは明らかではないため、裏切り戦略の組\(\left( D,D\right) \)は狭義の支配戦略均衡ではありません。そこで、プレイヤーの合理性が共有知識であることを仮定した上で、狭義支配される戦略の逐次消去を用いてゲームを解いてみましょう。

命題(共有知識の囚人のジレンマの均衡)
戦略型ゲーム\(G\)のプレイヤー集合は\(I=\left\{ 1,2\right\} \)であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は\(S_{i}=\left\{ C,D\right\} \)であり、利得関数\(u_{i}:S_{1}\times S_{2}\rightarrow \mathbb{R} \)は、\begin{eqnarray*}&&\left( C_{1}\right) \ c_{1}>d_{1} \\
&&\left( C_{2}\right) \ a_{2}>b_{2}\wedge c_{2}>d_{2} \\
&&\left( C_{3}\right) \ b_{1}>c_{1}\wedge b_{2}>c_{2}
\end{eqnarray*}を満たす実数\(a_{2},b_{1},b_{2},c_{1},c_{2},d_{1},d_{2}\in \mathbb{R} \)を用いて、以下の利得行列
$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & C & D \\ \hline
C & b_{1},b_{2} & d_{1},a_{2} \\ \hline
D & a_{1},d_{2} & c_{1},c_{2} \\ \hline
\end{array}$$

表:利得行列

によって表現されているものとする。このゲーム\(G\)は純粋戦略によって強支配される戦略の逐次消去によって解くことでき、その解は\(\left( D,D\right) \)である。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

戦略型ゲーム\(G\)が純粋戦略によって狭義支配される戦略の逐次消去によって解くことができる場合、その解が実現することを理論的に予測するためには、プレイヤーたちの合理性が共有知識である必要があります。共有知識の囚人のジレンマでは裏切り戦略の組\(\left(D,D\right) \)が狭義支配される戦略の逐次消去の解であるため、それぞれのプレイヤーが合理的であることが共有知識であれば、彼らは\(\left( D,D\right) \)を実際にプレーすることが予測されます。

例(共有知識の囚人のジレンマ)
以下の利得行列で表されるゲームは広義の囚人のジレンマとしての要件を満たしています。

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & C & D \\ \hline
C & 5,5 & 2,6 \\ \hline
D & 3,3 & 4,4 \\ \hline
\end{array}$$

表:広義の囚人のジレンマ

プレイヤー\(1\)は支配戦略を持たないため、このゲームには支配戦略均衡は存在しません。一方、狭義支配される戦略の逐次消去を適用すると解\(\left( D,D\right) \)が得られます。ただ、両者にとって\(\left( D,D\right) \)よりも\(\left( C,C\right) \)のほうが望ましい結果です。

次回は軍拡競争が囚人のジレンマとしての側面を持つことを解説します。

Share on twitter
Twitterで共有
Share on email
メールで共有
RELATED KNOWLEDGE

関連知識

囚人のジレンマ

囚人のジレンマ

囚人のジレンマとして広く知られるゲームの最も基本的なモデルを紹介し、それを戦略型ゲームとして定式化した上で、その均衡を分析します。

クールノー競争

戦略型ゲーム(標準型ゲーム)

完備情報の静学ゲームを記述するためにはプレイヤー、行動、結果、利得などをそれぞれ具体的に特定する必要があります。それらの要素を記述する方法はいくつか存在しますが、ここでは戦略型ゲームと呼ばれるモデルについて解説します。

囚人のジレンマ

n人囚人のジレンマ

囚人のジレンマは2人ゲームですが、これを3人以上に拡張するとどのようなモデルになるでしょうか。n人囚人のジレンマと呼ばれるゲームについて解説します。

囚人のジレンマ

囚人のジレンマの例:軍拡競争

冷戦期に行われた米ソ間の軍拡競争は囚人のジレンマとしての側面を持っていることを解説した上で、そこでのナッシュ均衡を求めます。

ベイジアンゲーム

ベイジアンゲームにおける支配戦略均衡

ベイジアンゲームにおいてプレイヤーがある純粋戦略を選ぶとき、自身を含めた全員のタイプや他のプレイヤーたちの行動、信念に関わらず利得を常に最大化できるならば、そのような戦略を支配純粋戦略と呼びます。支配純粋戦略の組を支配純粋戦略均衡と呼びます。

クールノー競争

クールノー競争(クールノー均衡)

同質財を生産する複占市場における数量競争をモデル化したゲームをクールノー競争と呼び、そこでのナッシュ均衡をクールノー均衡と呼びます。

支配戦略均衡

狭義の支配戦略均衡

戦略型ゲームにおける純粋戦略の組を構成する戦略がいずれも狭義の支配戦略である場合、そのような戦略の組を狭義の支配戦略均衡と呼びます。

支配戦略均衡

広義の支配戦略均衡

戦略型ゲームにおける純粋戦略の組を構成する戦略がいずれも広義の支配戦略である場合、そのような戦略の組を広義の支配戦略均衡と呼びます。

支配される戦略の逐次消去

狭義支配される戦略の逐次消去

与えられたゲームにおいてそれぞれのプレイヤーが何らかの戦略によって狭義支配される純粋戦略を持つ場合、それをプレイヤーの純粋戦略集合から消去することを通じてプレイヤーたちが選択し得る戦略の組を絞り込む手法を狭義支配される戦略の逐次消去と呼びます。

支配される戦略の逐次消去

広義支配される戦略の逐次消去

与えられたゲームにおいてそれぞれのプレイヤーが何らかの戦略によって広義支配される純粋戦略を持つ場合、それをプレイヤーの純粋戦略集合から消去することを通じてプレイヤーたちが選択し得る戦略の組を絞り込む手法を広義支配される戦略の逐次消去と呼びます。

支配される戦略の逐次消去

支配される戦略を消去する順番

支配される戦略の逐次消去のプロセスにおいて、戦略を消去する順番が結果に与える影響について解説します。

支配される戦略の逐次消去

支配される戦略の逐次消去と合理性

プレイヤーたちが支配される戦略の逐次消去にしたがって意思決定を行うことを保証するためには、プレイヤーの合理性が共有知識であることを仮定する必要があります。

事後均衡

事後均衡と支配戦略均衡の関係

ベイジアンゲームにおいて事後均衡は支配戦略均衡でもありますが、その逆は成立するとは限りません。ただ、私的価値モデルにおいて事後均衡が一定の条件を満たす場合、それは支配戦略均衡になることが保証されます。

ナッシュ均衡

ナッシュ均衡と支配される戦略の逐次消去の関係

戦略型ゲームにナッシュ均衡が存在する場合、そのゲームに支配される戦略の逐次消去を適用すると、そのナッシュ均衡は最後まで残ります。特に、ゲームが逐次消去によって解ける場合、その解はゲームの一意的なナッシュ均衡であることが保証されます。

DISCUSSION

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録

ゲームの例