囚人のジレンマとして広く知られるゲームの最も基本的なモデルを紹介し、それを戦略型ゲームとして定式化します。

2019年11月21日:改訂
2018年5月22日:公開

囚人のジレンマ

ある犯罪の共犯と思われる 2 人の被疑者が逮捕され取り調べを受けています。 2 人は別々の取調室に隔離されているため、互いに話をしたりメッセージを交換することはできません。検察は問題としている犯罪に関して 2 人を有罪にするほど十分な証拠を持っていませんが、比較的軽微な余罪に関して 2 人を有罪にするに足る証拠を持っています。そこで検察は 2 人に対して罪を自白するか黙秘するかのどちらか一方を選択させます。ただし、 2 人の行動の組み合わせに応じて以下の帰結が生じることを 2 人に対してあらかじめ伝えておきます。

  • 2 人がともに自白すれば両者は容疑の件に関して有罪が確定し、両者はともに 8 年の懲役刑を受ける。
  • 2 人がともに黙秘すれば両者は容疑の件に関しては有罪にならないが、余罪に関して有罪が確定し、両者はともに 1 年の懲役刑を受ける。
  • 2 人のうち一方だけが自白した場合には共犯証言の制度により、自白した者の量刑は 3 ヶ月となり、黙秘した者への量刑は 10 年となる。

これは 1950 年にランド研究所のメリル・フラッド(Merrill Flood)とメルビン・ドレッシャー(Melvin Dresher)が行った心理実験から着想を得て、同じくランド研究所の顧問であったアルバート・タッカー(Albert Tucker)が形式化した囚人のジレンマ(prisoner’s dilemma)と呼ばれる逸話です。

 

完備情報の静学ゲームとしての囚人のジレンマ

囚人のジレンマが想定する状況を 2 人の被疑者をプレイヤーとするゲームと解釈します。2 人の被疑者は別々の取調室に隔離されているため、両者の間に拘束的合意は成立しません。また、仮に 2 人は逮捕される前に接触しており、取り調べにおいて口裏を合わせる約束をしていた場合でも、その約束には拘束力がありません。したがって囚人のジレンマは非協力ゲームです。さらに、2 人の被疑者は取り調べ中に相談することはできず、各自が相手の意思決定を観察できない状態で意思決定を行うことを強いられるため、囚人のジレンマは静学ゲームです。さらにゲームのルールが 2 人にとって共有知識であることを仮定するのであれば、囚人のジレンマが描写する戦略的相互依存の状況は完備情報の静学ゲームとして記述可能です。

非協力ゲームについて復習する 静学ゲームについて復習する

そこで、囚人のジレンマを以下のような戦略型ゲーム\(G\)としてモデル化します。まず、ゲーム\(G\)のプレイヤー集合は\(I=\{1,2\}\)です。ただし、\(i\in I\)は被疑者\(i\)を表します。また、プレイヤー\(i\)の純戦略集合は\(S_{i}=\{C,D\}\)です。ただし、\(C\)は協調戦略である黙秘を表し(CooperateのC)、\(D\)は裏切り戦略である自白を表します(DefectのD)。ゲームの結果は以下の行列として整理されます。
$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & C & D \\ \hline
C & 1年,1年 & 10年,3カ月 \\ \hline
D & 3カ月,10年 & 8年,8年 \\ \hline
\end{array}$$

表:囚人のジレンマの結果行列

利得関数に関しては様々な可能性がありますが、囚人のジレンマとは以下の利得行列

$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & C & D \\ \hline
C & b,b & d,a \\ \hline
D & a,d & c,c \\ \hline
\end{array}$$

表:囚人のジレンマの利得行列

によって定義されるゲームです。ただし、表中の\(a,b,c,d\)は利得を表しており、これらの間には、\begin{eqnarray*}
&&\left( 1\right) \ a>b>c>d \\
&&\left( 2\right) \ 2b>a+d>2a
\end{eqnarray*}という関係が成り立つものとします。

条件\(\left( 1\right) \)は、それぞれのプレイヤーにとってどの結果が相対的に望ましいかを表現しています。つまり、それぞれのプレイヤーにとって、自分だけが裏切って相手を出し抜くこと(その場合の利得は\(a\))が最も望ましく、相手だけが裏切って相手に出し抜かれること(その場合の利得は\(d\))が最悪です。また、残りの 2 つの結果については、互いに裏切って自白するよりも(その場合の利得は\(c\))、互いに協調して黙秘するほうが(その場合の利得は\(d\))マシです。

条件\(\left( 2\right) \)は、2 人のプレイヤーから構成される集団にとってどの結果が相対的に望ましいかを表現しています。つまり、2 人が協調してともに黙秘することが集団としては最良であり(その場合の 2 人の利得の合計は\(2b\)で最大)、両者がともに裏切って自白することが集団として最悪な結果です(その場合の 2 人の利得の和は\(2a\)で最小になる)。

戦略型ゲームについて復習する
例(囚人のジレンマ)
以下の利得行列は囚人のジレンマとしての条件を満たしています。

$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & C & D \\ \hline
C & 5,5 & 0,8 \\ \hline
D & 8,0 & 2,2 \\ \hline
\end{array}$$

表:囚人のジレンマ

次回は囚人のジレンマの均衡を特定した上で、均衡の意味やそこから引き出される教訓などを解説します。

次へ進む 演習問題(プレミアム会員限定)

ワイズをさらに活用するための会員サービス

ユーザー名とメールアドレスを入力して一般会員に無料登録すれば、質問やコメントを投稿できるようになります。さらに、有料(500円/月)のプレミアム会員へアップグレードすることにより、プレミアムコンテンツ(命題の証明や演習問題、解答など)にアクセスできます。
会員サービス

ディスカッションに参加しますか?

質問やコメントを投稿するにはログインが必要です。
ログイン

アカウント
ログイン