囚人のジレンマとして広く知られるゲームの最も基本的なモデルを紹介し、それを戦略型ゲームとして定式化します。

2018年5月22日:公開

囚人のジレンマ

ある犯罪の共犯と思われる 2 人の被疑者が逮捕され取り調べを受けています。 2 人は別々の取調室に隔離されているため、互いに話をしたりメッセージを交換することはできません。検察は問題としている犯罪に関して 2 人を有罪にするほど十分な証拠を持っていませんが、比較的軽微な余罪に関して 2 人を有罪にするに足る証拠を持っています。そこで検察は 2 人に対して罪を自白するか黙秘するかのどちらか一方を選択させます。ただし、 2 人の行動の組み合わせに応じて以下の帰結が生じることを 2 人に対してあらかじめ伝えておきます。

  1. 2 人がともに自白すれば両者は容疑の件に関して有罪が確定し、両者はともに\(8\)年の懲役刑を受ける。
  2. 2 人がともに黙秘すれば両者は容疑の件に関しては有罪にならないが、余罪に関して有罪が確定し、両者はともに\(1\)年の懲役刑を受ける。
  3. 2 人のうち一方だけが自白した場合には共犯証言の制度により、自白した者の量刑は\(3\)ヶ月となり、黙秘した者への量刑は\(10\)年となる。

これは1950年にランド研究所のメリル・フラッド(Merrill Flood)とメルビン・ドレッシャー(Melvin Dresher)が行った心理実験から着想を得て、同じくランド研究所の顧問であったアルバート・タッカー(Albert Tucker)が形式化した囚人のジレンマ(prisoner’s dilemma)と呼ばれる逸話です。

 

完備情報の静学ゲームとしての囚人のジレンマ

囚人のジレンマが想定する状況を 2 人の被疑者をプレイヤーとするゲームと解釈します。2 人の被疑者は別々の取調室に隔離されているため、両者の間に拘束的合意は成立しません。また、仮に 2 人は逮捕される前に接触しており、取り調べにおいて口裏を合わせる約束をしていた場合でも、その約束には拘束力がありません。したがって囚人のジレンマは非協力ゲームです。さらに、2 人の被疑者は取り調べ中に相談することはできず、各自が相手の意思決定を観察できない状態で意思決定を行うことを強いられるため、囚人のジレンマは静学ゲームです。つまり、囚人のジレンマが描写する戦略的相互依存の状況は完備情報の静学ゲームとして記述可能です。

非協力ゲームについて復習する 静学ゲームについて復習する

そこで、囚人のジレンマを以下のような戦略型ゲーム\(G\)としてモデル化します。まず、ゲーム\(G\)のプレイヤー集合は\(I=\{1,2\}\)です。ただし、\(i\in I\)は被疑者\(i\)を表します。また、プレイヤー\(i\)の純戦略集合は\(S_{i}=\{C,D\}\)です。ただし、\(C\)は協調戦略である黙秘を表し(CooperateのC)、\(D\)は裏切り戦略である自白を表します(DefectのD)。ゲームの結果を以下の行列として整理しました。

$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & C & D \\ \hline
C & 1年,1年 & 10年,3カ月 \\ \hline
D & 3カ月,10年 & 8年,8年 \\ \hline
\end{array}$$

表:囚人のジレンマの結果行列

プレイヤーの利得関数に関しては様々な可能性がありますが、典型的なものは以下の利得行列として表現されます。

$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & C & D \\ \hline
C & R,R & S,T \\ \hline
D & T,S & P,P \\ \hline
\end{array}$$

表:囚人のジレンマの利得行列

ただし、表中の\(R,S,T,P\)は利得を表しており、これらの間には、\begin{eqnarray*}
&&\left( a\right) \ T>R>P>S \\
&&\left( b\right) \ 2R>T+S>2P
\end{eqnarray*}という関係が成り立ちます。

条件\(\left( a\right) \)はプレイヤーにとってどの結果が相対的に望ましいかを表現しています。つまり、それぞれのプレイヤーにとって自分だけ抜け駆けして自白することが最良であり(その場合に得る利得は\(T\))、相手に抜け駆けされることが最悪です(その場合に得る利得は\(S\))。また、残りの
2 つの結果に関しては、互いに裏切って自白することよりも(その場合に得る利得は\(P\))、互いに強調して黙秘するほうがマシです(その場合に得る利得は\(R\))。

条件\(\left( b\right) \)は 2 人のプレイヤーから構成される集団にとってどの結果が相対的に望ましいかを表現しています。つまり、両者が協調してともに黙秘することが集団としては最良であり(その場合に 2 人の利得の和は\(2R\)で最大になる)、両者がともに裏切って自白することが集団として最悪な結果です(その場合に 2 人の利得の和は\(2P\)で最小になる)。

戦略型ゲームについて復習する
例(囚人のジレンマ)
以下の利得行列は囚人のジレンマとしての条件\(\left( a\right) ,\left( b\right) \)をともに満たしています。

$$\begin{array}{|c|c|c|}
\hline
1\diagdown 2 & C & D \\ \hline
C & 5,5 & 0,8 \\ \hline
D & 8,0 & 2,2 \\ \hline
\end{array}$$

表:囚人のジレンマ

次回は囚人のジレンマの均衡を特定した上で、均衡の意味やそこから引き出される教訓などを解説します。

次へ進む 演習問題(プレミアム会員限定)