囚人のジレンマの例：軍拡競争

冷戦期の軍拡競争

第2次世界大戦が終結した1945年からソビエト連邦崩壊の1991年までの45年間は冷戦（the Cold War）と呼ばれる時期であり、世界は米国を中心とする西側陣営とソ連を中心とする東側陣営とに分かれて激しく対立しました。ただ、米ソ両国が直接的に軍事衝突することはなく、両者の激しい争いは政治や経済、技術、イデオロギーなどの分野で繰り広げられました。軍事力を用いて直接戦う熱戦（hot war）との対比で、この時期の両国間の緊張状態は冷戦と呼ばれています。

米ソ対立が熱戦へと発展しなかった最大の理由は原子爆弾（atomic bomb）の登場にあります。原爆の開発は1942年から米国で始まったマンハッタン計画（Manhattan Project）で進められ、1945年に実験が成功します。一方、ソ連が初めて核実験に成功したのが1949年です。つまり、冷戦の当初、原爆を保有していたのは米国だけでした。対立する2国の内の一方だけが核兵器を保有する場合、核保有国は核の脅し（nuclear blackmail）を背景に相手国を従わせることができます。しかし、両国がともに核兵器を保有するようになると状況が一変します。

核保有国どうしの軍事衝突がエスカレートして一方が核兵器を使用した場合、攻撃を受けた側に核戦力が残っていれば、核による報復を行います。このような戦略を相互確証破壊（Mutual Assured Destruction, MAD）と言います。MADが遂行される結果、両国において無数の人々が命を失い、主要都市が壊滅するとともに放射性物質で汚染されるため、両国の文明そのものが消滅してしまいます。したがって、核保有国どうしが対立している場合でも、両国はそれを熱戦へと発展させるインセンティブを持ちません。熱戦は核戦争の発端となり、両国の滅亡へつながるからです。ソ連が核を保有するようになったことで、米国による核の脅しは信憑性を失いました。

核保有国の間にMADが成立するためには、仮に相手から核の先制攻撃を受けた場合でも核戦力を残存させることができ、なおかつ核による報復が可能であることを相手に知らしめておく必要があります。そのような証明が不可能である場合、相手国から核の脅しを受けることになってしまいます。そのようなこともあり、冷戦期の米ソ両国は核兵器の増産と新型核兵器の開発を大々的に行い、それが両国の財政を圧迫しました。こうした現象は軍拡競争（the Arms Race）と呼ばれています。

完備情報の静学ゲームとしての軍拡競争

冷戦期に行われた軍拡競争を米ソ両国をプレイヤーとするゲームと解釈します。仮に両国が核兵器の増産や新型核兵器の開発を抑制するよう約束した場合でも、その約束には拘束力はありません。したがって軍拡競争は非協力ゲームです。また、両国は相手国の戦略を観察できない状態で自身の戦略を決めることを強いられるのであれば、軍拡競争は静学ゲームです。さらにゲームのルールが両国にとって共有知識であることを仮定するのであれば、軍拡競争が描写する戦略的相互依存の状況は完備情報の静学ゲームとして記述可能です。

そこで、軍拡競争を以下のような戦略型ゲーム$G$としてモデル化します。まず、ゲーム$G$のプレイヤー集合は$I=\{1,2\}$です。ただし、プレイヤー$1$は米国を、プレイヤー$2$はソ連を表します。それぞれのプレイヤー$i\in I$の純粋戦略集合は$S_{i}=\{D,A\}$です。ただし、$D$は軍拡を行わないことを表し（Disarm の D）、$A$は軍拡を進めることを表します（Arm の A）。

両国がともに軍拡を行わない場合、両国の核戦力バランスは変わらないため、両国の安全保障水準も変わりません。そこで、この場合に各国が得る利得を$1$で表します。

両国がともに軍拡を行う場合、両国の核戦力バランスは変わらないため、両国の安全保障水準も変わりません。しかし、軍拡には膨大な軍事支出がかかるため、この場合に各国が得る利得を$0$で表します。

一方の国が軍拡を行うとともに他方の国が軍拡を行わない場合、軍拡を行った国が核戦力で優位に立ちます。その結果、相手国がMADを遂行できなくなるため、相手に対して核の脅しを仕掛けることができるようになります。軍拡には軍事支出が必要ですが、核の脅しによって得られる諸々の利益はそれを上回るため、両国が軍拡を行わない場合の利得$1$よりも大きな利得$a$を得られるものとします。$a>1$です。軍拡を行わなかった国は相手から核の脅しを受けて服従せざるを得なくなりますが、その場合に被る諸々の不利益は、軍拡を行わないことで節約できる財政支出よりも大きいため、この場合、軍拡を行う場合の利得$0$よりも小さい利得$b$を得るものとします。$b<0$です。

以上を踏まえると、このゲームは以下の利得行列として整理されます。

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & D & A \\ \hline
D & 1,1 & b,a \\ \hline
A & a,b & 0,0 \\ \hline
\end{array}$$

表：軍拡競争

ただし、$a>1$かつ$b<0$です。

軍拡競争ゲームにおける均衡

軍拡競争ゲームでは軍拡戦略の組$\left( A,A\right) $が狭義の支配戦略均衡になります。

命題（軍拡ゲームにおける支配戦略均衡）

戦略型ゲーム$G$のプレイヤー集合は$I=\left\{ 1,2\right\} $であり、それぞれのプレイヤー$i\in I$の純粋戦略集合は$S_{i}=\left\{ D,A\right\} $であり、利得関数$u_{i}:S_{1}\times S_{2}\rightarrow \mathbb{R} $は、$a>1$かつ$b<0$を満たす実数$a,b\in \mathbb{R} $を用いて、以下の利得行列

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & D & A \\ \hline
D & 1,1 & b,a \\ \hline
A & a,b & 0,0 \\ \hline
\end{array}$$

表：軍拡競争

によって表現されているものとする。このゲーム$G$には狭義の支配戦略均衡が存在し、それは$\left( A,A\right) $である。

証明

プレミアム会員専用コンテンツです
【ログイン】【会員登録】

一般に、戦略型ゲーム$G$に狭義の支配戦略均衡が存在する場合には一意的であるため、軍拡戦略の組$\left(A,A\right) $は軍拡競争ゲームにおける唯一の狭義の支配戦略均衡です。戦略型ゲーム$G$に狭義の支配戦略均衡が存在する場合、プレイヤーたちが合理的であるという事実が共有知識でない場合においても、それぞれのプレイヤーが合理的でありさえすれば、プレイヤーたちはその均衡を実際にプレーする根拠としては十分です。なぜなら、それぞれのプレイヤーにとって、相手がどの行動を選ぶかとは関係なく、また、相手が合理的であるかどうかとは関係なく、自分が合理的でありさえすれば支配戦略を選ぶことが常に最適であるからです。軍拡競争ゲームでは軍拡戦略の組$\left( A,A\right) $が狭義の支配戦略均衡であるため、それぞれのプレイヤーが合理的であれば、彼らは均衡$\left(A,A\right) $を実際にプレーすることが予測されます。

プレイヤーが混合戦略を採用する場合にはどうなるでしょうか。一般に、戦略型ゲーム$G$に狭義の支配戦略均衡が存在することと、$G$の混合拡張$G^{\ast }$に狭義の支配戦略均衡が存在することは必要十分であるとともに、両者は一致します。したがって、軍拡戦略の組$\left( A,A\right) $は混合戦略の範囲においても狭義の支配戦略均衡です。

軍拡競争ゲームの均衡解釈

軍拡競争ゲームにおいてそれぞれのプレイヤーは、相手国が非軍拡$D$と軍拡$A$のどちらを選ぶ場合においても、自国は軍拡$A$したほうが非軍拡$D$の場合よりもより大きな利得を得られます（$A$が$D$を狭義支配する）。したがって、プレイヤーの目的が自己の利得の最大化である限りにおいて、プレイヤーは軍拡$A$を選びます。

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & D & A \\ \hline
D & 1,1 & b,a \\ \hline
A & a,b & 0,0 \\ \hline
\end{array}$$

表：軍拡競争

しかし、二国がともに軍拡$A$を選んだときに実現する結果$\left( A,A\right) $において自国が得る利得（上の表では$0$）は、二国がともに非軍拡$D$を選んだときに実現する結果$\left( D,D\right) $において自国が得る利得（上の表では$1$）よりも小さくなってしまいます。相手国にとっても事情は同じであるため、自国だけではなく相手国にとっても$\left( D,D\right) $は$\left(A,A\right) $よりも望ましい結果のはずです。つまり、それぞれのプレイヤーが自己の利得を最大化するために行動する場合、得られる結果は相手国だけではなく自国にとっても最適なものにならないという意味において、軍拡競争ゲーム興味深い例になっています。

自己の利得を最大化する合理的なプレイヤーたちは本当に$\left(D,D\right) $をプレーしないのでしょうか。$\left( D,D\right) $は$\left( A,A\right) $よりも両国により大きな利得をもたらすため、$\left( D,D\right) $が実現しないという結論に違和感を感じるかもしれません。そこで以下では、$\left( D,D\right) $が実現しない理由をより詳細に分析します。

まず、軍拡ゲームのような完備情報の静学ゲームは、プレイヤーの間に拘束的な合意が成立しない状況が想定されています。したがって、仮に一方の国が$D$を選んだとしても、その国は相手国に対して$D$を選ぶように仕向けることはできません。そして、自分が$D$を選んだときに相手が$A$を選べば、それは自分にとって最悪の結果です（上の表では利得$b$）。したがって自分が$D$を選ぶ合理的な根拠がありません。一歩譲って、仮に相手国に対して$D$を選ぶように仕向けることに成功したとしましょう。しかし、その場合には、今度は自国が$D$ではなく$A$を選べば自国にとって最良の結果になるため（上の表では利得$a$）、自身は$A$を選ぶことになります。したがってこの場合にも自身が$D$を選ぶ合理的な根拠がありません。

鹿狩りゲームとしての軍拡競争ゲーム

繰り返しになりますが、軍拡競争ゲーム$G$を以下の利得行列

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & D & A \\ \hline
D & 1,1 & b,a^{\ast } \\ \hline
A & a^{\ast },b & 0^{\ast },0^{\ast } \\ \hline
\end{array}$$

表：軍拡競争

として定義しました。ただし、$a>1$かつ$b<0$です。上図ではプレイヤーが相手の戦略に対する最適戦略を選んだときに得る利得に$\ast $を記しています。繰り返しになりますが、このゲームにおいて$\left( A,A\right) $が狭義の支配戦略均衡になります。ただ、以上の分析はプレイヤーたちの利得関数に依存しています。両国が直面する状況を少し変更し、それにあわせて利得関数を変更すると分析結果も変わります。

$a>1$という仮定、すなわち、相手が非軍拡$D$を選んだ場合に自分は非軍拡$D$よりも軍拡$A$を選んだ方がよいという仮定は、「核の脅しによって得られる利益は軍拡のための軍事支出がもたらす不利益よりも大きい」という仮定にもとづいています。ただ、軍拡にともなう軍事支出が想定よりも大きい場合、また、核の脅しによって得られる利益が想定よりも小さい場合などには、逆に、$a<1$という関係が成立する状況が起こり得ます。

$b<0$という仮定、すなわち、相手が軍拡$A$を選んだ場合に自分は非軍拡$D$よりも軍拡$A$を選んだ方がよいという仮定は、「核の脅しを受けて服従することの不利益は、軍拡のための軍事支出がもたらす不利益よりも大きい」という仮定にもとづいていますが、国として独立を維持することが最優先課題であるならば、軍事支出が想定よりも大きい場合でも、$b<0$という関係は相変わらず成立するものと考えられます。

以上のように話の前提を変更した場合、プレイヤーが相手の戦略に対する最適戦略を選んだときに得る利得に$\ast $を記すと以下のようになります。

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & D & A \\ \hline
D & 1^{\ast },1^{\ast } & b,a \\ \hline
A & a,b & 0^{\ast },0^{\ast } \\ \hline
\end{array}$$

表：軍拡競争

つまり、それぞれのプレイヤーにとって軍拡$A$はもはや支配戦略ではないということです。軍拡にともなう軍事費が大きい場合などには、軍拡ゲームは囚人のジレンマではなく、後に解説する鹿狩りゲームとみなされます。それにあわせて、ゲームのナッシュ均衡は以下のように変化します。

命題（鹿狩りゲームとしての軍拡競争ゲーム）

戦略型ゲーム$G$のプレイヤー集合は$I=\left\{ 1,2\right\} $であり、それぞれのプレイヤー$i\in I$の純粋戦略集合は$S_{i}=\left\{ D,A\right\} $であり、利得関数$u_{i}:S_{1}\times S_{2}\rightarrow \mathbb{R} $は、$a<1$かつ$b<0$を満たす実数$a,b\in \mathbb{R} $を用いて、以下の利得行列

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & D & A \\ \hline
D & 1,1 & b,a \\ \hline
A & a,b & 0,0 \\ \hline
\end{array}$$

表：軍拡競争

によって表現されているものとする。このゲーム$G$には狭義の純粋戦略ナッシュ均衡が存在し、それは$\left( D,D\right) $と$\left( A,A\right) $である。

証明

プレミアム会員専用コンテンツです
【ログイン】【会員登録】

軍拡にともなう軍事費が大きい場合などには、軍拡競争ゲームに2つの純粋戦略ナッシュ均衡が存在する状況が起こり得ることが明らかになりました。しかも、プレイヤーは支配戦略を持たないため、この2つの均衡は支配戦略均衡や、支配される戦略の逐次消去の解ではありません。したがって、この場合には以下の2つの点が問題になります。

1つ目は、均衡が実際にプレーされるかどうかという問題です。ナッシュ均衡が支配戦略均衡や支配される戦略の逐次消去による解である場合には、プレイヤーたちの合理性や警戒心の仮定、もしくはそれらが共有知識であることは、プレイヤーたちが実際に均衡をプレーする根拠となります。一方、新たな軍拡競争ゲームの均衡は支配戦略均衡や支配される戦略の逐次消去による解ではないため、合理性や警戒心の仮定、もしくはそれらが共有知識であることは、プレイヤーたちが何らかの均衡を実際にプレーする根拠となる得るか自明ではありません。新たな軍拡競争ゲームでは、相手が軍拡するのであれば自分も軍拡したほうがよく、相手が軍拡をしないのであれば自分も軍拡をしないほうがよい、という構造になっているため、何らかの均衡が実際にプレーされることを保証するためには、プレイヤーはお互いに相手の行動を正しく予想する必要があります。この予想が成立することを保証するためには、何らかの説明体系が必要になります。

2つ目は、複数均衡の問題です。ゲームに複数のナッシュ均衡が存在する場合においても、その中の1つが広義の支配戦略均衡や広義支配される戦略の逐次消去の解である場合には、プレイヤーたちの合理性や警戒心の仮定、もしくはそれらが共有知識であることは、その特定の均衡がプレーされる根拠となるため、複数均衡問題は解決可能です。一方、新たな軍拡競争ゲームの均衡の中には広義の支配戦略均衡や広義支配される戦略の逐次消去の解が含まれないため、どちらの均衡がプレーされることになるかは自明ではなく、何らかの説明体系が必要になります。

ちなみに、繰り返しになりますが、冒頭で考えた囚人のジレンマとしての軍拡競争ゲームでは両国が軍拡を行う結果$\left( A,A\right) $だけがナッシュ均衡であるため複数均衡の問題が発生しません。加えて、この均衡$\left( A,A\right) $は狭義の支配戦略均衡であるため、それぞれのプレイヤーは相手の行動について考える必要がなく、軍拡$A$を常に選ぶことが常に最善であり、したがって、プレイヤーが合理的でありさえすれば均衡$\left( A,A\right) $が実現します。

WIIS

数学のコース

経済学のコース

アカウント

WIIS

ゲームの例

目次

関連知識

冷戦期の軍拡競争

完備情報の静学ゲームとしての軍拡競争

軍拡競争ゲームにおける均衡

軍拡競争ゲームの均衡解釈

鹿狩りゲームとしての軍拡競争ゲーム

関連知識

質問とコメント

LEARN MORE

さらに深く学びたい人のための会員サービス

論理

集合

実数

ユークリッド空間

微分積分

測度

確率