タカ・ハトゲーム
総量\(V>0\)の資源を2つの個体に配分しようとしている状況を想定します。それぞれの個体に与えられている選択肢は以下の2つです。
1つ目は、資源を得るために相手を攻撃するという選択肢であり、これをタカ戦略(Hawk strategy)と呼びます。2つ目は、相手と戦わずに撤退するという選択肢であり、これをハト戦略(Dove strategy)と呼びます。
両者がともにタカ戦略を選択する場合には熾烈な戦いが行われるため、その結果、両者は確実に\(C>0\)の損害を被ります。勝者は資源を\(V\)だけを獲得できるものの、戦いがもたらす損失の大きさ\(C\)はそれを上回るものとします。つまり、\(C>V>0\)が成り立つということです。加えて、両者の強さに差はなく、等しい確率でどちらか一方が勝利するものとします。つまり、勝った場合の利得は\(V-C\)であり、負けた場合の利得は\(-C\)であるため、両者がタカ戦略を選択する場合に各個体が直面する利得の期待値は、\begin{equation*}\frac{1}{2}\left( V-C\right) +\frac{1}{2}\left( -C\right) =\frac{V}{2}-C
\end{equation*}です。\(C>V>0\)ゆえに\(\frac{V}{2}-C<0\)であることに注意してください。つまり、戦いは割に合いません。
一方がタカ戦略を選択し他方がハト戦略を選択する場合には戦いが起こらないため、双方に損害は発生しません。この場合、タカ戦略を選択した個体が資源\(V\)を占有することになるため、ハト戦略を選択した個体が得る資源は\(0\)です。
両者がともにハト戦略を選択する場合にも戦いは起こらないため、双方に損害は発生しません。この場合、両者は資源を2等分するものとします。つまり、両者がハト戦略を選択する場合、それぞれの個体が得られる資源は\(\frac{V}{2}>0\)です。
これはイギリスの生物学者ジョン・メイナード=スミス(John Maynard Smith)が1982年に発表したタカ・ハトゲーム(Hawk-Dove game)と呼ばれるモデルです。
完備情報の静学ゲームとしてのタカ・ハトゲーム
タカ・ハトゲームが想定する状況を2つの個体をプレイヤーとするゲームと解釈します。個体が動物である場合や、個体どうしが偶然に出会った状況を想定するのであれば、彼らが事前に話し合いを行う状況を排除できます。また、仮に事前に話し合いをした場合でも、その結果には拘束力がありません。したがってタカ・ハトゲームは非協力ゲームです。また、それぞれの個体は相手がどちらの戦略を選択するか観察できない状態で自身の戦略を選択せざるを得ない状況を想定するのであれば、タカ・ハトゲームは静学ゲームになります。さらにゲームのルールが双方にとって共有知識であることを仮定するのであれば、タカ・ハトゲームを完備情報の静学ゲームとして記述することになります。
そこで、タカ・ハトゲームを以下のような戦略型ゲーム\(G\)としてモデル化します。まず、プレイヤー集合は、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}です。ただし、\(i\in I\)は個体\(i\)を表します。また、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は、\begin{equation*}S_{1}=S_{2}=\left\{ D,H\right\}
\end{equation*}です。ただし、\(D\)は撤退するハト戦略を表し(DoveのD)、\(H\)は相手と戦うタカ戦略を表し(HawkのH)。ゲームの結果は以下の行列として整理されます。
$$\begin{array}{|c|c|c|}
\hline
1\setminus 2 & D & H \\ \hline
D & 引き分け & 2の勝利(1の敗北) \\ \hline
H & 1の勝利(2の敗北)
& 衝突 \\ \hline
\end{array}$$
利得関数としては様々な可能性がありますが、典型的なものは自身が得る資源量と利得を同一視するというものであり、その場合の利得行列は、以下の条件\begin{equation*}
C>V>0
\end{equation*}を満たす実数\(C,V\in \mathbb{R} \)を用いて、
$$\begin{array}{|c|c|c|}
\hline
1\setminus 2 & D & H \\ \hline
D & \frac{V}{2},\frac{V}{2} & 0,V \\ \hline
H & V,0 & \frac{V}{2}-C,\frac{V}{2}-C \\ \hline
\end{array}$$
と表されます。言い換えると、プレイヤー\(1\)の利得関数\(u_{1}:S_{1}\times S_{2}\rightarrow \mathbb{R} \)は、\begin{eqnarray*}u_{1}\left( D,D\right) &=&\frac{V}{2} \\
u_{1}\left( H,D\right) &=&V \\
u_{1}\left( D,H\right) &=&0 \\
u_{1}\left( H,H\right) &=&\frac{V}{2}-C
\end{eqnarray*}を満たし、プレイヤー\(2\)の利得関数\(u_{2}:S_{1}\times S_{2}\rightarrow \mathbb{R} \)は、\begin{eqnarray*}u_{2}\left( D,D\right) &=&\frac{V}{2} \\
u_{2}\left( D,H\right) &=&V \\
u_{2}\left( H,D\right) &=&0 \\
u_{2}\left( H,H\right) &=&\frac{V}{2}-C
\end{eqnarray*}を満たすということです。つまり、双方のプレイヤーにとって自分だけがタカ戦略を選ぶことが最も望ましく(利得\(V\)を得る)、双方がハト戦略を選ぶことが2番目に望ましく(利得\(\frac{V}{2}\)を得る)、自分だけがハト戦略を選ぶことは3番目に望ましく(\(0\)を得る)、双方がタカ戦略を選ぶことは最も望ましくありません(利得\(\frac{V}{2}-C\)を得る)。
$$\begin{array}{|c|c|c|}
\hline
1\setminus 2 & D & H \\ \hline
D & \frac{1}{2},\frac{1}{2} & 0,1 \\ \hline
H & 1,0 & -\frac{3}{2},-\frac{3}{2} \\ \hline
\end{array}$$
となります。
$$\begin{array}{|c|c|c|}
\hline
1\setminus 2 & D & H \\ \hline
D & 5,5 & 0,10 \\ \hline
H & 10,0 & -10,-10 \\ \hline
\end{array}$$
となります。
タカ・ハトゲームにおける純粋戦略ナッシュ均衡
タカ・ハトゲームには以下のような2つの純粋戦略ナッシュ均衡が存在します。
\end{equation*}であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は、\begin{equation*}S_{1}=S_{2}=\left\{ D,H\right\}
\end{equation*}であり、利得関数\(u_{i}:S_{1}\times S_{2}\rightarrow \mathbb{R} \)は、\begin{equation*}C>V>0
\end{equation*}を満たす実数\(C,V\in \mathbb{R} \)を用いて、以下の利得行列
$$\begin{array}{|c|c|c|}
\hline
1\setminus 2 & D & H \\ \hline
D & \frac{V}{2},\frac{V}{2} & 0,V \\ \hline
H & V,0 & \frac{V}{2}-C,\frac{V}{2}-C \\ \hline
\end{array}$$
によって表現されているものとする。このゲーム\(G\)には狭義の純粋戦略ナッシュ均衡が存在し、それは以下の2つ\begin{equation*}\left( s_{1}^{\ast },s_{2}^{\ast }\right) =\left( D,H\right) ,\left(
H,D\right)
\end{equation*}である。
以上の命題より、タカ・ハトゲームには2つの純粋戦略ナッシュ均衡\(\left( D,H\right) ,\left( H,D\right) \)が存在することが明らかになりました。つまり、一方のプレイヤーがタカ戦略を採用し、他方のプレイヤーがハト戦略を採用することが純粋戦略ナッシュ均衡です。
タカ・ハトゲームにおける混合戦略ナッシュ均衡
タカ・ハトゲームには先の2つの純粋戦略ナッシュ均衡とは異なる混合戦略ナッシュ均衡が存在します。
\end{equation*}であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は、\begin{equation*}S_{1}=S_{2}=\left\{ D,H\right\}
\end{equation*}であり、利得関数\(u_{i}:S_{1}\times S_{2}\rightarrow \mathbb{R} \)は、\begin{equation*}C>V>0
\end{equation*}を満たす実数\(C,V\in \mathbb{R} \)を用いて、以下の利得行列
$$\begin{array}{|c|c|c|}
\hline
1\setminus 2 & D & H \\ \hline
D & \frac{V}{2},\frac{V}{2} & 0,V \\ \hline
H & V,0 & \frac{V}{2}-C,\frac{V}{2}-C \\ \hline
\end{array}$$
によって表現されているものとする。2人の混合戦略を、\begin{eqnarray*}
\sigma _{1} &=&\left( \sigma _{1}\left( D\right) ,\sigma _{1}\left( H\right)
\right) =\left( \sigma _{1},1-\sigma _{1}\right) \\
\sigma _{2} &=&\left( \sigma _{2}\left( D\right) ,\sigma _{2}\left( H\right)
\right) =\left( \sigma _{2},1-\sigma _{2}\right)
\end{eqnarray*}で表記する。このゲーム\(G\)には混合戦略ナッシュ均衡が存在し、それは以下の3つ\begin{equation*}\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) =\left( 1,0\right)
,\left( 0,1\right) ,\left( 1-\frac{V}{2C},1-\frac{V}{2C}\right)
\end{equation*}である。
$$\begin{array}{|c|c|c|}
\hline
1\setminus 2 & D & H \\ \hline
D & \frac{1}{2},\frac{1}{2} & 0,1 \\ \hline
H & 1,0 & -\frac{3}{2},-\frac{3}{2} \\ \hline
\end{array}$$
となります。このゲームには純粋戦略の範囲で2つのナッシュ均衡\(\left( D,H\right) ,\left( H,D\right) \)が存在するとともに、これらとは別に、混合戦略の範囲でナッシュ均衡\begin{eqnarray*}\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) &=&\left( 1-\frac{1}{2\cdot 2},1-\frac{1}{2\cdot 2}\right) \\
&=&\left( \frac{3}{4},\frac{3}{4}\right)
\end{eqnarray*}が存在します。つまり、「\(1\)だけが\(D\)を選ぶ」と「\(2\)だけが\(H\)を選ぶ」に加えて、「\(1\)と\(2\)はともに確率\(\frac{3}{4}\)で\(D\)を選ぶ」ことがナッシュ均衡です。
$$\begin{array}{|c|c|c|}
\hline
1\setminus 2 & D & H \\ \hline
D & 5,5 & 0,10 \\ \hline
H & 10,0 & -10,-10 \\ \hline
\end{array}$$
となります。このゲームには純粋戦略の範囲で2つのナッシュ均衡\(\left( D,H\right) ,\left( H,D\right) \)が存在するとともに、これらとは別に、混合戦略の範囲でナッシュ均衡\begin{eqnarray*}\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) &=&\left( 1-\frac{10}{2\cdot 15},1-\frac{10}{2\cdot 15}\right) \\
&=&\left( \frac{2}{3},\frac{2}{3}\right)
\end{eqnarray*}が存在します。つまり、「\(1\)だけが\(D\)を選ぶ」と「\(2\)だけが\(H\)を選ぶ」に加えて、「\(1\)と\(2\)はともに確率\(\frac{2}{3}\)で\(D\)を選ぶ」ことがナッシュ均衡です。
タカ・ハトゲームにおける支配戦略
タカ・ハトゲームにはナッシュ均衡が存在することが明らかになりました。では、タカ・ハトゲームの均衡の中には、支配される戦略の逐次消去による解や、支配戦略均衡などは存在するでしょうか。
\end{equation*}であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は、\begin{equation*}S_{1}=S_{2}=\left\{ D,H\right\}
\end{equation*}であり、利得関数\(u_{i}:S_{1}\times S_{2}\rightarrow \mathbb{R} \)は、\begin{equation*}C>V>0
\end{equation*}を満たす実数\(C,V\in \mathbb{R} \)を用いて、以下の利得行列
$$\begin{array}{|c|c|c|}
\hline
1\setminus 2 & D & H \\ \hline
D & \frac{V}{2},\frac{V}{2} & 0,V \\ \hline
H & V,0 & \frac{V}{2}-C,\frac{V}{2}-C \\ \hline
\end{array}$$
によって表現されているものとする。このゲーム\(G\)において、プレイヤー\(1,2\)はともに広義の支配戦略を持たない。
タカ・ハトゲームにおいて、プレイヤーたちは広義の支配戦略を持たないことが明らかになりました。したがって、タカ・ハトゲームには広義支配戦略均衡や、広義支配される戦略の逐次消去による解は存在しません。戦略型ゲームに狭義支配戦略均衡が存在する場合、それは広義支配戦略均衡でもあります。また、狭義支配される戦略の逐次消去による解が存在する場合、それは広義支配される戦略の逐次消去による解でもあります。以上の事実と、タカ・ハトゲームには広義支配戦略均衡や、広義支配される戦略の逐次消去による解が存在することを踏まえると、タカ・ハトゲームには狭義支配戦略均衡や、狭義支配される戦略の逐次消去による解は存在しないことが明らかになりました。
タカ・ハトゲームにおける信憑性のない脅しとコミットメント
タカ・ハトゲームにおいて一方のプレイヤーが相手に対して「おまえがハト戦略を選ばない場合には大きな損害を被ることになるぞ。なぜなら俺は絶対にタカ戦略を選ぶからな。」と脅しをかけることはできるでしょうか。
プレイヤー\(1\)が先のように相手を脅した状況を想定します。仮にプレイヤー\(2\)もタカ戦略を選ぶ場合(\(s_{2}=H\))、プレイヤー\(1\)の利得に関して、\begin{equation*}u_{1}\left( D,H\right) =0>\frac{V}{2}-C=u_{1}\left( H,H\right)
\end{equation*}が成り立ちます。つまり、プレイヤー\(2\)がタカ戦略を選ぶ場合には、プレイヤー\(1\)にとって最適な選択はハト戦略(\(s_{1}=D\))であるため、先の脅しには信憑性がありません。したがって、プレイヤー\(2\)は相手による脅しを真に受ける合理的な理由が存在しないことになります。
プレイヤー\(1\)が自分の脅しを信憑性のない脅しから信憑性のある脅しへ転化させるためには、自分がタカ戦略を選ぶことにコミットする必要があります。例えば、プレイヤー\(1\)が自分の退路を断ち、そのことを相手に知らしめることに成功した場合、プレイヤー\(1\)がタカ戦略を選ばざるを得ないことが双方の共通認識となるため、ゲームは以下の形へと変化します。
$$\begin{array}{|c|c|c|}
\hline
1\setminus 2 & D & H \\ \hline
H & V,0 & \frac{V}{2}-C,\frac{V}{2}-C \\ \hline
\end{array}$$
この新たなゲームにおけるプレイヤー\(2\)の最適戦略は\(D\)であるため、プレイヤー\(1\)は「退路を断つ」というコミットメントデバイスを通じてタカ戦略\(H\)へコミットすることにより、自身にとって最も望ましい結果である\(\left( H,D\right) \)を実現することに成功します。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】