鹿狩りの寓話
狩人たちが林で鹿狩りをしています。彼らにはそれぞれ持ち場が割り当てられており、狩りを成功させるためには全員がもれなく持ち場で息をひそめて待機している必要があります。狩人が持ち場で待機をしていたところ、目の前にウサギがいることに気づきました。その狩人が持ち場を離れてウサギを追った結果、彼はウサギを捕まえることができましたが、鹿狩りは失敗してしまいました。
これは1755年にフランスの哲学者ジャン・ジャック・ルソー(Jean-Jacques Rousseau)が発表した『人間不平等起源論(Discourse on the Origin and Basis of Equality among Men)』に登場する鹿狩り(stag hunt)と呼ばれる寓話です。
完備情報の静学ゲームとしての鹿狩りゲーム
鹿狩りの寓話を2人の狩人をプレイヤーとするゲームと解釈します。彼らはお互いに持ち場を守るよう約束できますが、その約束には拘束力がないため、彼らが置かれている状況は非協力ゲームです。また、狩人たちが声を掛け合ったり、鹿が近づいてきたときにいちいち相談していては鹿は逃げてしまうため、彼らは相手の行動を観察する前に自分の行動を決定する必要があります。したがって、彼らが置かれている状況は静学ゲームです。さらにゲームのルールが2人にとって共有知識であることを仮定するのであれば、鹿狩りを完備情報ゲームとして記述することができます。
そこで、鹿狩りの寓話を以下のような戦略型ゲーム\(G\)としてモデル化します。まず、プレイヤー集合は、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}です。ただし、\(i\in I\)は狩人\(i\)を表します。それぞれのプレイヤー\(i\)の純粋戦略集合は、\begin{equation*}S_{1}=S_{2}=\left\{ C,D\right\}
\end{equation*}です。ただし、\(C\)は協調戦略である「持ち場で待機すること」を表し(Cooperateの\(C\))、\(D\)は裏切り戦略である「ウサギを追うこと」を表します(Defectの\(D\))。
各々の持ち場で待機している狩人の目の前にウサギが1匹ずつ近づいてきた状況を想定します。彼らがともにウサギに目もくれず持ち場で待機して鹿狩りに集中する場合、ウサギを捕まえることはできませんが、鹿狩りは成功して1頭の鹿を捕まえることができ、その獲物を二等分します。一方が持ち場で待機する一方で他方がウサギを追う場合、ウサギを追う狩人の音に気づいた鹿が逃げてしまうため鹿狩りは失敗しますが、ウサギを追った狩人はウサギを捕まえることができ、その獲物を独り占めします。持ち場で待機していた狩人は何も得られません。二人がともにウサギを追う場合、鹿狩りは失敗しますが、彼らはウサギを一匹ずつ捕まえることができ、それを自身の獲物とします。ゲームの結果は以上の通りであり、これは以下の行列として整理されます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & C & D \\ \hline
C & 鹿\frac{1}{2}頭,鹿\frac{1}{2}頭 & 獲物なし,ウサギ1匹 \\ \hline
D & ウサギ1匹,獲物なし& ウサギ1匹,ウサギ1匹
\\ \hline
\end{array}$$
利得関数としては様々な可能性がありますが、典型的なものは「自分の獲物が多いほど望ましい」というものです。\(\frac{1}{2}\)頭の鹿は\(1\)匹のウサギよりも獲物として多いのであれば、プレイヤーの利得関数は、\begin{equation*}a>b\geq d>c
\end{equation*}を満たす実数\(a,b,c,d\in \mathbb{R} \)を用いて以下の利得行列
$$\begin{array}{ccc}
\hline
1\diagdown 2 & C & D \\ \hline
C & a,a & c,b \\ \hline
D & b,c & d,d \\ \hline
\end{array}$$
として表現されます。つまり、それぞれのプレイヤーにとって、互いに協調した場合に得る利得\(a\)が最大であり、相手だけが裏切った場合に得る利得\(c\)が最小です。残りの2つの結果については、自分だけが裏切った場合に得る利得\(b\)は、双方が裏切った場合に得られる利得\(d\)以上です。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & C & D \\ \hline
C & 5,5 & 0,1 \\ \hline
D & 1,0 & 1,1 \\ \hline
\end{array}$$
$$\begin{array}{ccc}
\hline
1\diagdown 2 & C & D \\ \hline
C & 10,10 & 0,8 \\ \hline
D & 8,0 & 7,7 \\ \hline
\end{array}$$
鹿狩りゲームの純粋戦略ナッシュ均衡
鹿狩りゲームには以下のような2つの純粋戦略ナッシュ均衡が存在します。
\end{equation*}であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は、\begin{equation*}S_{1}=S_{2}=\left\{ C,D\right\}
\end{equation*}であり、利得関数\(u_{i}:S_{1}\times S_{2}\rightarrow \mathbb{R} \)は、\begin{equation*}a>b\geq d>c
\end{equation*}を満たす実数\(a,b,c,d\in \mathbb{R} \)を用いて、以下の利得行列
$$\begin{array}{ccc}
\hline
1\diagdown 2 & C & D \\ \hline
C & a,a & c,b \\ \hline
D & b,c & d,d \\ \hline
\end{array}$$
によって表現されているものとする。このゲーム\(G\)には狭義の純粋戦略ナッシュ均衡が存在し、それは以下の2つ\begin{equation*}\left( s_{1}^{\ast },s_{2}^{\ast }\right) =\left( C,C\right) ,\left(
D,D\right)
\end{equation*}である。
以上の命題より、鹿狩りゲームには2つの純粋戦略ナッシュ均衡\(\left( C,C\right) ,\left( D,D\right) \)が存在することが明らかになりました。ただし、\(\left( C,C\right) \)は2人が協力して鹿狩りが成功するという結果に相当し、\(\left( D,D\right) \)は2人がともに裏切ってウサギを1匹ずつ得るという結果に相当します。
鹿狩りゲームにおける支配戦略
鹿狩りゲームにはナッシュ均衡が存在することが明らかになりました。では、鹿狩りゲームの均衡の中には、支配される戦略の逐次消去による解や、支配戦略均衡などは存在するでしょうか。
\end{equation*}であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は、\begin{equation*}S_{1}=S_{2}=\left\{ C,D\right\}
\end{equation*}であり、利得関数\(u_{i}:S_{1}\times S_{2}\rightarrow \mathbb{R} \)は、\begin{equation*}a>b\geq d>c
\end{equation*}を満たす実数\(a,b,c,d\in \mathbb{R} \)を用いて、以下の利得行列
$$\begin{array}{ccc}
\hline
1\diagdown 2 & C & D \\ \hline
C & a,a & c,b \\ \hline
D & b,c & d,d \\ \hline
\end{array}$$
によって表現されているものとする。このゲーム\(G\)において、プレイヤー\(1,2\)はともに広義の支配戦略を持たない。
鹿狩りゲームにおいて、プレイヤーたちは広義の支配戦略を持たないことが明らかになりました。したがって、鹿狩りゲームには広義支配戦略均衡や、広義支配される戦略の逐次消去による解は存在しません。戦略型ゲームに狭義支配戦略均衡が存在する場合、それは広義支配戦略均衡でもあります。また、狭義支配される戦略の逐次消去による解が存在する場合、それは広義支配される戦略の逐次消去による解でもあります。以上の事実と、鹿狩りゲームには広義支配戦略均衡や、広義支配される戦略の逐次消去による解が存在することを踏まえると、鹿狩りゲームには狭義支配戦略均衡や、狭義支配される戦略の逐次消去による解は存在しないことが明らかになりました。
鹿狩りゲームの複数均衡問題
鹿狩りゲームには協調戦略の組\(\left( C,C\right) \)と裏切り戦略の組\(\left( D,D\right) \)という2つの純粋戦略ナッシュ均衡が存在するとともに、これらはいずれも支配戦略均衡や支配される戦略の逐次消去による解ではないことが明らかになりました。したがって、鹿狩りゲームでは以下の2つの点が問題になります。
1つ目は、均衡が実際にプレーされるかどうかという問題です。ナッシュ均衡が支配戦略均衡や支配される戦略の逐次消去による解である場合には、プレイヤーたちの合理性や警戒心の仮定、もしくはそれらが共有知識であることは、プレイヤーたちが実際に均衡をプレーする根拠となります。一方、鹿狩りゲームの均衡は支配戦略均衡や支配される戦略の逐次消去による解ではないため、合理性や警戒心の仮定、もしくはそれらが共有知識であることは、プレイヤーたちが何らかの均衡を実際にプレーする根拠となる得るか自明ではありません。鹿狩りゲームでは、相手が協調するのであれば自分も協調したほうがよく、相手が裏切るのであれば自分も裏切った方がよい、という構造になっているため、何らかの均衡が実際にプレーされることを保証するためには、プレイヤーはお互いに相手の行動を正しく予想する必要があります。この予想が成立することを保証するためには、何らかの説明体系が必要になります。
2つ目は、複数均衡の問題です。ゲームに複数のナッシュ均衡が存在する場合においても、その中の1つが広義の支配戦略均衡や広義支配される戦略の逐次消去の解である場合には、プレイヤーたちの合理性や警戒心の仮定、もしくはそれらが共有知識であることは、その特定の均衡がプレーされる根拠となるため、複数均衡問題は解決可能です。一方、鹿狩りゲームの均衡の中には広義の支配戦略均衡や広義支配される戦略の逐次消去の解が含まれないため、どちらの均衡がプレーされることになるかは自明ではなく、何らかの説明体系が必要になります。
囚人のジレンマにおいてもプレイヤーには協調戦略と裏切り戦略が選択肢として与えられていますが、鹿狩りゲームと比較すると、均衡の性質には大きな違いがあります。囚人のジレンマでは裏切り戦略の組\(\left( D,D\right) \)だけがナッシュ均衡であるため複数均衡の問題が発生しません。加えて、この均衡\(\left( D,D\right) \)は狭義の支配戦略均衡であるため、それぞれのプレイヤーは相手の行動について考える必要がなく、裏切り戦略\(D\)を常に選ぶことが常に最善であり、したがって、プレイヤーが合理的でありさえすれば均衡\(\left( D,D\right) \)が実現します。
鹿狩りゲームにおける利得支配とリスク支配
複数均衡問題に対する考え方の1つは、利得支配やリスク支配などの概念を用いてプレイヤーたちが実際にプレーするナッシュ均衡を予想する、というものです。
鹿狩りゲームでは協調戦略の組\(\left( C,C\right) \)が利得支配である一方で裏切り戦略の組\(\left( D,D\right) \)がリスク支配になるため、利得支配とリスク支配がトレードオフの関係にあります。つまり、それぞれのプレイヤーには、相互利益的な観点から考えると協調戦略\(C\)を選ぶ動機がある一方で、リスク軽減の観点から考えると裏切り戦略\(D\)を選ぶ動機がありますが、鹿狩りゲームではそれらの動機が逆向きに作用しています。
\end{equation*}であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は、\begin{equation*}S_{1}=S_{2}=\left\{ C,D\right\}
\end{equation*}であり、利得関数\(u_{i}:S_{1}\times S_{2}\rightarrow \mathbb{R} \)は、\begin{equation*}a>b\geq d>c
\end{equation*}を満たす実数\(a,b,c,d\in \mathbb{R} \)を用いて、以下の利得行列
$$\begin{array}{ccc}
\hline
1\diagdown 2 & C & D \\ \hline
C & a,a & c,b \\ \hline
D & b,c & d,d \\ \hline
\end{array}$$
によって表現されているものとする。このゲーム\(G\)には狭義の純粋戦略ナッシュ均衡が存在し、それは以下の2つ\begin{equation*}\left( s_{1}^{\ast },s_{2}^{\ast }\right) =\left( C,C\right) ,\left(
D,D\right)
\end{equation*}である。さらに、\(\left(C,C\right) \)は\(\left( D,D\right) \)を利得支配する一方で、\(\left( D,D\right) \)は\(\left( C,C\right) \)をリスク支配する。
鹿狩りゲームにおけるフォーカルポイント
複数均衡問題に対する別の考え方は、フォーカルポイントであるようなナッシュ均衡が存在するのであれば、プレイヤーたちはそれを実際にプレーする、というものです。
鹿狩りゲームにおいて\(\left( C,C\right) \)と\(\left( D,D\right) \)はともに純粋戦略ナッシュ均衡であるため、これは複数均衡問題です。
2人は新たにライフルを購入したばかりであり、その性能を試してみたいという強い欲求を持っており、狩りの前にそのような会話をしていた状況を想定します。2人がこのような気持ちを共有しているという事実はフォーカルポイントを生成する要因として働くため、その結果、ウサギなどには目もくれずに協力して鹿をハントするという均衡\(\left( C,C\right) \)がプレーされることになります。
ゲームの構造は同じでも、プレイヤーが直面する事情や文脈、2人の関係性、社会的背景などが異なればフォーカルポイントも変わり得ます。フォーカルポイントはゲームのルールとして記述されない要素によって決定されます。
鹿狩りゲームにおける混合戦略ナッシュ均衡
鹿狩りゲームには2つの純粋戦略ナッシュ均衡\(\left( C,C\right) ,\left( D,D\right) \)が存在しますが、\(\left( C,C\right) \)は\(\left( D,D\right) \)を利得支配する一方で\(\left( D,D\right) \)は\(\left( C,C\right) \)をリスク支配するため、仮にプレイヤーたちが事前に話し合うことにより一方の均衡をプレーするよう合意した場合でも、その合意は自己拘束的になるとは限らないため、プレイヤーたちは約束を守るとは限りません。
プレイヤーたちが事前に話し合うことができない場合でも、どちらか一方の均衡がフォーカルポイントになるような要因が存在するのであれば、プレイヤーたちはフォーカルポイントを選択することになります。では、フォーカルポイントが存在しない場合、プレイヤーたちはどうすればよいのでしょうか。そのような場合、プレイヤーたちは期待利得を最大化するような混合戦略を選択せざるを得ません。
混合戦略ナッシュ均衡にまで範囲を広げた場合、鹿狩りゲームには先の2つの純粋戦略ナッシュ均衡とは異なる混合戦略ナッシュ均衡が存在します。
\end{equation*}であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は、\begin{equation*}S_{1}=S_{2}=\left\{ C,D\right\}
\end{equation*}であり、利得関数\(u_{i}:S_{1}\times S_{2}\rightarrow \mathbb{R} \)は、\begin{equation*}a>b\geq d>c
\end{equation*}を満たす実数\(a,b,c,d\in \mathbb{R} \)を用いて、以下の利得行列
$$\begin{array}{ccc}
\hline
1\diagdown 2 & C & D \\ \hline
C & a,a & c,b \\ \hline
D & b,c & d,d \\ \hline
\end{array}$$
によって表現されているものとする。2人の混合戦略を、\begin{eqnarray*}
\sigma _{1} &=&\left( \sigma _{1}\left( C\right) ,\sigma _{1}\left( D\right)
\right) =\left( \sigma _{1},1-\sigma _{1}\right) \\
\sigma _{2} &=&\left( \sigma _{2}\left( C\right) ,\sigma _{2}\left( D\right)
\right) =\left( \sigma _{2},1-\sigma _{2}\right)
\end{eqnarray*}で表記する。このゲーム\(G\)には混合戦略ナッシュ均衡が存在し、それは以下の3つ\begin{equation*}\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) =\left( 1,1\right)
,\left( 0,0\right) ,\left( \frac{d-c}{a-b-c+d},\frac{d-c}{a-b-c+d}\right)
\end{equation*}である。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & C & D \\ \hline
C & 5,5 & 0,1 \\ \hline
D & 1,0 & 1,1 \\ \hline
\end{array}$$
先の命題より、このゲームには純粋戦略の範囲で2つのナッシュ均衡\(\left( C,C\right) ,\left( D,D\right) \)が存在するとともに、これらとは別に、混合戦略の範囲でナッシュ均衡\begin{eqnarray*}\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) &=&\left( \frac{1-0}{5-1-0+1},\frac{1-0}{5-1-0+1}\right) \\
&=&\left( \frac{1}{5},\frac{1}{5}\right)
\end{eqnarray*}が存在します。つまり、「2人がともに\(C\)を選ぶ」と「2人がともに\(D\)を選ぶ」に加えて、「2人がともに確率\(\frac{1}{5}\)で\(C\)を選ぶ」ことがナッシュ均衡です。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & C & D \\ \hline
C & 10,10 & 0,8 \\ \hline
D & 8,0 & 7,7 \\ \hline
\end{array}$$
先の命題より、このゲームには純粋戦略の範囲で2つのナッシュ均衡\(\left( C,C\right) ,\left( D,D\right) \)が存在するとともに、これらとは別に、混合戦略の範囲でナッシュ均衡\begin{eqnarray*}\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) &=&\left( \frac{7-0}{10-8-0+7},\frac{7-0}{10-8-0+7}\right) \\
&=&\left( \frac{7}{9},\frac{7}{9}\right)
\end{eqnarray*}が存在します。つまり、「2人がともに\(C\)を選ぶ」と「2人がともに\(D\)を選ぶ」に加えて、「2人がともに確率\(\frac{7}{9}\)で\(C\)を選ぶ」ことがナッシュ均衡です。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】