WIIS

教材一覧
教材一覧
教材検索
STATIC GAME OF COMPLETE INFORMATION

複数均衡問題とリスク支配

目次

Share on twitter
Twitterで共有
Share on email
メールで共有

複数均衡問題に対する説明体系の種類

問題としている戦略的状況が完備情報の静学ゲームであり、それが戦略型ゲーム\(G\)として表現されているものとします。ゲーム\(G\)に複数のナッシュ均衡が存在するとともに、それらがいずれも支配戦略均衡支配される戦略の逐次消去による解ではない場合、プレイヤーたちがその中のどれを実際にプレーすることになるかを合理性や警戒心の仮定、もしくはそれらが共有知識であることを根拠として説明できるとは限りません。

例(複数均衡の問題)
以下の利得行列で表される完備情報の静学ゲーム\(G\)について考えます。

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & R & L \\ \hline
R & 1^{\ast },1^{\ast } & 0,0 \\ \hline
L & 0,0 & 1^{\ast },1^{\ast } \\ \hline
\end{array}$$

表:利得行列

\(\left( R,R\right) \)と\(\left( L,L\right) \)がともに純粋戦略ナッシュ均衡であることは明らかです。このゲーム\(G\)において任意のプレイヤーは支配戦略を持たないため、ナッシュ均衡である\(\left(R,R\right) \)と\(\left( L,L\right) \)はともに支配戦略均衡ではなく、支配される戦略の逐次消去の解でもありません。したがって、\(\left( R,R\right) \)と\(\left( L,L\right) \)のどちらが実際にプレーされることになるかを、プレイヤーの合理性や警戒心の仮定、もしくはそれらが共有知識であるという仮定を根拠に説明できるとは限りません。

このような事情を踏まえると、複数均衡の問題に対しては、特定のナッシュ均衡がプレーされる根拠を与える何らかの説明体系が必要です。複数均衡問題の説明体系としては、大きく分けて2種類あります。1つ目はゲームの利得構造から説明する方法であり、2つ目はゲームに記述されていない要素、特にプレイヤーの心理的な側面から説明する方法です。今回は前者の立場から複数均衡の問題について考えます。

 

2人ゲームにおけるリスク支配

戦略型ゲーム\(G\)のプレイヤー集合が、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}であるとともに、\(G\)には複数の純粋戦略ナッシュ均衡が存在するものとします。その上で、異なる2つの純粋戦略ナッシュ均衡\begin{eqnarray*}s_{I} &=&\left( s_{1},s_{2}\right) \in S_{I} \\
s_{I}^{\prime } &=&\left( s_{1}^{\prime },s_{2}^{\prime }\right) \in S_{I}
\end{eqnarray*}をそれぞれ任意に選んだ上で、プレイヤーたちがそれぞれどちらか一方を選択しようとしている状況を想定します。ただし、それぞれのプレイヤーは、相手がどちらの戦略を選ぶか確率を主観的に定めた上で、その予想にもとづいて意思決定を行うものとします。

それぞれのプレイヤー\(i\in I\)は相手プレイヤー\(j\in I\backslash \left\{ i\right\} \)が\(s_{j}\)を選ぶ確率を\(f_{i}\left( s_{j}\right) \)と予想しているものとします。\(0\leq f_{i}\left( s_{j}\right) \leq 1\)です。これは同時に、相手が\(s_{j}^{\prime }\)を選ぶ確率を\(f_{i}\left( s_{j}^{\prime }\right) =1-f_{i}\left(s_{j}\right) \)と予想していることを意味します。以上の予想を踏まえた場合、プレイヤー\(i\)が\(s_{i}\)を選んだときに直面する利得の期待値は、\begin{equation}u_{i}\left( s_{i},s_{j}\right) \cdot f_{i}\left( s_{j}\right) +u_{i}\left(
s_{i},s_{j}^{\prime }\right) \cdot \left[ 1-f_{i}\left( s_{j}\right) \right] \quad \cdots (1)
\end{equation}である一方で、\(s_{i}^{\prime }\)を選んだときに直面する利得の期待値は、\begin{equation}u_{i}\left( s_{i}^{\prime },s_{j}\right) \cdot f_{i}\left( s_{j}\right)
+u_{i}\left( s_{i}^{\prime },s_{j}^{\prime }\right) \cdot \left[
1-f_{i}\left( s_{j}\right) \right] \quad \cdots (2)
\end{equation}となります。\(\left( 1\right) \)が\(\left( 2\right) \)以上になるために確率\(f_{i}\left( s_{j}\right) \)が満たすべき条件を導出すると、\begin{equation*}f_{i}\left( s_{j}\right) \geq \frac{u_{i}\left( s_{i}^{\prime
},s_{j}^{\prime }\right) -u_{i}\left( s_{i},s_{j}^{\prime }\right) }{u_{i}\left( s_{i},s_{j}\right) +u_{i}\left( s_{i}^{\prime },s_{j}^{\prime
}\right) -u_{i}\left( s_{i},s_{j}^{\prime }\right) -u_{i}\left(
s_{i}^{\prime },s_{j}\right) }
\end{equation*}となります。右辺を、\begin{equation}
\rho _{i}\left( s_{j}\right) =\frac{u_{i}\left( s_{i}^{\prime
},s_{j}^{\prime }\right) -u_{i}\left( s_{i},s_{j}^{\prime }\right) }{u_{i}\left( s_{i},s_{j}\right) +u_{i}\left( s_{i}^{\prime },s_{j}^{\prime
}\right) -u_{i}\left( s_{i},s_{j}^{\prime }\right) -u_{i}\left(
s_{i}^{\prime },s_{j}\right) } \quad \cdots (3)
\end{equation}とおいた上で、これをプレイヤー\(i\)のリスク係数(risk parameter)と呼ぶこととします。ただし、\begin{equation*}f_{i}\left( s_{j}\right) \geq \rho _{i}\left( s_{j}\right) \Leftrightarrow
\left( 1\right) >\left( 2\right)
\end{equation*}すなわち、\begin{equation*}
f_{i}\left( s_{j}\right) \geq \rho _{i}\left( s_{j}\right) \Leftrightarrow
\text{プレイヤー}i\text{にとって}s_{i}\text{は}s_{i}^{\prime }\text{以上に望ましい}
\end{equation*}という関係が成り立つことに注意してください。\(\left( 3\right) \)から明らかであるように、リスク係数\(\rho _{i}\left( s_{j}\right) \)の水準はプレイヤーたちの利得関数のみから決定されます。一方、プレイヤー\(i\)が予想\(f_{i}\left( s_{j}\right) \)をランダムに決定するのであれば、すなわち相手が\(s_{j}\)を選ぶ確率がランダムに決まるものとみなすのであれば、\(f_{i}\left( s_{j}\right) \geq \rho _{i}\left( s_{j}\right) \)が成り立つ確率、すなわちプレイヤー\(i\)にとって\(s_{i}\)が\(s_{i}^{\prime }\)以上に望ましい確率は\(1-\rho _{i}\left(s_{j}\right) \)であり、逆に、\(f_{i}\left( s_{j}\right) <\rho _{i}\left( s_{j}\right) \)が成り立つ確率、すなわちプレイヤー\(i\)にとって\(s_{i}^{\prime }\)が\(s_{i}\)よりも望ましい確率は\(\rho _{i}\left(s_{j}\right) \)になります。つまり、プレイヤー\(i\)がリスクを勘案しながら\(s_{i}\)と\(s_{i}^{\prime }\)のどちらを選ぶべきか考察する場合、その根拠の確かさを確率を用いて表現した指標がリスク係数\(\rho _{i}\left( s_{j}\right) \)であるということです。具体的には、プレイヤー\(i\)が\(s_{i}\)を選ぶべき根拠の確かさが\(1-\rho_{i}\left( s_{j}\right) \)の大きさとして、\(s_{i}^{\prime }\)を選ぶべき根拠の確かさが\(\rho _{i}\left(s_{j}\right) \)の大きさとしてそれぞれ表現されます。

完備情報の静学ゲームではプレイヤーたちの利得関数が共有知識であるため、プレイヤーたちのリスク係数\(\rho _{i}\left( s_{j}\right) ,p_{j}\left(s_{i}\right) \)もまた共有知識となります。プレイヤーたちはお互いのリスク係数\(\rho _{i}\left( s_{j}\right),p_{j}\left( s_{i}\right) \)を観察した上で、2つのナッシュ均衡\(s_{I},s_{I}^{\prime }\)のどちらをプレーすべきか考察する状況を想定します。仮に、\begin{equation}1-\rho _{i}\left( s_{j}\right) >\rho _{j}\left( s_{i}\right) \quad \cdots (1)
\end{equation}が成り立つ場合、リスク係数に関する先の議論より、プレイヤー\(i\)が\(s_{i}\)を選ぶべき根拠の確かさ\(1-\rho _{i}\left(s_{j}\right) \)が、プレイヤー\(j\)が\(s_{j}^{\prime }\)を選ぶべき根拠の確かさ\(\rho _{j}\left( s_{i}\right) \)よりも強固であることが客観的に明らかであるため、プレイヤー\(i\)は自身の根拠にもとづいて\(s_{i}\)をプレーする一方で、プレイヤー\(j\)は相手にあわせて\(s_{j}\)をプレーし、その結果、ナッシュ均衡\(s_{I}\)が実現することが予想されます。そこで、条件\(\left( 1\right) \)が成り立つ場合、\(s_{I}\)は\(s_{I}^{\prime }\)をリスク支配する(risk dominate)と言います。同じことを、\(s_{I}^{\prime }\)は\(s_{I}\)によってリスク支配される(risk dominated)と言うこともできます。リスク支配の定義では、ナッシュ均衡どうしの比較が問題になっていることに注意してください。

例(2人ゲームにおけるリスク支配)
以下の利得行列で表される完備情報の静学ゲーム\(G\)について考えます。

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & L & R \\ \hline
U & 99^{\ast },49^{\ast } & 0,0 \\ \hline
D & 0,0 & 1^{\ast },51^{\ast } \\ \hline
\end{array}$$

表:利得行列

\(\left( U,L\right) \)と\(\left( D,R\right) \)がともに純粋戦略ナッシュ均衡であることは明らかです。プレイヤー\(1\)のリスク係数\(\rho _{1}\left(L\right) \)は、\begin{equation*}99\cdot \rho _{1}\left( L\right) +0\cdot \left[ 1-\rho _{1}\left( L\right) \right] =0\cdot \rho _{1}\left( L\right) +1\cdot \left[ 1-\rho _{1}\left(
L\right) \right] \end{equation*}を満たすため、これを解くと、\begin{equation}
\rho _{1}\left( L\right) =\frac{1}{100} \quad \cdots (1)
\end{equation}を得ます。ちなみにこのとき、\begin{equation}
\rho _{1}\left( R\right) =1-\rho _{1}\left( L\right) =\frac{99}{100} \quad \cdots (2)
\end{equation}となります。一方、プレイヤー\(2\)のリスク係数\(\rho _{2}\left( U\right) \)は、\begin{equation*}49\cdot \rho _{2}\left( U\right) +0\cdot \left[ 1-\rho _{2}\left( U\right) \right] =0\cdot \rho _{2}\left( U\right) +51\cdot \left[ 1-\rho _{2}\left(
U\right) \right] \end{equation*}を満たすため、これを解くと、\begin{equation}
\rho _{2}\left( U\right) =\frac{51}{100} \quad \cdots (3)
\end{equation}を得ます。ちなみにこのとき、\begin{equation}
\rho _{2}\left( D\right) =1-\rho _{2}\left( U\right) =\frac{49}{100} \quad \cdots (4)
\end{equation}となります。\(\left( 1\right) ,\left(3\right) \)を踏まえると、\begin{eqnarray*}1-\rho _{1}\left( L\right) &=&1-\frac{1}{100}\quad \because \left( 1\right)
\\
&=&\frac{99}{100} \\
&>&\frac{51}{100} \\
&=&\rho _{2}\left( U\right) \quad \because \left( 2\right)
\end{eqnarray*}が成り立つため、\(\left(U,L\right) \)は\(\left( D,R\right) \)をリスク支配します。一方、\(\left( 2\right) ,\left( 4\right) \)を踏まえると、\begin{equation*}1-\rho _{1}\left( R\right) >\rho _{2}\left( D\right)
\end{equation*}は成り立たないため、\(\left( D,R\right) \)は\(\left( U,L\right) \)をリスク支配しません。

戦略型ゲーム\(G\)に複数の純粋戦略ナッシュ均衡が存在する場合でも、それらの間にリスク支配関係は成立するとは限りません。以下の例より明らかです。

例(2人ゲームにおけるリスク支配)
以下の利得行列で表される完備情報の静学ゲーム\(G\)について考えます。

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & L & R \\ \hline
U & 1^{\ast },1^{\ast } & 0,0 \\ \hline
D & 0,0 & 1^{\ast },1^{\ast } \\ \hline
\end{array}$$

表:利得行列

\(\left( U,L\right) \)と\(\left( D,R\right) \)がともに純粋戦略ナッシュ均衡であることは明らかです。プレイヤー\(1\)のリスク係数\(\rho _{1}\left(L\right) \)は、\begin{equation*}1\cdot \rho _{1}\left( L\right) +0\cdot \left[ 1-\rho _{1}\left( L\right) \right] =0\cdot \rho _{1}\left( L\right) +1\cdot \left[ 1-\rho _{1}\left(
L\right) \right] \end{equation*}を満たすため、これを解くと、\begin{equation}
\rho _{1}\left( L\right) =\frac{1}{2} \quad \cdots (1)
\end{equation}を得ます。ちなみにこのとき、\begin{equation}
\rho _{1}\left( R\right) =1-\rho _{1}\left( L\right) =\frac{1}{2} \quad \cdots (2)
\end{equation}となります。一方、プレイヤー\(2\)のリスク係数\(\rho _{2}\left( U\right) \)は、\begin{equation*}1\cdot \rho _{2}\left( U\right) +0\cdot \left[ 1-\rho _{2}\left( U\right) \right] =0\cdot \rho _{2}\left( U\right) +1\cdot \left[ 1-\rho _{2}\left(
U\right) \right] \end{equation*}を満たすため、これを解くと、\begin{equation}
\rho _{2}\left( U\right) =\frac{1}{2} \quad \cdots (3)
\end{equation}を得ます。ちなみにこのとき、\begin{equation}
\rho _{2}\left( D\right) =1-\rho _{2}\left( U\right) =\frac{1}{2} \quad \cdots (4)
\end{equation}となります。\(\left( 1\right) ,\left(3\right) \)を踏まえると、\begin{equation*}1-\rho _{1}\left( L\right) >\rho _{2}\left( U\right)
\end{equation*}は成り立たないため、\(\left( D,R\right) \)は\(\left( R,L\right) \)をリスク支配しません。一方、\(\left( 2\right) ,\left( 4\right) \)を踏まえると、\begin{equation*}1-\rho _{1}\left( R\right) >\rho _{2}\left( D\right)
\end{equation*}は成り立たないため、\(\left( D,R\right) \)は\(\left( U,L\right) \)をリスク支配しません。

 

離脱損失とリスク支配

リスク係数の定義を踏まえると、リスク支配を以下のように表現することもできます。

命題(2人ゲームにおけるリスク支配)
完備情報の静学ゲーム\(G\)が複数の純粋戦略ナッシュ均衡を持つものとする。異なる2つの純粋戦略ナッシュ均衡\(s_{I},s_{I}^{\prime }\in S_{I}\)を任意に選んだとき、\begin{equation*}\left[ u_{i}\left( s_{i},s_{j}\right) -u_{i}\left( s_{i}^{\prime
},s_{j}\right) \right] \left[ u_{j}\left( s_{j},s_{i}\right) -u_{j}\left(
s_{j}^{\prime },s_{i}\right) \right] >\left[ u_{i}\left( s_{i}^{\prime
},s_{j}^{\prime }\right) -u_{i}\left( s_{i},s_{j}^{\prime }\right) \right] \left[ u_{j}\left( s_{j}^{\prime },s_{i}^{\prime }\right) -u_{j}\left(
s_{j},s_{i}^{\prime }\right) \right] \end{equation*}が成り立つことと、\(s_{I}\)が\(s_{I}^{\prime }\)をリスク支配することは必要十分である。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

戦略ゲーム\(G\)において、プレイヤー\(i,j\)が異なる2つの純粋戦略ナッシュ均衡\(s_{I},s_{I}^{\prime }\in S_{I}\)のどちらをプレーすべきか考察している状況を想定します。本来、\(s_{I}\)をプレーすべきところをプレイヤー\(i\)だけが読み間違えて\(s_{i}\)ではなく\(s_{i}^{\prime }\)を選んでしまった場合、プレイヤー\(i\)に課される機会費用は、\begin{equation*}u_{i}\left( s_{i},s_{j}\right) -u_{i}\left( s_{i}^{\prime },s_{j}\right)
\end{equation*}となります。これをプレイヤー\(i\)にとっての\(s_{I}\)からの離脱損失(deriation loss)と呼びます。同様に、プレイヤー\(j\)にとっての\(s_{I}\)からの離脱損失は、\begin{equation*}u_{j}\left( s_{j},s_{i}\right) -u_{j}\left( s_{j}^{\prime },s_{i}\right)
\end{equation*}となります。その上で、両者の\(s_{I}\)からの離脱損失の積\begin{equation*}\left[ u_{i}\left( s_{i},s_{j}\right) -u_{i}\left( s_{i}^{\prime
},s_{j}\right) \right] \left[ u_{j}\left( s_{j},s_{i}\right) -u_{j}\left(
s_{j}^{\prime },s_{i}\right) \right] \end{equation*}を\(s_{I}\)のナッシュ積(Nash product)と呼びます。同様に考えると、もう一方のナッシュ均衡\(s_{I}^{\prime }\)のナッシュ積は、\begin{equation*}\left[ u_{i}\left( s_{i}^{\prime },s_{j}^{\prime }\right) -u_{i}\left(
s_{i},s_{j}^{\prime }\right) \right] \left[ u_{j}\left( s_{j}^{\prime
},s_{i}^{\prime }\right) -u_{j}\left( s_{j},s_{i}^{\prime }\right) \right] \end{equation*}となります。先の命題より、\(s_{I}\)が\(s_{I}^{\prime }\)をリスク支配することとは、\(s_{I}\)のナッシュ積が\(s_{I}^{\prime }\)のナッシュ積よりも大きいことを意味します。

Share on twitter
Twitterで共有
Share on email
メールで共有
RELATED KNOWLEDGE

関連知識

ナッシュ均衡
広義の純粋戦略ナッシュ均衡

戦略型ゲームにおいてプレイヤーたちの純粋戦略の組に注目したときに、その組を構成する戦略がお互いに最適反応になっているならば、その組を純粋戦略ナッシュ均衡と呼びます。純粋戦略ナッシュ均衡は存在するとは限らず、存在する場合にも一意的であるとは限りません。

ナッシュ均衡
狭義の純粋戦略ナッシュ均衡

戦略型ゲームにおいてプレイヤーたちの純粋戦略の組に注目したときに、その組を構成する戦略がお互いに狭義の最適反応になっているならば、その組を狭義の純粋戦略ナッシュ均衡と呼びます。

ナッシュ均衡
広義の混合戦略ナッシュ均衡

戦略型ゲームの混合拡張においてプレイヤーたちの混合戦略の組に注目したときに、その組を構成する混合戦略がお互いに広義の最適反応になっているならば、その組を広義の混合戦略ナッシュ均衡と呼びます。

ナッシュ均衡
狭義の混合戦略ナッシュ均衡

戦略型ゲームの混合拡張においてプレイヤーたちの混合戦略の組に注目したときに、その組を構成する混合戦略がお互いに狭義の最適反応になっているならば、その組を狭義の混合戦略ナッシュ均衡と呼びます。

ナッシュ均衡
ナッシュ均衡と支配される戦略の逐次消去の関係

戦略型ゲームにナッシュ均衡が存在する場合、そのゲームに支配される戦略の逐次消去を適用すると、そのナッシュ均衡は最後まで残ります。特に、ゲームが逐次消去によって解ける場合、その解はゲームの一意的なナッシュ均衡であることが保証されます。

ナッシュ均衡
ナッシュ均衡と支配戦略均衡の関係

戦略型ゲームに支配戦略均衡が存在する場合、それはナッシュ均衡であることが保証されます。逆は成立するとは限りません。つまり、ナッシュ均衡は支配戦略均衡であるとは限りません。

ナッシュ均衡
ナッシュ均衡の正当性

合理性の仮定や期待効用仮説を採用する限りにおいて、完備情報の静学ゲームにおける均衡概念はナッシュ均衡しか存在しません。しかし、これはあくまでもゲームの分析者の立場から見たときの考え方であり、プレイヤーの視点から考えてみると話が少し複雑になります。

ナッシュ均衡
ナッシュ均衡と自己拘束的な合意

プレイヤーたちが事前交渉を行い何らかの合意に至った場合、それを強制する仕組みが存在しないにも関わらず合意が守られるのであれば、そのような合意は自己拘束的であると言われます。自己拘束的な合意は必ずナッシュ均衡である一方、その逆は成立するとは限りません。

ナッシュ均衡
ナッシュ均衡と社会的慣習

プレイヤーをランダムに変えて同じゲームを繰り返しプレーした結果、ある時点からプレイヤーたちが一定の戦略をプレーするよう状況が安定するのであれば、それは社会的慣習が形成されたことを意味します。社会的慣習が形成される場合、それはナッシュ均衡です。

ナッシュ均衡
複数均衡の問題

戦略型ゲームに複数のナッシュ均衡が存在する場合、プレイヤーたちはその中のどれを実際にプレーすることになるか必ずしも明らかではありません。これを複数均衡の問題や均衡選択の問題などと呼びます。

ナッシュ均衡
複数均衡問題と利得支配

戦略型ゲームに複数のナッシュ均衡が存在するとともに、ある均衡が別の均衡を狭義にパレート支配することを利得支配と呼びます。

ナッシュ均衡
複数均衡問題とフォーカルポイント

プレイヤーたちが相談できない状況において何らかの選択を迫られた場合に、ある選択肢が他の選択肢よりも注意を引くものであるならば、それをフォーカルポイントと呼びます。ゲームに複数のナッシュ均衡が存在する場合、その中の1つがフォーカルポイントであれば、プレイヤーたちはそれをプレーすることが予想されます。

リスク支配
鹿狩りゲーム:調整ゲームの例

調整ゲームの1つの典型例である鹿狩りゲーム(stag hunt)を定式化した上で、ナッシュ均衡を求めます。鹿狩りゲームでは複数均衡問題が発生するとともに、利得支配とリスク支配の間にトレードオフが成立します。

ナッシュの要求ゲーム
ナッシュの要求ゲーム(1ドルの分配ゲーム)

資源量が所与である状況において2人のプレイヤーが取り分を同時に要求し、2人による要求量の和が資源量以下であれば各々は要求通りの取り分を得られる一方、要求量の和が総資源量を上回る場合には何も得られない、という構造のゲームをナッシュの要求ゲームと呼びます。

DISCUSSION

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録

完備情報の静学ゲーム