WIIS

完備情報の静学ゲーム

複数均衡問題とリスク支配

目次

関連知識

Mailで保存
Xで共有

複数均衡問題に対する説明体系の種類

問題としている戦略的状況が完備情報の静学ゲームであり、それが戦略型ゲーム\(G\)として表現されているものとします。ゲーム\(G\)に複数のナッシュ均衡が存在するとともに、それらがいずれも支配戦略均衡支配される戦略の逐次消去による解ではない場合、プレイヤーたちがその中のどれを実際にプレーすることになるかを合理性や警戒心の仮定、もしくはそれらが共有知識であることを根拠として説明できるとは限りません。

例(複数均衡の問題)
以下の利得行列で表される完備情報の静学ゲーム\(G\)について考えます。

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & R & L \\ \hline
R & 1^{\ast },1^{\ast } & 0,0 \\ \hline
L & 0,0 & 1^{\ast },1^{\ast } \\ \hline
\end{array}$$

表:利得行列

\(\left( R,R\right) \)と\(\left( L,L\right) \)がともに純粋戦略ナッシュ均衡であることは明らかです。このゲーム\(G\)において任意のプレイヤーは支配戦略を持たないため、ナッシュ均衡である\(\left(R,R\right) \)と\(\left( L,L\right) \)はともに支配戦略均衡ではなく、支配される戦略の逐次消去の解でもありません。したがって、\(\left( R,R\right) \)と\(\left( L,L\right) \)のどちらが実際にプレーされることになるかを、プレイヤーの合理性や警戒心の仮定、もしくはそれらが共有知識であるという仮定を根拠に説明できるとは限りません。

このような事情を踏まえると、複数均衡の問題に対しては、特定のナッシュ均衡がプレーされる根拠を与える何らかの説明体系が必要です。複数均衡問題の説明体系としては、大きく分けて2種類あります。1つ目はゲームの利得構造から説明する方法であり、2つ目はゲームに記述されていない要素、特にプレイヤーの心理的な側面から説明する方法です。今回は前者の立場から複数均衡の問題について考えます。

 

2人ゲームにおけるリスク支配

戦略型ゲーム\(G\)のプレイヤー集合が、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}であるとともに、\(G\)には複数の純粋戦略ナッシュ均衡が存在するものとします。その上で、異なる2つの純粋戦略ナッシュ均衡\begin{eqnarray*}s_{I} &=&\left( s_{1},s_{2}\right) \in S_{I} \\
s_{I}^{\prime } &=&\left( s_{1}^{\prime },s_{2}^{\prime }\right) \in S_{I}
\end{eqnarray*}をそれぞれ任意に選んだ上で、プレイヤーたちがそれぞれどちらか一方を選択しようとしている状況を想定します。ただし、それぞれのプレイヤーは、相手がどちらの戦略を選ぶか確率を主観的に定めた上で、その予想にもとづいて意思決定を行うものとします。

それぞれのプレイヤー\(i\in I\)は相手プレイヤー\(j\in I\backslash \left\{ i\right\} \)が\(s_{j}\)を選ぶ確率を\(f_{i}\left( s_{j}\right) \)と予想しているものとします。\(0\leq f_{i}\left( s_{j}\right) \leq 1\)です。これは同時に、相手が\(s_{j}^{\prime }\)を選ぶ確率を\(f_{i}\left( s_{j}^{\prime }\right) =1-f_{i}\left(s_{j}\right) \)と予想していることを意味します。以上の予想を踏まえた場合、プレイヤー\(i\)が\(s_{i}\)を選んだときに直面する利得の期待値は、\begin{equation}u_{i}\left( s_{i},s_{j}\right) \cdot f_{i}\left( s_{j}\right) +u_{i}\left(
s_{i},s_{j}^{\prime }\right) \cdot \left[ 1-f_{i}\left( s_{j}\right) \right] \quad \cdots (1)
\end{equation}である一方で、\(s_{i}^{\prime }\)を選んだときに直面する利得の期待値は、\begin{equation}u_{i}\left( s_{i}^{\prime },s_{j}\right) \cdot f_{i}\left( s_{j}\right)
+u_{i}\left( s_{i}^{\prime },s_{j}^{\prime }\right) \cdot \left[
1-f_{i}\left( s_{j}\right) \right] \quad \cdots (2)
\end{equation}となります。\(\left( 1\right) \)が\(\left( 2\right) \)以上になるために確率\(f_{i}\left( s_{j}\right) \)が満たすべき条件を導出すると、\begin{equation*}f_{i}\left( s_{j}\right) \geq \frac{u_{i}\left( s_{i}^{\prime
},s_{j}^{\prime }\right) -u_{i}\left( s_{i},s_{j}^{\prime }\right) }{u_{i}\left( s_{i},s_{j}\right) +u_{i}\left( s_{i}^{\prime },s_{j}^{\prime
}\right) -u_{i}\left( s_{i},s_{j}^{\prime }\right) -u_{i}\left(
s_{i}^{\prime },s_{j}\right) }
\end{equation*}となります。右辺を、\begin{equation}
\rho _{i}\left( s_{j}\right) =\frac{u_{i}\left( s_{i}^{\prime
},s_{j}^{\prime }\right) -u_{i}\left( s_{i},s_{j}^{\prime }\right) }{u_{i}\left( s_{i},s_{j}\right) +u_{i}\left( s_{i}^{\prime },s_{j}^{\prime
}\right) -u_{i}\left( s_{i},s_{j}^{\prime }\right) -u_{i}\left(
s_{i}^{\prime },s_{j}\right) } \quad \cdots (3)
\end{equation}とおいた上で、これをプレイヤー\(i\)のリスク係数(risk parameter)と呼ぶこととします。ただし、\begin{equation*}f_{i}\left( s_{j}\right) \geq \rho _{i}\left( s_{j}\right) \Leftrightarrow
\left( 1\right) >\left( 2\right)
\end{equation*}すなわち、\begin{equation*}
f_{i}\left( s_{j}\right) \geq \rho _{i}\left( s_{j}\right) \Leftrightarrow
\text{プレイヤー}i\text{にとって}s_{i}\text{は}s_{i}^{\prime }\text{以上に望ましい}
\end{equation*}という関係が成り立つことに注意してください。\(\left( 3\right) \)から明らかであるように、リスク係数\(\rho _{i}\left( s_{j}\right) \)の水準はプレイヤーたちの利得関数のみから決定されます。一方、プレイヤー\(i\)が予想\(f_{i}\left( s_{j}\right) \)をランダムに決定するのであれば、すなわち相手が\(s_{j}\)を選ぶ確率がランダムに決まるものとみなすのであれば、\(f_{i}\left( s_{j}\right) \geq \rho _{i}\left( s_{j}\right) \)が成り立つ確率、すなわちプレイヤー\(i\)にとって\(s_{i}\)が\(s_{i}^{\prime }\)以上に望ましい確率は\(1-\rho _{i}\left(s_{j}\right) \)であり、逆に、\(f_{i}\left( s_{j}\right) <\rho _{i}\left( s_{j}\right) \)が成り立つ確率、すなわちプレイヤー\(i\)にとって\(s_{i}^{\prime }\)が\(s_{i}\)よりも望ましい確率は\(\rho _{i}\left(s_{j}\right) \)になります。つまり、プレイヤー\(i\)がリスクを勘案しながら\(s_{i}\)と\(s_{i}^{\prime }\)のどちらを選ぶべきか考察する場合、その根拠の確かさを確率を用いて表現した指標がリスク係数\(\rho _{i}\left( s_{j}\right) \)であるということです。具体的には、プレイヤー\(i\)が\(s_{i}\)を選ぶべき根拠の確かさが\(1-\rho_{i}\left( s_{j}\right) \)の大きさとして、\(s_{i}^{\prime }\)を選ぶべき根拠の確かさが\(\rho _{i}\left(s_{j}\right) \)の大きさとしてそれぞれ表現されます。

完備情報の静学ゲームではプレイヤーたちの利得関数が共有知識であるため、プレイヤーたちのリスク係数\(\rho _{i}\left( s_{j}\right) ,p_{j}\left(s_{i}\right) \)もまた共有知識となります。プレイヤーたちはお互いのリスク係数\(\rho _{i}\left( s_{j}\right),p_{j}\left( s_{i}\right) \)を観察した上で、2つのナッシュ均衡\(s_{I},s_{I}^{\prime }\)のどちらをプレーすべきか考察する状況を想定します。仮に、\begin{equation}1-\rho _{i}\left( s_{j}\right) >\rho _{j}\left( s_{i}\right) \quad \cdots (1)
\end{equation}が成り立つ場合、リスク係数に関する先の議論より、プレイヤー\(i\)が\(s_{i}\)を選ぶべき根拠の確かさ\(1-\rho _{i}\left(s_{j}\right) \)が、プレイヤー\(j\)が\(s_{j}^{\prime }\)を選ぶべき根拠の確かさ\(\rho _{j}\left( s_{i}\right) \)よりも強固であることが客観的に明らかであるため、プレイヤー\(i\)は自身の根拠にもとづいて\(s_{i}\)をプレーする一方で、プレイヤー\(j\)は相手にあわせて\(s_{j}\)をプレーし、その結果、ナッシュ均衡\(s_{I}\)が実現することが予想されます。そこで、条件\(\left( 1\right) \)が成り立つ場合、\(s_{I}\)は\(s_{I}^{\prime }\)をリスク支配する(risk dominate)と言います。同じことを、\(s_{I}^{\prime }\)は\(s_{I}\)によってリスク支配される(risk dominated)と言うこともできます。リスク支配の定義では、ナッシュ均衡どうしの比較が問題になっていることに注意してください。

例(2人ゲームにおけるリスク支配)
以下の利得行列で表される完備情報の静学ゲーム\(G\)について考えます。

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & L & R \\ \hline
U & 99^{\ast },49^{\ast } & 0,0 \\ \hline
D & 0,0 & 1^{\ast },51^{\ast } \\ \hline
\end{array}$$

表:利得行列

\(\left( U,L\right) \)と\(\left( D,R\right) \)がともに純粋戦略ナッシュ均衡であることは明らかです。プレイヤー\(1\)のリスク係数\(\rho _{1}\left(L\right) \)は、\begin{equation*}99\cdot \rho _{1}\left( L\right) +0\cdot \left[ 1-\rho _{1}\left( L\right) \right] =0\cdot \rho _{1}\left( L\right) +1\cdot \left[ 1-\rho _{1}\left(
L\right) \right] \end{equation*}を満たすため、これを解くと、\begin{equation}
\rho _{1}\left( L\right) =\frac{1}{100} \quad \cdots (1)
\end{equation}を得ます。ちなみにこのとき、\begin{equation}
\rho _{1}\left( R\right) =1-\rho _{1}\left( L\right) =\frac{99}{100} \quad \cdots (2)
\end{equation}となります。一方、プレイヤー\(2\)のリスク係数\(\rho _{2}\left( U\right) \)は、\begin{equation*}49\cdot \rho _{2}\left( U\right) +0\cdot \left[ 1-\rho _{2}\left( U\right) \right] =0\cdot \rho _{2}\left( U\right) +51\cdot \left[ 1-\rho _{2}\left(
U\right) \right] \end{equation*}を満たすため、これを解くと、\begin{equation}
\rho _{2}\left( U\right) =\frac{51}{100} \quad \cdots (3)
\end{equation}を得ます。ちなみにこのとき、\begin{equation}
\rho _{2}\left( D\right) =1-\rho _{2}\left( U\right) =\frac{49}{100} \quad \cdots (4)
\end{equation}となります。\(\left( 1\right) ,\left(3\right) \)を踏まえると、\begin{eqnarray*}1-\rho _{1}\left( L\right) &=&1-\frac{1}{100}\quad \because \left( 1\right)
\\
&=&\frac{99}{100} \\
&>&\frac{51}{100} \\
&=&\rho _{2}\left( U\right) \quad \because \left( 2\right)
\end{eqnarray*}が成り立つため、\(\left(U,L\right) \)は\(\left( D,R\right) \)をリスク支配します。一方、\(\left( 2\right) ,\left( 4\right) \)を踏まえると、\begin{equation*}1-\rho _{1}\left( R\right) >\rho _{2}\left( D\right)
\end{equation*}は成り立たないため、\(\left( D,R\right) \)は\(\left( U,L\right) \)をリスク支配しません。

戦略型ゲーム\(G\)に複数の純粋戦略ナッシュ均衡が存在する場合でも、それらの間にリスク支配関係は成立するとは限りません。以下の例より明らかです。

例(2人ゲームにおけるリスク支配)
以下の利得行列で表される完備情報の静学ゲーム\(G\)について考えます。

$$\begin{array}{|c|c|c|}\hline
1\diagdown 2 & L & R \\ \hline
U & 1^{\ast },1^{\ast } & 0,0 \\ \hline
D & 0,0 & 1^{\ast },1^{\ast } \\ \hline
\end{array}$$

表:利得行列

\(\left( U,L\right) \)と\(\left( D,R\right) \)がともに純粋戦略ナッシュ均衡であることは明らかです。プレイヤー\(1\)のリスク係数\(\rho _{1}\left(L\right) \)は、\begin{equation*}1\cdot \rho _{1}\left( L\right) +0\cdot \left[ 1-\rho _{1}\left( L\right) \right] =0\cdot \rho _{1}\left( L\right) +1\cdot \left[ 1-\rho _{1}\left(
L\right) \right] \end{equation*}を満たすため、これを解くと、\begin{equation}
\rho _{1}\left( L\right) =\frac{1}{2} \quad \cdots (1)
\end{equation}を得ます。ちなみにこのとき、\begin{equation}
\rho _{1}\left( R\right) =1-\rho _{1}\left( L\right) =\frac{1}{2} \quad \cdots (2)
\end{equation}となります。一方、プレイヤー\(2\)のリスク係数\(\rho _{2}\left( U\right) \)は、\begin{equation*}1\cdot \rho _{2}\left( U\right) +0\cdot \left[ 1-\rho _{2}\left( U\right) \right] =0\cdot \rho _{2}\left( U\right) +1\cdot \left[ 1-\rho _{2}\left(
U\right) \right] \end{equation*}を満たすため、これを解くと、\begin{equation}
\rho _{2}\left( U\right) =\frac{1}{2} \quad \cdots (3)
\end{equation}を得ます。ちなみにこのとき、\begin{equation}
\rho _{2}\left( D\right) =1-\rho _{2}\left( U\right) =\frac{1}{2} \quad \cdots (4)
\end{equation}となります。\(\left( 1\right) ,\left(3\right) \)を踏まえると、\begin{equation*}1-\rho _{1}\left( L\right) >\rho _{2}\left( U\right)
\end{equation*}は成り立たないため、\(\left( D,R\right) \)は\(\left( R,L\right) \)をリスク支配しません。一方、\(\left( 2\right) ,\left( 4\right) \)を踏まえると、\begin{equation*}1-\rho _{1}\left( R\right) >\rho _{2}\left( D\right)
\end{equation*}は成り立たないため、\(\left( D,R\right) \)は\(\left( U,L\right) \)をリスク支配しません。

 

離脱損失とリスク支配

リスク係数の定義を踏まえると、リスク支配を以下のように表現することもできます。

命題(2人ゲームにおけるリスク支配)
完備情報の静学ゲーム\(G\)が複数の純粋戦略ナッシュ均衡を持つものとする。異なる2つの純粋戦略ナッシュ均衡\(s_{I},s_{I}^{\prime }\in S_{I}\)を任意に選んだとき、\begin{equation*}\left[ u_{i}\left( s_{i},s_{j}\right) -u_{i}\left( s_{i}^{\prime
},s_{j}\right) \right] \left[ u_{j}\left( s_{j},s_{i}\right) -u_{j}\left(
s_{j}^{\prime },s_{i}\right) \right] >\left[ u_{i}\left( s_{i}^{\prime
},s_{j}^{\prime }\right) -u_{i}\left( s_{i},s_{j}^{\prime }\right) \right] \left[ u_{j}\left( s_{j}^{\prime },s_{i}^{\prime }\right) -u_{j}\left(
s_{j},s_{i}^{\prime }\right) \right] \end{equation*}が成り立つことと、\(s_{I}\)が\(s_{I}^{\prime }\)をリスク支配することは必要十分である。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

戦略ゲーム\(G\)において、プレイヤー\(i,j\)が異なる2つの純粋戦略ナッシュ均衡\(s_{I},s_{I}^{\prime }\in S_{I}\)のどちらをプレーすべきか考察している状況を想定します。本来、\(s_{I}\)をプレーすべきところをプレイヤー\(i\)だけが読み間違えて\(s_{i}\)ではなく\(s_{i}^{\prime }\)を選んでしまった場合、プレイヤー\(i\)に課される機会費用は、\begin{equation*}u_{i}\left( s_{i},s_{j}\right) -u_{i}\left( s_{i}^{\prime },s_{j}\right)
\end{equation*}となります。これをプレイヤー\(i\)にとっての\(s_{I}\)からの離脱損失(deriation loss)と呼びます。同様に、プレイヤー\(j\)にとっての\(s_{I}\)からの離脱損失は、\begin{equation*}u_{j}\left( s_{j},s_{i}\right) -u_{j}\left( s_{j}^{\prime },s_{i}\right)
\end{equation*}となります。その上で、両者の\(s_{I}\)からの離脱損失の積\begin{equation*}\left[ u_{i}\left( s_{i},s_{j}\right) -u_{i}\left( s_{i}^{\prime
},s_{j}\right) \right] \left[ u_{j}\left( s_{j},s_{i}\right) -u_{j}\left(
s_{j}^{\prime },s_{i}\right) \right] \end{equation*}を\(s_{I}\)のナッシュ積(Nash product)と呼びます。同様に考えると、もう一方のナッシュ均衡\(s_{I}^{\prime }\)のナッシュ積は、\begin{equation*}\left[ u_{i}\left( s_{i}^{\prime },s_{j}^{\prime }\right) -u_{i}\left(
s_{i},s_{j}^{\prime }\right) \right] \left[ u_{j}\left( s_{j}^{\prime
},s_{i}^{\prime }\right) -u_{j}\left( s_{j},s_{i}^{\prime }\right) \right] \end{equation*}となります。先の命題より、\(s_{I}\)が\(s_{I}^{\prime }\)をリスク支配することとは、\(s_{I}\)のナッシュ積が\(s_{I}^{\prime }\)のナッシュ積よりも大きいことを意味します。

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員専用コンテンツです
ログイン】【会員登録