問題意識:なぜ純粋戦略を混ぜることが合理的なのか
問題としている戦略的状況が完備情報の静学ゲームであるとともに、それが戦略型ゲーム\begin{equation*}
G=\left( I,\left\{ S_{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in
I}\right)
\end{equation*}として記述されているものとします。ただし、\(I\)はプレイヤー集合、\(S_{i}\)はプレイヤー\(i\in I\)の純粋戦略集合、\(u_{i}:S_{I}\rightarrow \mathbb{R} \)はプレイヤー\(i\)の利得関数です。
戦略型ゲーム\(G\)においてプレイヤーたちが混合戦略を選択する状況を想定する場合、その戦略的状況は\(G\)の混合拡張\begin{equation*}G^{\ast }=(I,\{\Delta \left( S_{i}\right) \}_{i\in I},\{F_{i}\}_{i\in I})
\end{equation*}として表現されます。ただし、\(I\)はプレイヤー集合、\(\Delta \left( S_{i}\right) \)はプレイヤー\(i\in I\)の混合戦略集合、\(F_{i}:\Delta \left( S_{I}\right)\rightarrow \mathbb{R} \)はプレイヤー\(i\)の期待利得関数です。
プレイヤーは実際に混合戦略を採用するのでしょうか。つまり、何らかの確率分布にもとづいて純粋戦略をランダムに選ぶという指針は現実的でしょうか。一見すると、純粋戦略を混ぜることに積極的な動機はないように思えます。しかし、現実の戦略的環境において特定の純粋戦略を選択することは、相手に対して決定的な隙を与えることと同義になります。以下では、混合戦略を選択するメリットを、相手による狙い撃ちを防ぐという防御的側面から明らかにします。
静学ゲームにおける信念としての混合戦略
静学ゲーム(同時手番ゲーム)では、プレイヤーは相手が実際に何をしたかを見てから自分の行動を決めることはできません。しかし、プレイヤーは完全な闇の中で意思決定を行っているわけではありません。相手がどのように動くかという予想にもとづいて意思決定を行います。
ここで重要なことは、静学ゲームにおいてプレイヤーが相手の手を予想する状況は、プレイヤーが相手の混合戦略を予想することとして表現可能であるということです。なぜなら、相手がどの手を選ぶかを予想することは、相手がどのような確率分布にもとづいて行動するかを予想することと同義だからです。このような事情を踏まえた上で、プレイヤー\(i\)が予想するプレイヤー\(j\)の混合戦略を、\begin{equation*}\sigma _{i\rightarrow j}\in \Delta \left( S_{j}\right)
\end{equation*}で表記し、これをプレイヤー\(i\)が抱くプレイヤー\(j\)の戦略に関する信念(belief)と呼ぶこととします。
\end{equation*}であるものとします。プレイヤー\(1\)の純粋戦略集合が、\begin{equation*}S_{1}=\left\{ s_{11},s_{12}\right\}
\end{equation*}である状況において、プレイヤー\(2\)が「プレイヤー\(1\)は純粋戦略\(s_{11}\)を確実に選ぶ」と予想する状況は、以下の条件\begin{equation*}\sigma _{2\rightarrow 1}\left( s_{11}\right) =1\wedge \sigma _{2\rightarrow
1}\left( s_{12}\right) =0
\end{equation*}を満たす信念\(\sigma _{2\rightarrow 1}\)として表現されます。また、プレイヤー\(2\)が「プレイヤー\(1\)はどちらの純粋戦略も選び得る」と予想する状況は、以下の条件\begin{equation*}\sigma _{2\rightarrow 1}\left( s_{11}\right) >0\wedge \sigma _{2\rightarrow
1}\left( s_{12}\right) >0\wedge \sigma _{2\rightarrow 1}\left( s_{11}\right)
+\sigma _{2\rightarrow 1}\left( s_{12}\right) =1
\end{equation*}を満たす信念\(\sigma _{2\rightarrow 1}\)として表現されます。
混合戦略の優位性:狙い撃ちの無効化
戦略型ゲーム\(G\)が2人ゼロ和ゲームである状況を想定します。つまり、以下の条件\begin{eqnarray*}&&\left( a\right) \ I=\left\{ 1,2\right\} \\
&&\left( b\right) \ \forall \left( s_{1},s_{2}\right) \in S_{1}\times
S_{2}:u_{1}\left( s_{1},s_{2}\right) +u_{2}\left( s_{1},s_{2}\right) =0
\end{eqnarray*}がともに成り立つということです。また、純粋戦略集合\(S_{1},S_{2}\)はともに有限集合であるものとします。
まずは、プレイヤー\(1\)が純粋戦略だけを選ぶ状況を想定します。その上で、プレイヤー\(1\)がある純粋戦略\(s_{1}\in S_{1}\)を選ぶことをプレイヤー\(2\)が予想している状況を想定します。つまり、プレイヤー\(2\)は以下の条件\begin{equation*}\sigma _{2\rightarrow 1}\left( s_{1}\right) =1
\end{equation*}を満たす信念\(\sigma _{2\rightarrow 1}\)を持っているということです。この場合、プレイヤー\(2\)は相手の純粋戦略\(s_{1}\)に対する最適な純粋戦略を選ぶことにより以下の利得\begin{equation*}\max_{s_{2}\in S_{2}}u_{2}\left( s_{1},s_{2}\right)
\end{equation*}を得ます。ゼロ和ゲームを想定しているため、このときにプレイヤー\(1\)が得る利得は、\begin{equation*}\min_{s_{2}\in S_{2}}u_{1}\left( s_{1},s_{2}\right)
\end{equation*}です。つまり、プレイヤー\(2\)は相手の純粋戦略\(s_{1}\)を最も効率よく叩く純粋戦略を狙い撃ちするため、プレイヤー\(1\)の利得は最小化されます。言い換えると、この利得は、プレイヤー\(1\)が純粋戦略\(s_{1}\)を選んだときに、相手に狙い撃ちされた際の最低保証利得です。任意の純粋戦略\(s_{1}\in S_{1}\)について同様の議論が成立するため、プレイヤー\(1\)が純粋戦略だけを選ぶ状況を想定した場合、得られる利得は\begin{equation*}\max_{s_{1}\in S_{1}}\min_{s_{2}\in S_{2}}u_{1}\left( s_{1},s_{2}\right)
\end{equation*}を超えることはありません。これはプレイヤー\(1\)が純粋戦略だけを採用する場合に最低でも確保できる利得です。
では、プレイヤー\(1\)が純粋戦略ではなく混合戦略を採用する場合にはどうなるでしょうか。この場合、プレイヤー\(2\)は相手の特定の行動を予見できないため、\(S_{1}\)上の複数の純粋戦略に対して正の確率を付与する信念\(\sigma _{2\rightarrow 1}\)を持っていることになります。ゆえに、プレイヤー\(2\)は\(\sigma _{2\rightarrow 1}\)に対して期待利得を最大化する混合戦略を選ぶことにより以下の期待利得\begin{equation*}\max_{\sigma _{2}\in \Delta \left( S_{2}\right) }F_{2}\left( \sigma
_{2\rightarrow 1},\sigma _{2}\right)
\end{equation*}に直面します。ゼロ和ゲームを想定しているため、このときにプレイヤー\(1\)が直面する期待利得は、\begin{equation*}\min_{\sigma _{2}\in \Delta \left( S_{2}\right) }F_{1}\left( \sigma
_{2\rightarrow 1},\sigma _{2}\right)
\end{equation*}です。任意の信念\(\sigma_{2\rightarrow 1}\in \Delta \left( S_{1}\right) \)について同様の議論が成立するため、プレイヤー\(1\)が混合戦略を選ぶ状況を想定した場合、直面する期待利得は、\begin{equation*}\max_{\sigma _{2\rightarrow 1}\in \Delta \left( S_{1}\right) }\min_{\sigma
_{2}\in \Delta \left( S_{2}\right) }F_{1}\left( \sigma _{2\rightarrow
1},\sigma _{2}\right)
\end{equation*}すなわち、\begin{equation*}
\max_{\sigma _{1}\in \Delta \left( S_{1}\right) }\min_{\sigma _{2}\in \Delta
\left( S_{2}\right) }F_{1}\left( \sigma _{1},\sigma _{2}\right)
\end{equation*}を超えることはありません。これはプレイヤー\(1\)が混合戦略だけを採用する場合に最低でも確保できる期待利得です。
以上の議論より、プレイヤー\(1\)が純粋戦略だけを選択する状況においてプレイヤー\(2\)が常に狙い撃ちを成功したときにプレイヤー\(1\)が最低でも確保できる利得が、\begin{equation*}V_{pure}=\max_{s_{1}\in S_{1}}\min_{s_{2}\in S_{2}}u_{1}\left(
s_{1},s_{2}\right)
\end{equation*}である一方で、プレイヤー\(1\)が混合戦略を選択する状況においてプレイヤー\(2\)が常に最適な形で対応してきたときにプレイヤー\(1\)が最低でも確保できる期待利得が、\begin{equation*}V_{mixed}=\max_{\sigma _{1}\in \Delta \left( S_{1}\right) }\min_{\sigma
_{2}\in \Delta \left( S_{2}\right) }F_{1}\left( \sigma _{1},\sigma
_{2}\right)
\end{equation*}であることが明らかになりました。両者の間には、\begin{equation*}
V_{mixed}\geq V_{pure}
\end{equation*}が成り立ちます。つまり、プレイヤーが混合戦略を採用する場合には、純粋戦略だけを採用する場合以上の安全性を確保できます。
s_{1},s_{2}\right) \\
V_{mixed} &=&\max_{\sigma _{1}\in \Delta \left( S_{1}\right) }\min_{\sigma
_{2}\in \Delta \left( S_{2}\right) }F_{1}\left( \sigma _{1},\sigma
_{2}\right)
\end{eqnarray*}とそれぞれ定義したとき、\begin{equation*}
V_{mixed}\geq V_{pure}
\end{equation*}が成り立つ。
鞍点が存在しない場合
有限な2人ゼロ和ゲーム\(G\)においては、\begin{equation*}V_{mixed}\geq V_{pure}
\end{equation*}が成り立つことが明らかになりました。さらに、\(G\)に純粋戦略の範囲で鞍点が存在しない場合には、\begin{equation*}V_{mixed}>V_{pure}
\end{equation*}が成り立ちます。つまり、プレイヤーが混合戦略を採用する場合には、純粋戦略だけを採用する場合よりも大きい利得の底上げを達成できます。
s_{1},s_{2}\right) \\
V_{mixed} &=&\max_{\sigma _{1}\in \Delta \left( S_{1}\right) }\min_{\sigma
_{2}\in \Delta \left( S_{2}\right) }F_{1}\left( \sigma _{1},\sigma
_{2}\right)
\end{eqnarray*}とそれぞれ定義する。\(G\)に純粋戦略の範囲において鞍点が存在しない場合には、\begin{equation*}V_{mixed}>V_{pure}
\end{equation*}が成り立つ。
\end{equation*}であり、純粋戦略集合は、\begin{equation*}
S_{1}=S_{2}=\left\{ H,T\right\}
\end{equation*}です。ただし、\(H\)は表(head)であり\(T\)は裏(tail)です。利得関数を以下の利得行列
$$\begin{array}{ccc}
\hline
1\backslash 2 & H & T \\ \hline
H & 1,-1 & -1,1 \\ \hline
T & -1,1 & 1,-1 \\ \hline
\end{array}$$
によって定義します。これは有限な2人ゼロ和ゲームであるとともに、純粋戦略の範囲で鞍点、すなわち純粋戦略ナッシュ均衡は存在しません。このゲームでは、\begin{equation*}
V_{pure}=-1
\end{equation*}である一方で、\begin{equation*}
V_{mixed}=0
\end{equation*}であるため、\begin{equation*}
V_{mixed}>V_{pure}
\end{equation*}が成立します(演習問題)。以上の結果は先の命題の主張と整合的です。プレイヤー\(1\)が純粋戦略だけを採用して一点張りを行う場合、相手の予想が的中して狙い撃ちが成功すると自分の利得は最低の\(-1\)まで落ちます(\(V_{pure}=-1\))。一方、表と裏を一定の確率で混ぜる場合、相手がどれほどこちらの行動を上手く予想しようとも、期待値としての付け入る隙がゼロになります(\(V_{mixed}=0\))。プレイヤー\(1\)はあえて手の内を曖昧にすることで、相手の完璧な予測を無効化し、自力で確保できる利得の最低ラインを押し上げることに成功しています。
鞍点が存在する場合
有限な2人ゼロ和ゲーム\(G\)においては、\begin{equation*}V_{mixed}\geq V_{pure}
\end{equation*}が成り立つだけでなく、\(G\)に純粋戦略の範囲で鞍点が存在しない場合には、\begin{equation*}V_{mixed}>V_{pure}
\end{equation*}が成り立つことが明らかになりました。さらに、\(G\)に純粋戦略の範囲で鞍点が存在する場合には、\begin{equation*}V_{mixed}=V_{pure}
\end{equation*}が成り立ちます。
s_{1},s_{2}\right) \\
V_{mixed} &=&\max_{\sigma _{1}\in \Delta \left( S_{1}\right) }\min_{\sigma
_{2}\in \Delta \left( S_{2}\right) }F_{1}\left( \sigma _{1},\sigma
_{2}\right)
\end{eqnarray*}とそれぞれ定義する。\(G\)に純粋戦略の範囲において鞍点が存在する場合には、\begin{equation*}V_{mixed}=V_{pure}
\end{equation*}が成り立つ。
\end{equation*}であり、純粋戦略集合は、\begin{eqnarray*}
S_{1} &=&\left\{ H,L\right\} \\
S_{2} &=&\left\{ F,S\right\}
\end{eqnarray*}です。ただし、\(H\)は強気を意味し、\(L\)は慎重を意味します。また、\(F\)は対抗を意味し、\(S\)は静観を意味します。利得関数を以下の利得行列
$$\begin{array}{ccc}
\hline
1\backslash 2 & F & S \\ \hline
H & 1,-1 & 4,-4 \\ \hline
L & 2,-2 & 3,-3 \\ \hline
\end{array}$$
によって定義します。これは有限な2人ゼロ和ゲームであるとともに、純粋戦略の範囲で鞍点、すなわち純粋戦略ナッシュ均衡\(\left( L,H\right) \)が存在します。このゲームでは、\begin{equation*}V_{pure}=V_{mixed}=2
\end{equation*}が成立します(演習問題)。以上の結果は先の命題の主張と整合的です。参入企業\(1\)の均衡戦略は慎重\(L\)であり、その場合には最低でも利得\(V_{pure}=2\)を確保できます。では、参入企業\(1\)が欲を出して強気\(H\)を混ぜる必要はあるでしょうか。この場合、既存企業\(2\)は相手が強気\(H\)にくる可能性に賭けて全力で対抗\(F\)してくるため、企業\(1\)の利得が\(1\)に下がる可能性が生まれます。つまり、慎重\(L\)一点張りなら利得\(2\)を確保できたはずなのに、変に戦略を混ぜたせいで、期待利得の最低ラインが\(2\)を下回ってしまいます。つまり、鞍点が存在する場合、均衡戦略は最善の防御として完成しているため、わざわざ別の戦略を混ぜてリスクを負うよりも、最初から一番堅い守りである均衡戦略に徹することが最も賢いということです。
演習問題
\end{equation*}であり、純粋戦略集合が、\begin{equation*}
S_{1}=S_{2}=\left\{ H,T\right\}
\end{equation*}であり、利得関数が以下の利得行列
$$\begin{array}{ccc}
\hline
1\backslash 2 & H & T \\ \hline
H & 1,-1 & -1,1 \\ \hline
T & -1,1 & 1,-1 \\ \hline
\end{array}$$
によって定義されているものとします。このとき、\begin{eqnarray*}
V_{pure} &=&-1 \\
V_{mixed} &=&0
\end{eqnarray*}が成り立つことを示してください。
\end{equation*}であり、純粋戦略集合が、\begin{eqnarray*}
S_{1} &=&\left\{ H,L\right\} \\
S_{2} &=&\left\{ F,S\right\}
\end{eqnarray*}であり、利得関数が以下の利得行列
$$\begin{array}{ccc}
\hline
1\backslash 2 & F & S \\ \hline
H & 1,-1 & 4,-4 \\ \hline
L & 2,-2 & 3,-3 \\ \hline
\end{array}$$
によって定義されているものとします。このとき、\begin{equation*}
V_{pure}=V_{mixed}=2
\end{equation*}が成り立つことを示してください。
会員専用コンテンツです
【ログイン】【会員登録】