行動戦略と戦略的に同等な混合戦略は存在するとは限らない
問題としている戦略的状況が完備情報の動学ゲームであり、それが展開型ゲーム\begin{equation*}
\Gamma =\left( I\cup \left\{ 0\right\} ,A,X,>,a,\mathcal{H},i,p,\left\{
u_{i}\right\} _{i\in I}\right)
\end{equation*}として記述されているものとします。ただし、\(I\cup \left\{ 0\right\} \)は自然に相当するプレイヤー\(0\)を含めたプレイヤー集合、\(A\)は行動集合、\(\left( X,>\right) \)はゲームの木、\(a:X\backslash \left\{ x_{0}\right\} \rightarrow A\)はそれぞれの手番へ到達する直前に選択される行動を特定する写像、\(\mathcal{H}\)は情報分割、\(i:\mathcal{H}\rightarrow I\cup \left\{ 0\right\} \)はそれぞれの情報集合において意思決定を行うプレイヤーを特定する写像、\(p:\mathcal{H}_{0}\times A\rightarrow \left[0,1\right] \)は自然による意思決定を記述する確率分布、\(u_{i}:Z\rightarrow \mathbb{R} \)はプレイヤー\(i\)の利得関数です。
混合戦略と行動戦略を含めたプレイヤー\(i\)が選び得るすべての戦略からなる集合を、\begin{equation*}\Sigma _{i}=\Delta \left( S_{i}\right) \cup B_{i}
\end{equation*}で表記し、個々の戦略を、\begin{equation*}
\gamma _{i}\in \Sigma _{i}
\end{equation*}で表記します。純粋戦略は特別な混合戦略であるため、\(\Sigma _{i}\)の中にはプレイヤー\(i\)のすべての純粋戦略も含まれています。さて、プレイヤー\(i\)の2つの戦略\(\gamma _{i},\gamma _{i}^{\prime}\in \Sigma _{i}\)が戦略的に同等であることとは、他のプレイヤーたちが選ぶ戦略からなる組\(\gamma _{-i}\in \Sigma _{-i}\)がいかなるものである場合にも、プレイヤー\(i\)が\(\gamma _{i}\)と\(\gamma _{i}^{\prime }\)のどちらを採用してもゲームがそれぞれの頂点\(z\in Z\)へ到達する確率が等しいこと、すなわち、\begin{equation*}\forall \gamma _{-i}\in \Sigma _{-i},\ \forall z\in Z:P\left( z|\gamma
_{i},\gamma _{-i}\right) =P\left( z|\gamma _{i}^{\prime },\gamma _{-i}\right)
\end{equation*}が成り立つことを意味します。
展開型ゲーム\(\Gamma \)においてプレイヤー\(i\in I\)の行動戦略\(b_{i}\in B_{i}\)を任意に選んだとき、それと戦略的に同等な混合戦略\(\sigma _{i}\in \Delta \left( S_{i}\right) \)は常に存在するのでしょうか。つまり、以下の命題\begin{equation*}\forall b_{i}\in B_{i},\ \exists \sigma _{i}\in \Delta \left( S_{i}\right)
,\ \forall \gamma _{-i}\in \Sigma _{-i},\ \forall z\in Z:P\left(
z|b_{i},\gamma _{-i}\right) =P\left( z|\sigma _{i},\gamma _{-i}\right)
\end{equation*}は成立するのでしょうか。行動戦略と戦略的に同等な混合戦略が存在することが保証されるのであれば、分析対象を混合戦略に限定しても一般性は失われないことになります。
行動戦略と戦略的に同等な混合戦略は存在するとは限りません。以下の例より明らかです。
プレイヤーがどちらの交差点に直面しているか判別できない状況は、2つの手番\(x_{0},x_{1}\)が同一の情報集合\(H_{1}\)の要素であることとして表現されています。これらの手番において選択可能な行動はともに\(a_{11},a_{12}\)の2つです。プレイヤー\(1\)の情報集合からなる集合族は、\begin{equation*}\mathcal{H}_{1}=\left\{ H_{1}\right\}
\end{equation*}です。プレイヤー\(1\)の行動戦略\(b_{1}\)が、\begin{equation*}b_{1}\left( a_{11}|H_{1}\right) =b_{1}\left( a_{12}|H_{1}\right) =\frac{1}{2}
\end{equation*}を満たすものとします。プレイヤー\(1\)が以上の行動戦略\(b_{1}\)を選ぶ場合、ゲームが始まると手番\(x_{0}\)において\(\frac{1}{2}\)の確率で\(a_{11}\)または\(a_{12}\)をそれぞれ選びます。\(a_{11}\)が選ばれた場合には頂点\(z_{1}\)へ到達する一方、\(a_{12}\)が選ばれた場合には移動先の\(x_{1}\)において再び\(\frac{1}{2}\)の確率で\(a_{11}\)または\(a_{12}\)をそれぞれ選び、その結果\(z_{2}\)または\(z_{3}\)へ到達します。したがって、この行動戦略\(b_{1}\)のもとでゲームがそれぞれの頂点に到達する確率は、\begin{eqnarray*}P\left( z_{1}|b_{1}\right) &=&\frac{1}{2} \\
P\left( z_{2}|b_{1}\right) &=&\frac{1}{2}\cdot \frac{1}{2}=\frac{1}{4} \\
P\left( z_{3}|b_{1}\right) &=&\frac{1}{2}\cdot \frac{1}{2}=\frac{1}{4}
\end{eqnarray*}となります。さて、この行動戦略\(b_{1}\)と戦略的に同等な混合戦略は存在するでしょうか。プレイヤー\(1\)の純粋戦略集合は、\begin{equation*}S_{1}=A\left( H_{1}\right) =\left\{ a_{11},a_{12}\right\}
\end{equation*}です。ただし、\(a_{11}\)は「情報集合\(H_{1}\)において行動\(a_{11}\)を選ぶ」という純粋戦略であり、\(a_{12}\)は「情報集合\(H_{1}\)において行動\(a_{12}\)を選ぶ」という純粋戦略です。プレイヤー\(1\)が純粋戦略\(a_{11}\)を選ぶ場合、ゲームが始まると手番\(x_{0}\)において行動\(a_{11}\)を選んで頂点\(z_{1}\)に到達します。一方、純粋戦略\(a_{12}\)を選ぶ場合、ゲームが始まると手番\(x_{0}\)において行動\(a_{12}\)を選び、移動先の手番\(x_{1}\)において再び行動\(a_{12}\)を選んで頂点\(z_{3}\)へ到達します。これ以外の純粋戦略は存在しないため、頂点\(z_{2}\)に到達するような純粋戦略は存在しません。混合戦略は純粋戦略集合\(S_{1}\)上の確率分布として定義されますが、\(z_{2}\)へ到達する純粋戦略が存在しない以上、\(z_{2}\)へ到達するような混合戦略も存在しません。したがって、先の行動戦略\(b_{1}\)と戦略的に同等な混合戦略が存在しないことが明らかになりました。
上の例において行動戦略\(b_{1}\)と戦略的に同等な混合戦略が存在しない理由は、頂点\(z_{2}\)へ到達可能な純粋戦略が存在しないことにあります。さらに、そのような純粋戦略が存在しない理由は、頂点\(z_{2}\)への経路上にある2つの手番\(x_{0},x_{1}\)が同一の情報集合\(H_{1}\)に属しており、なおかつ、\(x_{0}\)から\(z_{2}\)へ到達するために選択すべき行動\(a_{11}\)と、\(x_{1}\)から\(z_{2}\)へ到達するために選択すべき行動\(a_{12}\)が異なることにあります。純粋戦略は情報集合において確定的に選択する行動を1つだけ定めるルールであるため、情報集合\(H_{1}\)に対して\(a_{11}\)と\(a_{12}\)を同時に指定することはできず、したがっていかなる純粋戦略のもとでも\(z_{2}\)へ到達することはできません。
いかなる混合戦略とも戦略的に同等ではない行動戦略が存在するための十分条件
先の例および考察を手掛かりに、いかなる混合戦略とも戦略的に同等ではないような行動戦略が存在するための十分条件を以下のように一般化します。
行動戦略と戦略的に同等な混合戦略が存在するための必要条件
展開型ゲームにおいて、いかなる混合戦略とも戦略的に同等ではない行動戦略が存在するための十分条件が明らかになりました。先の命題を利用すると、プレイヤーの行動戦略に対して、それと戦略的に同等であるような混合戦略が存在するための必要条件を以下のように特定できます。
行動戦略と戦略的に同等な混合戦略が存在するための十分条件
プレイヤーの行動戦略に対して、それと戦略的に同等な混合戦略が存在するための必要条件が明らかになりましたが、逆に、十分条件を特定できるでしょうか。つまり、どのような条件が満たされていれば、行動戦略と戦略的に同等な混合戦略が存在することを保証できるでしょうか。実は、先の命題において提示した必要条件はそのまま十分条件になります。そのことを示す前に、行動戦略が与えられたとき、それと戦略的に同等になる混合戦略の候補を以下で提示します。
プレイヤー\(i\in I\)の行動戦略\(b_{i}\in B_{i}\)が与えられているものとします。ここから以下の要領で混合戦略\(\sigma _{i}\)を定義します。ただし、混合戦略\(\sigma _{i}\)を定義することとは、\(\sigma _{i}\)のもとでそれぞれの純粋戦略\(s_{i}\in S_{i}\)が選ばれる確率\(\sigma _{i}\left( s_{i}\right) \)を指定することと同義です。さて、プレイヤー\(i\)が純粋戦略\(s_{i}\)を採用する場合には情報集合\(H_{i}\in \mathcal{H}_{i}\)において行動\(s_{i}\left( H_{i}\right) \in A\left( H_{i}\right) \)を選択することになります。一方、先の行動戦略\(b_{i}\)のもとで、情報集合\(H_{i}\)において先の行動\(s_{i}\left( H_{i}\right) \)を選ぶ確率は\(b_{i}\left( s_{i}\left( H_{i}\right) |H_{i}\right) \)です。この確率をそれぞれの情報集合\(H_{i}\)に対して導出した上で、得られた確率の積をとり、その結果を、\begin{equation*}\sigma _{i}\left( s_{i}\right) =\prod_{H_{i}\in \mathcal{H}_{i}}b_{i}\left(
s_{i}\left( H_{i}\right) |H_{i}\right)
\end{equation*}で表記します。行動戦略\(b_{i}\)が与えられれば、それぞれの純粋戦略\(s_{i}\)に対して上の値\(\sigma _{i}\left( s_{i}\right) \)を導出できるため、混合戦略の候補\begin{equation*}\sigma _{i}=\left( \sigma _{i}\left( s_{i}\right) \right) _{s_{i}\in S_{i}}
\end{equation*}が得られます。現段階で混合戦略の「候補」と呼ぶ理由は、上のように定義された\(\sigma _{i}\)が混合戦略としての要件を満たすこと、すなわち純粋戦略集合\(\Delta \left( S_{i}\right) \)上の確率関数であることを確認できていないからです。この確認は後ほど行います。いずれにせよ、プレイヤー\(i\)の行動戦略\(b_{i}\)から以上のように定義される混合戦略\(\sigma _{i}\)を\(b_{i}\)から生成される混合戦略(mixed strategy generated by \(b_{i}\))と呼び、これを、\begin{equation*}\sigma _{i}\left[ b_{i}\right] =\left( \sigma _{i}\left[ b_{i}\right] \left(
s_{i}\right) \right) _{s_{i}\in S_{i}}
\end{equation*}で表記します。ただし、\(\sigma _{i}\left[ b_{i}\right] \left( s_{i}\right) \)は混合戦略\(\sigma _{i}\left[ b_{i}\right] \)のもとで純粋戦略\(s_{i}\)が選ばれる確率です。
プレイヤー\(1\)の情報集合からなる集合族は、\begin{equation*}\mathcal{H}_{1}=\left\{ \left\{ x_{0}\right\} \right\}
\end{equation*}であるため、プレイヤー\(1\)の純粋戦略集合は、\begin{eqnarray*}S_{1} &=&A\left( \left\{ x_{0}\right\} \right) \\
&=&\left\{ a_{11},a_{12}\right\}
\end{eqnarray*}です。プレイヤー\(1\)の行動戦略を、\begin{eqnarray*}b_{1} &=&\left( b_{1}\left( a_{11}|\left\{ x_{0}\right\} \right)
,b_{1}\left( a_{12}|\left\{ x_{0}\right\} \right) \right) \\
&=&\left( b_{11},1-b_{11}\right)
\end{eqnarray*}で表記します。ただし、\(0\leq b_{11}\leq 1\)です。\(b_{1}\)が生成する混合戦略\(\sigma _{1}\left[ b_{1}\right] \)がそれぞれの純粋戦略に付与する確率は、\begin{eqnarray*}\sigma _{1}\left[ b_{1}\right] \left( a_{11}\right) &=&b_{1}\left(
a_{11}|\left\{ x_{0}\right\} \right) =b_{11} \\
\sigma _{1}\left[ b_{1}\right] \left( a_{12}\right) &=&b_{1}\left(
a_{12}|\left\{ x_{0}\right\} \right) =1-b_{11}
\end{eqnarray*}ですが、これらの確率は非負かつ総和は\(1\)であるため、\(\sigma _{1}\left[ b_{1}\right] \)は混合戦略としての要件を満たしています。続いて、プレイヤー\(2\)の情報集合からなる集合族は、\begin{equation*}\mathcal{H}_{2}=\left\{ \left\{ x_{1}\right\} ,\left\{ x_{2}\right\}
\right\}
\end{equation*}であるため、プレイヤー\(2\)の純粋戦略集合は、\begin{eqnarray*}S_{2} &=&A\left( \left\{ x_{1}\right\} \right) \times A\left( \left\{
x_{2}\right\} \right) \\
&=&\left\{ a_{21},a_{22}\right\} \times \left\{ a_{21},a_{22}\right\} \\
&=&\left\{ \left( a_{21},a_{21}\right) ,\left( a_{21},a_{22}\right) ,\left(
a_{22},a_{21}\right) ,\left( a_{22},a_{22}\right) \right\}
\end{eqnarray*}です。プレイヤー\(2\)の行動戦略を、\begin{eqnarray*}b_{2} &=&\left( \left( b_{2}\left( a_{21}|\left\{ x_{1}\right\} \right)
,b_{2}\left( a_{22}|\left\{ x_{1}\right\} \right) \right) ,\left(
b_{2}\left( a_{21}|\left\{ x_{2}\right\} \right) ,b_{2}\left( a_{22}|\left\{
x_{2}\right\} \right) \right) \right) \\
&=&\left( \left( b_{21},1-b_{21}\right) ,\left( b_{22},1-b_{22}\right)
\right)
\end{eqnarray*}で表記します。ただし、\(0\leq b_{21}\leq 1\)かつ\(0\leq b_{22}\leq 1\)です。\(b_{2}\)が生成する混合戦略\(\sigma _{2}\left[ b_{2}\right] \)がそれぞれの純粋戦略に付与する確率は、\begin{eqnarray*}\sigma _{2}\left[ b_{2}\right] \left( a_{21},a_{21}\right) &=&b_{2}\left(
a_{21}|\left\{ x_{1}\right\} \right) \cdot b_{2}\left( a_{21}|\left\{
x_{2}\right\} \right) =b_{21}b_{22} \\
\sigma _{2}\left[ b_{2}\right] \left( a_{21},a_{22}\right) &=&b_{2}\left(
a_{21}|\left\{ x_{1}\right\} \right) \cdot b_{2}\left( a_{22}|\left\{
x_{2}\right\} \right) =b_{21}\left( 1-b_{22}\right) \\
\sigma _{2}\left[ b_{2}\right] \left( a_{22},a_{21}\right) &=&b_{2}\left(
a_{22}|\left\{ x_{1}\right\} \right) \cdot b_{2}\left( a_{21}|\left\{
x_{2}\right\} \right) =\left( 1-b_{21}\right) b_{22} \\
\sigma _{2}\left[ b_{2}\right] \left( a_{22},a_{22}\right) &=&b_{2}\left(
a_{22}|\left\{ x_{1}\right\} \right) \cdot b_{2}\left( a_{22}|\left\{
x_{2}\right\} \right) =\left( 1-b_{21}\right) \left( 1-b_{22}\right)
\end{eqnarray*}ですが、これらの確率は非負かつ総和は\(1\)であるため、\(\sigma _{2}\left[ b_{2}\right] \)は混合戦略としての要件を満たしています。
以上を踏まえた上で以下を示します。
行動戦略と戦略的に同等な混合戦略が存在するための必要十分条件
展開型ゲームにおいて、プレイヤーの行動戦略に対して、それと戦略的に同等な混合戦略が存在するための必要条件を特定するとともに、それが十分条件でもあることが明らかになりました。結論をまとめます。
- プレイヤー\(i\)の情報集合\(H_{i}\in \mathcal{H}_{i}\)と頂点\(z\in Z\)をそれぞれ任意に選んだとき、\(H_{i}\)は\(z\)への経路上に存在する複数の手番を要素として持たない。
- プレイヤー\(i\)の行動戦略\(b_{i}\in B_{i}\)を任意に選んだとき、それと戦略的に同等な混合戦略\(\sigma _{i}\in \Delta \left( S_{i}\right) \)が存在する。具体的には、\(b_{i}\)から生成される混合戦略\(\sigma _{i}\left[ b_{i}\right] \)はそのような混合戦略である。
このゲームの情報集合は、\begin{equation*}
\left\{ x_{0}\right\} ,\left\{ x_{1}\right\} ,\left\{ x_{2},x_{3}\right\}
\end{equation*}ですが、これらはいずれも特定の頂点への経路上に存在する複数の手番を要素として持ちません。したがって先の命題より、任意のプレイヤーの任意の行動戦略を選んだとき、それと戦略的に同等な混合戦略が存在することが保証されます。
上の例においてプレイヤー\(1\)の情報集合\(\left\{x_{2},x_{3}\right\} \)に注目すると、手番\(x_{3}\)は行動\(a_{12}\)から到達するにも関わらず、手番\(x_{2}\)は同じ行動\(a_{12}\)から到達できません。つまり、プレイヤー\(1\)は情報集合\(\left\{x_{0}\right\} \)における自身の意思決定の内容を記憶していないため、これは不完全記憶ゲームです。上の例は、不完全記憶ゲームにおいても行動戦略と戦略的に同等な混合戦略が存在し得ることを示唆しています。
演習問題
プレイヤー\(1\)の行動戦略\(b_{1}\)と、\(b_{1}\)が生成する混合戦略\(\sigma _{1}\left[ b_{1}\right] \)をそれぞれ定式化した上で、\(\sigma _{1}\left[ b_{1}\right] \)が\(b_{1}\)と戦略的に同等であることを示してください。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】