WIIS

完備情報の動学ゲーム

行動戦略と戦略的に同等な混合戦略が存在するための条件

目次

関連知識

Mailで保存
Xで共有

行動戦略と戦略的に同等な混合戦略は存在するとは限らない

問題としている戦略的状況が完備情報の動学ゲームであり、それが展開型ゲーム\begin{equation*}
\Gamma =\left( I\cup \left\{ 0\right\} ,A,X,>,a,\mathcal{H},i,p,\left\{
u_{i}\right\} _{i\in I}\right)
\end{equation*}として記述されているものとします。ただし、\(I\cup \left\{ 0\right\} \)は自然に相当するプレイヤー\(0\)を含めたプレイヤー集合、\(A\)は行動集合、\(\left( X,>\right) \)はゲームの木、\(a:X\backslash \left\{ x_{0}\right\} \rightarrow A\)はそれぞれの手番へ到達する直前に選択される行動を特定する写像、\(\mathcal{H}\)は情報分割、\(i:\mathcal{H}\rightarrow I\cup \left\{ 0\right\} \)はそれぞれの情報集合において意思決定を行うプレイヤーを特定する写像、\(p:\mathcal{H}_{0}\times A\rightarrow \left[0,1\right] \)は自然による意思決定を記述する確率分布、\(u_{i}:Z\rightarrow \mathbb{R} \)はプレイヤー\(i\)の利得関数です。

混合戦略行動戦略を含めたプレイヤー\(i\)が選び得るすべての戦略からなる集合を、\begin{equation*}\Sigma _{i}=\Delta \left( S_{i}\right) \cup B_{i}
\end{equation*}で表記し、個々の戦略を、\begin{equation*}
\gamma _{i}\in \Sigma _{i}
\end{equation*}で表記します。純粋戦略は特別な混合戦略であるため、\(\Sigma _{i}\)の中にはプレイヤー\(i\)のすべての純粋戦略も含まれています。さて、プレイヤー\(i\)の2つの戦略\(\gamma _{i},\gamma _{i}^{\prime}\in \Sigma _{i}\)が戦略的に同等であることとは、他のプレイヤーたちが選ぶ戦略からなる組\(\gamma _{-i}\in \Sigma _{-i}\)がいかなるものである場合にも、プレイヤー\(i\)が\(\gamma _{i}\)と\(\gamma _{i}^{\prime }\)のどちらを採用してもゲームがそれぞれの頂点\(z\in Z\)へ到達する確率が等しいこと、すなわち、\begin{equation*}\forall \gamma _{-i}\in \Sigma _{-i},\ \forall z\in Z:P\left( z|\gamma
_{i},\gamma _{-i}\right) =P\left( z|\gamma _{i}^{\prime },\gamma _{-i}\right)
\end{equation*}が成り立つことを意味します。

展開型ゲーム\(\Gamma \)においてプレイヤー\(i\in I\)の行動戦略\(b_{i}\in B_{i}\)を任意に選んだとき、それと戦略的に同等な混合戦略\(\sigma _{i}\in \Delta \left( S_{i}\right) \)は常に存在するのでしょうか。つまり、以下の命題\begin{equation*}\forall b_{i}\in B_{i},\ \exists \sigma _{i}\in \Delta \left( S_{i}\right)
,\ \forall \gamma _{-i}\in \Sigma _{-i},\ \forall z\in Z:P\left(
z|b_{i},\gamma _{-i}\right) =P\left( z|\sigma _{i},\gamma _{-i}\right)
\end{equation*}は成立するのでしょうか。行動戦略と戦略的に同等な混合戦略が存在することが保証されるのであれば、分析対象を混合戦略に限定しても一般性は失われないことになります。

行動戦略と戦略的に同等な混合戦略は存在するとは限りません。以下の例より明らかです。

例(いかなる混合戦略とも戦略的に同等ではない行動戦略)
目的地へ到着するまでの道のりには交差点が2つあり、最初の交差点は直進し、2つ目の交差点は右折する必要があるものとします。2つの交差点の外観は同じであるため、目の前の交差点がどちらであるか外観から判別できないものとします。不注意により、最初の交差点をすでに通り過ぎたか分からなくなってしまいました。このような状況を表す展開型ゲームは以下のゲームの木として表現されます。ただし、初期点\(x_{0}\)は最初の交差点、手番\(x_{1}\)は2番目の交差点にそれぞれ相当し、行動\(a_{11}\)は右折、行動\(a_{12}\)は直進にそれぞれ対応します。頂点\(z_{2}\)が目的地です。利得は省略しています。

図:展開型ゲーム
図:展開型ゲーム

プレイヤーがどちらの交差点に直面しているか判別できない状況は、2つの手番\(x_{0},x_{1}\)が同一の情報集合\(H_{1}\)の要素であることとして表現されています。これらの手番において選択可能な行動はともに\(a_{11},a_{12}\)の2つです。プレイヤー\(1\)の情報集合からなる集合族は、\begin{equation*}\mathcal{H}_{1}=\left\{ H_{1}\right\}
\end{equation*}です。プレイヤー\(1\)の行動戦略\(b_{1}\)が、\begin{equation*}b_{1}\left( a_{11}|H_{1}\right) =b_{1}\left( a_{12}|H_{1}\right) =\frac{1}{2}
\end{equation*}を満たすものとします。プレイヤー\(1\)が以上の行動戦略\(b_{1}\)を選ぶ場合、ゲームが始まると手番\(x_{0}\)において\(\frac{1}{2}\)の確率で\(a_{11}\)または\(a_{12}\)をそれぞれ選びます。\(a_{11}\)が選ばれた場合には頂点\(z_{1}\)へ到達する一方、\(a_{12}\)が選ばれた場合には移動先の\(x_{1}\)において再び\(\frac{1}{2}\)の確率で\(a_{11}\)または\(a_{12}\)をそれぞれ選び、その結果\(z_{2}\)または\(z_{3}\)へ到達します。したがって、この行動戦略\(b_{1}\)のもとでゲームがそれぞれの頂点に到達する確率は、\begin{eqnarray*}P\left( z_{1}|b_{1}\right) &=&\frac{1}{2} \\
P\left( z_{2}|b_{1}\right) &=&\frac{1}{2}\cdot \frac{1}{2}=\frac{1}{4} \\
P\left( z_{3}|b_{1}\right) &=&\frac{1}{2}\cdot \frac{1}{2}=\frac{1}{4}
\end{eqnarray*}となります。さて、この行動戦略\(b_{1}\)と戦略的に同等な混合戦略は存在するでしょうか。プレイヤー\(1\)の純粋戦略集合は、\begin{equation*}S_{1}=A\left( H_{1}\right) =\left\{ a_{11},a_{12}\right\}
\end{equation*}です。ただし、\(a_{11}\)は「情報集合\(H_{1}\)において行動\(a_{11}\)を選ぶ」という純粋戦略であり、\(a_{12}\)は「情報集合\(H_{1}\)において行動\(a_{12}\)を選ぶ」という純粋戦略です。プレイヤー\(1\)が純粋戦略\(a_{11}\)を選ぶ場合、ゲームが始まると手番\(x_{0}\)において行動\(a_{11}\)を選んで頂点\(z_{1}\)に到達します。一方、純粋戦略\(a_{12}\)を選ぶ場合、ゲームが始まると手番\(x_{0}\)において行動\(a_{12}\)を選び、移動先の手番\(x_{1}\)において再び行動\(a_{12}\)を選んで頂点\(z_{3}\)へ到達します。これ以外の純粋戦略は存在しないため、頂点\(z_{2}\)に到達するような純粋戦略は存在しません。混合戦略は純粋戦略集合\(S_{1}\)上の確率分布として定義されますが、\(z_{2}\)へ到達する純粋戦略が存在しない以上、\(z_{2}\)へ到達するような混合戦略も存在しません。したがって、先の行動戦略\(b_{1}\)と戦略的に同等な混合戦略が存在しないことが明らかになりました。

上の例において行動戦略\(b_{1}\)と戦略的に同等な混合戦略が存在しない理由は、頂点\(z_{2}\)へ到達可能な純粋戦略が存在しないことにあります。さらに、そのような純粋戦略が存在しない理由は、頂点\(z_{2}\)への経路上にある2つの手番\(x_{0},x_{1}\)が同一の情報集合\(H_{1}\)に属しており、なおかつ、\(x_{0}\)から\(z_{2}\)へ到達するために選択すべき行動\(a_{11}\)と、\(x_{1}\)から\(z_{2}\)へ到達するために選択すべき行動\(a_{12}\)が異なることにあります。純粋戦略は情報集合において確定的に選択する行動を1つだけ定めるルールであるため、情報集合\(H_{1}\)に対して\(a_{11}\)と\(a_{12}\)を同時に指定することはできず、したがっていかなる純粋戦略のもとでも\(z_{2}\)へ到達することはできません。

 

いかなる混合戦略とも戦略的に同等ではない行動戦略が存在するための十分条件

先の例および考察を手掛かりに、いかなる混合戦略とも戦略的に同等ではないような行動戦略が存在するための十分条件を以下のように一般化します。

命題(いかなる混合戦略とも戦略的に同等ではない行動戦略が存在するための十分条件)
展開型ゲーム\(\Gamma \)において、少なくとも1つの頂点\(z\in Z\)へ至る経路上に、あるプレイヤー\(i\in I\)の複数の手番を含む情報集合\(H_{i}\in \mathcal{H}_{i}\)が存在し、なおかつ、\(H_{i}\)に属する異なる2つの手番\(x_{i},x_{i}^{\prime }\in H_{i}\)について、\(x_{i}\)から\(z\)へ向かう行動\(a_{i}\)と、\(x_{i}^{\prime }\)から\(z\)へ向かう行動\(a_{i}^{\prime }\)が異なる場合には、プレイヤー\(i\)はいかなる混合戦略\(\sigma _{i}\in\Delta \left( S_{i}\right) \)とも戦略的に同等ではない行動戦略\(b_{i}\in B_{i}\)を持つ。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

 

行動戦略と戦略的に同等な混合戦略が存在するための必要条件

展開型ゲームにおいて、いかなる混合戦略とも戦略的に同等ではない行動戦略が存在するための十分条件が明らかになりました。先の命題を利用すると、プレイヤーの行動戦略に対して、それと戦略的に同等であるような混合戦略が存在するための必要条件を以下のように特定できます。

命題(行動戦略と戦略的に同等な混合戦略が存在するための必要条件)
任意の手番\(x\in X\backslash Z\)において少なくとも2つの行動が選択可能であるような展開型ゲーム\(\Gamma \)が与えられているものとする。プレイヤー\(i\in I\)の行動戦略\(b_{i}\in B_{i}\)を任意に選んだとき、それと戦略的に同等な混合戦略\(\sigma_{i}\in \Delta \left( S_{i}\right) \)が存在するものとする。以上の条件のもとでは、プレイヤー\(i\)の情報集合\(H_{i}\in \mathcal{H}_{i}\)と頂点\(z\in Z\)をそれぞれ任意に選んだとき、\(H_{i}\)は\(z\)への経路上に存在する複数の手番を要素として持たない。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

 

行動戦略と戦略的に同等な混合戦略が存在するための十分条件

プレイヤーの行動戦略に対して、それと戦略的に同等な混合戦略が存在するための必要条件が明らかになりましたが、逆に、十分条件を特定できるでしょうか。つまり、どのような条件が満たされていれば、行動戦略と戦略的に同等な混合戦略が存在することを保証できるでしょうか。実は、先の命題において提示した必要条件はそのまま十分条件になります。そのことを示す前に、行動戦略が与えられたとき、それと戦略的に同等になる混合戦略の候補を以下で提示します。

プレイヤー\(i\in I\)の行動戦略\(b_{i}\in B_{i}\)が与えられているものとします。ここから以下の要領で混合戦略\(\sigma _{i}\)を定義します。ただし、混合戦略\(\sigma _{i}\)を定義することとは、\(\sigma _{i}\)のもとでそれぞれの純粋戦略\(s_{i}\in S_{i}\)が選ばれる確率\(\sigma _{i}\left( s_{i}\right) \)を指定することと同義です。さて、プレイヤー\(i\)が純粋戦略\(s_{i}\)を採用する場合には情報集合\(H_{i}\in \mathcal{H}_{i}\)において行動\(s_{i}\left( H_{i}\right) \in A\left( H_{i}\right) \)を選択することになります。一方、先の行動戦略\(b_{i}\)のもとで、情報集合\(H_{i}\)において先の行動\(s_{i}\left( H_{i}\right) \)を選ぶ確率は\(b_{i}\left( s_{i}\left( H_{i}\right) |H_{i}\right) \)です。この確率をそれぞれの情報集合\(H_{i}\)に対して導出した上で、得られた確率の積をとり、その結果を、\begin{equation*}\sigma _{i}\left( s_{i}\right) =\prod_{H_{i}\in \mathcal{H}_{i}}b_{i}\left(
s_{i}\left( H_{i}\right) |H_{i}\right)
\end{equation*}で表記します。行動戦略\(b_{i}\)が与えられれば、それぞれの純粋戦略\(s_{i}\)に対して上の値\(\sigma _{i}\left( s_{i}\right) \)を導出できるため、混合戦略の候補\begin{equation*}\sigma _{i}=\left( \sigma _{i}\left( s_{i}\right) \right) _{s_{i}\in S_{i}}
\end{equation*}が得られます。現段階で混合戦略の「候補」と呼ぶ理由は、上のように定義された\(\sigma _{i}\)が混合戦略としての要件を満たすこと、すなわち純粋戦略集合\(\Delta \left( S_{i}\right) \)上の確率関数であることを確認できていないからです。この確認は後ほど行います。いずれにせよ、プレイヤー\(i\)の行動戦略\(b_{i}\)から以上のように定義される混合戦略\(\sigma _{i}\)を\(b_{i}\)から生成される混合戦略(mixed strategy generated by \(b_{i}\))と呼び、これを、\begin{equation*}\sigma _{i}\left[ b_{i}\right] =\left( \sigma _{i}\left[ b_{i}\right] \left(
s_{i}\right) \right) _{s_{i}\in S_{i}}
\end{equation*}で表記します。ただし、\(\sigma _{i}\left[ b_{i}\right] \left( s_{i}\right) \)は混合戦略\(\sigma _{i}\left[ b_{i}\right] \)のもとで純粋戦略\(s_{i}\)が選ばれる確率です。

例(行動戦略によって生成される混合戦略)
以下のゲームの木によって表現される展開型ゲーム\(\Gamma \)について考えます。ただし、利得を省略しています。

図:展開型ゲーム
図:展開型ゲーム

プレイヤー\(1\)の情報集合からなる集合族は、\begin{equation*}\mathcal{H}_{1}=\left\{ \left\{ x_{0}\right\} \right\}
\end{equation*}であるため、プレイヤー\(1\)の純粋戦略集合は、\begin{eqnarray*}S_{1} &=&A\left( \left\{ x_{0}\right\} \right) \\
&=&\left\{ a_{11},a_{12}\right\}
\end{eqnarray*}です。プレイヤー\(1\)の行動戦略を、\begin{eqnarray*}b_{1} &=&\left( b_{1}\left( a_{11}|\left\{ x_{0}\right\} \right)
,b_{1}\left( a_{12}|\left\{ x_{0}\right\} \right) \right) \\
&=&\left( b_{11},1-b_{11}\right)
\end{eqnarray*}で表記します。ただし、\(0\leq b_{11}\leq 1\)です。\(b_{1}\)が生成する混合戦略\(\sigma _{1}\left[ b_{1}\right] \)がそれぞれの純粋戦略に付与する確率は、\begin{eqnarray*}\sigma _{1}\left[ b_{1}\right] \left( a_{11}\right) &=&b_{1}\left(
a_{11}|\left\{ x_{0}\right\} \right) =b_{11} \\
\sigma _{1}\left[ b_{1}\right] \left( a_{12}\right) &=&b_{1}\left(
a_{12}|\left\{ x_{0}\right\} \right) =1-b_{11}
\end{eqnarray*}ですが、これらの確率は非負かつ総和は\(1\)であるため、\(\sigma _{1}\left[ b_{1}\right] \)は混合戦略としての要件を満たしています。続いて、プレイヤー\(2\)の情報集合からなる集合族は、\begin{equation*}\mathcal{H}_{2}=\left\{ \left\{ x_{1}\right\} ,\left\{ x_{2}\right\}
\right\}
\end{equation*}であるため、プレイヤー\(2\)の純粋戦略集合は、\begin{eqnarray*}S_{2} &=&A\left( \left\{ x_{1}\right\} \right) \times A\left( \left\{
x_{2}\right\} \right) \\
&=&\left\{ a_{21},a_{22}\right\} \times \left\{ a_{21},a_{22}\right\} \\
&=&\left\{ \left( a_{21},a_{21}\right) ,\left( a_{21},a_{22}\right) ,\left(
a_{22},a_{21}\right) ,\left( a_{22},a_{22}\right) \right\}
\end{eqnarray*}です。プレイヤー\(2\)の行動戦略を、\begin{eqnarray*}b_{2} &=&\left( \left( b_{2}\left( a_{21}|\left\{ x_{1}\right\} \right)
,b_{2}\left( a_{22}|\left\{ x_{1}\right\} \right) \right) ,\left(
b_{2}\left( a_{21}|\left\{ x_{2}\right\} \right) ,b_{2}\left( a_{22}|\left\{
x_{2}\right\} \right) \right) \right) \\
&=&\left( \left( b_{21},1-b_{21}\right) ,\left( b_{22},1-b_{22}\right)
\right)
\end{eqnarray*}で表記します。ただし、\(0\leq b_{21}\leq 1\)かつ\(0\leq b_{22}\leq 1\)です。\(b_{2}\)が生成する混合戦略\(\sigma _{2}\left[ b_{2}\right] \)がそれぞれの純粋戦略に付与する確率は、\begin{eqnarray*}\sigma _{2}\left[ b_{2}\right] \left( a_{21},a_{21}\right) &=&b_{2}\left(
a_{21}|\left\{ x_{1}\right\} \right) \cdot b_{2}\left( a_{21}|\left\{
x_{2}\right\} \right) =b_{21}b_{22} \\
\sigma _{2}\left[ b_{2}\right] \left( a_{21},a_{22}\right) &=&b_{2}\left(
a_{21}|\left\{ x_{1}\right\} \right) \cdot b_{2}\left( a_{22}|\left\{
x_{2}\right\} \right) =b_{21}\left( 1-b_{22}\right) \\
\sigma _{2}\left[ b_{2}\right] \left( a_{22},a_{21}\right) &=&b_{2}\left(
a_{22}|\left\{ x_{1}\right\} \right) \cdot b_{2}\left( a_{21}|\left\{
x_{2}\right\} \right) =\left( 1-b_{21}\right) b_{22} \\
\sigma _{2}\left[ b_{2}\right] \left( a_{22},a_{22}\right) &=&b_{2}\left(
a_{22}|\left\{ x_{1}\right\} \right) \cdot b_{2}\left( a_{22}|\left\{
x_{2}\right\} \right) =\left( 1-b_{21}\right) \left( 1-b_{22}\right)
\end{eqnarray*}ですが、これらの確率は非負かつ総和は\(1\)であるため、\(\sigma _{2}\left[ b_{2}\right] \)は混合戦略としての要件を満たしています。

以上を踏まえた上で以下を示します。

命題(行動戦略と戦略的に同等な混合戦略が存在するための十分条件)
任意の手番\(x\in X\backslash Z\)において少なくとも2つの行動が選択可能であるような展開型ゲーム\(\Gamma \)が与えられているものとする。加えて、プレイヤー\(i\)の情報集合\(H_{i}\in \mathcal{H}_{i}\)と頂点\(z\in Z\)をそれぞれ任意に選んだとき、\(H_{i}\)は\(z\)への経路上に存在する複数の手番を要素として持たないものとする。以上の条件のもとでは、プレイヤー\(i\in I\)の行動戦略\(b_{i}\in B_{i}\)を任意に選んだとき、それと戦略的に同等な混合戦略\(\sigma _{i}\in \Delta\left( S_{i}\right) \)が存在する。具体的には、\(b_{i}\)から生成される混合戦略\(\sigma _{i}\left[ b_{i}\right] \)はそのような混合戦略である。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

 

行動戦略と戦略的に同等な混合戦略が存在するための必要十分条件

展開型ゲームにおいて、プレイヤーの行動戦略に対して、それと戦略的に同等な混合戦略が存在するための必要条件を特定するとともに、それが十分条件でもあることが明らかになりました。結論をまとめます。

命題(行動戦略と戦略的に同等な混合戦略が存在するための必要十分条件)
任意の手番\(x\in X\backslash Z\)において少なくとも2つの行動が選択可能であるような展開型ゲーム\(\Gamma \)が与えられているものとする。この場合、それぞれのプレイヤー\(i\in I\)について以下の2つの命題は必要十分である。

  1. プレイヤー\(i\)の情報集合\(H_{i}\in \mathcal{H}_{i}\)と頂点\(z\in Z\)をそれぞれ任意に選んだとき、\(H_{i}\)は\(z\)への経路上に存在する複数の手番を要素として持たない。
  2. プレイヤー\(i\)の行動戦略\(b_{i}\in B_{i}\)を任意に選んだとき、それと戦略的に同等な混合戦略\(\sigma _{i}\in \Delta \left( S_{i}\right) \)が存在する。具体的には、\(b_{i}\)から生成される混合戦略\(\sigma _{i}\left[ b_{i}\right] \)はそのような混合戦略である。
例(行動戦略と戦略的に同等な混合戦略)
以下のゲームの木によって表現される展開型ゲーム\(\Gamma \)について考えます。ただし、利得を省略しています。

図:展開型ゲーム
図:展開型ゲーム

このゲームの情報集合は、\begin{equation*}
\left\{ x_{0}\right\} ,\left\{ x_{1}\right\} ,\left\{ x_{2},x_{3}\right\}
\end{equation*}ですが、これらはいずれも特定の頂点への経路上に存在する複数の手番を要素として持ちません。したがって先の命題より、任意のプレイヤーの任意の行動戦略を選んだとき、それと戦略的に同等な混合戦略が存在することが保証されます。

上の例においてプレイヤー\(1\)の情報集合\(\left\{x_{2},x_{3}\right\} \)に注目すると、手番\(x_{3}\)は行動\(a_{12}\)から到達するにも関わらず、手番\(x_{2}\)は同じ行動\(a_{12}\)から到達できません。つまり、プレイヤー\(1\)は情報集合\(\left\{x_{0}\right\} \)における自身の意思決定の内容を記憶していないため、これは不完全記憶ゲームです。上の例は、不完全記憶ゲームにおいても行動戦略と戦略的に同等な混合戦略が存在し得ることを示唆しています。

 

演習問題

問題(行動戦略と戦略的に同等な混合戦略)
以下のゲームの木によって表現される展開型ゲーム\(\Gamma \)について考えます。ただし、利得を省略しています。

図:展開型ゲーム
図:展開型ゲーム

プレイヤー\(1\)の行動戦略\(b_{1}\)と、\(b_{1}\)が生成する混合戦略\(\sigma _{1}\left[ b_{1}\right] \)をそれぞれ定式化した上で、\(\sigma _{1}\left[ b_{1}\right] \)が\(b_{1}\)と戦略的に同等であることを示してください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員専用コンテンツです
ログイン】【会員登録