WIIS

完備情報の動学ゲーム

展開型ゲームにおける戦略の同等性

目次

関連知識

Mailで保存
Xで共有

混合戦略と行動戦略の比較

問題としている戦略的状況が完備情報の動学ゲームであり、それが展開型ゲーム\(\Gamma \)として表現されているものとします。展開型ゲーム\(\Gamma \)におけるプレイヤー\(i\)の純粋戦略とは、ゲームにおいて彼が直面し得るそれぞれの情報集合\(H\in \mathcal{H}_{i}\)に対して、そこで彼が確定的に選択する行動\(s_{i}\left(H\right) \in A_{i}\)を1つずつあらかじめ指定する写像\begin{equation*}s_{i}:\mathcal{H}_{i}\rightarrow A_{i}
\end{equation*}として定式化されます。一方、プレイヤーが何らかの確率分布にもとづいてランダムに意思決定を行う場合には、混合戦略と行動戦略という2つの異なるタイプの戦略が存在します。

展開型ゲーム\(\Gamma \)におけるプレイヤー\(i\)の混合戦略とは、ゲームにおいて彼が選択し得るそれぞれの純粋戦略\(s_{ij}\in S_{i}\)に対して、それを採用する確率に相当する実数\(\sigma _{i}\left(s_{ij}\right) \in \mathbb{R} \)を1つずつ指定する写像\begin{equation*}\sigma _{i}:S_{i}\rightarrow \mathbb{R} \end{equation*}として定式化されます。つまり、プレイヤーが混合戦略を採用することとは何らかの確率分布にもとづいてランダムに特定の純粋戦略を選択することを意味します。言い換えると、ゲームの開始時点において、あらかじめ定めた確率分布にしたがって特定の純粋戦略をランダムに選択し、以降は選択した純粋戦略にもとづいて意思決定を行うということです。

一方、展開型ゲーム\(\Gamma \)におけるプレイヤー\(i\)の行動戦略とは、ゲームにおいて彼が直面し得るそれぞれの情報集合\(H\in \mathcal{H}_{i}\)に対して、そこで採用する局所戦略\(b_{i}\left( \cdot |H\right)\in L_{i}\)を1つずつ指定する写像\begin{equation*}b_{i}:\mathcal{H}_{i}\rightarrow L_{i}
\end{equation*}として定式化されます。ただし、情報集合\(H\)における局所戦略\(b_{i}\left( \cdot |H\right) \)とは、情報集合\(H\)において選択可能なそれぞれの行動\(a_{ij}\in A\left( H\right) \)に対し、それが選ばれる確率\(b_{i}\left( a_{ij}|H\right)\in \mathbb{R} \)を指定する写像\begin{equation*}b_{i}\left( \cdot |H\right) :A\left( H\right) \rightarrow \mathbb{R} \end{equation*}として定式化されます。つまり、プレイヤーが行動戦略を採用することとは、自身が意思決定を行うそれぞれの情報集合において何らかの確率分布にもとづいてランダムに特定の行動を選択することを意味します。言い換えると、ゲームの開始後、自身が意思決定を行う情報集合に到達するたびに、あらかじめ定めた確率分布にしたがって特定の行動をランダムに選択していく形で意思決定を行うということです。

展開型ゲームにおいてプレイヤーが何らかの確率分布にもとづいてランダムに意思決定を行う場合、プレイヤーは混合戦略と行動戦略のどちらを採用すべきでしょうか。実は、ある一定の条件のもとでは、プレイヤーにとって混合戦略と行動戦略は実質的に等しくなります。以降では、プレイヤーにとって混合戦略と行動戦略が実質的に等しいことの意味を定義した上で、後に、両者が実質的に等しくなるための条件について考えます。ちなみに、純粋戦略は特別な混合戦略であるため、以降の議論において混合戦略という場合、それは純粋戦略を同時に意味します。

 

展開型ゲームにおける戦略の同等性

展開型ゲーム\(\Gamma \)におけるプレイヤー\(i\in I\)の混合戦略集合\(\Delta \left( S_{i}\right) \)と行動戦略集合\(B_{i}\)が与えられれば、ゲームにおいてプレイヤー\(i\)が選択可能なすべての集合は両者の和集合\begin{equation*}\Sigma _{i}=\Delta \left( S_{i}\right) \cup B_{i}
\end{equation*}として得られます。純粋戦略は特別な混合戦略であるため、プレイヤー\(i\)の任意の純粋戦略もまた\(\Sigma _{i}\)の要素です。\(\Sigma _{i}\)の要素である個々の戦略を、\begin{equation*}\gamma _{i}\in \Sigma _{i}
\end{equation*}で表記します。

すべてのプレイヤーの戦略からなる組を\(\gamma _{I}=\left( \gamma _{i}\right) _{i\in I}\)で表記し、プレイヤー\(i\)以外のプレイヤーたちの戦略からなる組を\(\gamma_{-i}=\left( \gamma _{j}\right) _{j\in I\backslash \left\{ i\right\} }\)で表記します。\(\gamma _{I}=\left(\gamma _{i},\gamma _{-i}\right) \)です。

すべてのプレイヤーの戦略集合からなる直積を\(\Sigma _{I}=\prod_{i\in I}\Sigma _{i}\)で表記し、プレイヤー\(i\)以外のプレイヤーたちの戦略集合からなる直積を\(\Sigma _{-i}=\prod_{j\in I\backslash\left\{ i\right\} }\Sigma _{j}\)で表記します。\(\gamma _{I}\in \Sigma _{I}\)かつ\(\gamma _{-i}\in\Sigma _{-i}\)です。

展開型ゲーム\(\Gamma \)においてプレイヤーたちが選択する戦略からなる組が\(\gamma _{I}\in \Sigma _{I}\)である場合にゲームがノード\(x\in X\)へ到達する確率を、\begin{equation*}P\left( x|\gamma _{I}\right)
\end{equation*}で表記します。頂点\(z\in Z\)もまたノードであるため、戦略の組\(\gamma _{I}\)のもとでゲームが頂点\(z\)へ到達する確率は、\begin{equation*}P\left( z|\gamma _{I}\right)
\end{equation*}と表記されます。ここでは、戦略の組\(\gamma _{I}\)を構成する戦略の種類が異なる可能性は排除されていません。つまり、あるプレイヤーは混合戦略を採用する一方で別のプレイヤーは行動戦略を選択するような状況も考慮するということです。

プレイヤー\(i\)の2つの戦略\(\gamma _{i},\gamma _{i}^{\prime }\in \Sigma _{i}\)に注目したとき、他のプレイヤーたちが選ぶ戦略の組\(\gamma _{-i}\in \Sigma _{-i}\)がいかなるものである場合にも、\(\gamma _{i}\)と\(\gamma_{i}^{\prime }\)のどちらにおいてもゲームがそれぞれの頂点\(z\in Z\)へ到達する確率が等しい場合には、すなわち、\begin{equation*}\forall \gamma _{-i}\in \Sigma _{-i},\ \forall z\in Z:P\left( z|\gamma
_{i},\gamma _{-i}\right) =P\left( z|\gamma _{i}^{\prime },\gamma
_{-i}\right)
\end{equation*}が成り立つ場合には、プレイヤー\(i\)にとって\(\gamma _{i}\)と\(\gamma _{i}^{\prime }\)は戦略的に同等(strategically equivalent)であると言います。

戦略集合\(\Sigma _{i}\)には混合戦略と行動戦略が含まれているため、上の定義は、プレイヤー\(i\)の混合戦略\(\sigma _{i}\)と行動戦略\(b_{i}\)が同等であることの意味を内包しています。なお、プレイヤー\(i\)にとって混合戦略\(\sigma _{i}\)と行動戦略\(b_{i}\)が戦略的に同等であることをあえて明示的に表現するのであれば、\begin{equation*}\forall \gamma _{-i}\in \Sigma _{-i},\ \forall z\in Z:P\left( z|\sigma
_{i},\gamma _{-i}\right) =P\left( z|b_{i},\gamma _{-i}\right)
\end{equation*}となります。

混合戦略と戦略的に同等な行動戦略が存在することが保証されるのであれば、ランダムな意思決定を行うプレイヤーがとり得る戦略を行動戦略に限定しても一般性は失われないことになります。逆に、行動戦略と戦略的に同等な混合戦略が存在することが保証されるのであれば、分析対象を混合戦略に限定しても一般性は失われません。後ほど明らかになるように、一定の条件のもとでは、どちらの主張も成立します(クーンの定理)。

 

同等な戦略のもとでゲームがノードに到達する確率

繰り返しになりますが、展開型ゲーム\(\Gamma \)においてプレイヤー\(i\in I\)の2つの戦略\(\gamma _{i},\gamma_{i}^{\prime }\in \Sigma _{i}\)が戦略的に同等であることとは、\begin{equation*}\forall \gamma _{-i}\in \Sigma _{-i},\ \forall z\in Z:P\left( z|\gamma
_{i},\gamma _{-i}\right) =P\left( z|\gamma _{i}^{\prime },\gamma
_{-i}\right)
\end{equation*}が成り立つことを意味します。実は、以上の条件が満たされる場合、ゲームが頂点とは限らないそれぞれのノードへ到達する確率もまた等しくなります。つまり、\begin{equation*}
\forall \gamma _{-i}\in \Sigma _{-i},\ \forall x\in X:P\left( x|\gamma
_{i},\gamma _{-i}\right) =P\left( x|\gamma _{i}^{\prime },\gamma
_{-i}\right)
\end{equation*}が成り立つということです。

命題(同等な戦略のもとでゲームがノードに到達する確率)
展開型ゲーム\(\Gamma \)においてプレイヤー\(i\in I\)の2つの戦略\(\gamma _{i},\gamma _{i}^{\prime }\in \Sigma_{i}\)が戦略的に同等であるならば、\begin{equation*}\forall \gamma _{-i}\in \Sigma _{-i},\ \forall x\in X:P\left( x|\gamma
_{i},\gamma _{-i}\right) =P\left( x|\gamma _{i}^{\prime },\gamma
_{-i}\right)
\end{equation*}が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

 

混合戦略と行動戦略が戦略的に同等であるための条件

展開型ゲーム\(\Gamma \)においてプレイヤー\(i\in I\)の混合戦略\(\sigma _{i}\in \Delta \left( S_{i}\right) \)と行動戦略\(b_{i}\in B_{i}\)および頂点\(z\in Z\)をそれぞれ任意に選びます。初期点\(x_{0}\)から頂点\(z\)へ至る経路上においてプレイヤー\(i\)が意思決定を行う手番を初期点に近い順で並べたものを、\begin{equation*}x_{i}^{1},\ x_{i}^{2},\cdots ,\ x_{i}^{L_{i}^{x}}
\end{equation*}で表記し、ゲームが頂点\(z\)へ到達するためにプレイヤー\(i\)が以上のそれぞれの手番において選択すべき行動を、\begin{equation*}a_{i}\left( x_{i}^{1}\rightarrow z\right) ,\ a_{i}\left(
x_{i}^{2}\rightarrow z\right) ,\cdots ,\ a_{i}\left(
x_{i}^{L_{i}^{x}}\rightarrow z\right)
\end{equation*}で表記するのであれば、これらの行動をすべて選択するプレイヤー\(i\)の純粋戦略からなる集合は、\begin{equation*}S_{i}\left( z\right) =\left\{ s_{i}\in S_{i}\ |\ \forall l\in \left\{
1,2,\cdots ,L_{i}^{x}\right\} :s_{i}\left( h_{i}\left( x_{i}^{l}\right)
\right) =a_{i}\left( x_{i}^{l}\rightarrow z\right) \right\}
\end{equation*}となります。ただし、\(h_{i}\left( x_{i}^{l}\right) \)は手番\(x_{i}^{l}\)が属する情報集合です。以上を踏まえると、プレイヤー\(i\)が混合戦略\(\sigma _{i}\)のもとで頂点\(z\)へ至る経路上にある行動をすべて選ぶ確率は、\begin{equation*}P\left( z|\sigma _{i}\right) =\sum_{s_{i}\in S_{i}\left( x\right) }\sigma
_{i}\left( s_{i}\right)
\end{equation*}であり、プレイヤー\(i\)が行動戦略\(b_{i}\)のもとで頂点\(z\)へ至る経路上にある行動をすべて選ぶ確率は、\begin{equation*}P\left( z|b_{i}\right) =\prod_{l=1}^{L_{i}^{x}}b_{i}\left( a_{i}\left(
x_{i}^{l}\rightarrow z\right) |h_{i}\left( x_{i}^{l}\right) \right)
\end{equation*}となります。以上を踏まえたとき、任意の頂点\(z\)に対して上の2つの確率が等しくなる場合には、すなわち、\begin{equation*}\forall z\in Z:P\left( z|\sigma _{i}\right) =P\left( z|b_{i}\right)
\end{equation*}が成り立つのであれば、混合戦略\(\sigma _{i}\)と行動戦略\(b_{i}\)は戦略的に同等になることが保証されます。つまり、\begin{equation*}\forall \gamma _{-i}\in \Sigma _{-i},\ \forall z\in Z:P\left( z|\sigma
_{i},\gamma _{-i}\right) =P\left( z|b_{i},\gamma _{-i}\right)
\end{equation*}が成り立つということです。

命題(混合戦略と行動戦略が戦略的に同等であるための条件)
展開型ゲーム\(\Gamma \)において、プレイヤー\(i\in I\)の混合戦略\(\sigma _{i}\in \Delta \left(S_{i}\right) \)と行動戦略\(b_{i}\in B_{i}\)の間に以下の関係\begin{equation*}\forall z\in Z:P\left( z|\sigma _{i}\right) =P\left( z|b_{i}\right)
\end{equation*}が成り立つならば、\(\sigma _{i}\)と\(b_{i}\)は戦略的に同等になる。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

 

戦略的に同等な混合戦略と行動戦略がもたらす期待利得

展開型ゲーム\(\Gamma \)においてプレイヤー\(i\in I\)の混合戦略\(\sigma _{i}\in \Delta \left( S_{i}\right) \)と行動戦略\(b_{i}\in B_{i}\)をそれぞれ任意に選びます。他のプレイヤーたちの戦略\(\gamma _{-i}\in \Sigma _{-i}\)を任意に選んだとき、プレイヤー\(i\)が\(\sigma _{i}\)を選んだ場合にプレイヤー\(j\in I\)が直面する期待利得は、\begin{equation*}F_{j}\left( \sigma _{i},\gamma _{-i}\right) =\sum_{z\in Z}P\left( z|\sigma
_{i},\gamma _{-i}\right) \cdot u_{j}\left( z\right)
\end{equation*}である一方で、プレイヤー\(i\)が\(b_{i}\)を選んだ場合にプレイヤー\(j\)が直面する期待利得は、\begin{equation*}F_{j}\left( b_{i},\gamma _{-i}\right) =\sum_{z\in Z}P\left( z|b_{i},\gamma
_{-i}\right) \cdot u_{j}\left( z\right)
\end{equation*}となります。プレイヤー\(i\)にとって\(\sigma _{i}\)と\(b_{i}\)が戦略的に同等である場合には、他のプレイヤーたちの戦略\(\gamma _{-i}\)に関わらず、プレイヤー\(i\)を含めた任意のプレイヤー\(j\)について、以上の2つの期待利得が一致することが保証されます。つまり、\begin{equation*}\forall j\in I,\ \forall \gamma _{-i}\in \Sigma _{-i}:F_{j}\left( \sigma
_{i},\gamma _{-i}\right) =F_{j}\left( b_{i},\gamma _{-i}\right)
\end{equation*}が成り立つということです。プレイヤー\(i\)が同等な混合戦略と行動戦略を持つとき、彼がどちらを選ぶ場合においても、彼自身を含むすべてのプレイヤーが直面する期待利得に差は生じないということです。

命題(戦略的に同等な混合戦略と行動戦略がもたらす期待利得)
展開型ゲーム\(\Gamma \)において、プレイヤー\(i\in I\)の混合戦略\(\sigma _{i}\in \Delta \left(S_{i}\right) \)と行動戦略\(b_{i}\in B_{i}\)が戦略的に同等であるならば、\begin{equation*}\forall j\in I,\ \forall \gamma _{-i}\in \Sigma _{-i}:F_{j}\left( \sigma
_{i},\gamma _{-i}\right) =F_{j}\left( b_{i},\gamma _{-i}\right)
\end{equation*}が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

展開型ゲーム\(\Gamma \)においてプレイヤーたちの混合戦略の組\(\sigma _{I}\in\Delta \left( S_{I}\right) \)と行動戦略の組\(b_{I}\in B_{I}\)に注目します。これらの組において、任意のプレイヤー\(i\)にとって混合戦略\(\sigma _{i}\)と行動戦略\(b_{i}\)が戦略的に同等である場合には、先の命題より、任意のプレイヤー\(i\)にとって\(\sigma _{I}\)のもとで直面する期待利得と\(b_{I}\)のもとで直面する期待利得が等しくなることが示されます。つまり、\begin{equation*}F_{i}\left( \sigma _{I}\right) =F_{i}\left( b_{I}\right)
\end{equation*}が成り立ちます。それぞれのプレイヤーが戦略的に同等な混合戦略と行動戦略を持つとき、全員がそれらの混合戦略を選ぶ場合と、全員がそれらの行動戦略を選ぶ場合とでは、全員が直面する期待利得に差は生じないということです。

命題(戦略的に同等な混合戦略と行動戦略がもたらす期待利得)
展開型ゲーム\(\Gamma \)において、混合戦略の組\(\sigma _{I}\in \Delta \left( S_{I}\right) \)と行動戦略の組\(b_{I}\in B_{I}\)が与えられたとき、任意のプレイヤー\(i\in I\)について混合戦略\(\sigma _{i}\in \Delta \left( S_{i}\right) \)と行動戦略\(b_{i}\in B_{i}\)が戦略的に同等であるならば、\begin{equation*}\forall i\in I:F_{i}\left( \sigma _{I}\right) =F_{i}\left( b_{I}\right)
\end{equation*}が成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員専用コンテンツです
ログイン】【会員登録