WIIS

完備情報の動学ゲーム

展開型ゲームの戦略型の混合拡張

目次

関連知識

Mailで保存
Xで共有

展開型ゲームのもとでの戦略型の混合拡張

問題としている戦略的状況が完備情報の動学ゲームであり、それが展開型ゲーム\(\Gamma \)として表現されているものとします。それぞれのプレイヤー\(i\in I\)が純粋戦略\(s_{i}\in S_{i}\)を採用する場合、そこでプレイヤーたちが直面する戦略的状況は\(\Gamma \)の戦略型\begin{equation*}G\left( \Gamma \right) =\left( I,\left\{ S_{i}\right\} _{i\in I},\left\{
U_{i}\right\} _{i\in I}\right)
\end{equation*}として表現されます。ただし、\(I\)はプレイヤー集合、\(S_{i}\)はプレイヤー\(i\)の純粋戦略集合、\(U_{i}\)はプレイヤー\(i\)が純粋戦略の組どうしを比較する\(S_{I}\)上の期待利得関数です。

一方、プレイヤーたちが混合戦略を採用する場合、どの純粋戦略の組が実際に実現するかを事前に確定することはできないという意味において、プレイヤーたちは不確実な状況に直面します。そこで、そのような状況をクジ\(\sigma _{I}:S_{I}\rightarrow \mathbb{R} \)を用いて表現します。これは、プレイヤーたちが選択する混合戦略の組が\(\sigma _{I}=\left( \sigma_{i}\right) _{i\in I}\)であるときに、それぞれの純粋戦略\(s_{I}=\left( s_{i}\right) _{i\in I}\)が起こる確率\(\sigma _{I}\left( s_{I}\right) =\left( \sigma _{i}\left(s_{i}\right) \right) _{i\in I}\)を特定する関数です。

混合戦略の組が与えられればそれに対して1つのクジが定まります。クジが変化すればプレイヤーたちは以前とは異なる不確実な状況に直面するため、プレイヤーたちが混合戦略を採用する場合、それぞれのプレイヤーはクジどうしを比較する選好関係を持っているものと考えるべきです。さらに言えば、混合戦略の組が与えられればそれに対して1つのクジが定まるため、結局、プレイヤーがクジを比較する選好を、混合戦略の組どうしを比較する\(\Delta \left( S_{I}\right) \)上の選好関係、もしくはそれを表す期待利得関数\(F_{i}:\Delta \left( S_{I}\right) \rightarrow \mathbb{R} \)として表現できます。ただし、期待利得関数\(F_{i}\)がそれぞれの混合戦略の組\(\sigma _{I}\in \Delta\left( S_{I}\right) \)に対して定める期待利得は、\begin{equation*}F_{i}\left( \sigma _{I}\right) =\sum_{s_{I}\in S_{I}}\left[ \left(
\prod\limits_{j\in I}\sigma _{j}(s_{j})\right) \cdot U_{i}(s_{I})\right] \end{equation*}となります。

以上を踏まえると、混合戦略を採用するプレイヤーたちが直面する戦略的状況は、\begin{equation*}
G^{\ast }\left( \Gamma \right) =\left( I,\left\{ \Delta \left( S_{i}\right)
\right\} _{i\in I},\left\{ F_{i}\right\} _{i\in I}\right)
\end{equation*}として表現されますが、これを展開型ゲーム\(\Gamma \)のもとでの戦略型ゲーム\(G\left( \Gamma \right) \)の混合拡張(mixed extension)と呼びます。

例(混合拡張)
以下のゲームの木によって表現される展開型ゲーム\(\Gamma \)について考えます。

図:ゲームの木
図:ゲームの木

プレイヤー\(1\)の純粋戦略集合は、\begin{eqnarray*}S_{1} &=&A\left( \left\{ x_{0}\right\} \right) \\
&=&\left\{ a_{11},a_{12}\right\}
\end{eqnarray*}であり、プレイヤー\(2\)の純粋戦略集合は、\begin{eqnarray*}S_{2} &=&A\left( \left\{ x_{1}\right\} \right) \times A\left( \left\{
x_{2}\right\} \right) \\
&=&\left\{ \left( a_{21},a_{21}\right) ,\left( a_{21},a_{22}\right) ,\left(
a_{22},a_{21}\right) ,\left( a_{22},a_{22}\right) \right\}
\end{eqnarray*}です。プレイヤーたちが選択する純粋戦略からなる組が\(\left(a_{11},\left( a_{21},a_{21}\right) \right) \)である場合、ゲームは確率\(1\)で頂点\(z_{1}\)へ到達するため、そこでプレイヤーたちが得る期待利得は、\begin{eqnarray*}U_{1}\left( a_{11},\left( a_{21},a_{21}\right) \right) &=&2 \\
U_{2}\left( a_{11},\left( a_{21},a_{21}\right) \right) &=&1
\end{eqnarray*}となります。他の純粋戦略の組についても期待利得行列を計算することにより、この展開型ゲーム\(\Gamma \)の戦略型\(G\left( \Gamma \right) \)が以下の利得行列として得られます。

$$\begin{array}{ccccc}\hline
1\backslash 2 & \left( a_{21},a_{21}\right) & \left( a_{21},a_{22}\right) & \left( a_{22},a_{21}\right) & \left( a_{22},a_{22}\right) \\ \hline
a_{11} & 2,1 & 2,1 & 0,0 & 0,0 \\ \hline
a_{12} & -1,1 & 3,2 & -1,1 & 3,2 \\ \hline
\end{array}$$

表:利得行列

それぞれのプレイヤー\(i\)が混合戦略\(\sigma _{i}\)を選ぶ場合、それは、\begin{eqnarray*}\sigma _{1} &=&\left( \sigma _{1}\left( a_{11}\right) ,\sigma _{1}\left(
a_{12}\right) \right) \in \mathbb{R} ^{2} \\
\sigma _{2} &=&\left( \sigma _{2}\left( a_{21},a_{21}\right) ,\sigma
_{2}\left( a_{21},a_{22}\right) ,\sigma _{2}\left( a_{22},a_{21}\right)
,\sigma _{2}\left( a_{22},a_{22}\right) \right) \in \mathbb{R} ^{4}
\end{eqnarray*}というベクトルとしてそれぞれ表現されます。ただし、このベクトルの任意の成分は\(0\)以上\(1\)以下の実数であり、すべての成分の和は\(1\)です。そのような条件を満たすすべての\(\sigma _{i}\)からなる集合がプレイヤー\(i\)の混合戦略集合\(\Delta \left(S_{i}\right) \)です。混合戦略の組\(\left( \sigma _{1},\sigma _{2}\right) \)のもとでそれぞれの純粋戦略の組が選ばれる確率は、
$$\begin{array}{ccccc}\hline
1\backslash 2 & \left( a_{21},a_{21}\right) & \left( a_{21},a_{22}\right) & \left( a_{22},a_{21}\right) & \left( a_{22},a_{22}\right) \\ \hline
a_{11} & \sigma _{1}\left( a_{11}\right) \sigma _{2}\left( a_{21},a_{21}\right) & \sigma _{1}\left( a_{11}\right) \sigma _{2}\left( a_{21},a_{22}\right) & \sigma _{1}\left( a_{11}\right) \sigma _{2}\left( a_{22},a_{21}\right) & \sigma _{1}\left( a_{11}\right) \sigma _{2}\left( a_{22},a_{22}\right) \\ \hline a_{12} & \sigma _{1}\left( a_{12}\right) \sigma _{2}\left( a_{21},a_{21}\right) & \sigma _{1}\left( a_{12}\right) \sigma _{2}\left( a_{21},a_{22}\right) & \sigma _{1}\left( a_{12}\right) \sigma _{2}\left( a_{22},a_{21}\right) & \sigma _{1}\left( a_{12}\right) \sigma _{2}\left( a_{22},a_{22}\right) \\ \hline
\end{array}$$

表:純粋戦略の組が選ばれる確率

であるため、プレイヤー\(1\)の期待利得関数\(F_{1}\)は、\begin{eqnarray*}F_{1}\left( \sigma _{1},\sigma _{2}\right) &=&\sum_{\left(
s_{1},s_{2}\right) \in S_{1}\times S_{2}}\left[ \sigma _{1}\left(
s_{1}\right) \sigma _{2}\left( s_{2}\right) U_{1}(s_{1},s_{2})\right] \\
&=&2\sigma _{1}\left( a_{11}\right) \sigma _{2}\left( a_{21},a_{21}\right)
+2\sigma _{1}\left( a_{11}\right) \sigma _{2}\left( a_{21},a_{22}\right)
-\sigma _{1}\left( a_{12}\right) \sigma _{2}\left( a_{21},a_{21}\right) \\
&&+3\sigma _{1}\left( a_{12}\right) \sigma _{2}\left( a_{21},a_{22}\right)
-\sigma _{1}\left( a_{12}\right) \sigma _{2}\left( a_{22},a_{21}\right)
+3\sigma _{1}\left( a_{12}\right) \sigma _{2}\left( a_{22},a_{22}\right)
\end{eqnarray*}であり、プレイヤー\(2\)の期待利得関数\(F_{2}\)は、\begin{eqnarray*}F_{2}\left( \sigma _{1},\sigma _{2}\right) &=&\sum_{\left(
s_{1},s_{2}\right) \in S_{1}\times S_{2}}\left[ \sigma _{1}\left(
s_{1}\right) \sigma _{2}\left( s_{2}\right) U_{2}(s_{1},s_{2})\right] \\
&=&\sigma _{1}\left( a_{11}\right) \sigma _{2}\left( a_{21},a_{21}\right)
+\sigma _{1}\left( a_{11}\right) \sigma _{2}\left( a_{21},a_{22}\right)
+\sigma _{1}\left( a_{12}\right) \sigma _{2}\left( a_{21},a_{21}\right) \\
&&+2\sigma _{1}\left( a_{12}\right) \sigma _{2}\left( a_{21},a_{22}\right)
+\sigma _{1}\left( a_{12}\right) \sigma _{2}\left( a_{22},a_{21}\right)
+2\sigma _{1}\left( a_{12}\right) \sigma _{2}\left( a_{22},a_{22}\right)
\end{eqnarray*}です。こうして\(G\left( \Gamma\right) \)の混合拡張\(G^{\ast }\left( \Gamma\right) \)が得られます。

 

混合拡張における意思決定

展開型ゲーム\(\Gamma \)においてプレイヤーたちが純粋戦略を採用する場合の戦略的状況が戦略型\(G\left( \Gamma \right) \)によって表現されるとき、\(G\left( \Gamma \right) \)の要素であるプレイヤー集合\(I\)、任意のプレイヤー\(i\in I\)の純粋戦略集合\(S_{i}\)、そして任意のプレイヤー\(i\)の期待利得関数\(U_{i}\)はいずれもプレイヤーたちの共有知識です。したがって、これらの要素から間接的に定義される任意のプレイヤー\(i\)の混合戦略集合\(\Delta \left( S_{i}\right) \)と期待利得関数\(F_{i}\)もまたプレイヤーたちの共有知識となります。つまり、完備情報の動学ゲームにおいてプレイヤーたちが混合戦略を採用するとき、その状況を描写する混合拡張\(G^{\ast }\left(\Gamma \right) \)の要素はいずれもプレイヤーたちの共有知識となります。さらに、プレイヤーたちは以下の手順で意思決定を行います。

  1. それぞれのプレイヤー\(i\)は自身の混合戦略集合\(\Delta \left( S_{i}\right) \)の中から特定の混合戦略\(\sigma _{i}\)を選択する。その際、他のプレイヤーたちが選択する混合戦略の組\(\sigma _{-i}\)を観察できない。
  2. プレイヤーたちが選択した混合戦略の組\(\sigma _{I}=\left( \sigma _{i},\sigma _{-i}\right) \)にもとづいて純粋戦略の組\(s_{I}\)が1つだけランダムに選ばれ、さらに、その\(s_{I}\)に対してゲームのルールが1つの頂点\(z\)を定める。自然が参加する場合、その1つの頂点\(z\)もまたランダムに選ばれる一方、自然が参加しない場合、その1つの頂点\(z\)は確率\(1\)で選ばれる。
  3. そのゲームの頂点\(z\)から、それぞれのプレイヤー\(i\)は利得\(u_{i}\left(z\right) \)を得る。

混合拡張\(G^{\ast }\)を構成するすべての要素はプレイヤーたちの共有知識であるものの、それぞれのプレイヤー\(i\)は自分が意思決定を行う際に、他のプレイヤーたちが選択する混合戦略からなる組\(\sigma _{-i}\)を観察することはできません。したがって、それぞれのプレイヤー\(i\)は、それぞれの混合戦略の組\(\sigma _{I}=\left( \sigma _{i},\sigma _{-i}\right) \)において自分が得られる期待利得\(F_{i}\left( \sigma _{I}\right) \)を比較した上で、何らかの混合戦略\(\sigma _{i}\)を選びます。さらに、全員の混合戦略が出そろった後、その確率分布にもとづいて特定の純戦略の組\(s_{I}\)が実現し、それぞれのプレイヤー\(i\)は期待利得\(U_{i}\left( s_{I}\right) \)に直面するとともに、さらに実現した頂点\(z\)から利得\(u_{i}\left( z\right) \)を得ます。それぞれのプレイヤー\(i\)が意思決定を行う際に参照するのは期待利得\(F_{i}\left( \sigma _{I}\right) \)ですが、ゲームの終了時に実際に得るのは利得\(u_{i}\left( z\right) \)であることに注意してください。

 

期待効用仮説

繰り返しになりますが、ゲーム理論では、ゲームに参加するプレイヤーはそれぞれ明確な目的を持ち、その目的を達成するために最適な戦略を選択するものと仮定します。特に、完備情報の動学ゲームを展開型ゲームとして定式化したとき、それぞれのプレイヤーは自己の利得を最大化するために最適な純粋戦略を選択するものと仮定します。これを合理性の仮定と呼びます。つまり、それぞれのプレイヤーは、自分を含めた全員の純粋戦略集合を把握するに十分な情報理解力を持っており、他のプレイヤーたちが選び得る純粋戦略のそれぞれの組に対して自分のそれぞれの純粋戦略が自分にもたらす利得を計算する能力を持っており、その計算にもとづいて自分の利得を最大化するような純粋戦略を選ぶに足る知能を持っているということです。

プレイヤーたちが純粋戦略を採用する場合、それぞれのプレイヤーは、他のプレイヤーたちが選択する純粋戦略を事前に観察できないという意味での不確実性に直面します。さらに、同じゲームにおいてプレイヤーたちが混合戦略を採用する場合、それぞれのプレイヤーは二重の意味での不確実性に直面します。1つ目は、他のプレイヤーたちが選択する混合戦略を事前に観察できないという意味での不確実性です。もう1つは、全員の混合戦略が定まった場合でも、そのときに起こり得るゲームの結果は一意的に定まらないという意味での不確実性です。プレイヤーたちの混合戦略の組が与えられたとき、それが規定する確率分布にもとづいて、何らかのゲームの結果がランダムに実現します。このような二重の意味に直面するそれぞれのプレイヤーは、自身の期待利得を指標に意思決定を行います。

以上を踏まえると、プレイヤーたちが混合戦略を採用する場合の合理性とは、自己の期待利得を最大化するために最適な混合戦略を選択することとして表現されます。これを期待効用仮説(expected utility hypothesis)と呼びます。期待効用仮説が実際に成り立つことを保証するためには、展開型ゲーム\(\Gamma \)の戦略型\(G\left( \Gamma\right) \)ないしその混合拡張\(G^{\ast }\left( \Gamma \right) \)に関して少なくとも以下を要求する必要があります。

  1. それぞれのプレイヤー\(i\in I\)は、自分がプレーしている戦略型ゲーム\(G\left( \Gamma \right) \)において起こり得るすべての結果を把握している。プレイヤーたちが選択する純粋戦略の組\(s_{I}\in S_{I}\)に対してゲームの結果が定まるため、純粋戦略の組を結果と同一視するのであれば、この仮定は、それぞれのプレイヤーが、自分を含めた全員の純戦略集合を把握するに十分な情報理解力を持っていることを要求する。
  2. それぞれのプレイヤー\(i\in I\)は、ゲームにおいて起こり得るそれぞれの結果\(s_{I}\in S_{I}\)において自身が直面する期待利得\(U_{i}\left( s_{I}\right) \)を把握するに十分な知能を持っていることを要求する。
  3. それぞれのプレイヤー\(i\in I\)は、プレイヤーたちが選択する混合戦略の組\(\sigma _{I}\in \Delta \left(S_{I}\right) \)に対して、それぞれの純粋戦略の組\(s_{I}\in S_{I}\)が起こる確率\(\sigma_{I}\left( s_{I}\right) \)や、期待利得\(F_{i}\left( \sigma _{I}\right) \)を計算する能力を持っており、その上で、自身の期待利得を最大化するような混合戦略\(\sigma _{i}\in\Delta \left( S_{i}\right) \)を特定するに十分な知能を持っていることを要求する。

完備情報の動学ゲームを展開型ゲーム\(\Gamma \)の戦略型\(G\left( \Gamma \right) \)ないしその混合拡張\(G^{\ast }\left(\Gamma \right) \)として定式化するとき、そのすべての要素はプレイヤーたちの共有知識とみなされます。一方、プレイヤーの合理性は\(G\left( \Gamma \right) \)や\(G^{\ast }\left( \Gamma \right) \)の要素ではないため、「プレイヤーたちが合理的である」という事実は、プレイヤーたちの共有知識であるとは限りません。

ただ、ゲーム理論では多くの場合、プレイヤーの合理性は相互知識であるものと仮定した上で分析を行います。つまり、すべてのプレイヤーが合理的であることをすべてのプレイヤーが知っていることを仮定します。プレイヤーの合理性を共有知識と仮定する場合もあります。つまり、すべてのプレイヤーが合理的であることをすべてのプレイヤーが知っており、なおかつ、その事実をすべてのプレイヤーが知っており、\(\cdots \)、という仮定を無限に積み重ねるということです。後ほど明らかになるように、プレイヤーたちの合理性を共有知識とみなすか、相互知識とみなすか、その仮定の強さによって得られる結論も変わってくるため、注意が必要です。

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員専用コンテンツです
ログイン】【会員登録