行動戦略を前提とする展開型ゲームの戦略型

展開型ゲームの戦略型

問題としている戦略的状況が完備情報の動学ゲームであり、それが展開型ゲーム\(\Gamma \)として表現されているものとします。ゲーム\(\Gamma \)においてプレイヤーたちが行動戦略を採用する場合、どの頂点が実際に実現するかを事前に確定できないため、プレイヤーたちは不確実な状況に直面します。そこで、そのような不確実な状況をクジ\(P\left( \cdot |b_{I}\right) :Z\rightarrow \mathbb{R} \)を用いて表現しました。これは、プレイヤーたちが選択する行動戦略の組が\(b_{I}\in B_{I}\)であるときに、ゲームがそれぞれの頂点\(z\in Z\)へ到達する確率\(P\left(z|b_{I}\right) \)を特定する関数です。

クジが変化すればプレイヤーたちは以前とは異なる不確実な状況に直面するため、プレイヤーたちが行動戦略を採用する場合、プレイヤーはクジどうしを比較する選好関係を持っているものとみなしました。さらに、行動戦略の組が与えられればそれに対して1つのクジが定まるため、結局、プレイヤー\(i\in I\)がクジを比較する選好を、行動戦略の組どうしを比較する\(B_{I}\)上の選好関係\(\succsim _{i}\)もしくはそれを表す期待利得関数\(U_{i}:B_{I}\rightarrow \mathbb{R} \)として表現できます。ただし、期待利得関数\(U_{i}\)が行動戦略の組\(b_{I}\in B_{I}\)に対して定める期待利得は、\begin{equation*}U_{i}\left( b_{I}\right) =\sum_{z\in Z}\left[ P\left( z|b_{I}\right) \cdot
u_{i}\left( z\right) \right] \end{equation*}となります。以上を踏まえると、展開型ゲーム\(\Gamma \)において行動戦略を採用するプレイヤーたちが直面する戦略的状況を、以下のような戦略型ゲーム\begin{equation*}B\left( \Gamma \right) =\left( I,\left\{ B_{i}\right\} _{i\in I},\left\{
U_{i}\right\} _{i\in I}\right)
\end{equation*}として表現できます。これを展開型ゲーム\(\Gamma \)の戦略型（strategicform）や標準化（normalization）などと呼びます。

例（展開型ゲームの戦略型）

以下のゲームの木によって表現される展開型ゲーム\(\Gamma \)について考えます。

図：ゲームの木

プレイヤー\(1\)の行動戦略を、\begin{eqnarray*}b_{1} &=&\left( b_{1}\left( a_{11}|\left\{ x_{0}\right\} \right)
,b_{1}\left( a_{12}|\left\{ x_{0}\right\} \right) \right) \\
&=&\left( b_{11},1-b_{11}\right)
\end{eqnarray*}と記述し、プレイヤー\(2\)の行動戦略を、\begin{eqnarray*}b_{2} &=&\left( \left( b_{1}\left( a_{21}|\left\{ x_{1}\right\} \right)
,b_{1}\left( a_{22}|\left\{ x_{1}\right\} \right) \right) ,\left(
b_{1}\left( a_{21}|\left\{ x_{2}\right\} \right) ,b_{1}\left( a_{22}|\left\{
x_{2}\right\} \right) \right) \right) \\
&=&\left( \left( b_{21},1-b_{21}\right) ,\left( b_{22},1-b_{22}\right)
\right)
\end{eqnarray*}と記述します。ただし、\(b_{11},b_{21},b_{22}\)はいずれも\(0\)以上\(1\)以下の実数です。そのような条件を満たすすべての\(b_{i}\)からなる集合がプレイヤー\(i\)の行動戦略集合\(B_{i}\)です。行動戦略の組\(\left( b_{1},b_{2}\right) \in B_{1}\times B_{2}\)のもとでプレイヤー\(1\)が直面する期待利得は、\begin{equation*}F_{1}\left( b_{1},b_{2}\right) =2b_{11}b_{21}-\left( 1-b_{11}\right)
b_{22}+3\left( 1-b_{11}\right) \left( 1-b_{22}\right)
\end{equation*}であり、プレイヤー\(2\)が直面する期待利得は、\begin{equation*}F_{2}\left( b_{1},b_{2}\right) =b_{11}b_{21}+\left( 1-b_{11}\right)
b_{22}+2\left( 1-b_{11}\right) \left( 1-b_{22}\right)
\end{equation*}です。こうして展開型ゲーム\(\Gamma \)の戦略型\(B\left( \Gamma \right) \)が得られます。

展開型ゲームの戦略型における意思決定

本来、展開型ゲーム\(\Gamma \)はプレイヤーたちが順番に意思決定を行う動学ゲームを記述するモデルです。ただ、プレイヤーたちが展開型ゲーム\(\Gamma \)において行動戦略を選択することは、自身が直面し得るそれぞれの情報集合においてどのような確率分布にもとづいて行動を選択するか、その包括的な行動計画をあらかじめ立てた上でゲームに臨むことを意味します。展開型ゲーム\(\Gamma \)の開始時点においてプレイヤーたちはそのような行動計画を表明します。ゲームの開始後には先の行動計画を変更できず、自身が先に表明した行動計画にもとづいて意思決定を行います。つまり、展開型ゲームにおいてプレイヤーたちが行動戦略を採用する状況は、プレイヤーたちが行動戦略を同時に表明する静学ゲームと解釈できるため、そこでの戦略的状況を戦略型ゲーム\(B\left( \Gamma \right) \)として表現できるということです。

展開型ゲーム\(\Gamma \)においてプレイヤーたちが行動戦略を選択する状況を戦略型ゲーム\(B\left( \Gamma \right) \)として表現するとき、ゲームの完備性より、\(B\left( \Gamma \right) \)を構成するすべての要素はプレイヤーたちの共有知識です。また、ゲームの静学性より、プレイヤーたちは以下の手順で意思決定を行います。

それぞれのプレイヤー\(i\in I\)は自身の行動戦略集合\(B_{i}\)の中から特定の行動戦略\(b_{i}\)を選択する。その際、他のプレイヤーたちが選択した行動戦略を観察できない。
プレイヤーたちが選択した行動戦略の組\(b_{I}\in B_{I}\)のもとでプレイヤーたちが直面する不確実な状況はクジ\(P\left( \cdot |b_{I}\right) :Z\rightarrow \mathbb{R} \)として表現され、不確実な状況に対するプレイヤー\(i\)による評価が期待利得関数\(U_{i}:B_{I}\rightarrow \mathbb{R} \)として記述される。
クジ\(P\left( \cdot |b_{I}\right) \)のもとで実際に到達する1つの頂点\(z\)がランダムに選ばれ、その結果からプレイヤー\(i\)は利得\(u_{i}\left( z\right) \)を得る。

戦略型ゲーム\(B\left( \Gamma \right) \)を構成するすべての要素はプレイヤーたちの共有知識であるものの、それぞれのプレイヤー\(i\)は自分が意思決定を行う際に、他のプレイヤーたちが選択する行動戦略からなる組\(b_{-i}\)を観察することはできません。したがって、それぞれのプレイヤー\(i\)は、それぞれの行動戦略の組\(b_{I}=\left( b_{i},b_{-i}\right) \)において自分が直面する期待利得\(F_{i}\left( b_{I}\right) \)を比較した上で、何らかの行動戦略\(b_{i}\)を選びます。さらに、全員の行動戦略が出そろった後、その確率分布にもとづいて何らかの頂点\(z\)がランダムに実現し、その頂点\(z\)からそれぞれのプレイヤー\(i\)は利得\(u_{i}\left( z\right) \)を得ます。それぞれのプレイヤー\(i\)が意思決定する際に参照するのは期待利得\(F_{i}\left( b_{I}\right) \)ですが、ゲームの終了時に実際に得るのは利得\(u_{i}\left(z\right) \)であることに注意してください。

展開型ゲーム\(\Gamma \)を戦略型ゲーム\(B\left( \Gamma \right) \)へ変換することにより、もとの動学ゲームをあたかも静学ゲームであるかのように分析できるようになります。その反面、展開型ゲーム\(\Gamma \)はプレイヤーが順番に意思決定を行うというゲームの動学的側面を正確に記述するモデルであるため、それを戦略型ゲームへ変換してしまうと、行動の順番を考慮しながら行われるプレイヤーの意思決定を丁寧に分析できなくなってしまう恐れがあります。この点については場を改めて詳しく解説します。

期待効用仮説

繰り返しになりますが、ゲーム理論では、ゲームに参加するプレイヤーはそれぞれ明確な目的を持ち、その目的を達成するために最適な戦略を選択するものと仮定します。これを合理性の仮定と呼びます。

問題としている戦略的状況が完備情報の動学ゲームであり、それが展開型ゲームとして定式化されており、なおかつプレイヤーたちが行動戦略を採用するとき、プレイヤーたちは二重の意味での不確実性に直面します。1つ目は、他のプレイヤーたちが選択する行動戦略を事前に観察できないという意味での不確実性です。2つ目は、全員の行動戦略が出揃った後においても、そのときに起こり得るゲームの結果は一意的に定まらないという意味での不確実性です。プレイヤーたちの行動戦略の組が与えられたとき、それが規定する確率分布にもとづいて、何らかの頂点がランダムに実現します。このような二重の意味での不確実性に直面するプレイヤーは、自身の期待利得を指標に意思決定を行います。

以上を踏まえると、展開型ゲームにおいてプレイヤーたちが行動戦略を採用する場合の合理性とは、自己の期待利得を最大化するために最適な行動戦略を選択することを意味します。これを期待効用仮説（expected utility hypothesis）と呼びます。期待効用仮説が実際に成り立つことを保証するためには、展開型ゲーム\(\Gamma \)の戦略型\(B\left( \Gamma \right) \)に関して少なくとも以下を要求する必要があります。

それぞれのプレイヤー\(i\in I\)は、自分がプレーしている戦略型ゲーム\(B\left( \Gamma \right) \)において起こり得るすべての結果、すなわち頂点集合\(Z\)に属するすべての結果を把握するに十分な情報理解力を有している。
それぞれのプレイヤーは\(i\in I\)は、自分を含めた全員の行動戦略集合\(B_{I}\)を把握するに十分な情報理解力を有している。さらに、プレイヤーたちが選択する行動戦略の組\(b_{I}\in B_{I}\)のもとで、それぞれの結果\(z\in Z\)が起こり得る確率\(P\left(z|b_{I}\right) \)を把握するに十分な知能を有している。
それぞれのプレイヤー\(i\in I\)は、それぞれの結果\(z\in Z\)から自身が得る利得\(u_{i}\left( z\right) \)を把握しており、さらに先の確率分布を踏まえた上で、それぞれの行動戦略の組\(b_{I}\in B_{I}\)のもとで自身が直面する期待利得\(F_{i}\left( b_{I}\right) \)を計算することができ、その上で、自身の期待利得を最大化するような行動戦略\(b_{i}\in B_{i}\)を特定するに十分な知能を有している。

展開型ゲーム\(\Gamma \)を戦略型ゲーム\(B\left( \Gamma \right) \)として分析する場合、そのすべての要素はプレイヤーたちの共有知識とみなされます。一方、プレイヤーの合理性は戦略型ゲーム\(G\left( \Gamma \right) \)の要素ではないため、「プレイヤーたちが合理的である」という事実は、プレイヤーたちの共有知識であるとは限りません。

ただ、ゲーム理論では多くの場合、プレイヤーの合理性は相互知識であるものと仮定した上で分析を行います。つまり、すべてのプレイヤーが合理的であることをすべてのプレイヤーが知っていることを仮定します。プレイヤーの合理性を共有知識と仮定する場合もあります。つまり、すべてのプレイヤーが合理的であることをすべてのプレイヤーが知っており、なおかつ、その事実をすべてのプレイヤーが知っており、\(\cdots \)、という仮定を無限に積み重ねるということです。後ほど明らかになるように、プレイヤーたちの合理性を共有知識とみなすか、相互知識とみなすか、その仮定の強さによって得られる結論も変わってくるため、注意が必要です。

WIIS

数学のコース

経済学のコース

アカウント

WIIS

完備情報の動学ゲーム

目次

関連知識

展開型ゲームの戦略型

展開型ゲームの戦略型における意思決定

期待効用仮説

関連知識

質問とコメント

LEARN MORE

さらに深く学びたい人のための会員サービス

論理

集合

実数

ユークリッド空間

微分積分

測度

確率