不完備情報の静学ゲーム
複数の主体が関与する問題が与えられたとき、その問題に関与するそれぞれの主体にとって、自分の行動が他者の行動に影響を与えるとともに、他者の行動が自分の行動にも影響を与える場合、主体の間には戦略的相互依存性(strategic interdependence)が成立していると言います。ゲーム理論(game theory)は、戦略的相互依存性に直面した主体による意思決定を分析する学問です。
主体の間に戦略的相互依存性が成立する状況をゲーム(game)と呼びます。ゲームをモデル化する際には、以下の要素を具体的に記述します。
- ゲームにおいて意思決定を行う主体は誰か。つまり、ゲームのプレイヤー(player)は誰か。
- プレイヤーたちはどのような順番(turn)で意思決定を行うか。
- プレイヤーたちが意思決定を行う際にどのような選択肢が与えられているか。つまり、プレイヤーたちはどのような行動(action)が選択可能か。
- プレイヤーが意思決定を行う際にどのような情報(information)が与えられているか。
- プレイヤーたちが意思決定を行う帰結として、どのような結果(outcome)が起こり得るか。
- プレイヤーたちはそれぞれの結果をどの程度評価しているか。すなわち、プレイヤーはどのような利得(payoff)の体系を持っているか。
以上の要素をゲームのルール(rule)と呼びます。ゲームの開始後、それぞれの「プレイヤー」は自身が行動する「順番」になったら、その時点においてアクセス可能な「情報」を活用しつつ、何らかの行動原理にもとづいて、与えられた選択肢の中から特定の「行動」を選択します。すべてのプレイヤーによる意志決定が終了したら、プレイヤーたちが選んだ行動の組み合わせに応じて特定の「結果」が実現し、それぞれのプレイヤーは実現した結果から「利得」を得ます。
ゲームに直面したプレイヤーたちは、自身にとってより望ましい結果を導くために、最終的な意志決定を行う前に他のプレイヤーと交渉を行う可能性があります。事前交渉の結果に対してプレイヤーたちの間に拘束的な合意が成立するのであれば、つまり、合意通りに行動せざるを得ない何らかの仕組みが存在する場合には、プレイヤーたちは集団を形成した上で協力的な意志決定を行う可能性があります。拘束的な合意が成立する場合とそうでない場合とでは、プレイヤーにとって最適な行動は変化するため、ゲームを分析する際には、プレイヤーたちの間に拘束的な合意が成立するかどうかを事前に明らかにしておく必要があります。本節の分析対象である非協力ゲーム(non-cooperative game)とは、プレイヤーたちの間に拘束的な合意が成立しない状況を想定したゲームです。非協力ゲームのプレイヤーは事前の合意通りに行動することを強制されないため、他のプレイヤーによる意志決定から独立した形で自身の意思決定を行います。このような事情を踏まえると、非協力ゲームを「プレイヤーたちがそれぞれ独立に意志決定を行うゲーム」と定義することもできます。
ゲームに参加するすべてのプレイヤーが同時に意思決定を行うとき、そのゲームを静学ゲーム(static game)や同時手番ゲーム(simultaneous move game)などと呼びます。本節の分析対象は静学ゲームです。静学ゲームという概念はゲームのルールの中でも「順番」を基準にゲームを分類することで得られる概念ですが、「情報」によって静学ゲームという概念を特徴づけることもできます。具体的には、プレイヤーたちが同時に意思決定を行うことは、それぞれのプレイヤーが意思決定を行う際に、他のプレイヤーたちが行った意思決定を事前に観察できないことと実質的に同じです。したがって、静学ゲームを「それぞれのプレイヤーが意志決定を行う際に他のプレイヤーたちが行った意志決定に関する情報を与えられないゲーム」と定義することもできます。
戦略的相互依存関係に直面したそれぞれのプレイヤーは、自分が直面しているゲームのルールを常に正確に把握できるとは限りません。戦略的相互依存関係を分析する際には、それぞれのプレイヤーがゲームのルールにどの程度精通しているかを事前に明らかにしておく必要があります。本節の分析対象である不完備情報ゲーム(game of incomplete information)とは、少なくとも1人のプレイヤーがゲームのルールを構成する少なくとも1つの要素を知らないようなゲームのことです。不完備情報ゲームのプレイヤーが保有するゲームのルールに関する情報のうち、そのプレイヤーだけが観察可能で他のプレイヤーたちが観察できないものを、そのプレイヤーが持つ私的情報(private information)やタイプ(type)などと呼びます。少なくとも1人のプレイヤーが私的情報を持つ場合には、プレイヤーたちが直面する情報構造は対称的ではないため、情報の非対称性(asymmetric information)が存在すると表現します。不完備情報ゲームは情報の非対称性が成立する戦略的状況です。
本節の分析対象は非協力かつ静学かつ不完備情報であるようなゲームです。これを不完備情報の静学ゲーム(static games of incomplete information)と呼びます。不完備情報の静学ゲームは非協力ゲームであるため、そこではプレイヤーたちの間に拘束的な合意は成立せず、それぞれのプレイヤーの意思決定は他のプレイヤーたちの意思決定からは独立した形で行われます。不完備情報の静学ゲームを分析対象とする場合、ゲームのルールの中でも「順番」は明らかです。つまり、不完備情報の静学ゲームおいて、すべてのプレイヤーは同時に意思決定を行います。言い換えると、それぞれのプレイヤーは他のプレイヤーたちが選択する行動を観察できない状態で自身の行動を決定する必要があります。以上を踏まえると、不完備情報の静学ゲームを記述するためには、ゲームのルールの残りの要素である「プレイヤー」「行動」「情報」「結果」「利得」を特定すればよいということになります。これらの要素を記述する方法はいくつか存在しますが、以下ではベイジアンゲーム(Bayesian game)と呼ばれるモデルを紹介します。
プレイヤーの表現
不完備情報の静学ゲームに参加するすべてのプレイヤーからなる集合をプレイヤー集合(player set)やプレイヤー空間(player space)などと呼び、これを、\begin{equation*}
I
\end{equation*}で表記します。プレイヤー集合\(I\)はすべてのプレイヤーにとっての共有知識であるものと仮定します。
戦略的相互依存関係は複数のプレイヤーが存在することにより成立するため、プレイヤーの数が複数であることはゲームの基本的な条件となります。そこで、多くの場合、プレイヤーの人数は\(2\)以上の整数であるものと仮定します。
プレイヤーの人数が\(n\)であるとき、そのようなゲームを\(n\)人ゲーム(\(n\)-players game)と呼びます。その上で、\(n\)人ゲームのプレイヤー集合を、\begin{equation*}I=\left\{ 1,2,\cdots ,n\right\}
\end{equation*}で表記し、その要素である\(i\ \left( =1,2,\cdots ,n\right) \)番目のプレイヤーをプレイヤー\(i\)(player \(i\))と呼びます。\(i\in I\)です。
プレイヤーの単位は分析対象であるゲームに応じて変化します。個人をプレイヤーと定める場合もあれば、組織や国家などをプレイヤーとする場合もあります。重要なことは、問題としているゲームにおいて自律的な意思決定を行う最小単位をプレイヤーとみなすということです。
ゲームに関与している主体の中でも、他の主体と影響を与え合いながら意思決定を行っているのではなく、外生的に変化する状況に対応する形でのみ意志決定を行う主体はプレイヤーとはみなされず、モデルの環境変数とみなされます。
I=\left\{ 1,2\right\}
\end{equation*}となります。
\end{equation*}となります。ただし、状況によっては商品の売り手をプレイヤーをみなした上で分析を行います。
私的情報の表現
不完備情報ゲームでは、少なくとも1人のプレイヤーはゲームのルールを構成する少なくとも1つの要素を知りませんが、そのような状況をどのように表現すればよいでしょうか。
問題としているゲームのルールを構成する要素のうち、あるプレイヤー\(i\in I\)だけが観察可能で、他のプレイヤーが観察できない要素をプレイヤー\(i\)の私的情報(private information)やタイプ(type)などと呼び、これを、\begin{equation*}
\theta _{i}
\end{equation*}で表記します。\(\theta _{i}\)にはプレイヤー\(i\)が保有するすべての私的情報が含まれており、これは様々な値をとり得るものとします。そこで、\(\theta _{i}\)がとり得るすべての値からなる集合を\(i\)のタイプ集合(type set)と呼び、これを、\begin{equation*}\Theta _{i}
\end{equation*}で表記します。\(\theta _{i}\in\Theta _{i}\)です。
すべてのプレイヤーのタイプ集合\(\Theta _{1},\cdots ,\Theta_{n}\)は共有知識であるものと仮定します。プレイヤー\(i\)のタイプ\(\theta_{i}\)はタイプ集合\(\Theta _{i}\)に含まれる様々な値をとり得ますが、\(\theta _{i}\)の真の値を知っているのはプレイヤー\(i\)だけであり、他の任意のプレイヤー\(j\ \left( \not=i\right) \)は\(\theta _{i}\)がとり得る値の範囲\(\Theta _{i}\)を知っているだけで、その中のどの値が\(\theta _{i}\)の真の値であるかは知らないものとみなすことにより、それぞれのプレイヤーのタイプが私的情報である状況を表現します。
すべてのプレイヤーのタイプからなる組を、\begin{equation*}
\theta _{I}=(\theta _{i})_{i\in I}
\end{equation*}で表記し、プレイヤー\(i\)以外のすべてのプレイヤーのタイプからなる組を、\begin{equation*}\theta _{-i}=(\theta _{j})_{j\in I\backslash \left\{ i\right\} }
\end{equation*}で表記します。\(\theta _{I}=\left(\theta _{i},\theta _{-i}\right) \)です。
すべてのプレイヤーのタイプ集合の直積を、\begin{equation*}
\Theta _{I}=\prod_{i\in I}\Theta _{i}
\end{equation*}で表記し、プレイヤー\(i\)以外のすべてのプレイヤーのタイプ集合の直積を、\begin{equation*}\Theta _{-i}=\prod_{j\in I\backslash \left\{ i\right\} }\Theta _{j}
\end{equation*}で表記します。\(\theta _{I}\in\Theta _{I}\)かつ\(\theta _{-i}\in \Theta _{-i}\)です。
I=\left\{ 1,2\right\}
\end{equation*}であるものとします。それぞれの企業\(i\in I\)の技術水準は私的情報であり、競争相手はそれを事前に観察できないものとします。この場合、それぞれの企業が自社の技術水準を公言した場合でも、競争相手はその情報の真偽を確かめるのは困難です。企業\(i\)のタイプ\(\theta_{i}\)を自社の技術水準として定義します。\(\theta _{i}\)は高技術\(h\)と低技術\(l\)の2つの値をとり得るものと仮定するのであれば、企業\(i\)のタイプ集合は、\begin{equation*}\Theta _{i}=\left\{ h,l\right\}
\end{equation*}という有限集合になります。それぞれの企業\(i\)のタイプ集合\(\Theta_{i}\)は共有知識であるため、企業\(j\ \left( \not=i\right) \)は競争相手である企業\(i\)の技術水準\(\theta _{i}\)が\(h\)または\(l\)のどちらか一方であることを把握してますが、どちらが真の値であるかは判別できません。つまり、\(\theta _{i}\)の真の値を知っているのは企業\(i\)だけであり、企業\(j\)は\(\theta _{i}\)の真の値を知らないものとみなすことにより、企業\(i\)の技術水準が企業\(i\)の私的情報である状況を表現します。
I=\left\{ 1,\cdots ,n\right\}
\end{equation*}であるものとします。それぞれの入札者にとって出品されている商品への評価額は私的情報であり、他の入札者はそれを事前に観察できないものとします。この場合、それぞれの入札者が自身にとっての商品の評価額を公言した場合でも、他の入札者はその情報の真偽を確かめるのは困難です。入札者\(i\in I\)のタイプ\(\theta _{i}\)を、自身にとっての商品の評価額として定義します。\(\theta _{i}\)は\(\underline{\theta }_{i}\)以上\(\overline{\theta }_{i}\)以下の任意の実数を値としてとり得るものと仮定するのであれば、入札者\(i\)のタイプ集合は、\begin{equation*}\Theta _{i}=\left[ \underline{\theta }_{i},\overline{\theta }_{i}\right] \end{equation*}という\(\mathbb{R} \)上の有界な閉区間になります。それぞれの入札者\(i\)のタイプ集合\(\Theta _{i}\)は共有知識であるため、他の入札者\(j\ \left( \not=i\right) \)は競争相手である入札者\(i\)による評価額\(\theta _{i}\)が\(\underline{\theta }_{i}\)以上\(\overline{\theta }_{i}\)以下の実数であることを把握していますが、その中のどの値が真の値であるかは判別できません。つまり、\(\theta _{i}\)の真の値を知っているのは入札者\(i\)だけであり、入札者\(j\)は\(\theta _{i}\)の真の値を知らないものとみなすことにより、入札者\(i\)による商品への評価額が入札者\(i\)の私的情報である状況を表現します。他の任意の入札者のタイプについても同様です。
すべてのプレイヤーのタイプからなる組\begin{equation*}
\theta _{I}=\left( \theta _{i}\right) _{i\in I}
\end{equation*}を、ゲームにおいて起こり得る状態(state of the world)と呼びます。\(\theta _{I}\in \Theta _{I}\)であることから、全員のタイプ集合の直積\(\Theta _{I}\)はゲームにおいて起こり得るすべての状態からなる集合です。すべてのプレイヤーのタイプ集合\(\Theta _{1},\cdots ,\Theta _{n}\)は共有知識であることから、それらの直積である\(\Theta _{I}\)もまた共有知識です。つまり、ゲームにおいて起こり得るすべての状態は、すべてのプレイヤーにとっての共有知識です。
それぞれのプレイヤー\(i\)は自身のタイプ\(\theta_{i}\)の真の値(便宜的にこれを\(\theta _{i}^{\ast }\)と表記します)を知っていますが、他の任意のプレイヤー\(j\ \left( \not=i\right) \)のタイプ\(\theta _{j}\)の真の値\(\theta_{j}^{\ast }\)を知りません。プレイヤー\(i\)が他のプレイヤー\(j\)について知っていることは、\(\theta _{j}\)がとり得る値の範囲\(\Theta _{j}\)だけです。こうした事情はすべてのプレイヤーにとって同様であるため、結局、ゲームの真の状態\(\theta_{I}^{\ast }=\left( \theta _{i}^{\ast }\right) _{i\in I}\)を把握しているプレイヤーは存在しないことになります。つまり、それぞれのプレイヤー\(i\)はゲームの真の状態\(\theta _{I}^{\ast }=\left( \theta _{i}^{\ast },\theta_{-i}^{\ast }\right) \)に関する断片的な知識\(\theta _{i}^{\ast }\)を持っていますが、真の状態を構成する残りの要素\(\theta _{-i}^{\ast }\)については正確に知りません。プレイヤー\(i\)が他のプレイヤーたちについて知っていることは、他のプレイヤーたちのタイプの組\(\theta _{-i}\)がとり得る値の範囲\(\Theta _{-i}\)だけです。したがって、プレイヤー\(i\)の真のタイプが\(\theta _{i}^{\ast }\)である場合、彼が直面し得る状態からなる集合は、\begin{equation*}\left\{ \left( \theta _{i}^{\ast },\theta _{-i}\right) \right\} _{\theta
_{-i}\in \Theta _{-i}}
\end{equation*}となります。他の任意のプレイヤーについても同様の議論が成立します。
I=\left\{ 1,2\right\}
\end{equation*}であるとともに、タイプ集合が、\begin{equation*}
\Theta _{1}=\Theta _{2}=\left\{ h,l\right\}
\end{equation*}であるものとします。したがって、状態集合は、\begin{eqnarray*}
\Theta _{I} &=&\Theta _{1}\times \Theta _{2} \\
&=&\left\{ \left( h,h\right) ,\left( h,l\right) ,\left( l,h\right) ,\left(
l,l\right) \right\}
\end{eqnarray*}です。仮に、企業\(1\)の真の技術水準が\(h\)である場合、企業\(1\)が直面し得る状態からなる集合は、\begin{equation*}\left\{ \left( h,h\right) ,\left( h,l\right) \right\}
\end{equation*}です。一方、企業\(1\)の真の技術水準が\(l\)である場合、企業\(1\)が直面し得る状態からなる集合は、\begin{equation*}\left\{ \left( l,h\right) ,\left( l,l\right) \right\}
\end{equation*}です。企業\(2\)についても同様に考えます。
I=\left\{ 1,\cdots ,n\right\}
\end{equation*}であるとともに、タイプ集合が、\begin{eqnarray*}
\Theta _{1} &=&\left[ \underline{\theta }_{1},\overline{\theta }_{1}\right] \\
\Theta _{2} &=&\left[ \underline{\theta }_{2},\overline{\theta }_{2}\right] \end{eqnarray*}であるものとします。したがって、状態集合は、\begin{eqnarray*}
\Theta _{I} &=&\Theta _{1}\times \Theta _{2} \\
&=&\left[ \underline{\theta }_{1},\overline{\theta }_{1}\right] \times \left[
\underline{\theta }_{2},\overline{\theta }_{2}\right] \end{eqnarray*}です。仮に入札者\(1\)による商品への真の評価額が\(1\)である場合、入札者\(1\)が直面し得る状態からなる集合は、\begin{equation*}\left\{ \left( 1,\theta _{2}\right) \ |\ \theta _{2}\in \left[ \underline{\theta }_{2},\overline{\theta }_{2}\right] \right\}
\end{equation*}です。他のケースについても同様に考えます。
行動の表現
不完備情報の静学ゲームにおいて、プレイヤーに選択肢として与えられているすべての行動からなる集合を、そのプレイヤーの行動集合(action set)や行動空間(action space)などと呼びます。プレイヤー\(i\in I\)の行動集合を、\begin{equation*}A_{i}
\end{equation*}で表記し、プレイヤー\(i\)の個々の行動を、\begin{equation*}a_{i}
\end{equation*}で表記します。\(a_{i}\in A_{i}\)です。
すべてのプレイヤーの行動からなる組を、\begin{equation*}
a_{I}=\left( a_{i}\right) _{i\in I}
\end{equation*}で表記し、プレイヤー\(i\)以外のプレイヤーたちの行動からなる組を、\begin{equation*}a_{-i}=\left( a_{j}\right) _{j\in I\backslash \left\{ i\right\} }
\end{equation*}で表記します。\(a_{I}=\left(a_{i},a_{-i}\right) \)です。
すべてのプレイヤーの行動集合の直積を、\begin{equation*}
A_{I}=\prod_{i\in I}A_{i}
\end{equation*}で表記し、プレイヤー\(i\)以外のプレイヤーたちの行動集合の直積を、\begin{equation*}A_{-i}=\prod_{j\in I\backslash \left\{ i\right\} }A_{j}
\end{equation*}で表記します。\(a_{I}\in A_{I}\)かつ\(a_{-i}\in A_{-i}\)です。
I=\left\{ 1,2\right\}
\end{equation*}であり、タイプ集合が、\begin{equation*}
\Theta _{1}=\Theta _{2}=\left\{ h,l\right\}
\end{equation*}であるものとします。それぞれの企業\(i\in I\)は問題としている産業に「参入する」(entryの頭文字である\(E\)で表記する)か「参入しない」(not entryの頭文字である\(NE\)で表記する)かを選択可能であるならば、企業\(i\)の行動集合は、\begin{equation*}A_{i}=\left\{ E,NE\right\}
\end{equation*}となります。
不完備情報の静学ゲームでは、それぞれのプレイヤーにとって選択可能な行動が私的情報であるような状況も起こり得ます。プレイヤー\(i\)が保有するすべての私的情報は自身のタイプ\(\theta _{i}\)に含まれているため、プレイヤー\(i\)が選択可能な行動からなる集合\(A_{i}\)が私的情報であることを表現するためには、\(A_{i}\)の要素が\(\theta _{i}\)の値に依存して変化するものとみなすことで対応できます。そのことを、\begin{equation*}A_{i}\left( \theta _{i}\right)
\end{equation*}と表記します。ただ、\(A_{i}\left( \cdot \right) \)の形状はプレイヤーたちの共有知識です。プレイヤー\(i\)のタイプ集合\(\Theta _{i}\)と\(A_{i}\left( \cdot \right) \)が共有知識であるとき、プレイヤー\(i\)のタイプが\(\theta _{i}\in\Theta _{i}\)であるときの行動集合\(A_{i}\left( \theta _{i}\right) \)もまたプレイヤーたちの共有知識になります。任意の\(\theta _{i}\)について同様の議論が成り立つため、プレイヤー\(i\)が直面し得る行動集合からなる集合\begin{equation*}\left\{ A_{i}\left( \theta _{i}\right) \right\} _{\theta _{i}\in \Theta _{i}}
\end{equation*}もまたプレイヤーたちの共有知識です。ただ、他の任意のプレイヤー\(j\ \left( \not=i\right) \)はプレイヤー\(i\)の真のタイプ\(\theta _{i}^{\ast }\)を知らないため、\(\{A_{i}\left( \theta _{i}\right) \}_{\theta _{i}\in \Theta_{i}}\)に属するどの行動集合がプレイヤー\(i\)の真の行動集合\(A_{i}\left( \theta_{i}^{\ast }\right) \)であるかを観察することはできません。このように考えることにより、プレイヤー\(i\)の選択可能な行動が私的情報である状況を表現します。
I=\left\{ 1,\cdots ,n\right\}
\end{equation*}であり、タイプ集合が、\begin{eqnarray*}
\Theta _{1} &=&\left[ \underline{\theta }_{1},\overline{\theta }_{1}\right] \\
\Theta _{2} &=&\left[ \underline{\theta }_{2},\overline{\theta }_{2}\right] \end{eqnarray*}であるものとします。それぞれの入札者\(i\in I\)は商品への入札価格を提示するものとします。つまり、入札者\(i\)の行動\(a_{i}\)は入札価格であり、行動集合\(A_{i}\)は入札者\(i\)が提示し得る入札価格の範囲です。入札額は非負の実数でなければならないというオークションルールが設定されているものとします。また、入札者\(i\)は商品への評価額\(\theta _{i}\)を上回るような価格を入札する可能性を排除できるのであれば(例えば、入札者は代理人であり、雇い主からそのように命じられている場合)、入札者\(i\)の行動集合を、\begin{equation*}A_{i}\left( \theta _{i}\right) =\left[ 0,\theta _{i}\right] \end{equation*}と表現できます。つまり、商品への評価額が\(\theta _{i}\)である場合、入札者\(i\)が提示し得る入札額は\(0\)以上\(\theta _{i}\)以下の実数であるということです。
繰り返しになりますが、プレイヤー\(i\)の行動集合が私的情報である場合、それぞれのタイプ\(\theta _{i}\in \Theta _{i}\)ごとに行動集合\(A_{i}\left( \theta _{i}\right) \)を設定することになるため、プレイヤー\(i\)の行動集合を総体的に\(\{A_{i}\left( \theta _{i}\right) \}_{\theta _{i}\in \Theta _{i}}\)と記述することになります。一方、プレイヤー\(i\)の行動集合が私的情報ではない場合には、プレイヤー\(i\)のタイプ\(\theta _{i}\)にはプレイヤー\(i\)の行動集合に関する情報は含まれていないことになるため、ある集合\(A_{i}\)が存在して、\begin{equation*}\forall \theta _{i}\in \Theta _{i}:A_{i}=A_{i}\left( \theta _{i}\right)
\end{equation*}という関係が成り立つはずです。つまり、プレイヤー\(i\)の行動集合が私的情報でない場合には、行動集合はタイプ\(\theta _{i}\)の値に依存せず\(A_{i}\)で一定です。
後ほど解説するように、プレイヤーの行動集合が私的情報であるようなゲームが与えられたとき、一般性を失わない形で、行動集合が私的情報ではないようなゲームへ変換することができます。そのような変換を踏まえると、不完備情報の静学ゲームにおいて任意のプレイヤー\(i\)の行動集合を\(\left\{ A_{i}\left( \theta _{i}\right)\right\} _{\theta _{i}\in \Theta _{i}}\)ではなく\(A_{i}\)と記述しても一般性は失われません。
I=\left\{ 1,\cdots ,n\right\}
\end{equation*}であり、タイプ集合が、\begin{eqnarray*}
\Theta _{1} &=&\left[ \underline{\theta }_{1},\overline{\theta }_{1}\right] \\
\Theta _{2} &=&\left[ \underline{\theta }_{2},\overline{\theta }_{2}\right] \end{eqnarray*}であるものとします。後述する理由により、一定の仮定のもとでは、行動集合を、\begin{equation*}
A_{1}=A_{2}=[0,+\infty )
\end{equation*}と表現しても一般性は失われません。つまり、任意の入札者は任意の非負の実数を入札できるということです。
結果の表現
不完備情報の静学ゲームにおいてプレイヤーたちが行動の組\(a_{I}\in A_{I}\)を選ぶと、それに対して何らかの結果が実現します。不完備情報の静学ゲームにおいて起こり得る結果を特定することとは、\(A_{I}\)に属するそれぞれの行動の組\(a_{I}\)に対して結果を1つずつ割り当てることを意味します。ただし、異なる行動の組が同一の結果をもたらす状況は起こり得ます。
I=\left\{ 1,2\right\}
\end{equation*}であるとともに、タイプ集合が、\begin{equation*}
\Theta _{1}=\Theta _{2}=\left\{ h,l\right\}
\end{equation*}であり、行動集合は、\begin{equation*}
A_{1}=A_{2}=\left\{ E,NE\right\}
\end{equation*}であるものとします。両企業が選択する行動の組\(a_{I}=\left( a_{1},a_{2}\right) \)のもとで実現し得る結果の例としては以下のようなものがあります。まず、\begin{equation*}\left( a_{1},a_{2}\right) =\left( E,E\right)
\end{equation*}の場合、すなわち両企業が参入する場合には、両企業が市場の利益を二等分します。また、\begin{equation*}
\left( a_{1},a_{2}\right) =\left( E,NE\right) ,\left( NE,E\right)
\end{equation*}の場合、すなわち一方が参入し他方が参入しない場合には、参入した企業が市場の利益を独占し、参入しなかった企業は利益を得られません。最後に、\begin{equation*}
\left( a_{1},a_{2}\right) =\left( NE,NE\right)
\end{equation*}の場合、すなわち両社が参入しなかった場合には両社とも利益を得られません。
I=\left\{ 1,\cdots ,n\right\}
\end{equation*}であり、タイプ集合が、\begin{eqnarray*}
\Theta _{1} &=&\left[ \underline{\theta }_{1},\overline{\theta }_{1}\right] \\
\Theta _{2} &=&\left[ \underline{\theta }_{2},\overline{\theta }_{2}\right] \end{eqnarray*}であり、行動集合が、\begin{equation*}
A_{1}=A_{2}=[0,+\infty )
\end{equation*}であるものとします。入札者たちが提示する入札額の組\(a_{I}=\left(a_{i}\right) _{i\in I}\)のもとで実現し得る結果の例としては、「最大の入札額を提示した入札者が商品を落札し、落札者は入札額に等しい金額を支払う」というものが考えられます。ただし、引き分けの場合にはその中から1人を落札者としてランダムに選ぶものと定めます。つまり、\begin{equation*}a_{i}=\max \left\{ a_{1},\cdots ,a_{n}\right\}
\end{equation*}を満たす1人の入札者\(i\)が商品を落札し、自身の入札額\(a_{i}\)に等しい金額を支払うということです。他の任意の入札者\(j\ \left( \not=i\right) \)は商品を落札できず、支払いも課されません。
利得の表現
プレイヤーたちが選ぶそれぞれの行動の組\(a_{I}\in A_{I}\)にはゲームにおいて起こり得る結果が1つずつ対応しているため、プレイヤーがどの結果を好むかを記述する代わりに、プレイヤーがどの行動の組を好むかを記述しても一般性は失われません。そこで、プレイヤー\(i\)が持つ好みの体系を行動の組からなる集合\(A_{I}\)上の二項関係\(\succsim _{i}\)として定式化し、これをプレイヤー\(i\)の選好関係(preference relation)と呼びます。具体的には、2つの行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{equation*}a_{I}\succsim _{i}a_{I}^{\prime }\Leftrightarrow i\text{は}a_{I}\text{を}a_{I}^{\prime }\text{以上に好む}
\end{equation*}という関係を満たすものとして\(\succsim _{i}\)を定義します。つまり、比較対象として2つの行動の組\(a_{I},a_{I}^{\prime }\)を提示されたとき、プレイヤー\(i\)が\(a_{I}\)のもとで実現する結果を\(a_{I}^{\prime }\)のもとで実現する結果以上に好むとき、そしてその場合にのみ\(a_{I}\succsim _{i}a_{I}^{\prime }\)が成り立つものとして\(\succsim _{i}\)を定義するということです。ただし、\(a_{I}\)を\(a_{I}^{\prime }\)以上に好むとは、\(a_{I}\)を\(a_{I}^{\prime }\)よりも好むか、または\(a_{I}\)と\(a_{I}^{\prime }\)を同じ程度好むことを意味します。
プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、任意の行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{equation*}a_{I}\succ _{i}a_{I}^{\prime }\Leftrightarrow \left[ a_{I}\succsim
_{i}a_{I}^{\prime }\wedge \lnot \left( a_{I}^{\prime }\succsim
_{i}a_{I}\right) \right]
\end{equation*}という関係を満たすものとして\(A_{I}\)上の新たな二項関係\(\succ _{i}\)を定義します。これをプレイヤー\(i\)の狭義選好関係(strict preference relation)と呼びます。つまり、比較対象として2つの行動の組\(a_{I},a_{I}^{\prime }\)が提示されたとき、プレイヤー\(i\)が\(a_{I}\)を\(a_{I}^{\prime }\)以上に好むが\(a_{I}^{\prime }\)を\(a_{I}\)以上には好まないとき、そしてその場合にのみ\(a_{I}\succ _{i}a_{I}^{\prime }\)が成り立つものとして\(\succ _{i}\)を定義するということです。
プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、任意の行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{equation*}a_{I}\sim _{i}a_{I}^{\prime }\Leftrightarrow \left( a_{I}\succsim
_{i}a_{I}^{\prime }\wedge a_{I}^{\prime }\succsim _{i}a_{I}\right)
\end{equation*}という関係を満たすものとして\(A_{I}\)上の新たな二項関係\(\sim _{i}\)を定義します。これをプレイヤー\(i\)の無差別関係(indifference relation)と呼びます。つまり、比較対象として2つの行動の組\(a_{I},a_{I}^{\prime }\)が提示されたとき、プレイヤー\(i\)が\(a_{I}\)を\(a_{I}^{\prime }\)以上に好むと同時に\(a_{I}^{\prime }\)を\(a_{I}\)以上に好むとき、そしてその場合にのみ\(a_{I}\sim _{i}a_{I}^{\prime }\)が成り立つものとして\(\sim _{i}\)を定義するということです。
プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、任意の2つの行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、以下の関係\begin{equation*}u_{i}\left( a_{I}\right) \geq u_{i}\left( a_{I}^{\prime }\right)
\Leftrightarrow a_{I}\succsim _{i}a_{I}^{\prime }
\end{equation*}を満たす関数\begin{equation*}
u_{i}:A_{I}\rightarrow \mathbb{R} \end{equation*}が存在する場合には、これを\(\succsim _{i}\)を表現する利得関数(payoff function)と呼びます。また、利得関数\(u\)が行動の組\(a_{I}\)に対して定める値\(u_{i}\left( a_{I}\right) \)をプレイヤー\(i\)が\(a_{I}\)から得る利得(payoff)と呼びます。選好関係\(\succsim _{i}\)を表現する利得関数\(u_{i}\)が存在する場合、行動の組\(a_{I},a_{I}^{\prime }\)について、\(a_{I}\)が\(a_{I}^{\prime }\)以上に望ましいことと、\(a_{I}\)の利得が\(a_{I}^{\prime }\)の利得以上であることが必要十分になります。利得関数を用いれば、行動の組の間の相対的な望ましさを、行動の組がもたらす利得の大小関係として表現できるということです。
選好関係\(\succsim _{i}\)を表す利得関数\(u_{i}\)が存在する場合、任意の2つの行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{eqnarray*}u_{i}\left( a_{I}\right) &>&u_{i}\left( a_{I}^{\prime }\right)
\Leftrightarrow a_{I}\succ _{i}a_{I}^{\prime } \\
u_{i}\left( a_{I}\right) &=&u_{i}\left( a_{I}^{\prime }\right)
\Leftrightarrow a_{I}\sim _{i}a_{I}^{\prime }
\end{eqnarray*}という関係もまた成立します。
プレイヤー\(i\)の利得関数\(u_{i}\)の定義域が\(A_{I}\)であることは、プレイヤー\(i\)が得る効用\(u_{i}\left(a_{I}\right) =u_{i}\left( a_{i},a_{-i}\right) \)が自身の行動\(a_{i}\)だけに依存するのではなく、自分以外のプレイヤーたちの行動の組\(a_{-i}\)にも依存することを意味します。つまり、利得関数の定義域を\(A_{I}\)とすることにより、プレイヤーの間に戦略的相互依存関係が存在する状況を表現しています。
プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、それを表現する利得関数\(u_{i}\)は存在するとは限りません。ただ、利得関数が存在することを保証する上で必要とされる条件については様々なものが知られています。利得関数の存在条件については場を改めて詳しく解説します。
後ほど提示する例が示唆するように、不完備情報の静学ゲームでは、それぞれのプレイヤーの選好すなわち利得関数が私的情報であるような状況が起こり得ます。むしろ、実際にはプレイヤーの選好が私的状況であることは多く、不完備情報ゲームはそのような状況を明示的に分析するために開発された分析ツールであるとさえ言えます。タイプの定義より、プレイヤー\(i\)が保有するすべての私的情報は自身のタイプ\(\theta _{i}\)に含まれているため、プレイヤー\(i\)の利得関数\(u_{i}\)が私的情報であることを表現するためには\(u_{i}\)の形状が\(\theta _{i}\)の値に依存して変化すること、つまり、プレイヤー\(i\)が行動の組\(a_{I}\)から得る利得\(u_{i}\left(a_{I}\right) \)が自身のタイプ\(\theta _{i}\)の値に依存して変化するものとみなすことで対応できます。つまり、\(u_{i}\)は\(a_{I}\)を変数として持つだけでなく\(\theta _{i}\)をも変数として持つものとみなすということです。さらに言い換えると、\(u_{i}\)の定義域を\(A_{I}\times \Theta_{i}\)とみなすということです。この場合、プレイヤー\(i\)の利得関数は、\begin{equation*}u_{i}\left( \cdot ,\cdot \right) :A_{I}\times \Theta _{i}\rightarrow \mathbb{R} \end{equation*}として定式化されます。特に、プレイヤー\(i\)のタイプが\(\theta _{i}\in \Theta_{i}\)である場合の利得関数は、\begin{equation*}u_{i}\left( \cdot ,\theta _{i}\right) :A_{I}\rightarrow \mathbb{R} \end{equation*}となります。ただし、\(u_{i}\left( \cdot ,\cdot \right) \)の形状はプレイヤーたちの共有知識です。プレイヤー\(i\)のタイプ集合\(\Theta_{i}\)と\(u_{i}\left( \cdot ,\cdot \right) \)が共有知識であるとき、プレイヤー\(i\)のタイプが\(\theta _{i}\in \Theta _{i}\)である場合の利得関数\(u_{i}\left( \cdot ,\theta _{i}\right) \)もまたプレイヤーたちの共有知識になります。任意の\(\theta _{i}\)について同様の議論が成り立つため、プレイヤー\(i\)が持ち得る効用関数からなる集合\begin{equation*}\left\{ u_{i}\left( \cdot ,\theta _{i}\right) \right\} _{\theta _{i}\in
\Theta _{i}}
\end{equation*}もまたプレイヤーたちの共有知識です。ただ、他の任意のプレイヤー\(j\ \left( \not=i\right) \)はプレイヤー\(i\)の真のタイプ\(\theta _{i}^{\ast }\)を知らないため、\(\left\{ u_{i}\left( \cdot ,\theta _{i}\right) \right\}_{\theta _{i}\in \Theta _{i}}\)に属するどの利得関数がプレイヤー\(i\)の真の利得関数\(u_{i}\left( \cdot ,\theta _{i}^{\ast }\right) \)であるかを観察することはできません。このように考えることにより、プレイヤー\(i\)の利得関数が私的情報である状況を表現します。
I=\left\{ 1,2\right\}
\end{equation*}であり、タイプ集合が\begin{equation*}
\Theta _{1}=\Theta _{2}=\left\{ h,l\right\}
\end{equation*}であり、行動集合は\begin{equation*}
A_{1}=A_{2}=\left\{ E,NE\right\}
\end{equation*}であるものとします。まず、両企業が選択する行動が、\begin{equation*}
\left( a_{1},a_{2}\right) =\left( E,E\right)
\end{equation*}である場合、すなわち両社が参入する場合、企業\(1\)は市場の利益\(P>0\)の半分である\(\frac{P}{2}\)を得るものとします。加えて、この場合には競争相手がいるため企業\(1\)は追加的な研究開発が必要であり、その費用は自社の技術水準\(\theta _{1}\in \Theta _{1}\)に依存するものとします。企業\(1\)の技術水準が高い場合(\(\theta _{1}=h\))の追加的な研究開発費を\(c_{h}>0\)で表記し、技術水準が低い場合(\(\theta _{1}=l\))の追加的な研究開発費を\(c_{l}>0\)で表記します。\(c_{h}<c_{l}\)です。企業が得る利益を利得と同一視するのであれば、この場合に企業\(1\)が得る利得は、\begin{eqnarray*}&&u_{1}\left( E,E,h\right) =\frac{P}{2}-c_{h} \\
&&u_{1}\left( E,E,l\right) =\frac{P}{2}-c_{l}
\end{eqnarray*}となります。企業\(2\)についても同様に、\begin{eqnarray*}&&u_{2}\left( E,E,h\right) =\frac{P}{2}-c_{h} \\
&&u_{2}\left( E,E,l\right) =\frac{P}{2}-c_{l}
\end{eqnarray*}と定めます。続いて、両企業が提示する行動の組が、\begin{equation*}
\left( a_{1},a_{2}\right) =\left( E,NE\right)
\end{equation*}である場合、すなわち企業\(1\)だけが参入する場合、企業\(1\)は市場の利益\(P\)を独占するものとします。しかも、この場合には競争相手がいないため追加的な研究開発は不要であり、自社の技術水準\(\theta _{1}\in \Theta _{1}\)に依拠する追加費用も不要です。したがって、この場合に企業\(1\)が得る利得は、\begin{equation*}u_{1}\left( E,NE,h\right) =u_{1}\left( E,NE,l\right) =P
\end{equation*}となります。企業\(2\)は参入しないため利益は得られず、追加的な研究開発も行いません。つまり、\begin{equation*}u_{2}\left( E,NE,h\right) =u_{2}\left( E,NE,l\right) =0
\end{equation*}です。続いて、両企業が提示する行動の組が、\begin{equation*}
\left( a_{1},a_{2}\right) =\left( NE,E\right)
\end{equation*}である場合、すなわち企業\(2\)だけが参入する場合、先と同様に考えることにより、\begin{eqnarray*}u_{1}\left( NE,E,h\right) &=&u_{1}\left( NE,E,l\right) =0 \\
u_{2}\left( NE,E,h\right) &=&u_{2}\left( NE,E,l\right) =P
\end{eqnarray*}となります。最後に、両企業が提示する行動の組が、\begin{equation*}
\left( a_{1},a_{2}\right) =\left( NE,NE\right)
\end{equation*}である場合、すなわち両企業が参入しない場合、両社とも利益が得られず、追加的な研究開発も行わないため、\begin{eqnarray*}
u_{1}\left( NE,NE,h\right) &=&u_{1}\left( NE,NE,l\right) =0 \\
u_{2}\left( NE,NE,h\right) &=&u_{2}\left( NE,NE,l\right) =0
\end{eqnarray*}となります。
I=\left\{ 1,\cdots ,n\right\}
\end{equation*}であり、タイプ集合が、\begin{eqnarray*}
\Theta _{1} &=&\left[ \underline{\theta }_{1},\overline{\theta }_{1}\right] \\
\Theta _{2} &=&\left[ \underline{\theta }_{2},\overline{\theta }_{2}\right] \end{eqnarray*}であり、行動集合は、\begin{equation*}
A_{1}=A_{2}=[0,+\infty )
\end{equation*}であるものとします。入札者たちが提示する入札額の組が\(a_{I}=\left( a_{i}\right) _{i\in I}\)であるとき、\begin{equation*}a_{i}=\max \left\{ a_{1},\cdots ,a_{n}\right\}
\end{equation*}を満たす1人の入札者\(i\)が商品を落札し、自身の入札額\(a_{i}\)に等しい金額を支払うものとします。他の任意の入札者\(j\ \left( \not=i\right) \)は商品を落札できず、支払いも行いません。仮に、落札者の利得が、落札した商品への評価額から支払額を引いた額と一致するのであれば、\(a_{I}\)のもとで入札者\(i\)が得る利得は、\(i\)が落札者である場合には、\begin{equation*}u_{i}\left( a_{I},\theta _{i}\right) =\theta _{i}-a_{i}
\end{equation*}となります。一方、\(a_{I}\)のもとで落札できなかった任意の入札者\(j\)は商品を入手できず支払いも行わないため、\begin{equation*}u_{j}\left( a_{I},\theta _{j}\right) =0
\end{equation*}と定めます。
後ほど提示する例が示唆するように、不完備情報の静学ゲームでは、それぞれのプレイヤーの選好すなわち利得関数が私的情報であるような状況が起こり得ます。むしろ、実際にはプレイヤーの選好が私的状況であることは多く、不完備情報ゲームはそのような状況を明示的に分析するために開発された分析ツールであるとさえ言えます。タイプの定義より、プレイヤー\(i\)が保有するすべての私的情報は自身のタイプ\(\theta _{i}\)に含まれているため、プレイヤー\(i\)の利得関数\(u_{i}\)が私的情報であることを表現するためには\(u_{i}\)の形状が\(\theta _{i}\)の値に依存して変化すること、つまり、プレイヤー\(i\)が行動の組\(a_{I}\)から得る利得\(u_{i}\left(a_{I}\right) \)が自身のタイプ\(\theta _{i}\)の値に依存して変化するものとみなすことで対応できます。つまり、\(u_{i}\)は\(a_{I}\)を変数として持つだけでなく\(\theta _{i}\)をも変数として持つものとみなすということです。さらに言い換えると、\(u_{i}\)の定義域を\(A_{I}\times \Theta_{i}\)とみなすということです。この場合、プレイヤー\(i\)の利得関数は、\begin{equation*}u_{i}\left( \cdot ,\cdot \right) :A_{I}\times \Theta _{I}\rightarrow \mathbb{R} \end{equation*}として定式化されます。特に、状態が\(\theta_{I}\in \Theta _{I}\)である場合の利得関数は、\begin{equation*}u_{i}\left( \cdot ,\theta _{I}\right) :A_{I}\rightarrow \mathbb{R} \end{equation*}となります。ただし、\(u_{i}\left( \cdot ,\cdot \right) \)の形状はプレイヤーたちの共有知識です。状態集合\(\Theta _{I}\)と\(u_{i}\left( \cdot ,\cdot \right) \)が共有知識であるとき、状態が\(\theta _{I}\in \Theta _{I}\)である場合の利得関数\(u_{i}\left(\cdot ,\theta _{I}\right) \)もまたプレイヤーたちの共有知識になります。任意の\(\theta _{I}\)について同様の議論が成り立つため、プレイヤー\(i\)が持ち得る効用関数からなる集合\begin{equation*}\left\{ u_{i}\left( \cdot ,\theta _{I}\right) \right\} _{\theta _{I}\in
\Theta _{I}}
\end{equation*}もまたプレイヤーたちの共有知識です。ただ、他の任意のプレイヤー\(j\ \left( \not=i\right) \)はプレイヤー\(i\)の真のタイプ\(\theta _{i}^{\ast }\)を知らないため、\(\left\{ u_{i}\left( \cdot ,\theta _{I}\right) \right\}_{\theta _{I}\in \Theta _{I}}\)に属するどの利得関数がプレイヤー\(i\)の真の利得関数\(u_{i}\left( \cdot ,\theta _{I}^{\ast }\right) \)であるかを観察することはできません。加えて、プレイヤー\(i\)は他のプレイヤーたちの真のタイプ\(\theta _{-i}^{\ast }\)を知らないため、\(\left\{ u_{i}\left( \cdot,\theta _{I}\right) \right\} _{\theta _{I}\in \Theta _{I}}\)に属するどの利得関数が自身の真の利得関数\(u_{i}\left( \cdot ,\theta _{I}^{\ast }\right) \)であるかを観察することはできません。
\end{equation*}として推定するものとします。このような想定のもとで、ベンチマークとして以下の2つの行動の組について考えます。1つ目は、入札者\(1\)の入札額は\(0\)で、他の任意の入札者\(j\ \left( \not=1\right) \)の入札額が\(10\)であるような組\begin{equation*}a_{I}=\left( a_{1},a_{2},\cdots ,a_{n}\right) =\left( 0,10,\cdots ,10\right)
\end{equation*}であり、2つ目は、入札者\(1\)の入札額は\(50\)で、他の任意の入札者\(j\)の入札額が\(10\)であるような組\begin{equation*}a_{I}^{\prime }=\left( a_{1},a_{2},\cdots ,a_{n}\right) =\left( 50,10,\cdots
,10\right)
\end{equation*}です。さて、入札者\(1\)による商品への評価額が\(10\)で、他の任意の入札者\(j\)による評価額が\(0\)であるような状態\begin{equation*}\theta _{I}=\left( \theta _{1},\theta _{2},\cdots ,\theta _{n}\right)
=\left( 10,0\cdots ,0\right)
\end{equation*}においては、\(n\)が十分大きいとき、先の推定評価額\(\left( 1\right) \)はおよそ\(0\)であるため、入札者\(1\)にとって、商品を落札して\(50\)を支払うよりも、商品を落札しないことのほうが明らかに望ましいです。つまり、\begin{equation*}u_{1}\left( a_{I},\theta _{I}\right) >u_{1}\left( a_{I}^{\prime },\theta
_{I}\right)
\end{equation*}が成り立ちます。一方、入札者\(1\)による財への評価額が\(10\)で、他の任意の入札者\(j\)による評価額が\(100\)であるような状態\begin{equation*}\theta _{I}^{\prime }=\left( \theta _{1},\theta _{2},\cdots ,\theta
_{n}\right) =\left( 10,100,\cdots ,100\right)
\end{equation*}においては、\(n\)が十分大きいとき、先の推定評価額はおよそ\(100\)であるため、入札者\(i\)にとって、商品を落札しないことよりも、商品を落札して\(50\)を支払うほうが明らかに望ましいです。つまり、\begin{equation*}u_{1}\left( a_{I}^{\prime },\theta _{I}^{\prime }\right) >u_{1}\left(
a_{I},\theta _{I}^{\prime }\right)
\end{equation*}が成り立ちます。\(\theta_{1}=\theta _{1}^{\prime }\)であるため、\(\theta _{I}\)と\(\theta _{I}^{\prime }\)の違いは他の入札者たちのタイプ\(\theta _{-1},\theta _{-1}^{\prime }\)の違いに起因しています。したがって、上の例では、入札者\(1\)の利得が自身のタイプ\(\theta _{1}\)だけでなく他の入札者たちのタイプ\(\theta _{-1}\)にも依存する形になっています。
先に指摘したように、プレイヤー\(i\)の行動集合\(A_{i}\)が私的情報である場合には、それぞれのタイプ\(\theta _{i}\in \Theta _{i}\)ごとに行動集合\(A_{i}\left( \theta_{i}\right) \)を指定することになるため、プレイヤー\(i\)の行動集合を、\begin{equation*}\left\{ A_{i}\left( \theta _{i}\right) \right\} _{\theta _{i}\in \Theta _{i}}
\end{equation*}と記述する必要があります。しかし、利得関数を上手く変換することにより、それぞれのプレイヤーの行動集合が私的情報であるようなモデルを、プレイヤーの行動集合がプレイヤーたちの共有知識であるようなモデルへ変換することができます。
具体的には、プレイヤー\(i\)の行動集合が\(\left\{A_{i}\left( \theta _{i}\right) \right\} _{\theta _{i}\in \Theta _{i}}\)として記述されるとき、新たな行動集合\(A_{i}\)を、\begin{equation*}A_{i}=\bigcup\limits_{\theta _{i}\in \Theta _{i}}A_{i}\left( \theta
_{i}\right)
\end{equation*}と定義します。つまり、この集合\(A_{i}\)にはプレイヤー\(i\)がそれぞれのタイプ\(\theta _{i}\)のもとで選択し得るすべての行動が含まれています。プレイヤー\(i\)の特定のタイプ\(\theta _{i}\)を任意に選びます。このとき、プレイヤー\(i\)が選択可能な行動からなる集合は\(A_{i}\left( \theta _{i}\right) \)ですが、これは\(A_{i}\)の部分集合であるため、\(A_{i}\)の中には\(\theta _{i}\)のもとでプレイヤー\(i\)が選択不可能な行動が含まれている可能性があります。そのような行動\(a_{i}\in A_{i}\backslash A_{i}\left( \theta_{i}\right) \)を任意に選んだ上で、\begin{equation*}\forall a_{-i}\in A_{-i},\ \forall \theta _{-i}\in \Theta _{-i}:u_{i}\left(
a_{i},a_{-i},\theta _{i},\theta _{-i}\right) =-\infty
\end{equation*}と定めれば、タイプ\(\theta _{i}\)のプレイヤー\(i\)がこの行動\(a_{i}\)を選ぶ可能性を排除できます。\(A_{i}\backslash A_{i}\left( \theta _{i}\right) \)に属する任意の行動に対して同様の操作が可能です。
議論を整理します。プレイヤー\(i\)の行動集合からなる組\(\left\{ A_{i}\left( \theta_{i}\right) \right\} _{\theta _{i}\in \Theta _{i}}\)が与えられたとき、そこから以下の集合\begin{equation*}A_{i}=\bigcup\limits_{\theta _{i}\in \Theta _{i}}A_{i}\left( \theta
_{i}\right)
\end{equation*}を定義します。プレイヤー\(i\)の行動集合は自身のタイプ\(\theta _{i}\)に依存せず常に\(A_{i}\)で一定であり、この\(A_{i}\)はプレイヤーたちの共有知識であるものとします。その上で、プレイヤー\(i\)の利得関数\(u_{i}\)は、\begin{equation*}\forall \theta _{i}\in \Theta _{i},\ \forall a_{i}\in A_{i}\backslash
A_{i}\left( \theta _{i}\right) ,\ \forall a_{-i}\in A_{-i},\ \forall \theta
_{-i}\in \Theta _{-i}:u_{i}\left( a_{i},a_{-i},\theta _{i},\theta
_{-i}\right) =-\infty
\end{equation*}を満たすものと仮定します。形式上はプレイヤー\(i\)が直面する行動集合は\(A_{i}\)ですが、プレイヤー\(i\)がタイプ\(\theta _{i}\)の場合に選択対象となり得る行動からなる集合は実質的には\(A_{i}\left( \theta _{i}\right) \)に限定されます。このような変換を行えば、プレイヤー\(i\)の行動集合を自身のタイプ\(\theta _{i}\)に依存しない集合\(A_{i}\)とみなしても一般性は失われません。
ベイジアンゲーム
繰り返しになりますが、不完備情報の静学ゲームを記述するためには「プレイヤー」「行動」「情報」「結果」「利得」をそれぞれ特定する必要があります。ゲームのプレイヤーをプレイヤー集合\(I\)によって記述され、それぞれのプレイヤー\(i\in I\)の行動は行動集合\(A_{i}\)として記述されます。また、プレイヤー間の非対称的な情報構造はそれぞれのプレイヤー\(i\)のタイプ集合\(\Theta _{i}\)によって記述されます。プレイヤーたちが選ぶ行動の組\(a_{I}\in A_{I}\)にはゲームにおいて起こり得る結果が1つずつ対応しており、状態\(\theta _{I}=\left( \theta _{i},\theta_{-i}\right) \in \Theta _{I}\)においてプレイヤー\(i\)がそれぞれの結果から得る利得は\(\theta _{I}\)のもとでの利得関数\(u_{i}\left( \cdot ,\theta _{I}\right) :A_{I}\rightarrow \mathbb{R} \)によって記述されます。それぞれの状態におけるプレイヤー\(i\)の利得関数からなる集合を\(u_{i}=\left\{ u_{i}\left( \cdot ,\theta _{I}\right)\right\} _{\theta _{I}\in \Theta _{I}}\)で表記します。以上の要素からなるモデルを、\begin{equation*}G=\left( I,\left\{ A_{i}\right\} _{i\in I},\left\{ \Theta _{i}\right\}
_{i\in I},\left\{ u_{i}\right\} _{i\in I}\right)
\end{equation*}と表記し、これをベイジアンゲーム(Bayesian game)と呼びます。
I=\left\{ 1,2\right\}
\end{equation*}であり、タイプ集合は、\begin{equation*}
\Theta _{1}=\Theta _{2}=\left\{ h,l\right\}
\end{equation*}であり、行動集合は、\begin{equation*}
A_{1}=A_{2}=\left\{ EN,E\right\}
\end{equation*}です。状態集合は、\begin{eqnarray*}
\Theta _{I} &=&\Theta _{1}\times \Theta _{2} \\
&=&\left\{ \left( h,h\right) ,\left( h,l\right) ,\left( l,h\right) ,\left(
l,l\right) \right\}
\end{eqnarray*}であり、それぞれの状態\(\theta _{I}\in \Theta _{I}\)について、その場合の利得関数\(u_{i}\left( \cdot ,\theta _{I}\right) :A_{I}\rightarrow \mathbb{R} \)を特定する必要があります。まず、状態が\(\left( h,h\right) \in \Theta _{I}\)である場合の企業\(1\)の利得関数は、\begin{eqnarray*}u_{1}\left( E,E,h,h\right) &=&\frac{p}{2}-c_{h} \\
u_{1}\left( E,NE,h,h\right) &=&P \\
u_{1}\left( NE,E,h,h\right) &=&0 \\
u_{1}\left( NE,NE,h,h\right) &=&0
\end{eqnarray*}であり、企業\(2\)の利得関数は、\begin{eqnarray*}u_{2}\left( E,E,h,h\right) &=&\frac{p}{2}-c_{h} \\
u_{2}\left( E,NE,h,h\right) &=&0 \\
u_{2}\left( NE,E,h,h\right) &=&P \\
u_{2}\left( NE,NE,h,h\right) &=&0
\end{eqnarray*}です。続いて、状態が\(\left( h,l\right) \in \Theta _{I}\)である場合の企業\(1\)の利得関数は、\begin{eqnarray*}u_{1}\left( E,E,h,l\right) &=&\frac{p}{2}-c_{h} \\
u_{1}\left( E,NE,h,l\right) &=&P \\
u_{1}\left( NE,E,h,l\right) &=&0 \\
u_{1}\left( NE,NE,h,l\right) &=&0
\end{eqnarray*}であり、企業\(2\)の利得関数は、\begin{eqnarray*}u_{2}\left( E,E,h,l\right) &=&\frac{p}{2}-c_{l} \\
u_{2}\left( E,NE,h,l\right) &=&0 \\
u_{2}\left( NE,E,h,l\right) &=&P \\
u_{2}\left( NE,NE,h,l\right) &=&0
\end{eqnarray*}です。続いて、状態が\(\left( l,h\right) \in \Theta _{I}\)である場合の企業\(1\)の利得関数は、\begin{eqnarray*}u_{1}\left( E,E,l,h\right) &=&\frac{p}{2}-c_{l} \\
u_{1}\left( E,NE,l,h\right) &=&P \\
u_{1}\left( NE,E,l,h\right) &=&0 \\
u_{1}\left( NE,NE,l,h\right) &=&0
\end{eqnarray*}であり、企業\(2\)の利得関数は、\begin{eqnarray*}u_{2}\left( E,E,l,h\right) &=&\frac{p}{2}-c_{h} \\
u_{2}\left( E,NE,l,h\right) &=&0 \\
u_{2}\left( NE,E,l,h\right) &=&P \\
u_{2}\left( NE,NE,l,h\right) &=&0
\end{eqnarray*}です。最後に、状態が\(\left( l,l\right) \in \Theta _{I}\)である場合の企業\(1\)の利得関数は、\begin{eqnarray*}u_{1}\left( E,E,l,l\right) &=&\frac{p}{2}-c_{l} \\
u_{1}\left( E,NE,l,l\right) &=&P \\
u_{1}\left( NE,E,l,l\right) &=&0 \\
u_{1}\left( NE,NE,l,l\right) &=&0
\end{eqnarray*}であり、企業\(2\)の利得関数は、\begin{eqnarray*}u_{2}\left( E,E,l,l\right) &=&\frac{p}{2}-c_{l} \\
u_{2}\left( E,NE,l,l\right) &=&0 \\
u_{2}\left( NE,E,l,l\right) &=&P \\
u_{2}\left( NE,NE,l,l\right) &=&0
\end{eqnarray*}です。
I=\left\{ 1,\cdots ,n\right\}
\end{equation*}であり、タイプ集合は、\begin{eqnarray*}
\Theta _{1} &=&\left[ \underline{\theta }_{1},\overline{\theta }_{1}\right] \\
\Theta _{2} &=&\left[ \underline{\theta }_{2},\overline{\theta }_{2}\right] \end{eqnarray*}であり、行動集合は、\begin{equation*}
A_{1}=A_{2}=[0,+\infty )
\end{equation*}です。状態集合は、\begin{eqnarray*}
\Theta _{I} &=&\Theta _{1}\times \cdots \times \Theta _{n} \\
&=&\left[ \underline{\theta }_{1},\overline{\theta }_{1}\right] \times
\cdots \times \left[ \underline{\theta }_{n},\overline{\theta }_{n}\right] \end{eqnarray*}であり、状態が\(\theta _{I}\in\Theta _{I}\)である場合の入札者\(i\in I\)の利得関数\(u_{i}\left( \cdot,\theta _{I}\right) :A\rightarrow \mathbb{R} \)はそれぞれの\(a_{I}\in A\)に対して、\begin{equation*}u_{i}\left( a_{I},\theta _{I}\right) =\left\{
\begin{array}{cc}
\theta _{i}-a_{i} & \left( if\ a_{i}=\max \left\{ a_{1},\cdots
,a_{n}\right\} \right) \\
0 & \left( if\ a_{i}<\max \left\{ a_{1},\cdots ,a_{n}\right\} \right)
\end{array}\right.
\end{equation*}を定めます。ただし、ここでは最高額を入札する者は常に1人であるような状況を想定しています。
不完備情報の静学ゲームがベイジアンゲーム\begin{equation*}
G=\left( I,\left\{ A_{i}\right\} _{i\in I},\left\{ \Theta _{i}\right\}
_{i\in I},\left\{ u_{i}\right\} _{i\in I}\right)
\end{equation*}によって表現されるとき、ゲーム\(G\)を構成するすべての要素はプレイヤーたちの共有知識です。それぞれのプレイヤー\(i\in I\)は自身のタイプ\(\theta _{i}\in \Theta _{i}\)の真の値(便宜的にこれを\(\theta _{i}^{\ast }\)と表記します)を知っていますが、他の任意のプレイヤー\(j\ \left( \not=i\right) \)のタイプ\(\theta _{j}\in \Theta _{j}\)の真の値\(\theta _{j}^{\ast }\)は知りません。プレイヤー\(i\)が他のプレイヤー\(j\)について知っていることは、\(\theta _{j}\)がとり得る値の範囲\(\Theta _{j}\)だけです。したがって、プレイヤー\(i\)が直面し得る状態からなる集合は、\begin{equation*}\left\{ \left( \theta _{i}^{\ast },\theta _{-i}\right) \right\} _{\theta
_{-i}\in \Theta _{-i}}
\end{equation*}です。他の任意のプレイヤーについても同様の議論が成立します。また、ゲームの静学性と不完備性より、プレイヤーたちは以下の手順で意志決定を行います。
- それぞれのプレイヤー\(i\)は自身の真のタイプ\(\theta _{i}^{\ast }\)を知る一方で他のプレイヤーたちの真のタイプ\(\theta _{-i}^{\ast }\)を知らない。そのような状況において、自身の行動集合\(A_{i}\)の中から特定の行動\(a_{i}\)を選択する。その際、他のプレイヤーたちが選択する行動\(a_{-i}\)を観察できない。
- プレイヤーたちが選択した行動の組\(a_{I}=\left( a_{i}\right) _{i\in I}\)に対して、ゲームのルールが結果を定める。
- そのゲームの結果から、それぞれのプレイヤー\(i\)は利得\(u_{i}\left(a_{I},\theta _{I}^{\ast }\right) \)を得る。
状態ゲーム
問題としている不完備情報の静学ゲームがベイジアンゲーム\(G\)として表されているものとします。この場合、それぞれのプレイヤー\(i\in I\)は自身のタイプ\(\theta _{i}\in \Theta _{i}\)の真の値(便宜的にこれを\(\theta _{i}^{\ast }\)と表記します)を知っていますが、他のプレイヤーたちのタイプ\(\theta _{-i}\in \Theta _{-i}\)の真の値\(\theta _{-i}^{\ast }\)は知らないという意味において情報の非対称性が成立しています。しかし、仮に真の状態\(\theta _{I}^{\ast }=\left( \theta _{i}^{\ast },\theta _{-i}^{\ast}\right) \)がプレイヤーたちの共有知識である場合には、情報の非対称性はもはや存在せず、そこでプレイヤーたちが直面する戦略的状況は完備情報ゲームになります。具体的には、真の状態\(\theta _{I}^{\ast }\)がプレイヤーたちの共有知識であるとき、その場合の戦略的状況は以下のような戦略型ゲームとして記述されます。
- プレイヤー集合はベイジアンゲーム\(G\)のプレイヤー集合\(I\)をそのまま引き継ぐ。
- それぞれのプレイヤー\(i\in I\)の行動集合はベイジアンゲーム\(G\)の行動集合\(A_{i}\)をそのまま引き継ぐ。
- それぞれのプレイヤー\(i\)の利得関数は、真の状態\(\theta _{I}^{\ast }\)のもとでの利得関数\(u_{i}\left( \cdot ,\theta_{I}^{\ast }\right) :A_{I}\rightarrow \mathbb{R} \)である。
ベイジアンゲーム\(G\)と真の状態\(\theta _{I}^{\ast }\)から定義されるこのような戦略型ゲームを\(\theta _{I}^{\ast }\)のもとでの状態ゲーム(state game)と呼び、これを、\begin{equation*}G\left( \theta _{I}^{\ast }\right) =\left( I,\left\{ A_{i}\right\} _{i\in
I},\left\{ u_{i}\left( \cdot ,\theta _{I}^{\ast }\right) \right\} _{i\in
I}\right)
\end{equation*}と表記します。
ベイジアンゲーム\(G\)の要素であるプレイヤー集合\(I\)、任意のプレイヤー\(i\)の行動集合\(A_{i}\)、任意のプレイヤー\(i\)の状態\(\theta _{I}^{\ast }\)における利得関数\(u_{i}\left( \cdot ,\theta _{I}^{\ast}\right) \)はいずれも共有知識であるため、状態ゲーム\(G\left( \theta _{I}^{\ast }\right) \)の要素もまた共有知識です。
ここでは真の状態\(\theta_{I}^{\ast }\)に対してそこでの状態ゲーム\(G\left( \theta _{I}^{\ast }\right) \)を考えましたが、真の状態とは限らないそれぞれの状態\(\theta _{I}\in\Theta _{I}\)に対しても、そこでの状態ゲーム\(G\left( \theta_{I}\right) \)を考えることができます。ベイジアンゲーム\(G\)においてそれぞれのプレイヤー\(i\)は自身のタイプ\(\theta _{i}\)の真の値\(\theta _{i}^{\ast }\)を知っていますが、他のプレイヤーたちのタイプ\(\theta _{-i}\)の真の値\(\theta _{-i}^{\ast }\)を事前に観察できません。したがって、ベイジアンゲーム\(G\)においてプレイヤー\(i\)が直面する不確実な状況は、彼が直面する真の状態ゲームが、\begin{equation*}\left\{ G\left( \theta _{i}^{\ast },\theta _{-i}\right) \right\} _{\theta
_{-i}\in \Theta _{-i}}
\end{equation*}の中のどれであるかを事前に知ることができないこととして表現できます。
\end{equation*}であり、行動集合が、\begin{equation*}
A_{1}=A_{2}=\left\{ a,b\right\}
\end{equation*}であり、タイプ集合が、\begin{eqnarray*}
\Theta _{1} &=&\left\{ \theta _{11}\right\} \\
\Theta _{2} &=&\left\{ \theta _{21},\theta _{22}\right\}
\end{eqnarray*}であるものとします。状態集合は、\begin{eqnarray*}
\Theta _{I} &=&\Theta _{1}\times \Theta _{2} \\
&=&\left\{ \left( \theta _{11},\theta _{21}\right) ,\left( \theta
_{11},\theta _{22}\right) \right\}
\end{eqnarray*}です。状態ゲーム\(G\left(\theta _{11},\theta _{21}\right) \)は以下の利得行列
$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 0,0 \\ \hline
b & 0,0 & 1,2 \\ \hline
\end{array}$$
として、状態ゲーム\(G\left( \theta _{11},\theta _{22}\right) \)は以下の利得行列
$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 0,2 \\ \hline
b & 0,1 & 1,0 \\ \hline
\end{array}$$
としてそれぞれ与えられているものとします。これらの状態ゲームを構成する要素はいずれもプレイヤーたちの共有知識です。また、タイプ集合\(\Theta _{1},\Theta _{2}\)は共有知識であるため、プレイヤーたちがこの2つの状態ゲームに直面し得るという事実もまた共有知識です。プレイヤー\(1\)のタイプは\(\theta _{11}\)の1通りであるため、プレイヤー\(2\)は不確実性に直面していません。つまり、プレイヤー\(2\)の真のタイプが\(\theta _{21}\)である場合、プレイヤー\(2\)は自身が直面するゲームが\(G\left( \theta _{11},\theta _{21}\right) \)であることを識別でき、真のタイプが\(\theta _{21}\)の場合には、自身が直面するゲームが\(G\left( \theta _{11},\theta_{22}\right) \)であることを識別できます。一方、プレイヤー\(2\)のタイプとしては\(\theta _{21}\)と\(\theta _{22}\)の2通り存在し、プレイヤー\(1\)はプレイヤー\(2\)の真のタイプがどちらであるかを事前に知ることはできないため、プレイヤー\(1\)は自分がどちらの状態ゲームをプレーすることになるかが分からず、したがって不確実性に直面しています。
I=\left\{ 1,2\right\}
\end{equation*}であり、タイプ集合は、\begin{equation*}
\Theta _{1}=\Theta _{2}=\left\{ h,l\right\}
\end{equation*}であり、行動集合は、\begin{equation*}
A_{1}=A_{2}=\left\{ E,NE\right\}
\end{equation*}です。状態集合は、\begin{eqnarray*}
\Theta _{I} &=&\Theta _{1}\times \Theta _{2} \\
&=&\left\{ \left( h,h\right) ,\left( h,l\right) ,\left( l,h\right) ,\left(
l,l\right) \right\}
\end{eqnarray*}です。状態ゲーム\(G\left(h,h\right) \)は以下の利得行列として表現されます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & E & NE \\ \hline
E & \frac{P}{2}-c_{h},\frac{P}{2}-c_{h} & P,0 \\ \hline
NE & 0,P & 0,0 \\ \hline
\end{array}$$
状態ゲーム\(G\left( h,l\right) \)は以下の利得行列として表現されます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & E & NE \\ \hline
E & \frac{P}{2}-c_{h},\frac{P}{2}-c_{l} & P,0 \\ \hline
NE & 0,P & 0,0 \\ \hline
\end{array}$$
状態ゲーム\(G\left( l,h\right) \)は以下の利得行列として表されます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & E & NE \\ \hline
E & \frac{P}{2}-c_{l},\frac{P}{2}-c_{h} & P,0 \\ \hline
NE & 0,P & 0,0 \\ \hline
\end{array}$$
状態ゲーム\(G\left( l,l\right) \)は以下の利得行列として表されます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & E & NE \\ \hline
E & \frac{P}{2}-c_{l},\frac{P}{2}-c_{l} & P,0 \\ \hline
NE & 0,P & 0,0 \\ \hline
\end{array}$$
先の例とは異なり、ここでは2人のプレイヤーがともに複数のタイプを持っているため、2人のプレイヤーはともに不確実性に直面しています。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】