メカニズムのもとでのベイジアンゲーム
分割不可能な1つの商品が売りに出される単一財オークションが環境\begin{equation*}
\left( I,\left\{ \theta _{i}\right\} _{i\in I},A\times \mathbb{R} ^{n},\left\{ u_{i}\left( \cdot ,\theta _{I}\right) \right\} _{i\in I}\right)
\end{equation*}として表現されているものとします。ただし、\(I\)は入札者集合、\(\theta _{i}\)は入札者\(i\)にとっての商品の評価額、\(A\times \mathbb{R} ^{n}\)は結果集合、\(u_{i}\left( \cdot,\theta _{I}\right) \)は入札者\(i\)が結果どうしを比較する利得関数です。特に、入札者の利得関数に関して準線型性、リスク中立性、私的価値を仮定する(準線型環境)場合には、入札者\(i\)が結果\(\left(a_{I},t_{I}\right) \in A\times \mathbb{R} ^{n}\)から得る利得を、\begin{equation*}u_{i}\left( a_{I},t_{I},\theta _{I}\right) =v_{i}\left( a_{I},\theta
_{i}\right) -t_{i}
\end{equation*}と表現できます。ただし、\(v_{i}\left( \cdot ,\theta _{I}\right) :A\rightarrow \mathbb{R} \)は配分の金銭価値を特定する評価関数です。また、準線型性、リスク中立性、私的価値の仮定に加えて非外部性を仮定する場合には、入札者\(i\)が結果\(\left( a_{I},t_{I}\right) \in A\times \mathbb{R} ^{n}\)から得る利得を、\begin{equation*}u_{i}\left( a_{I},t_{I},\theta _{I}\right) =a_{i}\cdot \theta _{i}-t_{i}
\end{equation*}と表現できます。
仮にオークションの主催者が問題としているオークション市場の真の状態\(\theta _{I}\in \Theta _{I}\)を観察できるならば、観察した\(\theta _{I}\)を基準に社会的に望ましい結果を結果集合\(A\times \mathbb{R} ^{n}\)の中から選び取ることが原理的に可能です。しかし、実際には、商品の評価額は入札者が持つ私的情報であるため、主催者は真の状態\(\theta _{I}\)を事前に観察できず、状態がとり得る値の範囲\(\Theta _{I}\)だけを知っています。そこで、主催者は入札者たちにタイプを申告させた上で(評価額を入札させる)、あらかじめ定めたルールにもとづいて資源配分を行うことになります。
単一財オークションにおける結果は配分と所得移転の組であるため、ここでは2つのルールが必要になります。つまり、入札者たちが申告するタイプの組に対して配分を定める配分ルール\(a:\Theta _{I}\rightarrow A\)と、所得移転を定める移転ルール\(t:\Theta _{I}\rightarrow \mathbb{R} ^{n}\)です。以上の2つの資源配分ルールからなる組\begin{equation*}\left( a,t\right) :\Theta _{I}\rightarrow A\times \mathbb{R} ^{n}
\end{equation*}をメカニズムと呼びます。入札者たちが申告する評価額からなる組\(\hat{\theta}_{I}\in \Theta _{I}\)に対して、メカニズム\(\left(a,t\right) \)は結果\begin{equation*}\left( a\left( \hat{\theta}_{I}\right) ,t\left( \hat{\theta}_{I}\right)
\right) \in A\times \mathbb{R} ^{n}
\end{equation*}を1つずつ定めます。この結果において入札者\(i\)は商品を確率\(a_{i}\left( \hat{\theta}_{I}\right) \)を入手し、その対価として所得移転\(t_{i}\left( \hat{\theta}_{I}\right) \)が課されます。
メカニズムに直面したそれぞれの入札者は自身にとっての真の評価額を正直に入札するとは限りません。入札者は望ましい結果を得るために戦略的に行動しますが、その一環として、偽りの評価額を入札する可能性があるからです。入札者にとって商品の評価額は私的情報であるため、入札者が嘘をついて真の評価額とは異なる金額を入札しても、主催者はそれが嘘であるかどうかを知る術はありません。入札者たちが偽りの評価額を入札する場合、主催者は偽りの評価額を基準に結果を決定することとなり、それは真の意味で社会的に望ましい結果とは異なるものになってしまう可能性があります。情報の非対称に起因するこのような問題をインセンティブの問題と呼びます。
インセンティブの問題を引き起こす原因が情報の非対称性である以上、インセンティブの問題を解決するためには、何らかの方法を通じて情報の非対称性を解消する必要があります。具体的には、それぞれの入札者にとって真の評価額を正直に入札することが得であるようなメカニズムを設計すれば、そのようなメカニズムのもと、入札者たちは真の評価額を自ら進んで正直に入札するため、結果として情報の非対称性は解消されます。以上のことをよりテクニカルに表現すると、メカニズムを提示された入札者たちが直面する戦略的状況をゲームとして記述したとき、そのゲームにおいて、「すべての入札者が自身にとっての真の評価額を正直に入札する」ことが均衡になるのであれば、そのようなメカニズムのもとで情報の非対称性は解消されるということです。ただ、そもそも、そのようなメカニズムを設計することは可能なのでしょうか。こうした問いについて考えるために、まずは、メカニズムを提示された入札者たちが直面する戦略的状況をゲームとして記述します。
単一財オークション市場において、主催者はメカニズム\(\left( a,t\right) \)を設計し、それを入札者たちに提示します。仮にすべての入札者が提示されたメカニズム\(\left( a,t\right) \)に同意するのであれば、それぞれの入札者\(i\in I\)は自身にとっての商品の評価額\(\hat{\theta}_{i}\in \Theta _{i}\)を入札することになります。その際、他の入札者たちによる入札額を事前に観察できません。また、入札者は真の評価額\(\theta_{i}\in \Theta _{i}\)を正直に入札するとは限りません。いずれにせよ、入札者たちが入札してきた評価額からなる組\(\hat{\theta}_{I}\in \Theta _{I}\)に対し、主催者はあらかじめ提示したメカニズム\(\left(a,t\right) \)にもとづいて結果\(\left( a\left( \hat{\theta}_{I}\right) ,t\left( \hat{\theta}_{I}\right)\right) \in A\times \mathbb{R} ^{n}\)を選び取り、これを遂行します。その結果、それぞれの入札者\(i\)は商品を確率\(a_{i}\left( \hat{\theta}_{I}\right) \)で入手するとともに所得移転\(t_{i}\left( \hat{\theta}_{I}\right) \)を課されます。メカニズム\(\left( a,t\right) \)を提示された入札者たちが直面する以上の戦略的状況をゲームとみなした上で、それを、\begin{equation*}G\left( a,t\right)
\end{equation*}で表記し、これをメカニズム\(\left( a,t\right) \)のもとでのゲームと呼ぶこととします。以降では、このゲーム\(G\left( a,t\right) \)を構成する要素を具体的に特定します。
まず、このゲームのプレイヤーはオークションに参加する入札者たちであるため、ゲーム\(G\left( a,t\right) \)のプレイヤー集合は問題としている単一財オークション市場の入札者集合\(I\)と一致します。
それぞれの入札者\(i\in I\)は商品に対する評価額\(\theta _{i}\in \Theta _{i}\)を私的情報として持っています。つまり、ゲーム\(G\left(a,t\right) \)におけるプレイヤー\(i\)のタイプは商品の評価額\(\theta _{i}\)であり、タイプ集合は評価額がとり得る値からなる集合\(\Theta _{i}\)と一致します。入札者\(i\)のタイプ\(\theta_{i}\)はタイプ集合\(\Theta _{i}\)に属する様々な値を取り得ますが、\(\theta _{i}\)の真の値を知っているのは入札者\(i\)だけです。他の任意の入札者や主催者は\(\theta _{i}\)がとり得る値の範囲\(\Theta _{i}\)を知っていますが、その中のどの値が真の値であるかは知らないものと仮定することにより、入札者\(i\)にとって評価額が私的情報である状況を表現します。
メカニズム\(\left( a,t\right) \)に直面したそれぞれの入札者\(i\)が申告する入札額を\(\hat{\theta}_{i}\in \Theta _{i}\)で表記します。つまり、ゲーム\(G\left( a,t\right) \)において入札者\(i\)に与えられた行動は自身が選択する入札額\(\hat{\theta}_{i}\)であり、自身が選択し得るすべての行動からなる集合はタイプ集合\(\Theta _{i}\)と一致します。それぞれのプレイヤーは真の評価額を正直に入札するとは限りません。つまり、入札額\(\hat{\theta}_{i}\)は真の評価額\(\theta _{i}\)と一致するとは限りません。
プレイヤーたちが選択する行動の組、すなわち入札額からなる組が\(\hat{\theta}_{I}\in \Theta _{I}\)であるとき、それに対してメカニズム\(\left( a,t\right) \)は結果\(\left( a\left( \hat{\theta}_{I}\right) ,t\left( \hat{\theta}_{I}\right) \right) \in A\times \mathbb{R} ^{n}\)を選び取ります。入札額\(\hat{\theta}_{I}\)が変われば結果\(\left( a\left( \hat{\theta}_{I}\right) ,t\left( \hat{\theta}_{I}\right) \right) \)も変化しますが、どのように変化するかはメカニズム\(\left(a,t\right) \)の内容に依存します。以上がゲーム\(G\left(a,t\right) \)において起こり得る結果です。
プレイヤー\(i\)が結果どうしを比較する評価体系は結果集合\(A\times \mathbb{R} ^{n}\)上に定義された利得関数\(u_{i}:A\times \mathbb{R} ^{n}\rightarrow \mathbb{R} \)として記述されます。一般に、プレイヤーが結果どうしを比較する利得関数\(u_{i}\)の形状はすべてのプレイヤーのタイプからなる組\(\theta _{I}\)に依存するため、そのことを明示するために、プレイヤー\(i\)の利得関数を、\begin{equation*}u_{i}\left( \cdot ,\theta _{I}\right) :A\times \mathbb{R} ^{n}\rightarrow \mathbb{R} \end{equation*}と表記します。その上で、それぞれの状態におけるプレイヤー\(i\)の利得関数からなる集合を、\begin{equation*}u_{i}=\left\{ u_{i}\left( \cdot ,\theta _{I}\right) \right\} _{\theta
_{I}\in \Theta _{i}}
\end{equation*}で表記します。
以上でゲーム\(G\left( a,t\right) \)の要素がすべて出揃いました。つまり、このゲームはプレイヤーである入札者が私的情報を持つ不完備情報ゲームであり、以下のようなベイジアンゲーム\begin{equation*}G\left( a,t\right) =\left( I,\left\{ \Theta _{i}\right\} _{i\in I},\left\{
u_{i}\right\} _{i\in I}\right)
\end{equation*}として定式化されます。ただし、\(\Theta _{i}\)は入札者\(i\)のタイプ集合と行動集合を兼ねています。これをメカニズム\(\left( a,t\right) \)のもとでのゲームと呼ぶこととします。
ゲーム\(G\left( a,t\right) \)を構成するすべての要素は入札者たちの共有知識です。それぞれの入札者\(i\in I\)は自身のタイプ\(\theta _{i}\)の真の値を観察できますが、他の入札者たちのタイプ\(\theta _{-i}\)の真の値を観察できません。入札者\(i\)が他の入札者たちについて知っていることは\(\theta _{-i}\)がとり得る値の範囲\(\Theta _{-i}\)だけです。したがって、入札者\(i\)のタイプの真の値が\(\theta _{i}\)である場合に直面し得る状態からなる集合は、\begin{equation*}\left\{ \left( \theta _{i},\theta _{-i}\right) \right\} _{\theta _{-i}\in
\Theta _{-i}}
\end{equation*}となります。他の任意の入札者についても同様の議論が成立します。また、ベイジアンゲームの静学性と不完備性より、ゲーム\(G\left( a,t\right) \)において入札者たちは以下の手順で意思決定を行います。
- 自身にとっての商品の真の評価額\(\theta _{i}\in\Theta _{i}\)を知っているが他のプレイヤーたちにとっての真の評価額\(\theta _{-i}\in \Theta _{-i}\)を知らないそれぞれの入札者\(i\in I\)は自身のタイプ集合\(\Theta _{i}\)の中から特定の評価額\(\hat{\theta}_{i}\in \Theta _{i}\)を選択し、それを入札する。その際、他の入札者たちが選択した入札額\(\hat{\theta}_{-i}\in \Theta _{-i}\)を観察できない。入札者\(i\)による入札額\(\hat{\theta}_{i}\)は自身の真の評価額\(\theta _{i}\)と一致するとは限らない。
- 入札者たちによる入札額からなる組\(\hat{\theta}_{I}\in \Theta _{I}\)に対して、メカニズム\(\left( a,t\right) :\Theta _{I}\rightarrow A\times \mathbb{R} ^{n}\)が結果\(\left( a\left( \hat{\theta}_{I}\right),t\left( \hat{\theta}_{I}\right) \right) \in A\times \mathbb{R} ^{n}\)を定める。
- それぞれの入札者\(i\)は真の状態\(\theta _{I}\)にもとづく利得関数\(u_{i}\left( \cdot ,\theta_{I}\right) \)のもとで、メカニズムが定める結果\(\left(a\left( \hat{\theta}_{I}\right) ,t\left( \hat{\theta}_{I}\right) \right) \)を評価する。つまり、入札者\(i\)が得る利得は\(u_{i}\left( a\left( \hat{\theta}_{I}\right) ,t\left( \hat{\theta}_{I}\right) ,\theta _{I}\right) \)である。特に、準線型環境の場合には、\begin{equation*}u_{i}\left( a\left( \hat{\theta}_{I}\right) ,t\left( \hat{\theta}_{I}\right),\theta _{I}\right) =a_{i}\left( \hat{\theta}_{I}\right) \cdot \theta
_{i}-t_{i}\left( \hat{\theta}_{I}\right)
\end{equation*}となる。
入札者の純粋戦略
メカニズムのもとでのゲーム\(G\left( a,t\right) \)において、仮にすべての入札者が真の状態\(\theta _{I}\)を把握しており、なおかつそのことが共有知識であるならば、それぞれの入札者\(i\in I\)の利得関数が\(u_{i}\left( \cdot ,\theta_{I}\right) \)であることが確定するため、入札者たちが直面する戦略的状況はもはや不完備情報ゲームではなく、以下のような完備情報ゲーム\begin{equation*}G\left( a,t,\theta _{I}\right) =\left\{ I,\left\{ \Theta _{i}\right\} _{i\in
I},\left\{ u_{i}\left( \cdot ,\theta _{I}\right) \right\} _{i\in I}\right\}
\end{equation*}となります。ただし、\(I\)は入札者集合、\(\Theta_{i}\)は入札者\(i\)の行動集合、\(u_{i}\left( \cdot ,\theta _{I}\right) \)は入札者\(i\)の利得関数です。これを状態\(\theta _{I}\)のもとでの状態ゲームと呼ぶこととします。状態ゲーム\(G\left( a,t,\theta _{I}\right) \)は完備情報ゲームであるため、そこでの入札者の戦略とは、単純に、入札者が選択可能な行動の中から1つの行動を選ぶことを意味します。
ただ、実際にはゲーム\(G\left( a,t\right) \)において真の状態\(\theta _{I}\)を把握している入札者は存在せず、それぞれの入札者\(i\)は真の状態\(\theta _{I}\)に関する断片的な知識、すなわち自身のタイプの真の値\(\theta _{i}\)に関する情報しか持っていないため、入札者は複数の状態ゲームに直面し得る中で意思決定を行う必要があります。具体的には、入札者\(i\)のタイプの真の値が\(\theta _{i}\)である場合に直面し得る状態ゲームからなる集合は、\begin{equation}\left\{ G\left( a,t,\theta _{i},\theta _{-i}\right) \right\} _{\theta
_{-i}\in \Theta _{-i}} \quad \cdots (1)
\end{equation}です。しかも、それぞれの入札者\(i\)は自身が直面し得るそれぞれの状態ゲーム\(G\left( a,t,\theta_{i},\theta _{-i}\right) \)に対して、そこで選択する行動を個別に指定することはできません。なぜなら、入札者\(i\)は他の入札者たちのタイプ\(\theta _{-i}\)を観察できず、それゆえ自分が\(\left( 1\right) \)に属するどの状態ゲームをプレーしているかを判別できないからです。したがって、入札者\(i\)は特定の行動\(\hat{\theta}_{i}\)を事前に選び、その1つの行動のもとで、自分が直面し得る\(\left( 1\right) \)に属するすべての状態ゲームに備える必要があります。
入札者\(i\)は自身のタイプ\(\theta _{i}\)の真の値を知っているため、\(\theta _{i}\)の真の値のもとで直面し得る状態ゲームの集合\(\left( 1\right) \)に対してのみ1つの行動を定めればよいと考えるかもしれませんが、この考えは誤りです。他の入札者\(j\ \left( \not=i\right) \)の視点から考えてみると、入札者\(j\)にとっての最適な行動は入札者\(i\)の行動に依存するため、入札者\(j\)は入札者\(i\)の行動を予想しながら自身の行動を決定します。入札者\(i\)の行動は自身のタイプに依存しますが、入札者\(j\)は入札者\(i\)の真のタイプを知らない以上、\(\Theta _{i}\)に属するそれぞれのタイプごとに、そこでの入札者\(i\)の行動を予想した上で、その予想を踏まえた上で自身の行動を決定します。つまり、入札者\(j\)の行動は入札者\(i\)のそれぞれのタイプのもとでの行動に依存します。逆に、入札者\(i\)の最適な行動は入札者\(j\)の行動に依存しますが、入札者\(j\)の行動が入札者\(i\)のそれぞれのタイプのもとでの行動に依存する以上、入札者\(i\)が自身の最適な行動を考えるためには、入札者\(i\)は真のタイプとは限らない自身のそれぞれのタイプのもとで自分が何をするであろうか考える必要があります。つまり、入札者\(i\)は自身のタイプ集合\(\Theta _{i}\)に属するそれぞれの値\(\theta _{i}\)について、自分の真のタイプが\(\theta _{i}\)である場合に自分が選択するであろう行動をそれぞれ定める必要があります。
以上を踏まえると、メカニズム\(\left( a,t\right) \)のもとでのベイジアンゲーム\(G\left( a,t\right) \)においてそれぞれの入札者は、自身のそれぞれのタイプごとに自身が選択するであろう行動を包括的に定めておく必要があります。具体的には、ゲーム\(G\left( a,t\right) \)における入札者\(i\)の戦略は写像\begin{equation*}s_{i}:\Theta _{i}\rightarrow \Theta _{i}
\end{equation*}として定式化されます。この戦略\(s_{i}\)のもとで、入札者\(i\)は自分のタイプが\(\theta _{i}\in \Theta _{i}\)の場合には行動\(s_{i}\left( \theta_{i}\right) \in \Theta _{i}\)を選択します。言い換えると、自身のタイプが\(\theta _{i}\)である場合、戦略\(s_{i}\)のもとでは、入札者\(i\)は主催者に対して自身にとっての商品の評価額が\(s_{i}\left( \theta _{i}\right) \)であると入札するということです。このような行動計画\(s_{i}\)を入札者の純粋戦略(pure strategy)と呼びます。
すべての入札者の純粋戦略からなる組を、\begin{equation*}
s_{I}=\left( s_{i}\right) _{i\in I}
\end{equation*}で表記し、入札者\(i\)以外の入札者たちの純粋戦略からなる組を、\begin{equation*}s_{-i}=\left( s_{j}\right) _{j\in I\backslash \left\{ i\right\} }
\end{equation*}で表記します。\(s_{I}=\left(s_{i},s_{-i}\right) \)です。
入札者\(i\)が選択可能なすべての純粋戦略からなる集合を入札者\(i\)の戦略集合(strategy set)や戦略空間(strategy space)などと呼び、これを、\begin{equation*}S_{i}
\end{equation*}で表記します。すべての入札者の戦略集合の直積を、\begin{equation*}
S_{I}=\prod_{i\in I}S_{i}
\end{equation*}で表します。また、\begin{equation*}
S_{-i}=\prod_{j\in I\backslash \left\{ i\right\} }S_{j}
\end{equation*}とします。\(s_{I}\in S_{I}\)かつ\(s_{-i}\in S_{-i}\)です。
メカニズムのもとでのゲーム\(G\left( a,t\right) \)において入札者たちが純粋戦略\(s_{I}\)を選択した場合、以下の手順のもとでゲームが進行します。
- 自身にとっての真の評価額\(\theta _{i}\in \Theta _{i}\)を知っているが他のプレイヤーたちにとっての真の評価額\(\theta _{-i}\in \Theta _{-i}\)を知らないそれぞれの入札者\(i\in I\)は、自身の純粋戦略\(s_{i}\)が指定する評価額\(s_{i}\left( \theta _{i}\right) \)を入札する。その際、他の入札者たちによる入札額\(s_{-i}\left( \theta _{-i}\right) \)を観察できない。入札者\(i\)による入札額\(s_{i}\left( \theta _{i}\right) \)は自身にとっての真の評価額\(\theta _{i}\)と一致するとは限らない。
- 入札者たちによる入札額からなる組\(s_{I}\left(\theta _{I}\right) =\left( s_{i}\left( \theta _{i}\right) \right) _{i\in I}\in \Theta _{I}\)に対して、メカニズム\(\left( a,t\right) :\Theta _{I}\rightarrow A\times \mathbb{R} ^{n}\)が結果\(\left( a\left( s_{I}\left( \theta _{I}\right)\right) ,t\left( s_{I}\left( \theta _{I}\right) \right) \right) \in A\times \mathbb{R} ^{n}\)を定める。
- それぞれの入札者\(i\)は真の状態\(\theta _{I}\)における利得関数\(u_{i}\left( \cdot ,\theta_{I}\right) \)のもとで、メカニズムが定める結果\(\left(a\left( s_{I}\left( \theta _{I}\right) \right) ,t\left( s_{I}\left( \theta_{I}\right) \right) \right) \)を評価する。つまり、入札者\(i\)が得る利得は\(u_{i}\left( a\left( s_{I}\left( \theta_{I}\right) \right) ,t\left( s_{I}\left( \theta _{I}\right) \right) ,\theta _{I}\right) \)である。特に、準線型環境の場合には、\begin{equation*}u_{i}\left( a\left( s_{I}\left( \theta _{I}\right) \right) ,t\left(
s_{I}\left( \theta _{I}\right) \right) ,\theta _{I}\right) =a_{i}\left(
s_{I}\left( \theta _{I}\right) \right) \cdot \theta _{i}-t_{i}\left(
s_{I}\left( \theta _{I}\right) \right)
\end{equation*}となる。
I=\left\{ 1,2,3\right\}
\end{equation*}であるとともに、入札者たちにとっての商品の評価額が、\begin{equation*}
\theta _{I}=\left( \theta _{1},\theta _{2},\theta _{3}\right) =\left(
10,11,7\right)
\end{equation*}であるものとします。メカニズム\(\left( a,t\right) \)が「最高金額を入札した者を勝者にし、勝者が自身の入札額に等しい金額を支払う」というものであるものとします。以上のメカニズム\(\left( a,t\right) \)に直面した任意の入札者\(i\in I\)が「評価額を正直に入札する」という純粋戦略\(s_{i}\)にもとづいて入札するのであれば、入札額からなる組は、\begin{eqnarray*}s_{I}\left( \theta _{I}\right) &=&\left( s_{1}\left( \theta _{1}\right)
,s_{2}\left( \theta _{2}\right) ,s_{3}\left( \theta _{3}\right) \right) \\
&=&\left( \theta _{1},\theta _{2},\theta _{3}\right) \quad \because s_{i}\text{の定義} \\
&=&\left( 10,11,7\right)
\end{eqnarray*}となるため、これに対してメカニズム\(\left(a,t\right) \)が定める結果は、\begin{eqnarray*}&&\left( a_{I}\left( s_{I}\left( \theta _{I}\right) \right) ,t_{I}\left(
s_{I}\left( \theta _{I}\right) \right) \right) \\
&=&\left( a_{1}\left( s_{I}\left( \theta _{I}\right) \right) ,a_{2}\left(
s_{I}\left( \theta _{I}\right) \right) ,a_{3}\left( s_{I}\left( \theta
_{I}\right) \right) ,t_{1}\left( s_{I}\left( \theta _{I}\right) \right)
,t_{2}\left( s_{I}\left( \theta _{I}\right) \right) ,t_{3}\left( s_{I}\left(
\theta _{I}\right) \right) \right) \\
&=&\left( 0,1,0,0,11,0\right)
\end{eqnarray*}となります。準線型環境であるならば、以上の結果においてそれぞれの入札者が得る利得は、\begin{eqnarray*}
u_{1}\left( a_{I}\left( s_{I}\left( \theta _{I}\right) \right) ,t_{I}\left(
s_{I}\left( \theta _{I}\right) \right) ,\theta _{I}\right) &=&a_{1}\left(
s_{I}\left( \theta _{I}\right) \right) \cdot \theta _{1}-t_{1}\left(
s_{I}\left( \theta _{I}\right) \right) =0\cdot 10-0=0 \\
u_{2}\left( a_{I}\left( s_{I}\left( \theta _{I}\right) \right) ,t_{I}\left(
s_{I}\left( \theta _{I}\right) \right) ,\theta _{I}\right) &=&a_{2}\left(
s_{I}\left( \theta _{I}\right) \right) \cdot \theta _{2}-t_{2}\left(
s_{I}\left( \theta _{I}\right) \right) =1\cdot 11-11=0 \\
u_{3}\left( a_{I}\left( s_{I}\left( \theta _{I}\right) \right) ,t_{I}\left(
s_{I}\left( \theta _{I}\right) \right) ,\theta _{I}\right) &=&a_{3}\left(
s_{I}\left( \theta _{I}\right) \right) \cdot \theta _{3}-t_{3}\left(
s_{I}\left( \theta _{I}\right) \right) =0\cdot 7-0=0
\end{eqnarray*}となります。一方、任意の入札者\(i\)が「真の評価額の半分の額を入札する」という純粋戦略\(s_{i}\)にもとづいて入札するのであれば、入札額からなる組は、\begin{eqnarray*}s_{I}\left( \theta _{I}\right) &=&\left( s_{1}\left( \theta _{1}\right)
,s_{2}\left( \theta _{2}\right) ,s_{3}\left( \theta _{3}\right) \right) \\
&=&\left( \frac{\theta _{1}}{2},\frac{\theta _{2}}{2},\frac{\theta _{3}}{2}\right) \quad \because s_{i}\text{の定義} \\
&=&\left( \frac{10}{2},\frac{11}{2},\frac{7}{2}\right)
\end{eqnarray*}であるため、これに対してメカニズム\(\left(a,t\right) \)が定める結果は、\begin{eqnarray*}&&\left( a_{I}\left( s_{I}\left( \theta _{I}\right) \right) ,t_{I}\left(
s_{I}\left( \theta _{I}\right) \right) \right) \\
&=&\left( a_{1}\left( s_{I}\left( \theta _{I}\right) \right) ,a_{2}\left(
s_{I}\left( \theta _{I}\right) \right) ,a_{3}\left( s_{I}\left( \theta
_{I}\right) \right) ,t_{1}\left( s_{I}\left( \theta _{I}\right) \right)
,t_{2}\left( s_{I}\left( \theta _{I}\right) \right) ,t_{3}\left( s_{I}\left(
\theta _{I}\right) \right) \right) \\
&=&\left( 0,1,0,0,\frac{11}{2},0\right)
\end{eqnarray*}となります。準線型環境であるならば、以上の結果においてそれぞれの入札者が得る利得は、\begin{eqnarray*}
u_{1}\left( a_{I}\left( s_{I}\left( \theta _{I}\right) \right) ,t_{I}\left(
s_{I}\left( \theta _{I}\right) \right) ,\theta _{I}\right) &=&a_{1}\left(
s_{I}\left( \theta _{I}\right) \right) \cdot \theta _{1}-t_{1}\left(
s_{I}\left( \theta _{I}\right) \right) =0\cdot 10-0=0 \\
u_{2}\left( a_{I}\left( s_{I}\left( \theta _{I}\right) \right) ,t_{I}\left(
s_{I}\left( \theta _{I}\right) \right) ,\theta _{I}\right) &=&a_{2}\left(
s_{I}\left( \theta _{I}\right) \right) \cdot \theta _{2}-t_{2}\left(
s_{I}\left( \theta _{I}\right) \right) =1\cdot 11-\frac{11}{2}=\frac{11}{2}
\\
u_{3}\left( a_{I}\left( s_{I}\left( \theta _{I}\right) \right) ,t_{I}\left(
s_{I}\left( \theta _{I}\right) \right) ,\theta _{I}\right) &=&a_{3}\left(
s_{I}\left( \theta _{I}\right) \right) \cdot \theta _{3}-t_{3}\left(
s_{I}\left( \theta _{I}\right) \right) =0\cdot 7-0=0
\end{eqnarray*}となります。
入札者の信念
メカニズム\(\left( a,t\right) \)に直面した入札者\(i\)のタイプが\(\theta _{i}\)である場合、彼が直面し得る状態ゲームからなる集合は\(\left\{ G\left( a,t,\theta _{i},\theta _{-i}\right) \right\}_{\theta _{-i}\in \Theta _{-i}}\)です。入札者\(i\)は自身のタイプ\(\theta_{i}\)を観察できますが、他の入札者たちのタイプ\(\theta _{-i}\)は観察できないため、自分のタイプが\(\theta _{i}\)の場合に\(\left\{ G\left( a,t,\theta _{i},\theta _{-i}\right) \right\} _{\theta_{-i}\in \Theta _{-i}}\)の中のどの状態ゲームを実際にプレーすることになるか識別できません。入札者\(i\)が純粋戦略\(s_{i}\)を選ぶこととは、自身のそれぞれのタイプ\(\theta _{i}\)に対して特定の行動\(s_{i}\left( \theta _{i}\right) \)を1つずつ事前に選び、その行動のもとで自分が直面し得る\(\left\{ G\left( a,t,\theta_{i},\theta _{-i}\right) \right\} _{\theta _{-i}\in \Theta _{-i}}\)に属するすべての状態ゲームに備えることを意味します。
こうした不確実な状況下で意思決定を迫られる入札者\(i\)は、自身のそれぞれのタイプ\(\theta _{i}\)に対して、\(\left\{G\left( a,t,\theta _{i},\theta _{-i}\right) \right\} _{\theta _{-i}\in
\Theta _{-i}}\)に属する状態ゲームがそれぞれどの程度の確率で起こり得るかを主観的に予想した上で、その予想にもとづいて意思決定を行うものとします。\(\left\{ G\left( a,t,\theta _{i},\theta _{-i}\right)\right\} _{\theta _{-i}\in \Theta _{-i}}\)に属するそれぞれの状態ゲームの発生確率を定めることは、\(\Theta _{-i}\)に属するそれぞれの値\(\theta_{-i} \)の発生確率を予想することと等しいため、入札者\(i\)のタイプの値が\(\theta _{i}\)であるときに抱く主観的な予想は、他の入札者たちのタイプ\(\theta _{-i}\)を確率変数とみなした場合の同時確率分布として表現されます。具体的には、入札者たちのタイプ集合が数直線\(\mathbb{R} \)上の区間のような非可算集合であるとともに入札者の総数が\(n\)である場合、入札者\(i\)が抱く予想は確率変数\(\theta _{-i}\)の確率分布を記述する同時確率密度関数\begin{equation*}f_{i}:\mathbb{R} ^{n-1}\rightarrow \mathbb{R} \end{equation*}として定式化されます。また、これに対応する同時分布関数を、\begin{equation*}
F_{i}:\mathbb{R} ^{n-1}\rightarrow \mathbb{R} \end{equation*}で表記します。
ただし、入札者\(i\)が持つ私的情報\(\theta _{i}\)の中には、他の入札者たちのタイプ\(\theta _{-i}\)を予想する上で参考になる情報が含まれている可能性があります。そのような場合には、入札者\(i\)は\(\theta _{i}\)に含まれるそのような情報を参照しながら\(\theta_{-i} \)の確率分布を予想できるため、一般的には、入札者\(i\)が自身のタイプの値が\(\theta _{i}\)であるときに設定する主観的確率は、入札者の総数が\(n\)である場合、条件付きの同時確率密度関数\begin{equation*}f_{i}\left( \cdot |\theta _{i}\right) :\mathbb{R} ^{n-1}\rightarrow \mathbb{R} \end{equation*}として定式化すべきです。また、これに対応する条件付きの同時分布関数を、\begin{equation*}
F_{i}\left( \cdot |\theta _{i}\right) :\mathbb{R} ^{n-1}\rightarrow \mathbb{R} \end{equation*}で表記します。以上のような条件付きの確率分布\(f_{i}\left( \cdot |\theta _{i}\right) \)をタイプ\(\theta _{i}\)の入札者\(i\)の信念(belief)と呼びます。\(f_{i}\left( \cdot|\theta _{i}\right) \)は入札者\(i\)の主観的な予想であるため、これは入札者\(i\)の私的情報であり、入札者たちの共有知識ではありません。
繰り返しになりますが、メカニズムのもとでのゲーム\(G\left( a,t\right) \)において、それぞれの入札者\(i\)は自身のタイプ\(\theta _{i}\)の真の値のもとでの行動を考えるだけでなく、真の値とは限らないそれぞれの値に対しても、その場合に自分が選ぶであろう行動を考える必要があります。したがって、信念についても同様に、自身のタイプ\(\theta _{i}\)の真の値のもとでの信念だけでなく、真の値とは限らないそれぞれの値に対しても、その場合に自分が抱くであろう信念をそれぞれ考えておく必要があります。つまり、ベイジアンゲーム\(G\left( a,t\right) \)において入札者\(i\)が意思決定を行うためには、自身のタイプのそれぞれの値\(\theta_{i}\in \Theta _{i}\)のもとでの信念からなる体系\begin{equation*}f_{i}=\{f_{i}\left( \cdot |\theta _{i}\right) \}_{\theta _{i}\in \Theta _{i}}
\end{equation*}が必要です。信念として分布関数を採用する場合、信念の体系を、\begin{equation*}
F_{i}=\{F_{i}\left( \cdot |\theta _{i}\right) \}_{\theta _{i}\in \Theta _{i}}
\end{equation*}で表記します。これを入札者\(i\)の信念(belief)と呼びます。タイプ\(\theta _{i}\)の入札者\(i\)の信念\(f_{i}\left( \cdot |\theta _{i}\right) \)が入札者\(i\)の私的情報である以上、入札者\(i\)の信念\(f_{i}\)もまた入札者\(i\)の私的情報です。
I=\left\{ 1,2\right\}
\end{equation*}であるとともに、入札者たちのタイプ集合が、\begin{equation*}
\Theta _{1}=\Theta _{2}=\left[ 0,100\right] \end{equation*}であるものとします。タイプ\(\theta _{1}\)の入札者\(1\)は、相手のタイプ\(\theta_{2}\)がタイプ集合\(\Theta _{2}=\left[0,100\right] \)上の連続一様分布にしたがって分布しているものと予想するのであれば、その予想は、それぞれの\(\theta _{2}\in \mathbb{R} \)に対して、\begin{equation*}f_{1}\left( \theta _{2}|\theta _{1}\right) =\left\{
\begin{array}{cl}
\frac{1}{100} & \left( if\ 0\leq \theta _{2}\leq 100\right) \\
0 & \left( otherwise\right)\end{array}\right.
\end{equation*}を定める信念\(f_{1}\left( \cdot |\theta_{1}\right) :\mathbb{R} \rightarrow \mathbb{R} \)として定式化されます。タイプ\(\theta _{2}\)の入札者\(2\)は、相手のタイプ\(\theta _{1}\)が自身のタイプ\(\theta_{2}\)以下の範囲\(\left[ 0,\theta _{2}\right] \)で連続一様分布にしたがって分布しているものと予想するのであれば、その予想は、それぞれの\(\theta _{1}\in \mathbb{R} \)に対して、\begin{equation*}f_{2}\left( \theta _{1}|\theta _{2}\right) =\left\{
\begin{array}{cl}
\frac{1}{\theta _{2}} & \left( if\ 0\leq \theta _{1}\leq \theta _{2}\right)
\\
0 & \left( otherwise\right)\end{array}\right.
\end{equation*}を定める信念\(f_{2}\left( \cdot |\theta_{2}\right) :\mathbb{R} \rightarrow \mathbb{R} \)として定式化されます。
入札者の中間期待利得とベイジアン仮説
メカニズムのもとでのゲーム\(G\left( a,t\right) \)において入札者\(i\)は自身のタイプ\(\theta _{i}\)を観察できますが、他の入札者たちのタイプ\(\theta _{-i}\)を観察できないため、自分のタイプが\(\theta _{i}\)の場合に\(\left\{ G\left( a,t,\theta _{i},\theta _{-i}\right)\right\} _{\theta _{-i}\in \Theta _{-i}}\)の中のどの状態ゲームを実際にプレーすることになるか識別できません。入札者\(i\)が純粋戦略\(s_{i}:\Theta _{i}\rightarrow \Theta _{i}\)を選ぶこととは、自身のそれぞれのタイプ\(\theta _{i}\)に対して特定の行動\(s_{i}\left(\theta _{i}\right) \)を1つずつ事前に選び、その行動のもとで自分が直面し得る\(\left\{ G\left( a,t,\theta _{i},\theta _{-i}\right) \right\}_{\theta _{-i}\in \Theta _{-i}}\)に属するすべての状態ゲームに備えることを意味します。では、入札者\(i\)は何を基準に最適な純粋戦略を選べばよいのでしょうか。順番に考えます。
まずは、ベイジアンゲーム\(G\left( a,t\right) \)において入札者\(i\)が観察可能な情報を整理しましょう。入札者\(i\)は自身のタイプ\(\theta _{i}\)を観察できます。また、任意の入札者のタイプ集合と行動集合は共有知識であるため、写像\(s_{j}:\Theta _{j}\rightarrow \Theta _{j}\)として定義される他の任意の入札者\(j\ \left( \not=i\right) \)の任意の純粋戦略\(s_{j}\)は共有知識です。したがって、入札者\(i\)にとって、他の入札者たちの純粋戦略の組からなる集合\(S_{-i}\)や、他の入札者たちのタイプ集合\(\Theta _{-i}\)は観察可能です。
入札者\(i\)のタイプが\(\theta_{i}\)であるとともに、他の入札者たちのタイプ\(\theta _{-i}\)と彼らが選ぶ純粋戦略\(s_{-i}\)を所与としたとき、自身の純粋戦略\(s_{i}\)がもたらす利得をどのように計算すればよいでしょうか。この場合、入札者たちによる入札額からなる組は、\begin{equation*}s_{I}\left( \theta _{I}\right) =\left( s_{i}\left( \theta _{i}\right)
,s_{-i}\left( \theta _{-i}\right) \right) \in \Theta _{I}
\end{equation*}であり、これに対してメカニズム\(\left( a,t\right) \)は結果\begin{equation*}\left( a\left( s_{I}\left( \theta _{I}\right) \right) ,t\left( s_{I}\left(
\theta _{I}\right) \right) \right) \in A\times \mathbb{R} ^{n}
\end{equation*}を定めます。この状態\(\theta _{I}=\left( \theta _{i},\theta _{-i}\right) \)における入札者\(i\)の利得関数は\(u_{i}\left( \cdot ,\cdot ,\theta _{I}\right) :A\times \mathbb{R} ^{n}\rightarrow \mathbb{R} \)であるため、以上の結果から入札者\(i\)が得る利得は、\begin{equation*}u_{i}\left( a\left( s_{I}\left( \theta _{I}\right) \right) ,t\left(
s_{I}\left( \theta _{I}\right) \right) ,\theta _{I}\right) \in \mathbb{R} \end{equation*}となります。繰り返しになりますが、この利得はタイプ\(\theta _{i}\)の入札者\(i\)が純粋戦略\(s_{i}\)を選んだときに、他の入札者たちのタイプが\(\theta _{-i}\)であるとともに彼らが選ぶ純粋戦略が\(s_{-i}\)であるという前提のもと、入札者\(i\)が得る利得に相当します。言い換えると、これは状態ゲーム\(G\left( a,t,\theta _{i},\theta _{-i}\right) \)において純粋戦略の組\(\left(s_{i},s_{-i}\right) \)が入札者\(i\)にもたらす利得に相当します。
タイプ\(\theta _{i}\)の入札者\(i\)は他の入札者たちのタイプ\(\theta _{-i}\)の真の値を知りませんが、\(\theta _{-i}\)がとり得る値の集合\(\Theta _{-i}\)を把握しているため、\(\Theta _{-i}\)に属するそれぞれの\(\theta _{-i}\)に対して先の利得\(u_{i}\left( a\left( s_{I}\left(\theta _{I}\right) \right) ,t\left( s_{I}\left( \theta _{I}\right) \right),\theta _{I}\right) \)を計算できます。さらに、\(\theta _{-i}\)がしたがう分布の予想を、タイプ\(\theta _{i}\)のもとでの信念\(f_{i}\left( \cdot |\theta _{i}\right) :\Theta_{-i}\rightarrow \mathbb{R} \)として主観的に形成しているため、結局、タイプ\(\theta _{i}\)の入札者\(i\)が純粋戦略の組\(s_{I}=\left(s_{i},s_{-i}\right) \)から得る利得の期待値を計算できます。具体的には、タイプ\(\theta _{i}\)の入札者\(i\)が純粋戦略の組\(s_{I}\)から得る利得の期待値は、タイプ\(\theta _{i}\)の入札者\(i\)の信念\(f_{i}\left( \cdot |\theta _{i}\right) \)のもとでは、\begin{equation*}\int_{\theta _{-i}\in \Theta _{-i}}\left[ u_{i}\left( a\left( s_{I}\left(
\theta _{I}\right) \right) ,t\left( s_{I}\left( \theta _{I}\right) \right)
,\theta _{I}\right) \cdot f_{i}\left( \theta _{-i}|\theta _{i}\right) \right]
d\theta _{-i}
\end{equation*}として導出されます。この値は、ベイジアンゲーム\(G\left( a,t\right) \)においてタイプ\(\theta _{i}\)の入札者\(i\)が純粋戦略\(s_{i}\)を選んだときに、他の入札者たちが選ぶ純粋戦略が\(s_{-i}\)であるという前提のもとで、入札者\(i\)が得る利得の期待値に相当します。これを、タイプ\(\theta _{i}\)の入札者\(i\)が純粋戦略の組\(s_{I}\)のもとで直面する中間期待利得(interim expected payoff)や条件付き期待利得などと呼び、\begin{equation*}E_{\theta _{-i}}\left[ u_{i}\left( a\left( s_{I}\left( \theta _{I}\right)
\right) ,t\left( s_{I}\left( \theta _{I}\right) \right) ,\theta _{I}\right)
\ |\ \theta _{i}\right]
\end{equation*}で表記します。
I=\left\{ 1,2\right\}
\end{equation*}であるとともに、入札者たちのタイプ集合が、\begin{equation*}
\Theta _{1}=\Theta _{2}=\left[ 0,100\right] \end{equation*}であるものとします。タイプ\(\theta _{1}\)の入札者\(1\)の信念\(f_{1}\left( \cdot |\theta _{1}\right) :\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(\theta _{2}\in \mathbb{R} \)に対して、\begin{equation*}f_{1}\left( \theta _{2}|\theta _{1}\right) =\left\{
\begin{array}{cl}
\frac{1}{100} & \left( if\ 0\leq \theta _{2}\leq 100\right) \\
0 & \left( otherwise\right)
\end{array}\right.
\end{equation*}を定めるものとします。メカニズム\(\left( a,t\right) \)が「最高金額を入札した者を勝者にし、勝者が自身の入札額に等しい金額を支払う」というものであるものとします。タイプ\(\theta _{1}\)の入札者\(1\)が以上の信念\(f_{1}\left( \cdot ,\theta_{1}\right) \)と純粋戦略の組\(\left(s_{1},s_{2}\right) \)のもとで直面する中間期待利得は、準線型環境の場合には、\begin{eqnarray*}&&E_{\theta _{2}}\left[ u_{1}\left( a\left( s_{1}\left( \theta _{1}\right)
,s_{2}\left( \theta _{2}\right) \right) ,t\left( s_{1}\left( \theta
_{1}\right) ,s_{2}\left( \theta _{2}\right) \right) ,\theta _{I}\right) \ |\
\theta _{1}\right] \\
&=&E_{\theta _{2}}\left[ \theta _{1}\cdot a_{1}\left( s_{1}\left( \theta
_{1}\right) ,s_{2}\left( \theta _{2}\right) \right) -t_{1}\left( s_{1}\left(
\theta _{1}\right) ,s_{2}\left( \theta _{2}\right) \right) \ |\ \theta _{1}\right] \quad \because \text{準線型環境} \\
&=&\int_{\theta _{2}\in \Theta _{2}}\left[ \theta _{1}\cdot a_{1}\left(
s_{1}\left( \theta _{1}\right) ,s_{2}\left( \theta _{2}\right) \right)
-t_{1}\left( s_{1}\left( \theta _{1}\right) ,s_{2}\left( \theta _{2}\right)
\right) \right] \cdot f_{1}\left( \theta _{2}|\theta _{1}\right) d\theta
_{2}\quad \because \text{中間期待利得の定義} \\
&=&\int_{0}^{100}\left[ \theta _{1}\cdot a_{1}\left( s_{1}\left( \theta
_{1}\right) ,s_{2}\left( \theta _{2}\right) \right) -t_{1}\left( s_{1}\left(
\theta _{1}\right) ,s_{2}\left( \theta _{2}\right) \right) \right] \cdot
\frac{1}{100}d\theta _{2}\quad \because \Theta _{2}\text{および}f_{1}\left( \cdot |\theta _{1}\right) \text{の定義} \\
&=&\frac{\theta _{1}}{100}\int_{0}^{100}a_{1}\left( s_{1}\left( \theta
_{1}\right) ,s_{2}\left( \theta _{2}\right) \right) d\theta _{2}-\frac{1}{100}\int_{0}^{100}t_{1}\left( s_{1}\left( \theta _{1}\right) ,s_{2}\left(
\theta _{2}\right) \right) d\theta _{2} \\
&=&\frac{\theta _{1}}{100}\int_{0}^{s_{1}\left( \theta _{1}\right) }1d\theta
_{2}-\frac{1}{100}\int_{0}^{s_{1}\left( \theta _{1}\right) }s_{1}\left(
\theta _{1}\right) d\theta _{2}\quad \because \left( a,t\right) \text{の定義} \\
&=&\frac{\theta _{1}}{100}\cdot s_{1}\left( \theta _{1}\right) -\frac{\left[
s_{1}\left( \theta _{1}\right) \right] ^{2}}{100}
\end{eqnarray*}となります。特に、純粋戦略\(s_{1}\)が「自身の評価額を正直に入札する」というものであるならば、\begin{eqnarray*}E_{\theta _{2}}\left[ u_{1}\left( a\left( s_{1}\left( \theta _{1}\right)
,s_{2}\left( \theta _{2}\right) \right) ,t\left( s_{1}\left( \theta
_{1}\right) ,s_{2}\left( \theta _{2}\right) \right) ,\theta _{I}\right) \ |\
\theta _{1}\right] &=&\frac{\theta _{1}}{100}\cdot s_{1}\left( \theta
_{1}\right) -\frac{\left[ s_{1}\left( \theta _{1}\right) \right] ^{2}}{100}
\\
&=&\frac{\theta _{1}}{100}\cdot \theta _{1}-\frac{\theta _{1}^{2}}{100}\quad
\because s_{1}\text{の定義} \\
&=&0
\end{eqnarray*}となります。
メカニズム\(\left( a,t\right) \)のもとで入札者たちが直面する戦略的状況をベイジアンゲーム\(G\left(a,t\right) \)として定式化しました。このゲームにおいてそれぞれの入札者は自身のタイプを知っていますが、他の入札者たちのタイプを事前に観察できません。このような不確実性下での意思決定に際して、それぞれの入札者\(i\)は自身のタイプ\(\theta _{i}\)と信念\(f_{i}\)にもとづいて他の入札者たちのタイプ\(\theta _{-i}\)を予想し、その予想から算出される中間期待利得を最大化するような純粋戦略を採用するものと仮定します。このような仮定をベイジアン仮説(Bayesian hypothesis)と呼びます。
ベイジアンナッシュ均衡
メカニズムのもとでのゲーム\(G\left( a,t\right) \)において、入札者\(i\)が他の入札者たちの純粋戦略\(s_{-i}\)に直面した状況を想定します。それに対して入札者\(i\)が純粋戦略\(s_{i}\)を選ぶ場合、信念\(f_{i}\left( \cdot |\theta _{i}\right) \)を持つタイプ\(\theta _{i}\)の入札者\(i\)が直面する中間期待利得は、\begin{eqnarray*}&&E_{\theta _{-i}}\left[ u_{i}\left( a\left( s_{i}\left( \theta _{i}\right)
,s_{-i}\left( \theta _{-i}\right) \right) ,t\left( s_{i}\left( \theta
_{i}\right) ,s_{-i}\left( \theta _{-i}\right) \right) ,\theta _{I}\right) \
|\ \theta _{i}\right] \\
&=&\int_{\theta _{-i}\in \Theta _{-i}}\left[ u_{i}\left( a\left( s_{i}\left(
\theta _{i}\right) ,s_{-i}\left( \theta _{-i}\right) \right) ,t\left(
s_{i}\left( \theta _{i}\right) ,s_{-i}\left( \theta _{-i}\right) \right)
,\theta _{I}\right) \cdot f_{i}\left( \theta _{-i}|\theta _{i}\right) \right]
d\theta _{-i}
\end{eqnarray*}となります。入札者\(i\)のタイプ\(\theta _{i}\)が変われば先の純粋戦略\(s_{i}\)のもとで自身が選ぶ入札額\(s_{i}\left( \theta _{i}\right) \)が変わり、自身のタイプにもとづく信念\(f_{i}\left( \cdot |\theta_{i}\right) \)も変わるため、入札者\(i\)が直面する中間期待利得もまた変化します。ただ、他の入札者たちが\(s_{-i}\)を選ぶという前提のもとで自身は\(s_{i}\)を選ぶ場合、自身のタイプ\(\theta _{i}\)によらず、自身の信念\(f_{i}\)のもとで中間期待利得を常に最大化できる場合には、すなわち、自身のタイプ\(\theta _{i}\in \Theta _{i}\)と入札額\(\hat{\theta}_{i}\in \Theta _{i}\)をそれぞれ任意に選んだときに、\begin{eqnarray*}&&E_{\theta _{-i}}\left[ u_{i}\left( a\left( s_{i}\left( \theta _{i}\right)
,s_{-i}\left( \theta _{-i}\right) \right) ,t\left( s_{i}\left( \theta
_{i}\right) ,s_{-i}\left( \theta _{-i}\right) \right) ,\theta _{I}\right) \
|\ \theta _{i}\right] \\
&\geq &E_{\theta _{-i}}\left[ u_{i}\left( a\left( \hat{\theta}_{i},s_{-i}\left( \theta _{-i}\right) \right) ,t\left( \hat{\theta}_{i},s_{-i}\left( \theta _{-i}\right) \right) ,\theta _{I}\right) \ |\
\theta _{i}\right]
\end{eqnarray*}が成り立つ場合には、\(s_{i}\)を\(s_{-i}\)に対する中間最適反応(interim best response)と呼びます。
つまり、メカニズムのもとでのゲーム\(G\left(a,t\right) \)において入札者\(i\)の純粋戦略\(s_{i}\)が他の入札者たちの純粋戦略\(s_{-i}\)に対する中間最適反応であることとは、他の入札者たちが\(s_{-i}\)にしたがって入札することを前提とした場合、さらに自身が主観的に形成する信念\(f_{i}\)にもとづいて他の入札者たちのタイプを予想する場合、自分は\(s_{i}\)にしたがって入札すれば、自身のタイプ\(\theta _{i}\)によらず、自身が直面する中間期待利得を常に最大化できることを意味します。
入札者\(i\)の中間最適反応は、他のプレイヤーたちの純粋戦略に依存して変化します。つまり、ある\(s_{-i}\)に対する入札者\(i\)の中間最適反応が\(s_{i}\)であるとき、\(s_{-i}\)とは別の\(s_{-i}^{\prime }\)に対する入札者\(i\)の中間最適反応は\(s_{i}\)であるとは限りません。
入札者\(i\)の中間最適反応は自身が主観的に形成する信念に依存して変化します。つまり、ある信念\(f_{i}\)のもとでは\(s_{-i}\)に対する中間最適反応が\(s_{i}\)であるとき、別の信念\(f_{i}^{\prime }\)のもとでは\(s_{-i}\)に対する中間最適反応は\(s_{i}\)であるとは限りません。ただ、ベイジアンゲームの定義において、入札者たちが信念を形成する際の主観が具体的にどのようなものであるかが記述されていません。入札者はいかなる信念をも形成することができます。ただ、合理的なプレイヤーは自身の中間期待利得を最大化することを踏まえると、それぞれの入札者は自身が形成し得る様々な信念の中でも自分が中間期待利得を最大化する上で最も有効な信念を探そうとするものと考えるのは自然です。さらに、ゲームにおいて入札者たちは相互依存関係に直面している以上、それぞれの入札者が自身の信念を選ぶプロセスにおいて、入札者たちが互いの信念を読み合う状況が発生することが容易に予期されます。しかし、このような読み合いが行われることを許容すると、ベイジアンゲームの分析が突如として複雑になってしまいます。この点に関する詳しい議論は場を改めて行いますが、現段階では、ベイジアンゲームにおける信念が分析家たちにとって所与である状況を想定します。つまり、それぞれの入札者がある特定の信念を形成したとき、その根拠や正当性については深く立ち入らないことにします。
繰り返しになりますが、メカニズムのもとでのゲーム\(\left( a,t\right) \)において入札者\(i\)の純粋戦略\(s_{i}^{\ast }\)が他の入札者たちの純粋戦略\(s_{-i}\)に対する中間最適反応であることは、自身の信念\(f_{i}\)を前提とした上で自身のタイプ\(\theta _{i}\in \Theta _{i}\)と入札額\(\hat{\theta}_{i}\in \Theta _{i}\)をそれぞれ任意に選んだときに、\begin{eqnarray*}&&E_{\theta _{-i}}\left[ u_{i}\left( a\left( s_{i}^{\ast }\left( \theta
_{i}\right) ,s_{-i}\left( \theta _{-i}\right) \right) ,t\left( s_{i}^{\ast
}\left( \theta _{i}\right) ,s_{-i}\left( \theta _{-i}\right) \right) ,\theta
_{I}\right) \ |\ \theta _{i}\right] \\
&\geq &E_{\theta _{-i}}\left[ u_{i}\left( a\left( \hat{\theta}_{i},s_{-i}\left( \theta _{-i}\right) \right) ,t\left( \hat{\theta}_{i},s_{-i}\left( \theta _{-i}\right) \right) ,\theta _{I}\right) \ |\
\theta _{i}\right]
\end{eqnarray*}が成り立つことを意味します。さて、入札者たちの純粋戦略の組\(s_{I}^{\ast }=\left( s_{i}^{\ast }\right) _{i\in I}\)において、任意の入札者\(i\)の純粋戦略\(s_{i}^{\ast }\)が他の入札者たちの純粋戦略\(s_{-i}^{\ast }\)に対する中間最適反応になっているならば、すなわち、全員の信念\(\left\{f_{i}\right\} _{i\in I}\)を前提とした上で、任意の入札者\(i\in I\)およびその任意のタイプ\(\theta _{i}\in \Theta _{i}\)と任意の入札額\(\hat{\theta}_{i}\in \Theta _{i}\)に対して、\begin{eqnarray*}&&E_{\theta _{-i}}\left[ u_{i}\left( a\left( s_{i}^{\ast }\left( \theta
_{i}\right) ,s_{-i}^{\ast }\left( \theta _{-i}\right) \right) ,t\left(
s_{i}^{\ast }\left( \theta _{i}\right) ,s_{-i}^{\ast }\left( \theta
_{-i}\right) \right) ,\theta _{I}\right) \ |\ \theta _{i}\right] \\
&\geq &E_{\theta _{-i}}\left[ u_{i}\left( a\left( \hat{\theta}_{i},s_{-i}^{\ast }\left( \theta _{-i}\right) \right) ,t\left( \hat{\theta}_{i},s_{-i}^{\ast }\left( \theta _{-i}\right) \right) ,\theta _{I}\right) \
|\ \theta _{i}\right]
\end{eqnarray*}が成り立つならば、\(s_{I}^{\ast }\)をベイジアンナッシュ均衡(Bayesian Nash equilibrium)や中間ベイジアンナッシュ均衡(interim Bayesian Nash equilibrium)などと呼びます。
メカニズムのもとでのゲーム\(\left( a,t\right) \)において純粋戦略の組\(s_{I}^{\ast }\)がベイジアンナッシュ均衡であるものとします。入札者\(i\)とそのタイプ\(\theta _{i}\)を任意に選んだ上で、他のすべての入札者が均衡戦略\(s_{-i}^{\ast }\)にしたがって入札することを前提とするとき、入札者\(i\)だけが均衡戦略\(s_{i}^{\ast }\)から逸脱して他の純粋戦略\(s_{i}\)を選ぶと、ベイジアンナッシュ均衡の定義より、\begin{eqnarray*}&&E_{\theta _{-i}}\left[ u_{i}\left( a\left( s_{i}^{\ast }\left( \theta
_{i}\right) ,s_{-i}^{\ast }\left( \theta _{-i}\right) \right) ,t\left(
s_{i}^{\ast }\left( \theta _{i}\right) ,s_{-i}^{\ast }\left( \theta
_{-i}\right) \right) ,\theta _{I}\right) \ |\ \theta _{i}\right] \\
&\geq &E_{\theta _{-i}}\left[ u_{i}\left( a\left( s_{i}\left( \theta
_{i}\right) ,s_{-i}^{\ast }\left( \theta _{-i}\right) \right) ,t\left(
s_{i}\left( \theta _{i}\right) ,s_{-i}^{\ast }\left( \theta _{-i}\right)
\right) ,\theta _{I}\right) \ |\ \theta _{i}\right]
\end{eqnarray*}という関係が成り立つため、タイプ\(\theta _{i}\)の入札者\(i\)はそのような逸脱から得できる可能性はありません。同様の議論は任意の入札者とその任意のタイプについて成り立ちます。つまり、入札者たちがベイジアンナッシュ均衡\(s_{i}^{\ast}\)をプレーしているとき、それぞれの入札者\(i\)は自身のタイプ\(\theta_{i}\)に関わらず、他の入札者たちが均衡戦略\(s_{-i}^{\ast }\)にしたがう限りにおいて、自分は均衡戦略\(s_{i}^{\ast }\)から逸脱しても得できません。ベイジアンナッシュ均衡では入札者たちの戦略がお互いに中間最適戦略になっているため、誰もそこから逸脱する動機を持たないということです。
I=\left\{ 1,2\right\}
\end{equation*}であるとともに、入札者たちのタイプ集合が、\begin{equation*}
\Theta _{1}=\Theta _{2}=\left[ 0,100\right] \end{equation*}であるものとします。準線型環境を想定します。タイプ\(\theta _{1}\)の入札者\(1\)の信念\(f_{1}\left( \cdot|\theta _{1}\right) :\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(\theta _{2}\in \mathbb{R} \)に対して、\begin{equation*}f_{1}\left( \theta _{2}|\theta _{1}\right) =\left\{
\begin{array}{cl}
\frac{1}{100} & \left( if\ 0\leq \theta _{2}\leq 100\right) \\
0 & \left( otherwise\right)\end{array}\right.
\end{equation*}を定めるものとします。同様に、タイプ\(\theta _{2}\)の入札者\(2\)の信念\(f_{2}\left( \cdot |\theta _{2}\right) :\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(\theta _{1}\in \mathbb{R} \)に対して、\begin{equation*}f_{2}\left( \theta _{1}|\theta _{2}\right) =\left\{
\begin{array}{cl}
\frac{1}{100} & \left( if\ 0\leq \theta _{1}\leq 100\right) \\
0 & \left( otherwise\right)\end{array}\right.
\end{equation*}を定めるものとします。メカニズム\(\left( a,t\right) \)は「最高額の入札者が落札者であり、落札者だけが自身の入札額に等しい金額を支払う」というルールであるものとします。2人の純粋戦略の中でも、\begin{eqnarray*}\forall \theta _{1} &\in &\Theta _{1}:s_{1}^{\ast }\left( \theta _{1}\right)
=\frac{\theta _{1}}{2} \\
\forall \theta _{2} &\in &\Theta _{2}:s_{2}^{\ast }\left( \theta _{2}\right)
=\frac{\theta _{2}}{2}
\end{eqnarray*}を満たすもの\(\left( s_{1}^{\ast},s_{2}^{\ast }\right) \)に注目したとき、これはベイジアンナッシュ均衡になります(演習問題)。
演習問題
I=\left\{ 1,2\right\}
\end{equation*}であるとともに、入札者たちのタイプ集合が、\begin{equation*}
\Theta _{1}=\Theta _{2}=\left[ 0,100\right] \end{equation*}であるものとします。準線型環境を想定します。タイプ\(\theta _{1}\)の入札者\(1\)の信念\(f_{1}\left( \cdot|\theta _{1}\right) :\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(\theta _{2}\in \mathbb{R} \)に対して、\begin{equation*}f_{1}\left( \theta _{2}|\theta _{1}\right) =\left\{
\begin{array}{cl}
\frac{1}{100} & \left( if\ 0\leq \theta _{2}\leq 100\right) \\
0 & \left( otherwise\right)\end{array}\right.
\end{equation*}を定めるものとします。同様に、タイプ\(\theta _{2}\)の入札者\(2\)の信念\(f_{2}\left( \cdot |\theta _{2}\right) :\mathbb{R} \rightarrow \mathbb{R} \)はそれぞれの\(\theta _{1}\in \mathbb{R} \)に対して、\begin{equation*}f_{2}\left( \theta _{1}|\theta _{2}\right) =\left\{
\begin{array}{cl}
\frac{1}{100} & \left( if\ 0\leq \theta _{1}\leq 100\right) \\
0 & \left( otherwise\right)\end{array}\right.
\end{equation*}を定めるものとします。メカニズム\(\left( a,t\right) \)は「最高額の入札者が落札者であり、落札者だけが自身の入札額に等しい金額を支払う」というルールであるものとします。2人の純粋戦略の中でも、\begin{eqnarray*}\forall \theta _{1} &\in &\Theta _{1}:s_{1}^{\ast }\left( \theta _{1}\right)
=\frac{\theta _{1}}{2} \\
\forall \theta _{2} &\in &\Theta _{2}:s_{2}^{\ast }\left( \theta _{2}\right)
=\frac{\theta _{2}}{2}
\end{eqnarray*}を満たすもの\(\left( s_{1}^{\ast},s_{2}^{\ast }\right) \)に注目したとき、これはベイジアンナッシュ均衡になることを示してください。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】