教材一覧
教材一覧
教材検索
STATIC GAME OF INCOMPLETE INFORMATION

ベイジアンナッシュ均衡と事後均衡の関係

目次

Share on twitter
Twitterで共有
Share on email
メールで共有

事後最適反応と中間最適反応の関係

問題としている戦略的状況が不完備情報の静学ゲームであり、それがベイジアンゲーム\(G\)として表現されているものとします。プレイヤー\(i\)の純粋戦略\(s_{i}\)が他のプレイヤーたちの戦略\(s_{-i}\)に対する事後最適反応であるものとします。つまり、\begin{equation*}\forall \theta _{I}\in \Theta _{I},\ \forall a_{i}\in A_{i}:u_{i}\left(
s_{i}\left( \theta _{i}\right) ,s_{-i}\left( \theta _{-i}\right) ,\theta
_{I}\right) \geq u_{i}\left( a_{i},s_{-i}\left( \theta _{-i}\right) ,\theta
_{I}\right)
\end{equation*}が成り立つということです。この場合、プレイヤー\(i\)の信念\(f_{i}\)がいかなるものであっても、\(s_{i}\)は\(s_{-i}\)に対する中間最適反応であること、すなわち、\begin{equation*}\forall \theta _{i}\in \Theta _{i},\ \forall a_{i}\in A_{i}:E_{\theta _{-i}}
\left[ u_{i}\left( s_{i}\left( \theta _{i}\right) ,s_{-i}\left( \theta
_{-i}\right) ,\theta _{I}\right) \ |\ \theta _{i}\right] \geq E_{\theta
_{-i}}\left[ u_{i}\left( a_{i},s_{-i}\left( \theta _{-i}\right) ,\theta
_{I}\right) \ |\ \theta _{i}\right] \end{equation*}が成り立つことが保証されます。

命題(事後最適反応と中間最適反応の関係)
ベイジアンゲーム\(G\)において、プレイヤー\(i\in I\)の純粋戦略\(s_{i}\in S_{i}\)が他のプレイヤーたちの純粋戦略\(s_{-i}\in S_{-i}\)に対する事後最適反応であるものとする。プレイヤー\(i\)の信念\(f_{i}=\left\{f_{i}\left( \cdot |\theta _{i}\right) \right\} _{\theta _{i}\in \Theta _{i}}\)を任意に選んだとき、この場合、\(s_{i}\)は\(s_{-i}\)に対する中間最適反応である。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

上の命題の逆は成立するとは限りません。つまり、\(s_{i}\)が\(s_{-i}\)に対する中間最適反応であっても、\(s_{i}\)は\(s_{-i}\)に対する事後最適反応であるとは限りません(演習問題)。

支配戦略は事後最適反応でもあることと先の命題を踏まえると以下を得ます。

命題(支配戦略と中間最適反応の関係)
ベイジアンゲーム\(G\)において、プレイヤー\(i\in I\)の純粋戦略\(s_{i}\in S_{i}\)が支配戦略であるものとする。プレイヤー\(i\)の信念\(f_{i}=\left\{ f_{i}\left( \cdot |\theta _{i}\right)\right\} _{\theta _{i}\in \Theta _{i}}\)と他のプレイヤーたちの純粋戦略\(s_{-i}\in S_{i}\)を任意に選んだとき、この場合、\(s_{i}\)は\(s_{-i}\)に対する中間最適反応である。

 

事後均衡はベイジアンナッシュ均衡

ベイジアンゲーム\(G\)においてプレイヤーたちの純粋戦略の組\(s_{I}^{\ast}\)が事後均衡であるものとします。つまり、任意のプレイヤー\(i\)について\(s_{i}^{\ast }\)が\(s_{-i}^{\ast }\)に対する事後最適反応であるということです。すると、先の命題より、プレイヤー\(i\)の信念\(f_{i}\)を任意に選んだとき、\(s_{i}^{\ast }\)は\(s_{-i}^{\ast }\)に対する中間最適反応になります。任意のプレイヤーとその任意の信念について同様の議論が成立するため、結局、この場合、プレイヤーたちの信念\(\left\{ f_{i}\right\} _{i\in I}\)を任意に選んだとき、\(s_{I}^{\ast }\)はベイジアンナッシュ均衡であることが保証されます。

命題(事後均衡はベイジアンナッシュ均衡)
ベイジアンゲーム\(G\)において、プレイヤーたちの純粋戦略の組\(s_{I}^{\ast }\in S_{I}\)が事後均衡であるものとする。プレイヤーたちの信念\(\left\{ f_{i}\right\} _{i\in I}\)を任意に選んだとき、この場合、\(s_{I}^{\ast }\)はベイジアンナッシュ均衡である。

上の命題の逆は成立するとは限りません。つまり、ベイジアンゲームにおけるベイジアンナッシュ均衡は事後均衡であるとは限りません(演習問題)。

支配戦略均衡が事後均衡であることと上の命題より以下を得ます。

命題(支配戦略均衡はベイジアンナッシュ均衡)
ベイジアンゲーム\(G\)において、プレイヤーたちの純粋戦略の組\(s_{I}^{\ast }\in S_{I}\)が支配戦略均衡であるものとする。プレイヤーたちの信念\(\left\{ f_{i}\right\} _{i\in I}\)を任意に選んだとき、この場合、\(s_{I}^{\ast }\)はベイジアンナッシュ均衡である。
Share on twitter
Twitterで共有
Share on email
メールで共有
DISCUSSION

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録

RELATED KNOWLEDGE

関連知識

ベイジアンゲーム
ベイジアンゲームの定義

不完備情報の静学ゲームを記述するためにはプレイヤー、行動、情報、結果、利得などをそれぞれ具体的に特定する必要があります。それらの要素を記述する方法はいくつか存在しますが、ここではベイジアンゲームと呼ばれるモデルについて解説します。

ベイジアンゲーム
ベイジアンゲームの私的価値モデル

不完備情報の静学ゲームをベイジアンゲームとして表現するとき、すべてのプレイヤーの利得関数が自身のタイプのみに依存し、他のプレイヤーのタイプに依存しないものと仮定する場合には、そのようなモデルを私的価値モデルと呼びます。

ベイジアンゲーム
メカニズムのもとでのゲーム

単一財オークション市場においてメカニズムを提示された入札者たちが直面する戦略的状況はベイジアンゲームとして定式化されます。そのようなゲームにおいて、それぞれの入札者は自身のタイプと信念にもとづいて他の入札者たちのタイプを予想し、その予想から算出される中間期待利得を最大化するような純粋戦略を採用するものと仮定します。

ハーサニ変換
共通事前分布とハーサニ変換

メカニズムのもとでのベイジアンゲームは不完備情報であり、そこに均衡は存在するとは限りません。一方、共通事前分布を導入してゲームをハサーニ変換すればゲームは完備情報ゲームになるため、均衡の存在を保証できるとともに分析が容易になります。

ベイジアンゲーム
ベイジアンゲームにおける純粋戦略

不完備情報の静学ゲームをベイジアンゲームとして表現したとき、プレイヤーによる意思決定は純粋戦略と呼ばれる概念として定式化されます。プレイヤーの純粋戦略とは、自身のそれぞれのタイプに対して行動を1つずつ定める行動計画です。

ベイジアンゲーム
ベイジアンゲームにおける信念

ベイジアンゲームにおいて不確実な状況下で意思決定を迫られるプレイヤーは、自身のそれぞれのタイプに対して、その場合に自分が直面し得る状態ゲームがそれぞれどの程度の確率で起こりえるか主観的に定めた上で、その予想にもとづいて意思決定を行うものとします。

ベイジアンゲーム
中間期待利得とベイジアン仮説

不完備情報の静学ゲームを表現するベイジアンゲームに直面したそれぞれのプレイヤーは、自身のタイプと信念にもとづいて他のプレイヤーたちのタイプを予想し、その予想から算出される中間期待利得を最大化するような純粋戦略を採用するものと仮定します。

ベイジアンゲーム
ベイジアンゲームにおける支配戦略均衡

ベイジアンゲームにおいてプレイヤーがある純粋戦略を選ぶとき、自身を含めた全員のタイプや他のプレイヤーたちの行動、信念に関わらず利得を常に最大化できるならば、そのような戦略を支配純粋戦略と呼びます。支配純粋戦略の組を支配純粋戦略均衡と呼びます。

ベイジアンゲーム
ベイジアンゲームにおける事後均衡

ベイジアンゲームにおいて他のプレイヤーたちの純粋戦略に直面したプレイヤーがある純粋戦略を選ぶ場合、自身のタイプや他のプレイヤーたちのタイプによらず利得を最大化できる場合、そのような純粋戦略を事後最適反応と呼びます。事後最適反応の組を事後均衡と呼びます。

事後均衡
事後均衡と支配戦略均衡の関係

ベイジアンゲームにおいて事後均衡は支配戦略均衡でもありますが、その逆は成立するとは限りません。ただ、私的価値モデルにおいて事後均衡が一定の条件を満たす場合、それは支配戦略均衡になることが保証されます。

ベイジアンゲーム
ベイジアンナッシュ均衡

ベイジアンナッシュ均衡における最適反応の概念を定義するとともに、最適反応であるような純粋戦略の組としてベイジアンナッシュ均衡と呼ばれる均衡概念を定義します。

ベイジアンゲーム
ベイジアンゲームにおける高階の信念と共通事前分布

ベイジアンゲームにおいてプレイヤーたちが各々のタイプを読み合う可能性を認めると、ゲームの分析が突如として複雑になってしまいます。このような問題を解消するために、多くの場合、プレイヤーたちのタイプに関して共通事前分布という仮定を設けます。

ハーサニ変換
ベイジアンゲームのハーサニ変換とベイズ同値仮説

ベイジアンゲームの分析を容易にするため、共通事前分布の仮定のもとで、ゲームを不完全な動学ゲームへハーサニ変換します。変換後のゲームにおける均衡概念は事前ベイジアンナッシュ均衡です。