教材一覧
教材一覧
教材検索

不完備情報の静学ゲーム

ベイジアン仮説(ベイジアンゲームにおける行動原理)

目次

Twitterで共有
メールで共有

ベイジアン仮説

不完備情報の静学ゲームベイジアンゲーム\(G\)として定式化し、そこでのプレイヤーの意思決定を純粋戦略として定式化しました。ベイジアンゲームにおけるプレイヤー\(i\in I\)の純粋戦略とは、自身のそれぞれのタイプ\(\theta _{i}\in \Theta _{i}\)に対して、そのときに自分が選択するであろう行動\(s_{i}\left( \theta _{i}\right) \in A_{i}\)を1つずつ写像\begin{equation*}s_{i}:\Theta _{i}\rightarrow A_{i}
\end{equation*}として定式化されます。ベイジアンゲーム\(G\)においてプレイヤー\(i\)は自身のタイプ\(\theta_{i}\)を観察できますが、他のプレイヤーたちのタイプ\(\theta _{-i}\)は観察できないため、自分のタイプが\(\theta _{i}\)の場合に\(\left\{ G\left( \theta _{i},\theta _{-i}\right) \right\} _{\theta_{-i}\in \Theta _{-i}}\)の中のどの状態ゲームを実際にプレーすることになるか識別できません。プレイヤー\(i\)が純粋戦略\(s_{i}:\Theta _{i}\rightarrow A_{i}\)を選ぶこととは、自身のそれぞれのタイプ\(\theta _{i}\)に対して特定の行動\(s_{i}\left( \theta_{i}\right) \)を1つずつ事前に選び、その行動のもとで自分が直面し得る\(\left\{ G\left( \theta _{i},\theta _{-i}\right) \right\} _{\theta_{-i}\in \Theta _{-i}}\)に属するすべての状態ゲームに備えることを意味します。

では、プレイヤーたちはどのような原理にもとづいて意思決定を行うのでしょうか。ベイジアンゲームや純粋戦略などの概念はゲームのルールや意思決定を定式化したものであり、プレイヤーたちの行動原理については何も言っていません。プレイヤーたちの行動原理については、別途、規定する必要があります。

プレイヤー\(i\)のタイプが\(\theta _{i}\)であるものとします。他のプレイヤーたちのタイプ\(\theta _{-i}\)と彼らが選ぶ純粋戦略\(s_{-i}\)を所与としたとき、自身の純粋戦略\(s_{i}\)がもたらす利得をどのように計算すればよいでしょうか。この場合、プレイヤーたちが選ぶ行動からなる組は、\begin{equation*}s_{I}\left( \theta _{I}\right) =\left( s_{i}\left( \theta _{i}\right)
,s_{-i}\left( \theta _{-i}\right) \right) \in A_{I}
\end{equation*}です。この状態\(\theta _{I}=\left(\theta _{i},\theta _{-i}\right) \)におけるプレイヤー\(i\)の利得関数は\(u_{i}\left( \cdot ,\theta _{I}\right) :A\rightarrow \mathbb{R} \)であるため、以上の行動の組のもとで実現する結果からプレイヤー\(i\)が得る利得は、\begin{equation*}u_{i}\left( s_{I}\left( \theta _{I}\right) ,\theta _{I}\right) =u_{i}\left(
s_{i}\left( \theta _{i}\right) ,s_{-i}\left( \theta _{-i}\right) ,\theta
_{i},\theta _{-i}\right)
\end{equation*}となります。繰り返しになりますが、この利得はタイプ\(\theta _{i}\)のプレイヤー\(i\)が純粋戦略\(s_{i}\)を選んだときに、他のプレイヤーたちのタイプが\(\theta _{-i}\)であるとともに彼らが選ぶ純粋戦略が\(s_{-i}\)であるという前提のもと、プレイヤー\(i\)が得る利得に相当します。言い換えると、これは状態ゲーム\(G\left( \theta_{i},\theta _{-i}\right) \)において純粋戦略の組\(\left( s_{i},s_{-i}\right) \)がプレイヤー\(i\)にもたらす利得に相当します。

タイプ\(\theta _{i}\)のプレイヤー\(i\)は他のプレイヤーたちのタイプ\(\theta _{-i}\)の真の値を知りませんが、\(\theta _{-i}\)がとり得る値の集合\(\Theta _{-i}\)を把握しているため、\(\Theta _{-i}\)に属するそれぞれの\(\theta _{-i}\)に対して上の利得\(u_{i}\left( s_{I}\left( \theta _{I}\right) ,\theta _{I}\right) \)を計算できます。さらに、\(\theta _{-i}\)がしたがう分布の予想を、タイプ\(\theta _{i}\)のもとでの信念\(f_{i}\left( \cdot |\theta _{i}\right) :\Theta _{-i}\rightarrow \mathbb{R} \)として主観的に形成しているため、結局、タイプ\(\theta _{i}\)のプレイヤー\(i\)が純粋戦略の組\(s_{I}=\left( s_{i},s_{-i}\right) \)から得る中間期待利得\begin{eqnarray*}E_{\theta _{-i}}\left[ u_{i}\left( s_{I}\left( \theta _{I}\right) ,\theta
_{I}\right) \ |\ \theta _{i}\right] &=&\sum_{\theta _{-i}\in \Theta _{-i}}\left[ u_{i}\left( s_{I}\left( \theta _{I}\right) ,\theta _{I}\right) \cdot
f_{i}\left( \theta _{-i}|\theta _{i}\right) \right] \quad \because \text{タイプが離散型の場合} \\
&=&\int_{\theta _{-i}\in \Theta _{-i}}\left[ u_{i}\left( s_{I}\left( \theta
_{I}\right) ,\theta _{I}\right) \cdot f_{i}\left( \theta _{-i}|\theta
_{i}\right) \right] d\theta _{-i}\quad \because \text{タイプが連続型の場合}
\end{eqnarray*}を計算できます。

ゲーム理論では、ゲームに参加するプレイヤーはそれぞれ明確な目的を持ち、その目的を達成するために最適な戦略を選択するものと仮定します。この意味においてプレイヤーは合理的(rational)です。さらに、多くの場合、プレイヤーの目的は自己の利得の最大化であるものと仮定します。つまり、ゲームに参加するプレイヤーは自分の利得の最大化をめざすという意味において利己的(selfish)です。なお、合理性と利己性を総称して合理性と呼ぶこともあります。

特に、不完備情報の静学ゲームをベイジアンゲームとして定式化したとき、それぞれのプレイヤーは自身の中間期待利得を最大化するために最適な純粋戦略を選択するものと仮定します。ベイジアンゲームにおいてそれぞれのプレイヤー\(i\)は自身のタイプ\(\theta _{i}\)を知っていますが、他のプレイヤーたちのタイプ\(\theta _{-i}\)を事前に観察できません。このような不確実性下での意思決定に際して、それぞれのプレイヤー\(i\)は自身のタイプ\(\theta_{i}\)と信念\(f_{i}\)にもとづいて他のプレイヤーたちのタイプ\(\theta _{-i}\)を予想し、その予想から算出される中間期待利得を最大化するような純粋戦略を採用するものと仮定します。このような仮定をベイジアン仮説(Bayesian hypothesis)と呼びます。

 

ベイジアン仮説の正当性

プレイヤーの行動原理に関してベイジアン仮説を仮定することは、プレイヤーが自己の中間期待利得を最大化するために最適な純粋戦略を選択するものと仮定することを意味します。この仮定はどれくらい現実的でしょうか。ベイジアン仮説が実際に成り立つことを保証するためには、ベイジアンゲーム\(G\)に関して、少なくとも以下を要求する必要があります。

  1. それぞれのプレイヤー\(i\in I\)は、自分がプレーしているベイジアンゲーム\(G\)において起こり得るすべての結果を把握している。具体的には、プレイヤーたちが選択する純粋戦略からなる組が\(s_{I}\in S_{I}\)であるとき、状態\(\theta _{I}\in \Theta _{I}\)においてプレイヤーたちが選択する行動からなる組は\(s_{I}\left( \theta _{I}\right) \in A_{I}\)であり、この行動の結果から結果が1つずつ定まるため、ゲームにおいて起こり得る結果をすべて把握するためには、それぞれのプレイヤーは、自身を含めた全員のタイプ集合と純粋戦略集合を把握するに十分な情報理解力を有していることを要求する。
  2. それぞれのプレイヤー\(i\in I\)は、自身がプレーしているベイジアンゲーム\(G\)において直面し得る中間期待利得を計算できる。具体的には、プレイヤーたちが選択する純粋戦略からなる組が\(s_{I}\in S_{I}\)であるとき、それぞれのプレイヤー\(i\)は自身のタイプ\(\theta_{i}\)と信念\(f_{i}\)にもとづいて他のプレイヤーたちのタイプ\(\theta _{-i}\)を予想し、その予想から中間期待利得を導出できることを要求する。その上で、自身の中間期待利得を最大化するような純粋戦略\(s_{i}\in S_{i}\)を特定するに十分な知能を持っていることを要求する。

加えて、信念に関する以下のような論点も存在します。ベイジアンゲームにおけるプレイヤーの信念とは、そのプレイヤーによる他のプレイヤーたちのタイプに関する主観的な予想を表現する確率分布です。ベイジアン仮説は、プレイヤーたちが主観的な確率分布から導出される中間期待利得を最大化するような純粋戦略を選択することを仮定します。ここで注意したいのは、ベイジアンゲームの定義やベイジアン仮説において、プレイヤーたちが信念を形成する際の主観が具体的にどのようなものであるかが記述されていないという点です。したがって、プレイヤーはいかなる信念をも形成することができます。ただ、合理的なプレイヤーは自身の中間期待利得を最大化することを踏まえると、それぞれのプレイヤーは自身が形成し得る様々な信念の中でも自分が中間期待利得を最大化する上で最も有効な信念を探そうとするものと考えるのは自然です。さらに、ゲームにおいてプレイヤーたちは相互依存関係に直面している以上、それぞれのプレイヤーが自身の信念を選ぶプロセスにおいて、プレイヤーたちが互いの信念を読み合う状況が発生することが容易に予期されます。しかし、このような読み合いが行われることを許容すると、ベイジアンゲームの分析が突如として複雑になってしまいます。この点に関する詳しい議論は場を改めて行いますが、現段階では、ベイジアンゲームにおける信念が分析家たちにとって所与である状況を想定します。つまり、それぞれのプレイヤーがある特定の信念を形成したとき、その根拠や正当性については深く立ち入らないことにします。

 

ベイジアンゲームにおける純粋戦略均衡

ベイジアンゲーム\(G\)として表現される不完備情報の静学ゲームに直面したそれぞれのプレイヤー\(i\)は、ベイジアン仮説のもとで、自身が選択可能な純粋戦略の集合\(S_{i}\)の中から、自身のタイプ\(\theta _{i}\)と信念\(f_{i}\)を所与とした上で、自身の中間期待利得を最大化する純粋戦略を選ぶものと仮定します。そのような純粋戦略を\(s_{i}^{\ast }\)で表し、これをプレイヤー\(i\)の最適戦略(best strategy)と呼びます。

プレイヤーたちが最適戦略を選ぶ目的は自身の中間期待利得の最大化ですが、最適戦略の具体的な内容はベイジアンゲーム\(G\)の要素とは別にゲームの分析者が定義する必要があります。つまり、ゲームの分析家は最適戦略の意味をあらかじめ規定した上で、そこで規定された最適戦略の概念のもとでプレイヤーたちが具体的にどのように振る舞い、そこからどのような結果がもたらされるかを分析する、ということです。したがって、同じゲーム\(G\)を分析対象とする場合でも、異なる最適戦略の概念のもとで分析を行えば異なる分析結果が得られます。分析家がどのような最適戦略の概念を採用するかは非常に重要な問題です。

最適戦略の意味を定義することとは、それぞれのベイジアンゲーム\(G\)に対して、そこでの最適戦略の組\(s_{I}^{\ast }=(s_{i}^{\ast })_{i\in I}\in S_{I}\)を定める概念を特定することを意味します。そこで、そのような概念を均衡概念(equilibriumconcept)や解の概念(solution concept)などと呼びます。また、均衡概念がそれぞれのベイジアンゲーム\(G\)に対して定める最適戦略の組\(s_{I}^{\ast }\)を\(G\)の均衡(equilibrium)や純粋戦略均衡(pure strategy equilibrium)などと呼び、均衡\(s_{I}^{\ast }\)を構成するプレイヤー\(i\)の最適戦略\(s_{i}^{\ast }\)を\(i\)の均衡戦略(equilibrium strategy)と呼びます。ゲーム\(G\)に対して均衡概念が均衡\(s_{I}^{\ast }\)を定めると、それぞれの状態\(\theta _{I}\in \Theta _{I}\)においてプレイヤーたちが選択する行動の組\(s_{I}^{\ast }\left( \theta _{I}\right) \in A\)が定まります。これをすべての状態\(\theta _{I}\)に対して特定すれば\(\left\{ s_{I}^{\ast}\left( \theta _{I}\right) \right\} _{\theta _{I}\in \Theta _{I}}\)を得ます。これを\(G\)の均衡結果(equilibrium outcome)と呼びます。これは、ある均衡\(s_{I}^{\ast }\)のもとで、それぞれの状態\(\theta _{I}\)において実現するゲームの結果を特定する概念です。均衡結果\(\left\{ s_{I}^{\ast }\left( \theta _{I}\right) \right\}_{\theta _{I}\in \Theta _{I}}\)が与えられれば、タイプ\(\theta _{i}\)のプレイヤー\(i\)が直面する結果の組\begin{equation*}\left\{ \left( s_{i}^{\ast }\left( \theta _{i}\right) ,s_{-i}^{\ast }\left(
\theta _{-i}\right) \right) \right\} _{\theta _{-i}\in \Theta _{-i}}
\end{equation*}が得られるため、均衡結果からタイプ\(\theta _{i}\)のプレイヤー\(i\)が得る中間期待利得\begin{equation*}E_{\theta _{-i}}\left[ u_{i}\left( s_{i}^{\ast }\left( \theta _{i}\right)
,s_{-i}^{\ast }\left( \theta _{-i}\right) ,\theta _{i},\theta _{-i}\right) \
|\ \theta _{i}\right] \end{equation*}が得られます。

ある均衡概念を分析家が定義したとき、その均衡概念のもとで、それぞれのベイジアンゲームに純粋戦略均衡は存在するとは限りません。また、純粋戦略均衡が存在する場合においても、それは一意的に定まるとは限りません。したがって、不完備情報の静学ゲームがベイジアンゲームとして表現されるとき、均衡概念とは、それぞれのベイジアンゲームに対してそこでの純粋戦略均衡を定める対応として定式化されます。

Twitterで共有
メールで共有
DISCUSSION

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録

RELATED KNOWLEDGE

関連知識

ベイジアンゲーム
ベイジアンゲームの定義

不完備情報の静学ゲームを記述するためにはプレイヤー、行動、情報、結果、利得などをそれぞれ具体的に特定する必要があります。それらの要素を記述する方法はいくつか存在しますが、ここではベイジアンゲームと呼ばれるモデルについて解説します。

ベイジアンゲーム
ベイジアンゲームの私的価値モデル

不完備情報の静学ゲームをベイジアンゲームとして表現するとき、すべてのプレイヤーの利得関数が自身のタイプのみに依存し、他のプレイヤーのタイプに依存しないものと仮定する場合には、そのようなモデルを私的価値モデルと呼びます。

ベイジアンゲーム
単一財オークションにおけるメカニズムのもとでのベイジアンゲーム

単一財オークション市場においてメカニズムを提示された入札者たちが直面する戦略的状況はベイジアンゲームとして定式化されます。そのようなゲームにおいて、それぞれの入札者は自身のタイプと信念にもとづいて他の入札者たちのタイプを予想し、その予想から算出される中間期待利得を最大化するような純粋戦略を採用するものとします。

ベイジアンゲーム
ベイジアンゲームにおける純粋戦略

不完備情報の静学ゲームをベイジアンゲームとして表現したとき、プレイヤーによる意思決定は純粋戦略と呼ばれる概念として定式化されます。プレイヤーの純粋戦略とは、自身のそれぞれのタイプに対して行動を1つずつ定める行動計画です。

ベイジアンゲーム
ベイジアンゲームにおける信念と中間期待利得

ベイジアンゲームにおいて不確実な状況下で意思決定を迫られるプレイヤーは、自身のそれぞれのタイプに対して、その場合に自分が直面し得る状態ゲームがそれぞれどの程度の確率で起こりえるか主観的に定めた上で、その予想にもとづいて意思決定を行うものとします。

ベイジアンゲーム
ベイジアンゲームにおける広義の支配戦略均衡

ベイジアンゲームにおいてプレイヤーがある純粋戦略を選ぶとき、自身を含めた全員のタイプや他のプレイヤーたちの行動、信念に関わらず利得を常に最大化できるならば、そのような戦略を支配純粋戦略と呼びます。支配純粋戦略の組を支配純粋戦略均衡と呼びます。

ベイジアンゲーム
ベイジアンゲームにおける広義の事後均衡

ベイジアンゲームにおいて他のプレイヤーたちの純粋戦略に直面したプレイヤーがある純粋戦略を選ぶ場合、自身のタイプや他のプレイヤーたちのタイプによらず利得を最大化できる場合、そのような純粋戦略を事後最適反応と呼びます。事後最適反応の組を事後均衡と呼びます。

ベイジアンゲーム
ベイジアンナッシュ均衡

ベイジアンナッシュ均衡における最適反応の概念を定義するとともに、最適反応であるような純粋戦略の組としてベイジアンナッシュ均衡と呼ばれる均衡概念を定義します。

ベイジアンゲーム
ベイジアンナッシュ均衡と事後均衡の関係

ベイジアンゲームにおいて、事後均衡はベイジアンナッシュ均衡でもある一方で、その逆は成り立つとは限りません。また、支配戦略均衡はベイジアンナッシュ均衡でもある一方で、その逆は成り立つとは限りません。

ベイジアンゲーム
ベイジアンゲームにおける高階の信念と共通事前分布

ベイジアンゲームにおいてプレイヤーたちが各々のタイプを読み合う可能性を認めると、ゲームの分析が突如として複雑になってしまいます。このような問題を解消するために、多くの場合、プレイヤーたちのタイプに関して共通事前分布という仮定を設けます。

ハーサニ変換
ベイジアンゲームのハーサニ変換とベイズ同値仮説

ベイジアンゲームの分析を容易にするため、共通事前分布の仮定のもとで、ゲームを不完全な動学ゲームへハーサニ変換します。変換後のゲームにおける均衡概念は事前ベイジアンナッシュ均衡です。