WIIS

不完備情報の静学ゲーム

ベイジアン仮説(ベイジアンゲームにおける行動原理)

目次

関連知識

Mailで保存
Xで共有

ベイジアン仮説

不完備情報の静学ゲームベイジアンゲーム\(G\)として定式化し、そこでのプレイヤーの意思決定を純粋戦略として定式化しました。ベイジアンゲームにおけるプレイヤー\(i\in I\)の純粋戦略とは、自身のそれぞれのタイプ\(\theta _{i}\in \Theta _{i}\)に対して、そのときに自分が選択するであろう行動\(s_{i}\left( \theta _{i}\right) \in A_{i}\)を1つずつ写像\begin{equation*}s_{i}:\Theta _{i}\rightarrow A_{i}
\end{equation*}として定式化されます。ベイジアンゲーム\(G\)においてプレイヤー\(i\)は自身のタイプ\(\theta_{i}\)を観察できますが、他のプレイヤーたちのタイプ\(\theta _{-i}\)は観察できないため、自分のタイプが\(\theta _{i}\)の場合に\(\left\{ G\left( \theta _{i},\theta _{-i}\right) \right\} _{\theta_{-i}\in \Theta _{-i}}\)の中のどの状態ゲームを実際にプレーすることになるか識別できません。プレイヤー\(i\)が純粋戦略\(s_{i}:\Theta _{i}\rightarrow A_{i}\)を選ぶこととは、自身のそれぞれのタイプ\(\theta _{i}\)に対して特定の行動\(s_{i}\left( \theta_{i}\right) \)を1つずつ事前に選び、その行動のもとで自分が直面し得る\(\left\{ G\left( \theta _{i},\theta _{-i}\right) \right\} _{\theta_{-i}\in \Theta _{-i}}\)に属するすべての状態ゲームに備えることを意味します。

では、プレイヤーたちはどのような原理にもとづいて意思決定を行うのでしょうか。ベイジアンゲームや純粋戦略などの概念はゲームのルールや意思決定を定式化したものであり、プレイヤーたちの行動原理については何も言っていません。プレイヤーたちの行動原理については、別途、規定する必要があります。

プレイヤー\(i\)のタイプが\(\theta _{i}\)であるものとします。他のプレイヤーたちのタイプ\(\theta _{-i}\)と彼らが選ぶ純粋戦略\(s_{-i}\)を所与としたとき、自身の純粋戦略\(s_{i}\)がもたらす利得をどのように計算すればよいでしょうか。この場合、プレイヤーたちが選ぶ行動からなる組は、\begin{equation*}s_{I}\left( \theta _{I}\right) =\left( s_{i}\left( \theta _{i}\right)
,s_{-i}\left( \theta _{-i}\right) \right) \in A_{I}
\end{equation*}です。この状態\(\theta _{I}=\left(\theta _{i},\theta _{-i}\right) \)におけるプレイヤー\(i\)の利得関数は\(u_{i}\left( \cdot ,\theta _{I}\right) :A\rightarrow \mathbb{R} \)であるため、以上の行動の組のもとで実現する結果からプレイヤー\(i\)が得る利得は、\begin{equation*}u_{i}\left( s_{I}\left( \theta _{I}\right) ,\theta _{I}\right) =u_{i}\left(
s_{i}\left( \theta _{i}\right) ,s_{-i}\left( \theta _{-i}\right) ,\theta
_{i},\theta _{-i}\right)
\end{equation*}となります。繰り返しになりますが、この利得はタイプ\(\theta _{i}\)のプレイヤー\(i\)が純粋戦略\(s_{i}\)を選んだときに、他のプレイヤーたちのタイプが\(\theta _{-i}\)であるとともに彼らが選ぶ純粋戦略が\(s_{-i}\)であるという前提のもと、プレイヤー\(i\)が得る利得に相当します。言い換えると、これは状態ゲーム\(G\left( \theta_{i},\theta _{-i}\right) \)において純粋戦略の組\(\left( s_{i},s_{-i}\right) \)がプレイヤー\(i\)にもたらす利得に相当します。

タイプ\(\theta _{i}\)のプレイヤー\(i\)は他のプレイヤーたちのタイプ\(\theta _{-i}\)の真の値を知りませんが、\(\theta _{-i}\)がとり得る値の集合\(\Theta _{-i}\)を把握しているため、\(\Theta _{-i}\)に属するそれぞれの\(\theta _{-i}\)に対して上の利得\(u_{i}\left( s_{I}\left( \theta _{I}\right) ,\theta _{I}\right) \)を計算できます。さらに、\(\theta _{-i}\)がしたがう分布の予想を、タイプ\(\theta _{i}\)のもとでの信念\(f_{i}\left( \cdot |\theta _{i}\right) :\Theta _{-i}\rightarrow \mathbb{R} \)として主観的に形成しているため、結局、タイプ\(\theta _{i}\)のプレイヤー\(i\)が純粋戦略の組\(s_{I}=\left( s_{i},s_{-i}\right) \)から得る中間期待利得\begin{eqnarray*}E_{\theta _{-i}}\left[ u_{i}\left( s_{I}\left( \theta _{I}\right) ,\theta
_{I}\right) \ |\ \theta _{i}\right] &=&\sum_{\theta _{-i}\in \Theta _{-i}}\left[ u_{i}\left( s_{I}\left( \theta _{I}\right) ,\theta _{I}\right) \cdot
f_{i}\left( \theta _{-i}|\theta _{i}\right) \right] \quad \because \text{タイプが離散型の場合} \\
&=&\int_{\theta _{-i}\in \Theta _{-i}}\left[ u_{i}\left( s_{I}\left( \theta
_{I}\right) ,\theta _{I}\right) \cdot f_{i}\left( \theta _{-i}|\theta
_{i}\right) \right] d\theta _{-i}\quad \because \text{タイプが連続型の場合}
\end{eqnarray*}を計算できます。

ゲーム理論では、ゲームに参加するプレイヤーはそれぞれ明確な目的を持ち、その目的を達成するために最適な戦略を選択するものと仮定します。この意味においてプレイヤーは合理的(rational)です。さらに、多くの場合、プレイヤーの目的は自己の利得の最大化であるものと仮定します。つまり、ゲームに参加するプレイヤーは自分の利得の最大化をめざすという意味において利己的(selfish)です。なお、合理性と利己性を総称して合理性と呼ぶこともあります。

特に、不完備情報の静学ゲームをベイジアンゲームとして定式化したとき、それぞれのプレイヤーは自身の中間期待利得を最大化するために最適な純粋戦略を選択するものと仮定します。ベイジアンゲームにおいてそれぞれのプレイヤー\(i\)は自身のタイプ\(\theta _{i}\)を知っていますが、他のプレイヤーたちのタイプ\(\theta _{-i}\)を事前に観察できません。このような不確実性下での意思決定に際して、それぞれのプレイヤー\(i\)は自身のタイプ\(\theta_{i}\)と信念\(f_{i}\)にもとづいて他のプレイヤーたちのタイプ\(\theta _{-i}\)を予想し、その予想から算出される中間期待利得を最大化するような純粋戦略を採用するものと仮定します。このような仮定をベイジアン仮説(Bayesian hypothesis)と呼びます。

 

ベイジアン仮説の正当性

プレイヤーの行動原理に関してベイジアン仮説を仮定することは、プレイヤーが自己の中間期待利得を最大化するために最適な純粋戦略を選択するものと仮定することを意味します。この仮定はどれくらい現実的でしょうか。ベイジアン仮説が実際に成り立つことを保証するためには、ベイジアンゲーム\(G\)に関して、少なくとも以下を要求する必要があります。

  1. それぞれのプレイヤー\(i\in I\)は、自分がプレーしているベイジアンゲーム\(G\)において起こり得るすべての結果を把握している。具体的には、プレイヤーたちが選択する純粋戦略からなる組が\(s_{I}\in S_{I}\)であるとき、状態\(\theta _{I}\in \Theta _{I}\)においてプレイヤーたちが選択する行動からなる組は\(s_{I}\left( \theta _{I}\right) \in A_{I}\)であり、この行動の結果から結果が1つずつ定まるため、ゲームにおいて起こり得る結果をすべて把握するためには、それぞれのプレイヤーは、自身を含めた全員のタイプ集合と純粋戦略集合を把握するに十分な情報理解力を有していることを要求する。
  2. それぞれのプレイヤー\(i\in I\)は、自身がプレーしているベイジアンゲーム\(G\)において直面し得る中間期待利得を計算できる。具体的には、プレイヤーたちが選択する純粋戦略からなる組が\(s_{I}\in S_{I}\)であるとき、それぞれのプレイヤー\(i\)は自身のタイプ\(\theta_{i}\)と信念\(f_{i}\)にもとづいて他のプレイヤーたちのタイプ\(\theta _{-i}\)を予想し、その予想から中間期待利得を導出できることを要求する。その上で、自身の中間期待利得を最大化するような純粋戦略\(s_{i}\in S_{i}\)を特定するに十分な知能を持っていることを要求する。

加えて、信念に関する以下のような論点も存在します。ベイジアンゲームにおけるプレイヤーの信念とは、そのプレイヤーによる他のプレイヤーたちのタイプに関する主観的な予想を表現する確率分布です。ベイジアン仮説は、プレイヤーたちが主観的な確率分布から導出される中間期待利得を最大化するような純粋戦略を選択することを仮定します。ここで注意したいのは、ベイジアンゲームの定義やベイジアン仮説において、プレイヤーたちが信念を形成する際の主観が具体的にどのようなものであるかが記述されていないという点です。したがって、プレイヤーはいかなる信念をも形成することができます。ただ、合理的なプレイヤーは自身の中間期待利得を最大化することを踏まえると、それぞれのプレイヤーは自身が形成し得る様々な信念の中でも自分が中間期待利得を最大化する上で最も有効な信念を探そうとするものと考えるのは自然です。さらに、ゲームにおいてプレイヤーたちは相互依存関係に直面している以上、それぞれのプレイヤーが自身の信念を選ぶプロセスにおいて、プレイヤーたちが互いの信念を読み合う状況が発生することが容易に予期されます。しかし、このような読み合いが行われることを許容すると、ベイジアンゲームの分析が突如として複雑になってしまいます。この点に関する詳しい議論は場を改めて行いますが、現段階では、ベイジアンゲームにおける信念が分析家たちにとって所与である状況を想定します。つまり、それぞれのプレイヤーがある特定の信念を形成したとき、その根拠や正当性については深く立ち入らないことにします。

 

ベイジアンゲームにおける純粋戦略均衡

ベイジアンゲーム\(G\)として表現される不完備情報の静学ゲームに直面したそれぞれのプレイヤー\(i\)は、ベイジアン仮説のもとで、自身が選択可能な純粋戦略の集合\(S_{i}\)の中から、自身のタイプ\(\theta _{i}\)と信念\(f_{i}\)を所与とした上で、自身の中間期待利得を最大化する純粋戦略を選ぶものと仮定します。そのような純粋戦略を\(s_{i}^{\ast }\)で表し、これをプレイヤー\(i\)の最適戦略(best strategy)と呼びます。

プレイヤーたちが最適戦略を選ぶ目的は自身の中間期待利得の最大化ですが、最適戦略の具体的な内容はベイジアンゲーム\(G\)の要素とは別にゲームの分析者が定義する必要があります。つまり、ゲームの分析家は最適戦略の意味をあらかじめ規定した上で、そこで規定された最適戦略の概念のもとでプレイヤーたちが具体的にどのように振る舞い、そこからどのような結果がもたらされるかを分析する、ということです。したがって、同じゲーム\(G\)を分析対象とする場合でも、異なる最適戦略の概念のもとで分析を行えば異なる分析結果が得られます。分析家がどのような最適戦略の概念を採用するかは非常に重要な問題です。

最適戦略の意味を定義することとは、それぞれのベイジアンゲーム\(G\)に対して、そこでの最適戦略の組\(s_{I}^{\ast }=(s_{i}^{\ast })_{i\in I}\in S_{I}\)を定める概念を特定することを意味します。そこで、そのような概念を均衡概念(equilibriumconcept)や解の概念(solution concept)などと呼びます。また、均衡概念がそれぞれのベイジアンゲーム\(G\)に対して定める最適戦略の組\(s_{I}^{\ast }\)を\(G\)の均衡(equilibrium)や純粋戦略均衡(pure strategy equilibrium)などと呼び、均衡\(s_{I}^{\ast }\)を構成するプレイヤー\(i\)の最適戦略\(s_{i}^{\ast }\)を\(i\)の均衡戦略(equilibrium strategy)と呼びます。ゲーム\(G\)に対して均衡概念が均衡\(s_{I}^{\ast }\)を定めると、それぞれの状態\(\theta _{I}\in \Theta _{I}\)においてプレイヤーたちが選択する行動の組\(s_{I}^{\ast }\left( \theta _{I}\right) \in A\)が定まります。これをすべての状態\(\theta _{I}\)に対して特定すれば\(\left\{ s_{I}^{\ast}\left( \theta _{I}\right) \right\} _{\theta _{I}\in \Theta _{I}}\)を得ます。これを\(G\)の均衡結果(equilibrium outcome)と呼びます。これは、ある均衡\(s_{I}^{\ast }\)のもとで、それぞれの状態\(\theta _{I}\)において実現するゲームの結果を特定する概念です。均衡結果\(\left\{ s_{I}^{\ast }\left( \theta _{I}\right) \right\}_{\theta _{I}\in \Theta _{I}}\)が与えられれば、タイプ\(\theta _{i}\)のプレイヤー\(i\)が直面する結果の組\begin{equation*}\left\{ \left( s_{i}^{\ast }\left( \theta _{i}\right) ,s_{-i}^{\ast }\left(
\theta _{-i}\right) \right) \right\} _{\theta _{-i}\in \Theta _{-i}}
\end{equation*}が得られるため、均衡結果からタイプ\(\theta _{i}\)のプレイヤー\(i\)が得る中間期待利得\begin{equation*}E_{\theta _{-i}}\left[ u_{i}\left( s_{i}^{\ast }\left( \theta _{i}\right)
,s_{-i}^{\ast }\left( \theta _{-i}\right) ,\theta _{i},\theta _{-i}\right) \
|\ \theta _{i}\right] \end{equation*}が得られます。

ある均衡概念を分析家が定義したとき、その均衡概念のもとで、それぞれのベイジアンゲームに純粋戦略均衡は存在するとは限りません。また、純粋戦略均衡が存在する場合においても、それは一意的に定まるとは限りません。したがって、不完備情報の静学ゲームがベイジアンゲームとして表現されるとき、均衡概念とは、それぞれのベイジアンゲームに対してそこでの純粋戦略均衡を定める対応として定式化されます。

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員専用コンテンツです
ログイン】【会員登録

不完備情報の静学ゲーム