不完備情報の静学ゲームをベイジアンゲームとして表現したとき、プレイヤーによる意思決定は純戦略と呼ばれる概念として定式化されます。プレイヤーの純戦略とは、自身のそれぞれのタイプに対して行動を1つずつ定める行動計画です。

2019年11月25日:公開

不完備情報の静学ゲームにおける戦略

プレイヤーたちが直面する戦略的状況が不完備情報の静学ゲームである場合には、それをベイジアンゲームとして定式化できます。では、プレイヤーたちの意思決定をどのように定式化すればよいでしょうか。プレイヤーの意思決定は戦略(strategy)と呼ばれる概念を用いて表現します。一般に、プレイヤーの戦略とは、プレイヤーがゲーム中に意志決定を行うそれぞれの局面において、そこで与えられた情報と行動を踏まえた上でどの行動を選ぶかをあらかじめ包括的に定める行動計画として定義されます。

まず、プレイヤーたちが順番に意思決定を行う動学ゲームでは、プレイヤーの戦略とは、自分とは異なるタイミングで意志決定を行う他のプレイヤーたちの選択の結果として実現し得るすべての経路を想定した上で、各経路において自分がどのような行動を選ぶかをあらかじめ包括的に定める行動計画に相当します。一方、プレイヤーたちが同時に意思決定を行う静学ゲームでは、すべてのプレイヤーが同時に 1 度だけ意志決定を行うため、それぞれのプレイヤーは複数の経路を想定する必要がありません。

また、ゲームのルールが共有知識である完備情報ゲームでは、すべてのプレイヤーはゲームのルールについて確かな認識を持っているため、それぞれのプレイヤーはゲームのルールに関して起こり得る複数の状態を想定する必要がありません。一方、不完備情報ゲームではゲームのルールが共有知識ではないため、そこでのプレイヤーの戦略とは、実現し得るルールのあらゆる状態を想定した上で、それぞれの状態において自分がどのような行動を選ぶかをあらかじめ包括的に定める行動計画に相当します。

 

純戦略

問題としている戦略的状況が不完備情報の静学ゲームであるならば、それはベイジアンゲーム\(G\)として記述できます。仮に、すべてのプレイヤーが真の状態\(\theta _{I}^{\ast }\)を把握しており、なおかつそのことが共有知識であるならば、プレイヤーたちが直面する状況は状態\(\theta _{I}^{\ast }\)のもとでの状態ゲーム\(G\left( \theta _{I}^{\ast }\right) \)として記述できます。状態ゲーム\(G\left( \theta _{I}^{\ast }\right)\)は戦略型ゲームですので、そこでのプレイヤーの戦略とは、単純に、プレイヤーが選択可能な行動の中から1つの行動を選ぶことを意味します。

しかし実際には、ベイジアンゲーム\(G\)において真の状態\(\theta _{I}^{\ast }=\left( \theta _{i}^{\ast },\theta _{-i}^{\ast }\right) \)を把握しているプレイヤーは存在せず、それぞれのプレイヤー\(i\)は真の状態\(\theta _{I}^{\ast }\)に関する断片的な知識\(\theta _{i}^{\ast }\)しか持っていないため、プレイヤーは複数の状態ゲームに直面し得る中で意思決定を行う必要があります。具体的には、プレイヤー\(i\)が直面し得る状態ゲームからなる集合は\(\{G\left( \theta _{i}^{\ast },\theta _{-i}\right) \}_{\theta _{-i}\in \Theta _{-i}}\)です。ただし、プレイヤー\(i\)はそれぞれの状態ゲームに対して、そこで選択する行動をあらかじめ指定することはできません。なぜなら、プレイヤー\(i\)は他のプレイヤーたちのタイプ\(\theta _{-i}\)を観察できず、ゆえに、自分が\(\{G\left( \theta _{i}^{\ast },\theta _{-i}\right) \}_{\theta _{-i}\in \Theta _{-i}}\)に属するどの状態ゲームをプレーしているか判別できないからです。したがって、プレイヤー\(i\)は特定の行動\(a_{i}\)を事前に選び、その1つの行動のもとで、自分が直面し得る\(\{G\left( \theta _{i}^{\ast },\theta _{-i}\right) \}_{\theta _{-i}\in \Theta _{-i}}\)に属するすべての状態ゲームに備えなければなりません。

プレイヤー\(i\)は自身のタイプ\(\theta _{i}\)の真の値\(\theta _{i}^{\ast }\)を知っているため、\(\theta _{i}^{\ast }\)のもとで直面し得る状態ゲームの集合\(\{G\left( \theta _{i}^{\ast },\theta _{-i}\right) \}_{\theta _{-i}\in \Theta _{-i}}\)に対してのみ 1 つの行動を定めればよいと考えるかもしれませんが、この考えは誤りです。他のプレイヤー\(j\ \left( \not=i\right) \)の視点から考えてみると、プレイヤー\(j\)にとっての最適な行動はプレイヤー\(i\)の行動に依存するため、プレイヤー\(j\)はプレイヤー\(i\)の行動を予想しながら自身の行動を決定します。プレイヤー\(i\)の行動は自身のタイプ\(\theta _{i}\)に依存しますが、プレイヤー\(j\)はプレイヤー\(i\)の真のタイプ\(\theta _{i}^{\ast }\)を知らない以上、\(\Theta _{i}\)に属するそれぞれのタイプごとに、そこでのプレイヤー\(i\)の行動を予想した上で、その予想を踏まえた上で自身の行動を決定します。つまり、プレイヤー\(j\)の行動はプレイヤー\(i\)のそれぞれのタイプのもとでの行動に依存します。逆に、プレイヤー\(i\)の最適な行動はプレイヤー\(j\)の行動に依存しますが、プレイヤー\(j\)の行動がプレイヤー\(i\)のそれぞれのタイプのもとでの行動に依存する以上、プレイヤー\(i\)が自身の最適な行動を考えるためには、プレイヤー\(i\)は自身のタイプ\(\theta _{i}^{\ast }\)とは限らない自身のそれぞれのタイプにおいて自分が何をするであろうか考える必要があります。つまり、真のタイプ\(\theta _{i}^{\ast }\)とは異なる任意のタイプ\(\theta _{i}\)についても、プレイヤー\(i\)はその場合の行動をあらかじめ定める必要があります。

以上を踏まえると、ベイジアンゲーム\(G\)においてそれぞれのプレイヤーは、自身のそれぞれのタイプごとに自身が選択するであろう行動を定める必要があります。具体的には、ベイジアンゲーム\(G\)におけるプレイヤー\(i\)の戦略は、\(s_{i}:\Theta _{i}\rightarrow A_{i}\)という写像として定式化されます。この戦略\(s_{i}\)のもとで、プレイヤー\(i\)は自分のタイプが\(\theta _{i}\in \Theta _{i}\)の場合には行動\(s_{i}\left( \theta _{i}\right) \in A_{i}\)を選択します。このような行動計画\(s_{i}\)をプレイヤーの純戦略(pure strategy)と呼びます。

すべてのプレイヤーの戦略の組を\(s_{I}=(s_{i})_{i\in I}\)で表し、プレイヤー\(i\)以外のプレイヤーの戦略の組を\(s_{-i}=(s_{j})_{j\in I\backslash \left\{ i\right\} }\)で表します。\(s_{I}=\left( s_{i},s_{-i}\right) \)です。

プレイヤー\(i\)が選択可能なすべての戦略からなる集合をプレイヤー\(i\)の戦略集合(strategy set)や戦略空間(strategy space)などと呼び、これを\(S_{i}\)で表します。\(s_{i}\in S_{i}\)です。すべてのプレイヤーの戦略集合の直積を\(S_{I}=\prod_{i\in I}S_{i}\)で表します。また、\(S_{-i}=\prod_{j\in I\backslash \left\{ i\right\} }S_{j}\)とします。\(s_{I}\in S_{I}\)かつ\(s_{-i}\in S_{-i}\)です。

例(純戦略)
ベイジアンゲーム\(G\)のプレイヤー集合が\(I=\{1,2\}\)、行動集合は\(A_{1}=A_{2}=\{a,b\}\)、タイプ集合は\(\Theta _{1}=\{\theta _{1}^{\prime }\},\ \Theta _{2}=\{\theta _{2}^{\prime },\theta _{2}^{\prime \prime }\}\)であるものとします。このとき、2 通りの状態ゲーム\(G\left( \theta _{1}^{\prime },\theta _{2}^{\prime \prime }\right) ,\ G\left( \theta _{1}^{\prime },\theta _{2}^{\prime \prime }\right) \)が存在しますが、それらを以下の利得行列で表します。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,1 & 0,0 \\ \hline
b & 0,0 & 1,2 \\ \hline
\end{array}$$
表:状態ゲーム\(G\left( \theta _{1}^{\prime },\theta _{2}^{\prime }\right) \)
$$\begin{array}{ccc}
\hline
1\diagdown 2 & a & b \\ \hline
a & 2,0 & 0,2 \\ \hline
b & 0,1 & 1,0 \\ \hline
\end{array}$$
表:状態ゲーム\(G\left( \theta _{1}^{\prime },\theta _{2}^{\prime \prime }\right) \)

プレイヤー\(1\)の純戦略\(s_{1}:\Theta _{1}\rightarrow A_{1}\)としては、\(s_{1}^{\prime }\left( \theta _{1}^{\prime }\right) =a\)を満たす\(s_{1}^{\prime }\)と、\(s_{1}^{\prime \prime }\left( \theta _{1}^{\prime }\right) =b\)を満たす\(s_{1}^{\prime \prime }\)の 2 通りがあります。したがって、\(S_{1}=\{s_{1}^{\prime },s_{1}^{\prime \prime }\}\)です。プレイヤー\(2\)の純戦略\(s_{2}:\Theta _{2}\rightarrow A_{2}\)としては、\(s_{2}^{\prime }\left( \theta _{2}^{\prime }\right) =a\)かつ\(s_{2}^{\prime }\left( \theta _{2}^{\prime \prime }\right) =a\)を満たす\(s_{2}^{\prime }\)、\(s_{2}^{\prime \prime }\left( \theta _{2}^{\prime }\right) =a\)かつ\(s_{2}^{\prime \prime }\left( \theta _{2}^{\prime \prime }\right) =b\)を満たす\(s_{2}^{\prime \prime }\)、\(s_{2}^{\prime \prime \prime }\left( \theta _{2}^{\prime }\right) =b\)かつ\(s_{2}^{\prime \prime \prime }\left( \theta _{2}^{\prime \prime }\right) =a\)を満たす\(s_{2}^{\prime \prime \prime }\)、そして\(s_{2}^{\prime \prime \prime \prime }\left( \theta _{2}^{\prime }\right) =b\)かつ\(s_{2}^{\prime \prime \prime \prime }\left( \theta _{2}^{\prime \prime }\right) =b\)を満たす\(s_{2}^{\prime \prime \prime \prime }\)の 4 通りがあります。したがって、\(S_{2}=\{s_{2}^{\prime },s_{2}^{\prime \prime },s_{2}^{\prime \prime \prime },s_{2}^{\prime \prime \prime \prime }\}\)です。

ベイジアンゲームにおいてプレイヤーが意思決定を行うためには、純戦略だけでなく信念という概念が必要です。次回は信念について解説します。

次へ進む 質問・コメントを投稿する 演習問題(プレミアム会員限定)

ワイズをさらに活用するための会員サービス

ユーザー名とメールアドレスを入力して一般会員に無料登録すれば、質問やコメントを投稿できるようになります。さらに、有料(500円/月)のプレミアム会員へアップグレードすることにより、プレミアムコンテンツ(命題の証明や演習問題、解答など)にアクセスできます。
会員サービス

ディスカッションに参加しますか?

質問やコメントを投稿するにはログインが必要です。
ログイン

コメントを残す

アカウント
ログイン