完備情報の静学ゲームを記述するためにはプレイヤー、行動、結果、利得などをそれぞれ具体的に特定する必要があります。それらの要素を記述する方法はいくつか存在しますが、ここでは戦略型ゲームと呼ばれるモデルについて解説します。
< 前のページ
次のページ >

完備情報の静学ゲーム

復習になりますが、ゲーム理論の分析対象であるゲームとは、複数の主体が関わり合う中に戦略的相互依存性が存在する状況、すなわち、それぞれの主体が最終的に直面する結果が自身の行動だけによって決まるのではなく、他の主体の行動にも依存するような状況を指します。また、それぞれのゲームを記述するためには、ゲームのルールと呼ばれる以下の要素を特定する必要があります。

  1. ゲームにおいて意思決定を行う主体は誰か。つまり、ゲームの「プレイヤー」は誰か。
  2. プレイヤーたちはどのような「順番」で意思決定を行うか。
  3. プレイヤーたちが意思決定を行う際にどのような選択肢が与えられているか。つまり、プレイヤーたちはどのような「行動」を選択可能か。
  4. プレイヤーが意思決定を行う際にどのような「情報」が与えられているか。
  5. プレイヤーたちが意思決定を行う帰結として、どのような「結果」が起こり得るか。
  6. プレイヤーたちはそれぞれの結果をどの程度評価しているか。すなわち、プレイヤーはどのような「利得」の体系を持っているか。
ゲームのルールについて復習する

完備情報の静学ゲーム(static games of complete information)は非協力ゲームであるため、そこではプレイヤーたちの間に拘束的な合意は成立せず、それぞれのプレイヤーの意思決定は、他のプレイヤーたちの意思決定からは独立した形で行われます。

非協力ゲームについて復習する

完備情報の静学ゲームを分析対象とする場合、ゲームのルールの中でも「順番」と「情報」は明らかです。つまり、完備情報の静学ゲームにおいて、プレイヤーたちは同時に意思決定を行います。言い換えると、それぞれのプレイヤーは他のプレイヤーたちの意思決定の内容を観察できない状態で意思決定を行うということです。また、完備情報の静学ゲームのルールはすべてのプレイヤーにとって共有知識です。つまり、ゲームのルールを\(P\)で表し、すべてのプレイヤーが\(P\)を知っているという事実を\(P_{1}\)で表し、すべてのプレイヤーが\(P_{1}\)を知っているという事実を\(P_{2}\)で表し、\(\cdots \)などと表記を定めるとき、無限個の事実\(P_{1},P_{2},P_{3},P_{4},\cdots \)が成立することを仮定するということです。

静学ゲームについて復習する 完備情報ゲームについて復習する

以上を踏まえると、完備情報の静学ゲームを記述するためには、ゲームのルールを構成する残りの要素である「プレイヤー」「行動」「結果」「利得」を特定すればよいということになります。これらの要素を記述する方法はいくつか存在しますが、以降では、その中でも戦略型ゲーム(game in strategic form)と呼ばれるモデルを紹介します。

 

プレイヤーの表現

完備情報の静学ゲームに参加するすべてのプレイヤーからなる集合をプレイヤー集合(player set)やプレイヤー空間(player space)などと呼び、これを\(I\)で表します。

\(n\)人のプレイヤーが参加するゲームを\(n\)人ゲーム(\(n\)-players game)と呼びます。その上で、\(n\)人ゲームのプレイヤー集合を\(I=\{1,2,\cdots ,n\}\)で表します。また、プレイヤー集合\(I\)に属する\(i\ \left( =1,2,\cdots ,n\right) \)番目のプレイヤーをプレイヤー\(i\)(player \(i\))と呼びます。\(i\in I\)です。

戦略的相互依存関係は複数のプレイヤーが存在することで初めて成立する状況であるため、プレイヤーの数が複数であることはゲームの基本的な条件となります。そこで、多くの場合、プレイヤーの人数\(n\)は\(2\)以上の整数と仮定します。

プレイヤーの単位として何を採用するかは分析対象となる戦略的相互依存関係に応じて変化します。個人をプレイヤーの単位とする場合もあれば、組織や国家などをプレイヤーの単位とする場合もあります。プレイヤーの単位を決定する上で重要なことは、ゲームにおいて自律的な意思決定を行う最小単位がプレイヤーであるということです。もう 1 つの重要な点は、その主体が戦略的相互依存関係に直面する中で意思決定を行う主体であるということです。したがって、他の主体との関係性の中で意思決定を行うのではなく、外生的に変化する状況に対応する形でのみ意志決定を行う主体はプレイヤーとはみなされず、モデルの環境変数とみなされます。

例(プレイヤー集合)
2 人がジャンケンを 1 回だけ行う状況を想定します。2 人をそれぞれ\(1,2\)と呼ぶのであれば、このゲームのプレイヤー集合は\(I=\{1,2\}\)となります。
例(プレイヤー集合)
複占市場において 2 つの企業が競争する状況を分析する際には、そのゲームのプレイヤーは 2 つの企業であり、彼らが供給する商品の消費者はプレイヤーとはみなされません。なぜなら、消費者は 2 つの企業による行動の結果として決定される商品の価格を所与として意思決定を行う主体であり、消費者と企業の間には戦略的相互依存関係は成立しないからです。これをテクニカルに表現すると、複占市場のプレイヤーである企業にとって市場の需要曲線は外生的に与えられる要因であり、消費者は市場の需要曲線を形成する環境変数として位置付けられるということです。2 つの企業をそれぞれ\(1,2\)と呼ぶのであれば、このゲームのプレイヤー集合は\(I=\{1,2\}\)となります。

 

行動の表現

完備情報の静学ゲームにおいてそれぞれのプレイヤーに選択肢として与えられているすべての行動からなる集合をそのプレイヤーの行動集合(action set)や行動空間(action space)などと呼びます。プレイヤー\(i\in I\)の行動集合を\(A_{i}\)で表し、プレイヤー\(i\)の個々の行動を\(a_{i}\in A_{i}\)で表します。

すべてのプレイヤーの行動からなる組を\(a_{I}=(a_{i})_{i\in I}\)で表し、プレイヤー\(i\)以外のプレイヤーたちの行動の組を\(a_{-i}=(a_{j})_{j\in I\backslash \left\{ i\right\} }\)で表します。\(a_{I}=\left( a_{i},a_{-i}\right) \)です。

すべてのプレイヤーの行動集合の直積を\(A_{I}=\prod_{i\in I}A_{i}\)で表します。また、\(A_{-i}=\prod_{j\in I\backslash \left\{ i\right\} }A_{j}\)と定めます。\(a_{I}\in A_{I}\)かつ\(a_{-i}\in A_{-i}\)です。

例(行動集合)
先のジャンケンの例において、それぞれのプレイヤー\(i\in I=\{1,2\}\)の行動集合は\(A_{i}=\{R,P,S\}\)となります。ただし、\(R\)はグー(Rock)、\(P\)はパー(Paper)、\(S\)はチョキ(Scissors)をそれぞれ表します。
例(行動集合)
先の複占市場の例において、それぞれの企業は商品の生産量として任意の非負の実数を選択可能であるならば、それぞれの企業\(i\in I=\{1,2\}\)の行動集合は\(A_{i}= \mathbb{R} _{+}\)となります。

 

結果の表現

完備情報の静学ゲームにおいてプレイヤーたちが行動の組\(a_{I}\in A_{I}\)を選ぶと、それに対して何らかの結果が実現します。完備情報の静学ゲームにおいて起こり得る結果を特定することとは、\(A_{I}\)に属するそれぞれの行動の組\(a_{I}\)に対して結果を 1 つずつ割り当てることを意味します。ちなみに、異なる行動の組が同一の結果をもたらす状況は起こり得ます。

例(結果)
先のジャンケンの例における結果は、2 人の手の組み合わせに応じて生じる結果のことですが、それらは「\(1\)が勝つ」「\(2\)が勝つ」「あいこ」の 3 種類に分類可能です。具体的には、2 人の行動の組、すなわち 2 人が出す手の組を\(\left( a_{1},a_{2}\right) \)で表すとき、「\(1\)が勝つ」という結果に相当する行動の組は\(\left( R,S\right) ,\left( P,R\right) ,\left( S,P\right) \)の 3 つ、「\(2\)が勝つ」という結果に相当する行動の組は\(\left( R,P\right) ,\left( P,S\right) ,\left( S,R\right) \)の 3 つ、「あいこ」という結果に相当する行動の組は\(\left( R,R\right) ,\left( P,P\right) ,\left( S,S\right) \)の 3 つです。ただし、\(R\)はグー、\(P\)はパー、\(S\)はチョキを表します。
例(結果)
先の複占市場の例における結果は、2 つの企業が選ぶ生産量の組み合わせに応じて生じる結果のことです。ここでは商品の均衡価格に注目します。具体的には、2 つの企業の行動の組、すなわち 2 つの企業が選択する生産量の組み合わせを\(\left( a_{1},a_{2}\right) \)で表すとき、市場における総供給量は\(a_{1}+a_{2}\)となるため、商品の市場価格は\(p\left( a_{1}+a_{2}\right) >0\)で均衡するものとします。

 

利得の表現

プレイヤーたちが選ぶそれぞれの行動の組\(a_{I}\)にはゲームにおいて起こり得る結果が 1 つずつ対応しているため、プレイヤーがどの結果を好むかを記述する代わりに、プレイヤーがどの行動の組を好むかを記述しても一般性は失われません。そこで、2 つの行動の組\(a_{I},a_{I}^{\prime }\)に対して、プレイヤー\(i\)が\(a_{I}\)のもとで実現する結果を\(a_{I}^{\prime }\)のもとで実現する結果以上に好ましいものと考える場合には、そのことを\(a_{I}\succsim _{i}a_{I}^{\prime }\)で表現します。この記号\(\succsim _{i}\)は行動の組の集合\(A_{I}\)上に定義された二項関係であり、プレイヤー\(i\)の選好関係(preference relation)と呼びます。

プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{equation*}
a_{I}\succ _{i}a_{I}^{\prime }\ \overset{def}{\Leftrightarrow }\
a_{I}\succsim _{i}a_{I}^{\prime }\ \wedge \ \lnot \left( a_{I}^{\prime
}\succsim _{i}a_{I}\right)
\end{equation*}という関係を満たすものとして\(A_{I}\)上の新たな二項関係\(\succ _{i}\)を定義します。つまり、プレイヤー\(i\)にとって\(a_{I}\)が\(a_{I}^{\prime }\)以上に望ましく、なおかつ、\(a_{I}^{\prime }\)が\(a_{I}\)以上に望ましくない場合にはそのことを\(a_{I}\succ _{i}a_{I}^{\prime }\)で表現するということです。言い換えると、\(a_{I}\succ _{i}a_{I}^{\prime }\)とはプレイヤー\(i\)にとって\(a_{I}\)のもとで実現する結果が\(a_{I}^{\prime }\)のもとで実現する結果より望ましいことを意味します。この二項関係\(\succ _{i}\)をプレイヤー\(i\)の狭義選好関係(strict preference relation)と呼びます。

プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{equation*}
a_{I}\sim _{i}a_{I}^{\prime }\ \overset{def}{\Leftrightarrow }\
a_{I}\succsim _{i}a_{I}^{\prime }\ \wedge \ a_{I}^{\prime }\succsim _{i}a_{I}
\end{equation*}という関係を満たすものとして\(A_{I}\)上の新たな二項関係\(\sim _{i}\)を定義します。つまり、プレイヤー\(i\)にとって\(a_{I}\)が\(a_{I}^{\prime }\)以上に望ましく、なおかつ、\(a_{I}^{\prime }\)が\(a_{I}\)以上に望ましい場合にはそのことを\(a_{I}\sim _{i}a_{I}^{\prime }\)で表現するということです。言い換えると、\(a_{I}\sim _{i}a_{I}^{\prime }\)とはプレイヤー\(i\)にとって\(a_{I}\)のもとで実現する結果と\(a_{I}^{\prime }\)のもとで実現する結果が同じ程度望ましいことを意味します。この二項関係\(\sim _{i}\)をプレイヤー\(i\)の無差別関係(indifference relation)と呼びます。

プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{equation*}
u_{i}\left( a_{I}\right) \geq u_{i}\left( a_{I}^{\prime }\right) \
\Leftrightarrow \ a_{I}\succsim _{i}a_{I}^{\prime }
\end{equation*}という関係を満たす関数\(u_{i}:A_{I}\rightarrow \mathbb{R} \)が存在する場合には、\(u_{i}\)を\(\succsim _{i}\)を表現する利得関数(payoff function)と呼びます。さらに、プレイヤー\(i\)の利得関数\(u_{i}\)が行動の組\(a_{I} \)に対して定める値\(u_{i}\left( a_{I}\right) \)を、プレイヤー\(i\)が\(a_{I}\)から得る利得(payoff)と呼びます。

プレイヤー\(i\)の効用関数\(u_{i}\)の定義域が\(A_{I}\)であることは、プレイヤー\(i\)の効用\(u_{i}\left( a_{I}\right) =u_{i}\left( a_{i},a_{-i}\right) \)が自身の行動\(a_{i}\)だけに依存するのではなく自分とは異なるプレイヤーたちの行動の組\(a_{-i}\)にも依存することを意味します。つまり、効用関数を上のように定義することを通じてプレイヤーの間に戦略的相互依存関係が存在する状況を表現しています。

選好関係を表現する利得関数が存在するための条件や利得関数の性質などについては場を改めて詳しく解説します。とりあえず以降では、プレイヤーが持つ評価体系は利得関数によって表現されるものと仮定します。

例(利得)
先のジャンケンの例におけるプレイヤーの利得の体系として典型的なものは、それぞれのプレイヤーは「自分が勝つ」「あいこ」「相手が勝つ」の順番で好むというものです。このとき、プレイヤー\(1\)の利得関数\(u_{1}\)としては、\begin{eqnarray*}
&&u_{1}\left( R,S\right) =u_{1}\left( P,R\right) =u_{1}\left( S,P\right) \\
&>&u_{1}\left( R,R\right) =u_{1}\left( P,P\right) =u_{1}\left( S,S\right) \\
&>&u_{1}\left( R,P\right) =u_{1}\left( P,S\right) =u_{1}\left( S,R\right)
\end{eqnarray*}を満たす任意の関数が該当し、プレイヤー\(2\)の利得関数\(u_{2}\)としては、\begin{eqnarray*}
&&u_{2}\left( S,R\right) =u_{2}\left( R,P\right) =u_{2}\left( P,S\right) \\
&>&u_{2}\left( R,R\right) =u_{2}\left( P,P\right) =u_{2}\left( S,S\right) \\
&>&u_{2}\left( P,R\right) =u_{2}\left( P,R\right) =u_{2}\left( R,S\right)
\end{eqnarray*}を満たす任意の関数が該当します。
例(利得)
先の複占市場の例におけるプレイヤーの利得の体系として典型的なものは、それぞれの企業は「自分の利潤がより大きい結果をより好む」というものです。つまり、プレイヤーは利潤と利得を同一視するということです。繰り返しになりますが、2 つの企業が選択する生産量の組み合わせが\(\left( a_{1},a_{2}\right) \)であるとき、商品の市場価格は\(p\left( a_{1}+a_{2}\right) >0\)で均衡するものとします。また、企業\(i\in I=\{1,2\}\)が商品を\(a_{1}\)だけ生産するための費用を\(c_{i}\left( a_{i}\right) \geq 0\)で表すものとします。このとき、\(\left( a_{1},a_{2}\right) \)のもとで企業\(1\)が得る利得は、収入から費用を差し引いて得られる利潤\begin{equation*}
u_{1}\left( a_{1},a_{1}\right) =p\left( a_{1}+a_{2}\right) \cdot
a_{1}-c_{1}\left( a_{1}\right)
\end{equation*}と一致します。同様に、\(\left( a_{1},a_{2}\right) \)のもとで企業\(2\)が得る利得は、\begin{equation*}
u_{2}\left( a_{1},a_{1}\right) =p\left( a_{1}+a_{2}\right) \cdot
a_{2}-c_{2}\left( a_{2}\right)
\end{equation*}となります。

 

戦略型ゲーム

繰り返しになりますが、完備情報の静学ゲームを記述するためには「プレイヤー」「行動」「結果」「利得」をそれぞれ特定する必要があります。ゲームのプレイヤーはプレイヤー集合\(I\)によって表現可能であり、それぞれのプレイヤー\(i\in I\)の行動は行動集合\(A_{i}\)によって表現可能です。プレイヤーたちが選ぶ行動の組\(a_{I}\in A_{I}\)にはゲームにおいて起こり得る結果が 1 つずつ対応しているため、それぞれのプレイヤー\(i\)の利得は利得関数\(u_{i}:A_{I}\rightarrow \mathbb{R} \)として表現可能です。以上の要素からなるモデルを、\begin{equation*}
G=(I,\left\{ A_{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in I})
\end{equation*}で表し、これを戦略型ゲーム(game in strategic form)や標準型ゲーム(game in normal form)などと呼びます。

完備情報の静学ゲームが戦略型ゲーム\(G\)によって表されるとき、ゲームの完備性より、\(G\)を構成するすべての要素はプレイヤーたちの共有知識です。また、ゲームの静学性より、プレイヤーたちは以下の手順で意志決定を行います。

  1. それぞれのプレイヤー\(i\)は自身の行動集合\(A_{i}\)の中から特定の行動\(a_{i}\)を選択する。その際、他のプレイヤーたちが選択した行動を観察できない。
  2. プレイヤーたちが選択した行動の組\(a_{I}=\left( a_{i}\right) _{i\in I}\)に対して、ゲームのルールが結果を定める。
  3. そのゲームの結果から、それぞれのプレイヤー\(i\)は利得\(u_{i}(a_{I})\)を得る。

以下は戦略型ゲームとして定式化された完備情報の静学ゲームの例です。

囚人のジレンマ 軍拡競争 価格競争 広告競争 美人投票 クールノー競争 ベルトラン競争

 

利得行列

戦略型ゲーム\(G\)を構成するすべての要素が有限集合である場合には\(G\)を有限ゲーム(finite game)と呼びます。具体的には、ゲーム\(G\)が有限であるとは、プレイヤー集合\(I\)と任意のプレイヤー\(i\in I\)の行動集合\(A_{i}\)が有限集合であるということです。有限ゲームではプレイヤーの数が有限であるとともに、それぞれのプレイヤーが選択可能な行動の数もまた有限です。

戦略型ゲームが有限な 2 人ゲームである場合には、そのゲームを行列を用いて表現できます。具体的には、2 人のプレイヤーをそれぞれ\(1,2\)で表し、彼らの行動集合をそれぞれ\(A_{1}=\{a_{11},a_{12}\},A_{2}=\{a_{21},a_{22}\}\)で表す場合、ゲーム\(G\)を以下のような行列として表現できます。これを利得行列(payoff matrix)と呼びます。
$$\begin{array}{ccc}
\hline
1\backslash 2 & a_{21} & a_{22} \\ \hline
a_{11} & u_{1}\left( a_{11},a_{21}\right) ,\ u_{2}\left( a_{11},a_{21}\right) & u_{1}\left( a_{11},a_{22}\right) ,\ u_{2}\left( a_{11},a_{22}\right) \\ \hline
a_{12} & u_{1}\left( a_{11},a_{21}\right) ,\ u_{2}\left( a_{11},a_{21}\right) & u_{1}\left( a_{12},a_{22}\right) ,\ u_{2}\left( a_{12},a_{22}\right) \\ \hline
\end{array}$$

表:利得行列

上の利得行列について、プレイヤー\(1\)は行を選択し、プレイヤー\(2\)は列を選択するものとみなします。さらに、利得行列の\(i\)行\(j\)列(\(i,j=1,2\))成分\(\left( u_{1}\left( a_{1i},a_{2j}\right) ,\ u_{2}\left( a_{1i},a_{2j}\right) \right) \)は、プレイヤー\(1\)が行動\(a_{1i}\)を選びプレイヤー\(2\)が行動\(a_{2j}\)を選んだときに 2 人が得る利得の組み合わせを表しています。

例(利得行列)
2 人がジャンケンを 1 回だけ行う状況を想定します。プレイヤー集合は\(I=\{1,2\}\)であり、それぞれのプレイヤー\(i\in I\)の行動集合は\(A_{i}=\{R,P,S\}\)です。ただし、\(R\)はグー(Rock)、\(P\)はパー(Paper)、\(S\)はチョキ(Scissors)を表します。プレイヤーの利得の体系として典型的なものは「自分が勝つ」「あいこ」「相手が勝つ」の順番で好むというものです。このような状況は、例えば、以下の利得行列として表されます。
$$\begin{array}{cccc}
\hline
1\backslash 2 & R & P & S \\ \hline
R & 0,0 & -1,1 & 1,-1 \\ \hline
P & 1,-1 & 0,0 & -1,1 \\ \hline
S & -1,1 & 1,-1 & 0,0 \\ \hline
\end{array}$$
表:利得行列

戦略型ゲーム\(G\)を構成する少なくとも1つの要素が無限集合である場合には\(G\)を無限ゲーム(infinite game)と呼びます。つまり、ゲーム\(G\)が無限であるとはプレイヤー集合\(I\)、もしくは少なくとも 1 人のプレイヤー\(i\)の行動集合\(A_{i}\)が無限集合であるということです。無限ゲームではプレイヤーの人数が無限であるか、もしくは少なくとも 1 人のプレイヤーは無限個の行動を選択可能です。通常、無限ゲームは利得行列を用いて表現することはできません。

例(利得行列)
先の複占市場の例において、それぞれの企業\(i\in I=\{1,2\}\)の行動\(a_{i}\)は商品の生産量ですが、これが任意の非負の実数を値として取り得るものとするのであれば、行動集合は\(A_{i}= \mathbb{R} _{+}\)という無限集合になります。したがって、この状況を表すゲーム\(G\)は無限ゲームであるため、利得行列を用いてそれを表現することはできません。

次回はプレイヤーによる意思決定を純戦略と呼ばれる概念を用いて表現することを学びます。

次へ進む 質問・コメント(プレミアム会員限定) 演習問題(プレミアム会員限定)
Share on facebook
Share on twitter
Share on email
< 前のページ
次のページ >

プレミアム会員サービス

ユーザー名とメールアドレスを入力して有料(500円/月)のプレミアム会員へアップグレードすることにより、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題、解答など)へのアクセスが可能に。
会員サービス
ログイン

プレミアム会員だけが質問やコメントを投稿・閲覧できます。

完備情報の静学ゲーム
アカウント
ログイン