教材一覧
教材一覧
教材検索

完備情報の静学ゲーム

戦略型ゲーム(標準型ゲーム)

目次

前のページ:
Twitterで共有
メールで共有

完備情報の静学ゲーム

ゲーム理論(game theory)は戦略的相互依存性(strategic interdependence)が存在する状況を分析対象とする学問です。戦略的相互依存性が存在する状況とは、複数の主体が関わり合う場面において、それぞれの主体が最終的に直面する結果が自身の行動だけによって決まるのではなく、他の主体による行動にも依存するような状況を指します。戦略的相互依存関係が成立する状況をモデル化する際には、以下の要素を具体的に記述します。

  1. ゲームにおいて意思決定を行う主体は誰か。つまり、ゲームのプレイヤー(player)は誰か。
  2. プレイヤーたちはどのような順番(turn)で意思決定を行うか。
  3. プレイヤーたちが意思決定を行う際にどのような選択肢が与えられているか。つまり、プレイヤーたちはどのような行動(action)を選択可能か。
  4. プレイヤーが意思決定を行う際にどのような情報(information)が与えられているか。
  5. プレイヤーたちが意思決定を行う帰結として、どのような結果(outcome)が起こり得るか。
  6. プレイヤーたちはそれぞれの結果をどのように評価しているか。すなわち、プレイヤーはどのような利得(payoff)の体系を持っているか。

以上の要素をゲームのルール(rule)と呼びます。ゲームの開始後、それぞれの「プレイヤー」は自身が行動する「順番」になったら、その時点においてアクセス可能な「情報」を活用しつつ、何らかの行動原理にもとづいて、与えられた選択肢の中から特定の「行動」を選択します。すべてのプレイヤーによる意志決定が終了したら、プレイヤーたちが選んだ行動の組み合わせに応じて特定の「結果」が実現し、それぞれのプレイヤーは実現した結果から「利得」を得ます。

戦略的相互依存関係に直面したプレイヤーたちは、自身にとってより望ましい結果を導くために、最終的な意志決定を行う前に交渉を行う可能性があります。事前交渉の結果に対してプレイヤーたちの間に拘束的な合意が成立するのであれば、プレイヤーたちはグループを作って互いに協力的な意志決定を行う可能性があります。そして、その場合の意思決定は、プレイヤーたちの間に拘束的な合意が成立しない場合の意思決定とは異なるものになり得ます。ですから、戦略的相互依存関係を分析する際には、プレイヤーたちの間に拘束的な合意が成立するか否かを事前に明らかにしておく必要があります。本節の分析対象である非協力ゲーム(non-cooperative game)とは、プレイヤーたちの間に拘束的な合意が成立しないようなゲームです。非協力ゲームではプレイヤーたちの間に拘束的な合意が成立しないため、それぞれのプレイヤーは他のプレイヤーによる意志決定から独立した形で自身の意思決定を行います。したがって、非協力ゲームを「プレイヤーたちがそれぞれ独立に意志決定を行うゲーム」と定義することもできます。

ゲームに参加するすべてのプレイヤーが同時に意思決定を行うとき、そのゲームを静学ゲーム(static game)や同時手番ゲーム(simultaneous move game)などと呼びます。本節の分析対象は静学ゲームです。静学ゲームという概念はゲームのルールの中でも「順番」を基準にゲームを分類することで得られる概念ですが、「情報」によって静学ゲームという概念を特徴づけることもできます。具体的には、プレイヤーたちが同時に意思決定を行うことは、それぞれのプレイヤーが意思決定を行う際に、他のプレイヤーたちが行った意思決定を事前に観察できないことと実質的に同じです。したがって、静学ゲームを「それぞれのプレイヤーが意志決定を行う際に他のプレイヤーたちが行った意志決定に関する情報を与えられないゲーム」と定義することもできます。

戦略的相互依存関係に直面したそれぞれのプレイヤーは、自分が直面しているゲームのルールを常に正確に把握できるとは限りません。戦略的相互依存関係を分析する際には、それぞれのプレイヤーがゲームのルールにどの程度精通しているかを事前に明らかにしておく必要があります。問題としているゲームのルールのすべての要素からなる集合を\(P\)で表記します。すべてのプレイヤーがゲームのルールを完全に知っている場合、すなわちすべてのプレイヤーが\(P\)を知っている場合、その事実を\(P_{1}\)で表記します。また、すべてのプレイヤーが事実\(P_{1}\)を知っているという事実を\(P_{2}\)で表記します。事実\(P_{3},P_{4},\cdots \)についても同様に考えます。その上で、無限個の事実\(P_{1},P_{2},P_{3},P_{4},\cdots \)が成立する場合、ゲームのルールに相当する事実\(P\)はプレイヤーたちにとって共有知識(common knowledge)であると言います。本節の分析対象である完備情報ゲーム(game ofcomplete information)とは、ゲームのルールのすべての要素がすべてのプレイヤーにとって共有知識であるようなゲームです。

本節の分析対象は非協力かつ静学かつ完備情報であるようなゲームです。これを完備情報の静学ゲーム(static games of complete information)と呼びます。完備情報の静学ゲームは非協力ゲームであるため、そこではプレイヤーたちの間に拘束的な合意は成立せず、それぞれのプレイヤーの意思決定は他のプレイヤーたちの意思決定からは独立した形で行われます。完備情報の静学ゲームを分析対象とする場合、ゲームのルールの中でも「順番」と「情報」は明らかです。つまり、完備情報の静学ゲームおいて、すべてのプレイヤーは同時に意思決定を行います。言い換えると、それぞれのプレイヤーは他のプレイヤーたちが選択する行動を観察できない状態で自身の行動を決定する必要があります。また、完備情報の静学ゲームのルールはすべてのプレイヤーにとって共有知識です。つまり、ゲームのルールを\(P\)で表し、すべてのプレイヤーが\(P\)を知っているという事実を\(P_{1}\)で表し、すべてのプレイヤーが\(P_{1}\)を知っているという事実を\(P_{2}\)で表し、\(\cdots \)などと表記を定めるとき、無限個の事実\(P_{1},P_{2},P_{3},P_{4},\cdots \)が成立することを仮定するということです。以上を踏まえると、完備情報の静学ゲームを記述するためには、ゲームのルールの残りの要素である「プレイヤー」「行動」「結果」「利得」を特定すればよいということになります。これらの要素を記述する方法はいくつか存在しますが、以下では戦略型ゲーム(game in strategic form)と呼ばれるモデルを紹介します。

 

プレイヤーの表現

完備情報の静学ゲームに参加するすべてのプレイヤーからなる集合をプレイヤー集合(player set)やプレイヤー空間(player space)などと呼び、これを\(I\)で表します。

\(n\)人のプレイヤーが参加するゲームを\(n\)人ゲーム(\(n\)-players game)と呼びます。その上で、\(n\)人ゲームのプレイヤー集合を\(I=\{1,2,\cdots ,n\}\)で表します。また、プレイヤー集合\(I\)に属する\(i\ \left( =1,2,\cdots ,n\right) \)番目のプレイヤーをプレイヤー\(i\)(player \(i\))と呼びます。\(i\in I\)です。

戦略的相互依存関係は複数のプレイヤーが存在することで初めて成立する状況であるため、プレイヤーの数が複数であることはゲームの基本的な条件となります。そこで、多くの場合、プレイヤーの人数\(n\)は\(2\)以上の整数と仮定します。

プレイヤーの単位として何を採用するかは分析対象となる戦略的相互依存関係に応じて変化します。個人をプレイヤーの単位とする場合もあれば、組織や国家などをプレイヤーの単位とする場合もあります。プレイヤーの単位を決定する上で重要なことは、ゲームにおいて自律的な意思決定を行う最小単位がプレイヤーであるということです。もう1つの重要な点は、その主体が戦略的相互依存関係に直面する中で意思決定を行う主体であるということです。したがって、他の主体との関係性の中で意思決定を行うのではなく、外生的に変化する状況に対応する形でのみ意志決定を行う主体はプレイヤーとはみなされず、モデルの環境変数とみなされます。

例(プレイヤー集合)
2人がジャンケンを1回だけ行う状況を想定します。2人をそれぞれ\(1,2\)と呼ぶのであれば、このゲームのプレイヤー集合は\(I=\{1,2\}\)となります。
例(プレイヤー集合)
複占市場において2つの企業が競争する状況を分析する際には、そのゲームのプレイヤーは2つの企業であり、彼らが供給する商品の消費者はプレイヤーとはみなされません。なぜなら、消費者は2つの企業による行動の結果として決定される商品の価格を所与として意思決定を行う主体であり、消費者と企業の間には戦略的相互依存関係は成立しないからです。これをテクニカルに表現すると、複占市場のプレイヤーである企業にとって市場の需要曲線は外生的に与えられる要因であり、消費者は市場の需要曲線を形成する環境変数として位置付けられるということです。2つの企業をそれぞれ\(1,2\)と呼ぶのであれば、このゲームのプレイヤー集合は\(I=\{1,2\}\)となります。

 

行動の表現

完備情報の静学ゲームにおいてそれぞれのプレイヤーに選択肢として与えられているすべての行動からなる集合をそのプレイヤーの行動集合(action set)や行動空間(action space)などと呼びます。プレイヤー\(i\in I\)の行動集合を\(A_{i}\)で表し、プレイヤー\(i\)の個々の行動を\(a_{i}\in A_{i}\)で表します。

すべてのプレイヤーの行動からなる組を\(a_{I}=(a_{i})_{i\in I}\)で表し、プレイヤー\(i\)以外のプレイヤーたちの行動の組を\(a_{-i}=(a_{j})_{j\in I\backslash \left\{ i\right\} }\)で表します。\(a_{I}=\left( a_{i},a_{-i}\right) \)です。

すべてのプレイヤーの行動集合の直積を\(A_{I}=\prod_{i\in I}A_{i}\)で表します。また、\(A_{-i}=\prod_{j\in I\backslash \left\{ i\right\} }A_{j}\)と定めます。\(a_{I}\in A_{I}\)かつ\(a_{-i}\in A_{-i}\)です。

例(行動集合)
先のジャンケンの例において、それぞれのプレイヤー\(i\in I=\{1,2\}\)の行動集合は、\begin{equation*}
A_{i}=\left\{ R,P,S\right\}
\end{equation*}となります。ただし、\(R\)はグー(Rock)、\(P\)はパー(Paper)、\(S\)はチョキ(Scissors)をそれぞれ表します。
例(行動集合)
先の複占市場の例において、それぞれの企業\(i\in I=\{1,2\}\)は商品の生産量として任意の非負の実数を選択可能であるならば、その行動集合は、\begin{equation*}
A_{i}=\mathbb{R}_{+}
\end{equation*}となります。

 

結果の表現

完備情報の静学ゲームにおいてプレイヤーたちが行動の組\(a_{I}\in A_{I}\)を選ぶと、それに対して何らかの結果が実現します。完備情報の静学ゲームにおいて起こり得る結果を特定することとは、\(A_{I}\)に属するそれぞれの行動の組\(a_{I}\)に対して結果を1つずつ割り当てることを意味します。ちなみに、異なる行動の組が同一の結果をもたらす状況は起こり得ます。

例(結果)
先のジャンケンの例における結果は、2人が出す手の組み合わせに応じて生じる結果のことですが、それらは「\(1\)が勝つ」「\(2\)が勝つ」「あいこ」の3種類に分類可能です。具体的には、2人が出す手の組を\(\left( a_{1},a_{2}\right) \)で表すとき、「\(1\)が勝つ」という結果に相当する行動の組は\(\left( R,S\right) ,\left( P,R\right) ,\left( S,P\right) \)の3つ、「\(2\)が勝つ」という結果に相当する行動の組は\(\left( R,P\right) ,\left( P,S\right) ,\left( S,R\right) \)の3つ、「あいこ」という結果に相当する行動の組は\(\left( R,R\right) ,\left( P,P\right) ,\left( S,S\right) \)の3つです。ただし、\(R\)はグー、\(P\)はパー、\(S\)はチョキを表します。
例(結果)
先の複占市場の例における結果は、2つの企業が選ぶ生産量の組み合わせに応じて生じる結果のことです。ここでは商品の均衡価格に注目します。具体的には、2つの企業が選択する生産量の組み合わせが\(\left( a_{1},a_{2}\right) \in \mathbb{R}_{+}^{2}\)であるとき、市場の総供給量は\(a_{1}+a_{2}\)となりますが、それに対して商品の市場価格は\(p\left( a_{1}+a_{2}\right) >0\)で均衡するものとします。ただし、\(p\)は市場の逆需要関数です。

 

利得の表現

プレイヤーたちが選ぶそれぞれの行動の組\(a_{I}\)にはゲームにおいて起こり得る結果が1つずつ対応しているため、プレイヤーがどの結果を好むかを記述する代わりに、プレイヤーがどの行動の組を好むかを記述しても一般性は失われません。そこで、プレイヤー\(i\)が持つ好みの体系を行動の組からなる集合\(A_{I}\)上の二項関係\(\succsim _{i}\)として定式化し、これをプレイヤー\(i\)の選好関係(preference relation)と呼びます。具体的には、任意の2つの行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{equation*}
a_{I}\succsim _{i}a_{I}^{\prime }\Leftrightarrow \text{プレイヤー}i\text{は}a_{I}\text{を}a_{I}^{\prime }\text{以上に好む}
\end{equation*}という関係を満たすものとして\(\succsim _{i}\)を定義します。つまり、比較対象として2つの行動の組\(a_{I},a_{I}^{\prime }\)を提示されたとき、プレイヤー\(i\)が\(a_{I}\)(のもとで実現する結果)を\(a_{I}^{\prime }\)(のもとで実現する結果)以上に好むとき、そしてその場合にのみ\(a_{I}\succsim _{i}a_{I}^{\prime }\)が成り立つものとして\(\succsim _{i}\)を定義するということです。ただし、\(a_{I}\)を\(a_{I}^{\prime }\)以上に好むとは、\(a_{I}\)を\(a_{I}^{\prime }\)よりも好むか、または\(a_{I}\)と\(a_{I}^{\prime }\)を同じ程度好むことを意味します。

プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、任意の行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{equation*}
a_{I}\succ _{i}a_{I}^{\prime }\Leftrightarrow \left[ a_{I}\succsim
_{i}a_{I}^{\prime }\wedge \lnot \left( a_{I}^{\prime }\succsim
_{i}a_{I}\right) \right] \end{equation*}という関係を満たすものとして\(A_{I}\)上の新たな二項関係\(\succ _{i}\)を定義します。これをプレイヤー\(i\)の狭義選好関係(strict preference relation)と呼びます。つまり、比較対象として2つの行動の組\(a_{I},a_{I}^{\prime }\)が提示されたとき、プレイヤー\(i\)が\(a_{I}\)を\(a_{I}^{\prime }\)以上に好むが\(a_{I}^{\prime }\)を\(a_{I}\)以上には好まないとき、そしてその場合にのみ\(a_{I}\succ _{i}a_{I}^{\prime }\)が成り立つものとして\(\succ _{i}\)を定義するということです。

プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、任意の行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{equation*}
a_{I}\sim _{i}a_{I}^{\prime }\Leftrightarrow \left( a_{I}\succsim
_{i}a_{I}^{\prime }\wedge a_{I}^{\prime }\succsim _{i}a_{I}\right)
\end{equation*}という関係を満たすものとして\(A_{I}\)上の新たな二項関係\(\sim _{i}\)を定義します。これをプレイヤー\(i\)の無差別関係(indifference relation)と呼びます。つまり、比較対象として2つの行動の組\(a_{I},a_{I}^{\prime }\)が提示されたとき、プレイヤー\(i\)が\(a_{I}\)を\(a_{I}^{\prime }\)以上に好むと同時に\(a_{I}^{\prime }\)を\(a_{I}\)以上に好むとき、そしてその場合にのみ\(a_{I}\sim _{i}a_{I}^{\prime }\)が成り立つものとして\(\sim _{i}\)を定義するということです。

例(選好関係)
先のジャンケンの例におけるプレイヤーの選好として典型的なものは、それぞれのプレイヤーは「自分が勝つ」「あいこ」「相手が勝つ」の順番で好むというものです。その場合、プレイヤー\(1\)の選好関係\(\succsim _{1}\)は、\begin{eqnarray*}&&\left( R,S\right) \sim _{1}\left( P,R\right) \sim _{1}\left( S,P\right) \\
&\succ &_{1}\left( R,R\right) \sim _{1}\left( P,P\right) \sim _{1}\left(
S,S\right) \\
&\succ &_{1}\left( R,P\right) \sim _{1}\left( P,S\right) \sim _{1}\left(
S,R\right)
\end{eqnarray*}と記述され、プレイヤー\(2\)の選好関係\(\succsim _{2}\)は、\begin{eqnarray*}&&\left( S,R\right) \sim _{2}\left( R,P\right) \sim _{2}\left( P,S\right) \\
&\succ &\left( R,R\right) \sim _{2}\left( P,P\right) \sim _{2}\left(
S,S\right) \\
&\succ &\left( P,R\right) \sim _{2}\left( P,R\right) \sim _{2}\left(
R,S\right)
\end{eqnarray*}と記述されます。
例(選好関係)
先の複占市場の例におけるプレイヤーの選好として典型的なものは、それぞれの企業は「自分の利潤がより大きい結果をより好む」というものです。2つの企業が選択する生産量の組み合わせが\(\left( a_{1},a_{2}\right) \in \mathbb{R}_{+}^{2}\)であるとき、商品の市場価格は\(p\left( a_{1}+a_{2}\right) >0\)で均衡するものとします。また、企業\(i\in I=\{1,2\}\)が商品を\(a_{i}\)だけ生産するために必要な費用を\(c_{i}\left( a_{i}\right) \geq 0\)で表すものとします。このとき、\(\left( a_{1},a_{2}\right) \)のもとで企業\(1\)が得る利潤\(\pi _{1}\left( a_{1},a_{2}\right) \)は、収入から費用を差し引いて得られる、\begin{equation*}
\pi _{1}\left( a_{1},a_{2}\right) =p\left( a_{1}+a_{2}\right) \cdot
a_{1}-c_{1}\left( a_{1}\right)
\end{equation*}です。この場合、プレイヤー\(1\)の選好関係\(\succsim _{1}\)は、任意の2つの行動の組\(\left( a_{1},a_{2}\right) ,\left( a_{1}^{\prime },a_{2}^{\prime }\right) \in \mathbb{R}_{+}^{2}\)に対して、\begin{equation*}
\left( a_{1},a_{2}\right) \succsim _{1}\left( a_{1}^{\prime },a_{2}^{\prime
}\right) \Leftrightarrow \pi _{1}\left( a_{1},a_{2}\right) \succsim _{1}\pi
_{1}\left( a_{1}^{\prime },a_{2}^{\prime }\right)
\end{equation*}を満たすものとして記述されます。つまり、\(\left( a_{1},a_{2}\right) \)のもとで自身が得る利潤が\(\left( a_{1}^{\prime },a_{2}^{\prime }\right) \)のもとで自身が得る利潤以上である場合、そしてその場合にのみ、プレイヤー\(1\)は\(\left( a_{1},a_{2}\right) \)を\(\left( a_{1}^{\prime },a_{2}^{\prime }\right) \)以上に好むということです。プレイヤー\(2\)の選好関係\(\succsim _{2}\)についても同様です。

プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、ある関数\(u_{i}:A_{I}\rightarrow \mathbb{R}\)が存在して、任意の2つの行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{equation*}
u_{i}\left( a_{I}\right) \geq u_{i}\left( a_{I}^{\prime }\right)
\Leftrightarrow a_{I}\succsim _{i}a_{I}^{\prime }
\end{equation*}という関係が成り立つ場合には、この関数\(u_{i}\)のことを\(\succsim _{i}\)を表現する利得関数(payoff function)と呼びます。また、利得関数\(u\)が行動の組\(a_{I}\)に対して定める値\(u_{i}\left( a_{I}\right) \)をプレイヤー\(i\)が\(a_{I}\)から得る利得(payoff)と呼びます。つまり、選好関係\(\succsim _{i}\)を表現する利得関数\(u_{i}\)が存在する場合、行動の組\(a_{I},a_{I}^{\prime }\)について\(a_{I}\)が\(a_{I}^{\prime }\)以上に望ましいことと、\(a_{I}\)の利得が\(a_{I}^{\prime }\)の利得以上であることが必要十分になります。言い換えると、利得関数を用いれば、行動の組の間の相対的な望ましさを、行動の組がもたらす利得の大小関係として表現できるということです。ちなみに、選好関係\(\succsim _{i}\)を表す利得関数\(u_{i}\)が存在する場合、任意の2つの行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{eqnarray*}
u_{i}\left( a_{I}\right) &>&u_{i}\left( a_{I}^{\prime }\right)
\Leftrightarrow a_{I}\succ _{i}a_{I}^{\prime } \\
u_{i}\left( a_{I}\right) &=&u_{i}\left( a_{I}^{\prime }\right)
\Leftrightarrow a_{I}\sim _{i}a_{I}^{\prime }
\end{eqnarray*}という関係もまた成立します。

プレイヤー\(i\)の利得関数\(u_{i}\)の定義域が\(A_{I}\)であることは、プレイヤー\(i\)の効用\(u_{i}\left( a_{I}\right) =u_{i}\left( a_{i},a_{-i}\right) \)が自身の行動\(a_{i}\)だけに依存するのではなく自分とは異なるプレイヤーたちの行動の組\(a_{-i}\)にも依存することを意味します。つまり、利得関数を上のように定義することを通じて、プレイヤー間に戦略的相互依存関係が存在する状況を表現しています。

一般に、プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、それを表現する利得関数\(u_{i}\)は存在するとは限りません。ただ、利得関数が存在することを保証する上で必要とされる条件については様々なものが知られています。利得関数の存在条件については場を改めて詳しく解説します。

例(利得関数)
繰り返しになりますが、先のジャンケンの例におけるプレイヤー\(1\)の利得関数\(u_{1}\)としては、\begin{eqnarray*}
&&u_{1}\left( R,S\right) =u_{1}\left( P,R\right) =u_{1}\left( S,P\right) \\
&>&u_{1}\left( R,R\right) =u_{1}\left( P,P\right) =u_{1}\left( S,S\right) \\
&>&u_{1}\left( R,P\right) =u_{1}\left( P,S\right) =u_{1}\left( S,R\right)
\end{eqnarray*}を満たす任意の関数が該当し、プレイヤー\(2\)の利得関数\(u_{2}\)としては、\begin{eqnarray*}
&&u_{2}\left( S,R\right) =u_{2}\left( R,P\right) =u_{2}\left( P,S\right) \\
&>&u_{2}\left( R,R\right) =u_{2}\left( P,P\right) =u_{2}\left( S,S\right) \\
&>&u_{2}\left( P,R\right) =u_{2}\left( P,R\right) =u_{2}\left( R,S\right)
\end{eqnarray*}を満たす任意の関数が該当します。
例(利得関数)
繰り返しになりますが、先の複占市場の例におけるプレイヤー\(1\)の利得関数\(u_{1}\)としては、任意