教材一覧
教材検索
STATIC GAME OF COMPLETE INFORMATION

戦略型ゲーム

目次

< 前のページ
Share on twitter
Twitterで共有
Share on email
メールで共有

完備情報の静学ゲーム

ゲーム理論(game theory)は戦略的相互依存性(strategic interdependence)が存在する状況を分析対象とする学問です。戦略的相互依存性が存在する状況とは、複数の主体が関わり合う場面において、それぞれの主体が最終的に直面する結果が自身の行動だけによって決まるのではなく、他の主体による行動にも依存するような状況を指します。戦略的相互依存関係が成立する状況をモデル化する際には、以下の要素を具体的に記述します。

  1. ゲームにおいて意思決定を行う主体は誰か。つまり、ゲームのプレイヤー(player)は誰か。
  2. プレイヤーたちはどのような順番(turn)で意思決定を行うか。
  3. プレイヤーたちが意思決定を行う際にどのような選択肢が与えられているか。つまり、プレイヤーたちはどのような行動(action)を選択可能か。
  4. プレイヤーが意思決定を行う際にどのような情報(information)が与えられているか。
  5. プレイヤーたちが意思決定を行う帰結として、どのような結果(outcome)が起こり得るか。
  6. プレイヤーたちはそれぞれの結果をどのように評価しているか。すなわち、プレイヤーはどのような利得(payoff)の体系を持っているか。

以上の要素をゲームのルール(rule)と呼びます。ゲームの開始後、それぞれの「プレイヤー」は自身が行動する「順番」になったら、その時点においてアクセス可能な「情報」を活用しつつ、何らかの行動原理にもとづいて、与えられた選択肢の中から特定の「行動」を選択します。すべてのプレイヤーによる意志決定が終了したら、プレイヤーたちが選んだ行動の組み合わせに応じて特定の「結果」が実現し、それぞれのプレイヤーは実現した結果から「利得」を得ます。

戦略的相互依存関係に直面したプレイヤーたちは、自身にとってより望ましい結果を導くために、最終的な意志決定を行う前に交渉を行う可能性があります。事前交渉の結果に対してプレイヤーたちの間に拘束的な合意が成立するのであれば、プレイヤーたちはグループを作って互いに協力的な意志決定を行う可能性があります。そして、その場合の意思決定は、プレイヤーたちの間に拘束的な合意が成立しない場合の意思決定とは異なるものになり得ます。ですから、戦略的相互依存関係を分析する際には、プレイヤーたちの間に拘束的な合意が成立するか否かを事前に明らかにしておく必要があります。本節の分析対象である非協力ゲーム(non-cooperative game)とは、プレイヤーたちの間に拘束的な合意が成立しないようなゲームです。非協力ゲームではプレイヤーたちの間に拘束的な合意が成立しないため、それぞれのプレイヤーは他のプレイヤーによる意志決定から独立した形で自身の意思決定を行います。したがって、非協力ゲームを「プレイヤーたちがそれぞれ独立に意志決定を行うゲーム」と定義することもできます。

ゲームに参加するすべてのプレイヤーが同時に意思決定を行うとき、そのゲームを静学ゲーム(static game)や同時手番ゲーム(simultaneous move game)などと呼びます。本節の分析対象は静学ゲームです。静学ゲームという概念はゲームのルールの中でも「順番」を基準にゲームを分類することで得られる概念ですが、「情報」によって静学ゲームという概念を特徴づけることもできます。具体的には、プレイヤーたちが同時に意思決定を行うことは、それぞれのプレイヤーが意思決定を行う際に、他のプレイヤーたちが行った意思決定を事前に観察できないことと実質的に同じです。したがって、静学ゲームを「それぞれのプレイヤーが意志決定を行う際に他のプレイヤーたちが行った意志決定に関する情報を与えられないゲーム」と定義することもできます。

戦略的相互依存関係に直面したそれぞれのプレイヤーは、自分が直面しているゲームのルールを常に正確に把握できるとは限りません。戦略的相互依存関係を分析する際には、それぞれのプレイヤーがゲームのルールにどの程度精通しているかを事前に明らかにしておく必要があります。問題としているゲームのルールのすべての要素からなる集合を\(P\)で表記します。すべてのプレイヤーがゲームのルールを完全に知っている場合、すなわちすべてのプレイヤーが\(P\)を知っている場合、その事実を\(P_{1}\)で表記します。また、すべてのプレイヤーが事実\(P_{1}\)を知っているという事実を\(P_{2}\)で表記します。事実\(P_{3},P_{4},\cdots \)についても同様に考えます。その上で、無限個の事実\(P_{1},P_{2},P_{3},P_{4},\cdots \)が成立する場合、ゲームのルールに相当する事実\(P\)はプレイヤーたちにとって共有知識(common knowledge)であると言います。本節の分析対象である完備情報ゲーム(game ofcomplete information)とは、ゲームのルールのすべての要素がすべてのプレイヤーにとって共有知識であるようなゲームです。

本節の分析対象は非協力かつ静学かつ完備情報であるようなゲームです。これを完備情報の静学ゲーム(static games of complete information)と呼びます。完備情報の静学ゲームは非協力ゲームであるため、そこではプレイヤーたちの間に拘束的な合意は成立せず、それぞれのプレイヤーの意思決定は他のプレイヤーたちの意思決定からは独立した形で行われます。完備情報の静学ゲームを分析対象とする場合、ゲームのルールの中でも「順番」と「情報」は明らかです。つまり、完備情報の静学ゲームおいて、すべてのプレイヤーは同時に意思決定を行います。言い換えると、それぞれのプレイヤーは他のプレイヤーたちが選択する行動を観察できない状態で自身の行動を決定する必要があります。また、完備情報の静学ゲームのルールはすべてのプレイヤーにとって共有知識です。つまり、ゲームのルールを\(P\)で表し、すべてのプレイヤーが\(P\)を知っているという事実を\(P_{1}\)で表し、すべてのプレイヤーが\(P_{1}\)を知っているという事実を\(P_{2}\)で表し、\(\cdots \)などと表記を定めるとき、無限個の事実\(P_{1},P_{2},P_{3},P_{4},\cdots \)が成立することを仮定するということです。以上を踏まえると、完備情報の静学ゲームを記述するためには、ゲームのルールの残りの要素である「プレイヤー」「行動」「結果」「利得」を特定すればよいということになります。これらの要素を記述する方法はいくつか存在しますが、以下では戦略型ゲーム(game in strategic form)と呼ばれるモデルを紹介します。

 

プレイヤーの表現

完備情報の静学ゲームに参加するすべてのプレイヤーからなる集合をプレイヤー集合(player set)やプレイヤー空間(player space)などと呼び、これを\(I\)で表します。

\(n\)人のプレイヤーが参加するゲームを\(n\)人ゲーム(\(n\)-players game)と呼びます。その上で、\(n\)人ゲームのプレイヤー集合を\(I=\{1,2,\cdots ,n\}\)で表します。また、プレイヤー集合\(I\)に属する\(i\ \left( =1,2,\cdots ,n\right) \)番目のプレイヤーをプレイヤー\(i\)(player \(i\))と呼びます。\(i\in I\)です。

戦略的相互依存関係は複数のプレイヤーが存在することで初めて成立する状況であるため、プレイヤーの数が複数であることはゲームの基本的な条件となります。そこで、多くの場合、プレイヤーの人数\(n\)は\(2\)以上の整数と仮定します。

プレイヤーの単位として何を採用するかは分析対象となる戦略的相互依存関係に応じて変化します。個人をプレイヤーの単位とする場合もあれば、組織や国家などをプレイヤーの単位とする場合もあります。プレイヤーの単位を決定する上で重要なことは、ゲームにおいて自律的な意思決定を行う最小単位がプレイヤーであるということです。もう1つの重要な点は、その主体が戦略的相互依存関係に直面する中で意思決定を行う主体であるということです。したがって、他の主体との関係性の中で意思決定を行うのではなく、外生的に変化する状況に対応する形でのみ意志決定を行う主体はプレイヤーとはみなされず、モデルの環境変数とみなされます。

例(プレイヤー集合)
2人がジャンケンを1回だけ行う状況を想定します。2人をそれぞれ\(1,2\)と呼ぶのであれば、このゲームのプレイヤー集合は\(I=\{1,2\}\)となります。
例(プレイヤー集合)
複占市場において2つの企業が競争する状況を分析する際には、そのゲームのプレイヤーは2つの企業であり、彼らが供給する商品の消費者はプレイヤーとはみなされません。なぜなら、消費者は2つの企業による行動の結果として決定される商品の価格を所与として意思決定を行う主体であり、消費者と企業の間には戦略的相互依存関係は成立しないからです。これをテクニカルに表現すると、複占市場のプレイヤーである企業にとって市場の需要曲線は外生的に与えられる要因であり、消費者は市場の需要曲線を形成する環境変数として位置付けられるということです。2つの企業をそれぞれ\(1,2\)と呼ぶのであれば、このゲームのプレイヤー集合は\(I=\{1,2\}\)となります。

 

行動の表現

完備情報の静学ゲームにおいてそれぞれのプレイヤーに選択肢として与えられているすべての行動からなる集合をそのプレイヤーの行動集合(action set)や行動空間(action space)などと呼びます。プレイヤー\(i\in I\)の行動集合を\(A_{i}\)で表し、プレイヤー\(i\)の個々の行動を\(a_{i}\in A_{i}\)で表します。

すべてのプレイヤーの行動からなる組を\(a_{I}=(a_{i})_{i\in I}\)で表し、プレイヤー\(i\)以外のプレイヤーたちの行動の組を\(a_{-i}=(a_{j})_{j\in I\backslash \left\{ i\right\} }\)で表します。\(a_{I}=\left( a_{i},a_{-i}\right) \)です。

すべてのプレイヤーの行動集合の直積を\(A_{I}=\prod_{i\in I}A_{i}\)で表します。また、\(A_{-i}=\prod_{j\in I\backslash \left\{ i\right\} }A_{j}\)と定めます。\(a_{I}\in A_{I}\)かつ\(a_{-i}\in A_{-i}\)です。

例(行動集合)
先のジャンケンの例において、それぞれのプレイヤー\(i\in I=\{1,2\}\)の行動集合は、\begin{equation*}
A_{i}=\left\{ R,P,S\right\}
\end{equation*}となります。ただし、\(R\)はグー(Rock)、\(P\)はパー(Paper)、\(S\)はチョキ(Scissors)をそれぞれ表します。
例(行動集合)
先の複占市場の例において、それぞれの企業\(i\in I=\{1,2\}\)は商品の生産量として任意の非負の実数を選択可能であるならば、その行動集合は、\begin{equation*}
A_{i}=\mathbb{R}_{+}
\end{equation*}となります。

 

結果の表現

完備情報の静学ゲームにおいてプレイヤーたちが行動の組\(a_{I}\in A_{I}\)を選ぶと、それに対して何らかの結果が実現します。完備情報の静学ゲームにおいて起こり得る結果を特定することとは、\(A_{I}\)に属するそれぞれの行動の組\(a_{I}\)に対して結果を1つずつ割り当てることを意味します。ちなみに、異なる行動の組が同一の結果をもたらす状況は起こり得ます。

例(結果)
先のジャンケンの例における結果は、2人が出す手の組み合わせに応じて生じる結果のことですが、それらは「\(1\)が勝つ」「\(2\)が勝つ」「あいこ」の3種類に分類可能です。具体的には、2人が出す手の組を\(\left( a_{1},a_{2}\right) \)で表すとき、「\(1\)が勝つ」という結果に相当する行動の組は\(\left( R,S\right) ,\left( P,R\right) ,\left( S,P\right) \)の3つ、「\(2\)が勝つ」という結果に相当する行動の組は\(\left( R,P\right) ,\left( P,S\right) ,\left( S,R\right) \)の3つ、「あいこ」という結果に相当する行動の組は\(\left( R,R\right) ,\left( P,P\right) ,\left( S,S\right) \)の3つです。ただし、\(R\)はグー、\(P\)はパー、\(S\)はチョキを表します。
例(結果)
先の複占市場の例における結果は、2つの企業が選ぶ生産量の組み合わせに応じて生じる結果のことです。ここでは商品の均衡価格に注目します。具体的には、2つの企業が選択する生産量の組み合わせが\(\left( a_{1},a_{2}\right) \in \mathbb{R}_{+}^{2}\)であるとき、市場の総供給量は\(a_{1}+a_{2}\)となりますが、それに対して商品の市場価格は\(p\left( a_{1}+a_{2}\right) >0\)で均衡するものとします。ただし、\(p\)は市場の逆需要関数です。

 

利得の表現

プレイヤーたちが選ぶそれぞれの行動の組\(a_{I}\)にはゲームにおいて起こり得る結果が1つずつ対応しているため、プレイヤーがどの結果を好むかを記述する代わりに、プレイヤーがどの行動の組を好むかを記述しても一般性は失われません。そこで、プレイヤー\(i\)が持つ好みの体系を行動の組からなる集合\(A_{I}\)上の二項関係\(\succsim _{i}\)として定式化し、これをプレイヤー\(i\)の選好関係(preference relation)と呼びます。具体的には、任意の2つの行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{equation*}
a_{I}\succsim _{i}a_{I}^{\prime }\Leftrightarrow \text{プレイヤー}i\text{は}a_{I}\text{を}a_{I}^{\prime }\text{以上に好む}
\end{equation*}という関係を満たすものとして\(\succsim _{i}\)を定義します。つまり、比較対象として2つの行動の組\(a_{I},a_{I}^{\prime }\)を提示されたとき、プレイヤー\(i\)が\(a_{I}\)(のもとで実現する結果)を\(a_{I}^{\prime }\)(のもとで実現する結果)以上に好むとき、そしてその場合にのみ\(a_{I}\succsim _{i}a_{I}^{\prime }\)が成り立つものとして\(\succsim _{i}\)を定義するということです。ただし、\(a_{I}\)を\(a_{I}^{\prime }\)以上に好むとは、\(a_{I}\)を\(a_{I}^{\prime }\)よりも好むか、または\(a_{I}\)と\(a_{I}^{\prime }\)を同じ程度好むことを意味します。

プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、任意の行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{equation*}
a_{I}\succ _{i}a_{I}^{\prime }\Leftrightarrow \left[ a_{I}\succsim
_{i}a_{I}^{\prime }\wedge \lnot \left( a_{I}^{\prime }\succsim
_{i}a_{I}\right) \right] \end{equation*}という関係を満たすものとして\(A_{I}\)上の新たな二項関係\(\succ _{i}\)を定義します。これをプレイヤー\(i\)の狭義選好関係(strict preference relation)と呼びます。つまり、比較対象として2つの行動の組\(a_{I},a_{I}^{\prime }\)が提示されたとき、プレイヤー\(i\)が\(a_{I}\)を\(a_{I}^{\prime }\)以上に好むが\(a_{I}^{\prime }\)を\(a_{I}\)以上には好まないとき、そしてその場合にのみ\(a_{I}\succ _{i}a_{I}^{\prime }\)が成り立つものとして\(\succ _{i}\)を定義するということです。

プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、任意の行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{equation*}
a_{I}\sim _{i}a_{I}^{\prime }\Leftrightarrow \left( a_{I}\succsim
_{i}a_{I}^{\prime }\wedge a_{I}^{\prime }\succsim _{i}a_{I}\right)
\end{equation*}という関係を満たすものとして\(A_{I}\)上の新たな二項関係\(\sim _{i}\)を定義します。これをプレイヤー\(i\)の無差別関係(indifference relation)と呼びます。つまり、比較対象として2つの行動の組\(a_{I},a_{I}^{\prime }\)が提示されたとき、プレイヤー\(i\)が\(a_{I}\)を\(a_{I}^{\prime }\)以上に好むと同時に\(a_{I}^{\prime }\)を\(a_{I}\)以上に好むとき、そしてその場合にのみ\(a_{I}\sim _{i}a_{I}^{\prime }\)が成り立つものとして\(\sim _{i}\)を定義するということです。

例(選好関係)
先のジャンケンの例におけるプレイヤーの選好として典型的なものは、それぞれのプレイヤーは「自分が勝つ」「あいこ」「相手が勝つ」の順番で好むというものです。その場合、プレイヤー\(1\)の選好関係\(\succsim _{1}\)は、\begin{eqnarray*}
&&u_{1}\left( R,S\right) \sim _{1}u_{1}\left( P,R\right) \sim
_{1}u_{1}\left( S,P\right) \\
&\succ &_{1}u_{1}\left( R,R\right) \sim _{1}u_{1}\left( P,P\right) \sim
_{1}u_{1}\left( S,S\right) \\
&\succ &_{1}u_{1}\left( R,P\right) \sim _{1}u_{1}\left( P,S\right) \sim
_{1}u_{1}\left( S,R\right)
\end{eqnarray*}と記述され、プレイヤー\(2\)の選好関係\(\succsim _{2}\)は、\begin{eqnarray*}
&&u_{2}\left( S,R\right) \sim _{2}u_{2}\left( R,P\right) \sim
_{2}u_{2}\left( P,S\right) \\
&\succ &u_{2}\left( R,R\right) \sim _{2}u_{2}\left( P,P\right) \sim
_{2}u_{2}\left( S,S\right) \\
&\succ &u_{2}\left( P,R\right) \sim _{2}u_{2}\left( P,R\right) \sim
_{2}u_{2}\left( R,S\right)
\end{eqnarray*}と記述されます。
例(選好関係)
先の複占市場の例におけるプレイヤーの選好として典型的なものは、それぞれの企業は「自分の利潤がより大きい結果をより好む」というものです。2つの企業が選択する生産量の組み合わせが\(\left( a_{1},a_{2}\right) \in \mathbb{R}_{+}^{2}\)であるとき、商品の市場価格は\(p\left( a_{1}+a_{2}\right) >0\)で均衡するものとします。また、企業\(i\in I=\{1,2\}\)が商品を\(a_{i}\)だけ生産するために必要な費用を\(c_{i}\left( a_{i}\right) \geq 0\)で表すものとします。このとき、\(\left( a_{1},a_{2}\right) \)のもとで企業\(1\)が得る利潤\(\pi _{1}\left( a_{1},a_{2}\right) \)は、収入から費用を差し引いて得られる、\begin{equation*}
\pi _{1}\left( a_{1},a_{2}\right) =p\left( a_{1}+a_{2}\right) \cdot
a_{1}-c_{1}\left( a_{1}\right)
\end{equation*}です。この場合、プレイヤー\(1\)の選好関係\(\succsim _{1}\)は、任意の2つの行動の組\(\left( a_{1},a_{2}\right) ,\left( a_{1}^{\prime },a_{2}^{\prime }\right) \in \mathbb{R}_{+}^{2}\)に対して、\begin{equation*}
\left( a_{1},a_{2}\right) \succsim _{1}\left( a_{1}^{\prime },a_{2}^{\prime
}\right) \Leftrightarrow \pi _{1}\left( a_{1},a_{2}\right) \succsim _{1}\pi
_{1}\left( a_{1}^{\prime },a_{2}^{\prime }\right)
\end{equation*}を満たすものとして記述されます。つまり、\(\left( a_{1},a_{2}\right) \)のもとで自身が得る利潤が\(\left( a_{1}^{\prime },a_{2}^{\prime }\right) \)のもとで自身が得る利潤以上である場合、そしてその場合にのみ、プレイヤー\(1\)は\(\left( a_{1},a_{2}\right) \)を\(\left( a_{1}^{\prime },a_{2}^{\prime }\right) \)以上に好むということです。プレイヤー\(2\)の選好関係\(\succsim _{2}\)についても同様です。

プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、ある関数\(u_{i}:A_{I}\rightarrow \mathbb{R}\)が存在して、任意の2つの行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{equation*}
u_{i}\left( a_{I}\right) \geq u_{i}\left( a_{I}^{\prime }\right)
\Leftrightarrow a_{I}\succsim _{i}a_{I}^{\prime }
\end{equation*}という関係が成り立つ場合には、この関数\(u_{i}\)のことを\(\succsim _{i}\)を表現する利得関数(payoff function)と呼びます。また、利得関数\(u\)が行動の組\(a_{I}\)に対して定める値\(u_{i}\left( a_{I}\right) \)をプレイヤー\(i\)が\(a_{I}\)から得る利得(payoff)と呼びます。つまり、選好関係\(\succsim _{i}\)を表現する利得関数\(u_{i}\)が存在する場合、行動の組\(a_{I},a_{I}^{\prime }\)について\(a_{I}\)が\(a_{I}^{\prime }\)以上に望ましいことと、\(a_{I}\)の利得が\(a_{I}^{\prime }\)の利得以上であることが必要十分になります。言い換えると、利得関数を用いれば、行動の組の間の相対的な望ましさを、行動の組がもたらす利得の大小関係として表現できるということです。ちなみに、選好関係\(\succsim _{i}\)を表す利得関数\(u_{i}\)が存在する場合、任意の2つの行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{eqnarray*}
u_{i}\left( a_{I}\right) &>&u_{i}\left( a_{I}^{\prime }\right)
\Leftrightarrow a_{I}\succ _{i}a_{I}^{\prime } \\
u_{i}\left( a_{I}\right) &=&u_{i}\left( a_{I}^{\prime }\right)
\Leftrightarrow a_{I}\sim _{i}a_{I}^{\prime }
\end{eqnarray*}という関係もまた成立します。

プレイヤー\(i\)の利得関数\(u_{i}\)の定義域が\(A_{I}\)であることは、プレイヤー\(i\)の効用\(u_{i}\left( a_{I}\right) =u_{i}\left( a_{i},a_{-i}\right) \)が自身の行動\(a_{i}\)だけに依存するのではなく自分とは異なるプレイヤーたちの行動の組\(a_{-i}\)にも依存することを意味します。つまり、利得関数を上のように定義することを通じて、プレイヤー間に戦略的相互依存関係が存在する状況を表現しています。

一般に、プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、それを表現する利得関数\(u_{i}\)は存在するとは限りません。ただ、利得関数が存在することを保証する上で必要とされる条件については様々なものが知られています。利得関数の存在条件については場を改めて詳しく解説します。

例(利得関数)
繰り返しになりますが、先のジャンケンの例におけるプレイヤー\(1\)の利得関数\(u_{1}\)としては、\begin{eqnarray*}
&&u_{1}\left( R,S\right) =u_{1}\left( P,R\right) =u_{1}\left( S,P\right) \\
&>&u_{1}\left( R,R\right) =u_{1}\left( P,P\right) =u_{1}\left( S,S\right) \\
&>&u_{1}\left( R,P\right) =u_{1}\left( P,S\right) =u_{1}\left( S,R\right)
\end{eqnarray*}を満たす任意の関数が該当し、プレイヤー\(2\)の利得関数\(u_{2}\)としては、\begin{eqnarray*}
&&u_{2}\left( S,R\right) =u_{2}\left( R,P\right) =u_{2}\left( P,S\right) \\
&>&u_{2}\left( R,R\right) =u_{2}\left( P,P\right) =u_{2}\left( S,S\right) \\
&>&u_{2}\left( P,R\right) =u_{2}\left( P,R\right) =u_{2}\left( R,S\right)
\end{eqnarray*}を満たす任意の関数が該当します。
例(利得関数)
繰り返しになりますが、先の複占市場の例におけるプレイヤー\(1\)の利得関数\(u_{1}\)としては、任意の2つの行動の組\(\left( a_{1},a_{2}\right) ,\left( a_{1}^{\prime },a_{2}^{\prime }\right) \in \mathbb{R}_{+}^{2}\)に対して、\begin{equation*}
u_{1}\left( a_{1},a_{2}\right) \geq u_{1}\left( a_{1}^{\prime
},a_{2}^{\prime }\right) \Leftrightarrow \pi _{1}\left( a_{1},a_{2}\right)
\succsim _{1}\pi _{1}\left( a_{1}^{\prime },a_{2}^{\prime }\right)
\end{equation*}を満たす任意の関数が該当します。例えば、それぞれの\(\left( a_{1},a_{2}\right) \in \mathbb{R}_{+}^{2}\)に対して、\begin{equation*}
u_{1}\left( a_{1},a_{2}\right) =\pi _{1}\left( a_{1},a_{2}\right)
\end{equation*}を定める関数\(u_{1}\)が具体例の1つです。この場合、プレイヤー\(1\)は行動の組\(\left( a_{1},a_{2}\right) \)から自身が得る利得と利潤を同一視するということです。プレイヤー\(2\)の利得関数\(u_{2}\)についても同様です。

 

戦略型ゲーム

繰り返しになりますが、完備情報の静学ゲームを記述するためには「プレイヤー」「行動」「結果」「利得」をそれぞれ特定する必要があります。ゲームのプレイヤーはプレイヤー集合\(I\)によって記述され、それぞれのプレイヤー\(i\in I\)の行動は行動集合\(A_{i}\)として記述されます。プレイヤーたちが選ぶ行動の組\(a_{I}\in A_{I}\)にはゲームにおいて起こり得る結果が1つずつ対応しているため、それぞれのプレイヤー\(i\)の利得は利得関数\(u_{i}:A_{I}\rightarrow \mathbb{R}\)として表現可能です。以上の要素からなるモデルを、\begin{equation*}
G=(I,\left\{ A_{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in I})
\end{equation*}と表記し、これを戦略型ゲーム(game in strategic form)や標準型ゲーム(game in normal form)などと呼びます。

完備情報の静学ゲームが戦略型ゲーム\(G\)によって表されるとき、ゲームの完備性より、\(G\)を構成するすべての要素はプレイヤーたちの共有知識です。また、ゲームの静学性より、プレイヤーたちは以下の手順で意志決定を行います。

  1. それぞれのプレイヤー\(i\)は自身の行動集合\(A_{i}\)の中から特定の行動\(a_{i}\)を選択する。その際、他のプレイヤーたちが選択した行動を観察できない。
  2. プレイヤーたちが選択した行動の組\(a_{I}=\left( a_{i}\right) _{i\in I}\)に対して、ゲームのルールが結果を定める。
  3. そのゲームの結果から、それぞれのプレイヤー\(i\)は利得\(u_{i}(a_{I})\)を得る。

 

利得行列

戦略型ゲーム\(G\)を構成するすべての要素が有限集合である場合には\(G\)を有限ゲーム(finite game)と呼びます。具体的には、ゲーム\(G\)が有限であるとは、プレイヤー集合\(I\)と任意のプレイヤー\(i\in I\)の行動集合\(A_{i}\)が有限集合であるということです。有限ゲームではプレイヤーの数が有限であるとともに、それぞれのプレイヤーが選択可能な行動の数もまた有限です。

戦略型ゲームが有限な2人ゲームである場合には、そのゲームを行列を用いて表現できます。具体的には、2 人のプレイヤーをそれぞれ\(1,2\)で表し、彼らの行動集合をそれぞれ\(A_{1}=\{a_{11},a_{12}\}\)と\(A_{2}=\{a_{21},a_{22}\}\)で表す場合、ゲーム\(G\)を以下のような行列として表現できます。これを利得行列(payoff matrix)と呼びます。
$$\begin{array}{ccc}
\hline
1\backslash 2 & a_{21} & a_{22} \\ \hline
a_{11} & u_{1}\left( a_{11},a_{21}\right) ,\ u_{2}\left( a_{11},a_{21}\right) & u_{1}\left( a_{11},a_{22}\right) ,\ u_{2}\left( a_{11},a_{22}\right) \\ \hline
a_{12} & u_{1}\left( a_{11},a_{21}\right) ,\ u_{2}\left( a_{11},a_{21}\right) & u_{1}\left( a_{12},a_{22}\right) ,\ u_{2}\left( a_{12},a_{22}\right) \\ \hline
\end{array}$$

表:利得行列

上の利得行列について、プレイヤー\(1\)は行を選択し、プレイヤー\(2\)は列を選択するものとみなします。さらに、利得行列の\(i\)行\(j \)列(\(i,j=1,2\))成分\(\left( u_{1}\left( a_{1i},a_{2j}\right) ,\ u_{2}\left( a_{1i},a_{2j}\right) \right) \)は、プレイヤー\(1\)が行動\(a_{1i}\)を選びプレイヤー\(2\)が行動\(a_{2j}\)を選んだときに 2 人が得る利得の組み合わせを表しています。

例(利得行列)
2人がジャンケンを1回だけ行う状況を想定します。プレイヤー集合は\(I=\{1,2\}\)であり、それぞれのプレイヤー\(i\in I\)の行動集合は\(A_{i}=\{R,P,S\}\)です。ただし、\(R\)はグー(Rock)、\(P\)はパー(Paper)、\(S\)はチョキ(Scissors)を表します。プレイヤーの利得の体系として典型的なものは「自分が勝つ」「あいこ」「相手が勝つ」の順番で好むというものです。このような状況は、例えば、以下の利得行列として表されます。

$$\begin{array}{cccc}
\hline
1\backslash 2 & R & P & S \\ \hline
R & 0,0 & -1,1 & 1,-1 \\ \hline
P & 1,-1 & 0,0 & -1,1 \\ \hline
S & -1,1 & 1,-1 & 0,0 \\ \hline
\end{array}$$

表:利得行列

戦略型ゲーム\(G\)を構成する少なくとも1つの要素が無限集合である場合には\(G\)を無限ゲーム(infinite game)と呼びます。つまり、ゲーム\(G\)が無限であるとはプレイヤー集合\(I\)、もしくは少なくとも 1 人のプレイヤー\(i\)の行動集合\(A_{i}\)が無限集合であるということです。無限ゲームではプレイヤーの人数が無限であるか、もしくは少なくとも1人のプレイヤーには無限個の行動が選択肢として与えられています。通常、無限ゲームは利得行列を用いて表現することはできません。

例(利得行列)
先の複占市場の例において、それぞれの企業\(i\in I=\{1,2\}\)の行動\(a_{i}\)は商品の生産量ですが、これが任意の非負の実数を値として取り得るものとするのであれば、行動集合は\(A_{i}=\mathbb{R}_{+}\)という無限集合になります。したがって、この状況を表すゲーム\(G\)は無限ゲームであるため、利得行列を用いてそれを表現することはできません。

 

演習問題

問題(戦略型ゲーム)
2人のプレイヤー\(1,2\)はそれぞれ\(A\)と\(B\)のどちらか一方の文字を選び、相手に見せないように紙に記します。2人とも書き終わったら、紙を開いて2人が記した文字を確認します。2人が選んだ文字が同じである場合、プレイヤー\(1\)がプレイヤー\(2\)に対して\(1\)万円を支払います。逆に、2人が選んだ文字が異なる場合、プレイヤー\(2\)がプレイヤー\(1\)に対して\(1\)万円を支払います。2人とも自身が得る金額を最大化するものと仮定します。以上の状況を戦略型ゲーム\(G=\left( I,\{A_{i}\}_{i\in I},\{u_{i}\}_{i\in I}\right) \)として定式化してください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(戦略型ゲーム)
ある道路沿いに3店のガソリンスタンドが密集して立地しています。ある日の朝、各店舗はその日のガソリン販売価格を設定しようとしています。3店とも営業開始時間は同じであるため、それぞれの店は、他の店が設定する価格を事前に知ることはできません。それぞれの店は、価格として任意の非負の実数を選べるものとします。この道路沿いにおける一日当たりのガソリン総販売額は\(6\)で一定であり、それを3つの店で奪い合う状況を想定します。すべての客は3つの店が提示する価格を観察した上で、最も安い店へ行くものとします。ただし、複数の店が同一の価格をつける場合、それらの店の間で総販売額\(6\)を等分する形になります。ガソリンの販売に必要な費用は無視します。3店とも、その日のガソリン販売額を最大化するものとします。以上の状況を戦略型ゲーム\(G=\left( I,\{A_{i}\}_{i\in I},\{u_{i}\}_{i\in I}\right) \)として定式化してください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(戦略型ゲーム)
ある企業には経営者と従業員が1人ずついます。この企業は今、ある事業を計画しています。もし事業に成功すれば経営者は収入\(10\)を、従業員は収入\(4\)を得ますが、事業に失敗すれば両者は収入\(0\)を得るものとします。事業が成功する確率は2人の行動に依存します。経営者に与えられている選択肢は、事業に必要な投資を行うか行わないかの2つです。従業員に与えられている選択肢は、事業のために努力するか怠けるかの2つです。経営者が投資を行い、従業員が努力する場合には、事業は確実に成功します。経営者が投資を行わず、従業員が怠ける場合、事業は確実に失敗します。また、経営者が投資を行い、従業員が怠ける場合、事業の成功確率は\(\frac{1}{2}\)であるものとします。また、経営者が投資を行わず、経営者が努力する場合、事業の成功確率は\(\frac{1}{4}\)であるものとします。経営者と従業員はともに自身が得る収入の期待値を最大化するものとします。以上の状況を戦略型ゲーム\(G=\left( I,\{A_{i}\}_{i\in I},\{u_{i}\}_{i\in I}\right) \)として定式化してください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

次回はプレイヤーによる意思決定を純粋戦略と呼ばれる概念を用いて表現することを学びます。

< 前のページ
Share on twitter
Twitterで共有
Share on email
メールで共有
RELATED KNOWLEDGE

関連知識

囚人のジレンマ

囚人のジレンマ

囚人のジレンマとして広く知られるゲームの最も基本的なモデルを紹介し、それを戦略型ゲームとして定式化した上で、その均衡を分析します。

囚人のジレンマ

n人囚人のジレンマ

囚人のジレンマは2人ゲームですが、これを3人以上に拡張するとどのようなモデルになるでしょうか。n人囚人のジレンマと呼ばれるゲームについて解説します。

囚人のジレンマ

非対称的な利得構造を持つ囚人のジレンマ

これまではプレイヤーたちが同一の利得関数を持つ囚人のジレンマについて考えてきましたが、状況を少し一般化して、プレイヤーたちが異なる利得関数を持つ場合の囚人のジレンマについて考えます。

囚人のジレンマ

囚人のジレンマの例:軍拡競争

冷戦期に行われた米ソ間の軍拡競争は囚人のジレンマとしての側面を持っていることを解説した上で、そこでのナッシュ均衡を求めます。

混合戦略

戦略型ゲームの混合拡張

完備情報の静学ゲームにおいてプレイヤーたちが純戦略を選択する状況は戦略型ゲームとして表現できます。一方、プレイヤーたちが混合戦略を選択する状況は戦略型ゲームを拡張した混合拡張と呼ばれる概念として表現できます。

クールノー競争

クールノー競争(クールノー均衡)

同質財を生産する複占市場における数量競争をモデル化したゲームをクールノー競争と呼び、そこでのナッシュ均衡をクールノー均衡と呼びます。

クールノー競争

クールノー均衡の非効率性

クールノー均衡では死荷重が発生します。つまり、同様の市場において完全競争が行われた場合の均衡と比較したとき、クールノー均衡では社会的余剰は最大化されません。

ベルトラン競争

ベルトラン競争(ベルトラン均衡)

同質財を供給する複占市場における企業間の価格競争をモデル化したゲームをベルトラン競争と呼び、ベルトラン競争におけるナッシュ均衡をベルトラン均衡と呼びます。

美人投票

美人投票(平均の2/3の推測)

プレイヤーたちが0から100までの実数を1つずつ投票し、全体の平均の2/3に最も近い数字を投票したプレイヤーが勝者として賞金を得るゲームを美人投票や平均の2/3の推測などと呼びます。美人投票をゲームとして定式化した上で、そのナッシュ均衡を求めます。

DISCUSSION

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録

完備情報の静学ゲーム