完備情報の静学ゲーム
複数の主体が関与する問題が与えられたとき、その問題に関与するそれぞれの主体にとって、自分の行動が他者の行動に影響を与えるとともに、他者の行動が自分の行動にも影響を与える場合、主体の間には戦略的相互依存性(strategic interdependence)が成立していると言います。ゲーム理論(game theory)は、戦略的相互依存性に直面した主体による意思決定を分析する学問です。
主体の間に戦略的相互依存性が成立する状況をゲーム(game)と呼びます。ゲームをモデル化する際には、以下の要素を具体的に記述します。
- ゲームにおいて意思決定を行う主体は誰か。つまり、ゲームのプレイヤー(player)は誰か。
- プレイヤーたちはどのような順番(turn)で意思決定を行うか。
- プレイヤーたちが意思決定を行う際にどのような選択肢が与えられているか。つまり、プレイヤーたちはどのような行動(action)が選択可能か。
- プレイヤーが意思決定を行う際にどのような情報(information)が与えられているか。
- プレイヤーたちが意思決定を行う帰結として、どのような結果(outcome)が起こり得るか。
- プレイヤーたちはそれぞれの結果をどの程度評価しているか。すなわち、プレイヤーはどのような利得(payoff)の体系を持っているか。
以上の要素をゲームのルール(rule)と呼びます。ゲームの開始後、それぞれの「プレイヤー」は自身が行動する「順番」になったら、その時点においてアクセス可能な「情報」を活用しつつ、何らかの行動原理にもとづいて、与えられた選択肢の中から特定の「行動」を選択します。すべてのプレイヤーによる意志決定が終了したら、プレイヤーたちが選んだ行動の組み合わせに応じて特定の「結果」が実現し、それぞれのプレイヤーは実現した結果から「利得」を得ます。
ゲームに直面したプレイヤーたちは、自身にとってより望ましい結果を導くために、最終的な意志決定を行う前に他のプレイヤーと交渉を行う可能性があります。事前交渉の結果に対してプレイヤーたちの間に拘束的な合意が成立するのであれば、つまり、合意通りに行動せざるを得ない何らかの仕組みが存在する場合には、プレイヤーたちは集団を形成した上で協力的な意志決定を行う可能性があります。拘束的な合意が成立する場合とそうでない場合とでは、プレイヤーにとって最適な行動は変化するため、ゲームを分析する際には、プレイヤーたちの間に拘束的な合意が成立するかどうかを事前に明らかにしておく必要があります。本節の分析対象である非協力ゲーム(non-cooperative game)とは、プレイヤーたちの間に拘束的な合意が成立しない状況を想定したゲームです。非協力ゲームのプレイヤーは事前の合意通りに行動することを強制されないため、他のプレイヤーによる意志決定から独立した形で自身の意思決定を行います。このような事情を踏まえると、非協力ゲームを「プレイヤーたちがそれぞれ独立に意志決定を行うゲーム」と定義することもできます。
すべてのプレイヤーが同時に意思決定を行う状況を想定したゲームを静学ゲーム(static game)や同時手番ゲーム(simultaneous move game)などと呼びます。本節の分析対象は静学ゲームです。静学ゲームという概念はゲームのルールの中でも「順番」を基準にゲームを分類することで得られる概念ですが、「情報」によって静学ゲームという概念を特徴づけることもできます。つまり、プレイヤーたちが同時に意思決定を行うことと、プレイヤーたちが他のプレイヤーによる意思決定を観察できない状態で意思決定を行うことは実質的に等しいため、静学ゲームを「それぞれのプレイヤーが意志決定を行う際に、他のプレイヤーたちが行った意志決定に関する情報を与えられないゲーム」と定義することもできます。
プレイヤーは自身が直面しているゲームのルールを正確に把握できるとは限りません。ゲームを分析する際には、それぞれのプレイヤーがゲームのルールをどの程度正確に把握しているかを事前に明らかにしておく必要があります。問題としているゲームのルールのすべての要素からなる集合を\(P\)で表記します。すべてのプレイヤーがゲームのルールを完全に知っている場合、すなわちすべてのプレイヤーが\(P\)を知っている場合、その事実を\(P_{1}\)で表記します。また、すべてのプレイヤーが事実\(P_{1}\)を知っているという事実を\(P_{2}\)で表記します。事実\(P_{3},P_{4},\cdots \)についても同様に考えます。その上で、無限個の事実\(P_{1},P_{2},P_{3},P_{4},\cdots \)が成立する場合、ゲームのルールに相当する事実\(P\)はプレイヤーたちにとって共有知識(common knowledge)であると言います。本節の分析対象である完備情報ゲーム(game of complete information)とは、ゲームのルールのすべての要素がすべてのプレイヤーにとって共有知識であるようなゲームです。
本節の分析対象は非協力かつ静学かつ完備情報であるようなゲームです。これを完備情報の静学ゲーム(static games of complete information)と呼びます。完備情報の静学ゲームは非協力ゲームであるため、そこではプレイヤーたちの間に拘束的な合意は成立せず、それぞれのプレイヤーの意思決定は他のプレイヤーたちの意思決定からは独立した形で行われます。完備情報の静学ゲームを分析対象とする場合、ゲームのルールの中でも「順番」と「情報」は明らかです。つまり、完備情報の静学ゲームおいて、すべてのプレイヤーは同時に意思決定を行います。言い換えると、それぞれのプレイヤーは他のプレイヤーたちが選択する行動を観察できない状態で自身の行動を決定する必要があります。また、完備情報の静学ゲームのルールはすべてのプレイヤーにとって共有知識です。つまり、ゲームのルールを\(P\)で表し、すべてのプレイヤーが\(P\)を知っているという事実を\(P_{1}\)で表し、すべてのプレイヤーが\(P_{1}\)を知っているという事実を\(P_{2}\)で表し、\(\cdots \)などと表記を定めるとき、無限個の事実\(P_{1},P_{2},P_{3},P_{4},\cdots \)が成立することを仮定するということです。
以上を踏まえると、完備情報の静学ゲームを記述するためには、ゲームのルールの残りの要素である「プレイヤー」「行動」「結果」「利得」を特定する必要があります。これらの要素を記述する方法はいくつか存在しますが、以下では戦略型ゲーム(game in strategic form)と呼ばれるモデルを解説します。
プレイヤーの表現
完備情報の静学ゲームに参加するすべてのプレイヤーからなる集合をプレイヤー集合(player set)やプレイヤー空間(player space)などと呼び、これを、\begin{equation*}
I
\end{equation*}で表記します。
戦略的相互依存関係は複数のプレイヤーが存在することにより成立するため、プレイヤーの数が複数であることはゲームの基本的な条件となります。そこで、多くの場合、プレイヤーの人数は\(2\)以上の整数であるものと仮定します。
プレイヤーの人数が\(n\)であるとき、そのようなゲームを\(n\)人ゲーム(\(n\)-players game)と呼びます。\(n\)人ゲームのプレイヤー集合を、\begin{equation*}I=\left\{ 1,2,\cdots ,n\right\}
\end{equation*}で表記し、その要素である\(i\ \left( =1,2,\cdots ,n\right) \)番目のプレイヤーをプレイヤー\(i\)(player \(i\))と呼びます。\(i\in I\)です。
プレイヤーの単位は分析対象であるゲームに応じて変化します。個人をプレイヤーと定める場合もあれば、組織や国家などをプレイヤーとする場合もあります。重要なことは、問題としているゲームにおいて自律的な意思決定を行う最小単位をプレイヤーとみなすということです。
ゲームに関与している主体の中でも、他の主体と影響を与え合いながら意思決定を行っているのではなく、外生的に変化する状況に対応する形でのみ意志決定を行う主体はプレイヤーとはみなされず、モデルの環境変数とみなされます。
\end{equation*}となります。
\end{equation*}となります。
行動の表現
完備情報の静学ゲームにおいて、プレイヤーに選択肢として与えられているすべての行動からなる集合を、そのプレイヤーの行動集合(action set)や行動空間(action space)などと呼びます。プレイヤー\(i\in I\)の行動集合を、\begin{equation*}A_{i}
\end{equation*}で表記し、プレイヤー\(i\)の個々の行動を、\begin{equation*}a_{i}
\end{equation*}で表記します。\(a_{i}\in A_{i}\)です。
すべてのプレイヤーの行動からなる組を、\begin{equation*}
a_{I}=\left( a_{i}\right) _{i\in I}
\end{equation*}で表記し、プレイヤー\(i\)以外のプレイヤーたちの行動からなる組を、\begin{equation*}a_{-i}=\left( a_{j}\right) _{j\in I\backslash \left\{ i\right\} }
\end{equation*}で表記します。\(a_{I}=\left(a_{i},a_{-i}\right) \)です。
すべてのプレイヤーの行動集合の直積を、\begin{equation*}
A_{I}=\prod\limits_{i\in I}A_{i}
\end{equation*}で表記し、プレイヤー\(i\)以外のプレイヤーたちの行動集合の直積を、\begin{equation*}A_{-i}=\prod\limits_{j\in I\backslash \left\{ i\right\} }
\end{equation*}で表記します。\(a_{I}\in A_{I}\)かつ\(a_{-i}\in A_{-i}\)です。
\end{equation*}です。ただし、\(R\)はグー(Rock)、\(P\)はパー(Paper)、\(S\)はチョキ(Scissors)をそれぞれ表します。
\end{equation*}となります。
結果の表現
完備情報の静学ゲームにおいてプレイヤーたちが行動を選択すると、それに応じて何らかの結果が実現します。つまり、プレイヤーたちが選択する行動からなるそれぞれの組\(a_{I}\in A_{I}\)に対して、ゲームの結果が1つずつ定まるということです。完備情報の静学ゲームにおいて起こり得る結果を記述することとは、\(A_{I}\)に属するそれぞれの行動の組\(a_{I}\)に対して結果を1つずつ割り当てることを意味します。ちなみに、異なる行動の組が同一の結果をもたらす状況は起こり得ます。
\end{equation*}であり、「\(2\)が勝つ」という結果に相当する行動の組は、\begin{equation*}\left( R,P\right) ,\left( P,S\right) ,\left( S,R\right)
\end{equation*}であり、「あいこ」という結果に相当する行動の組は、\begin{equation*}
\left( R,R\right) ,\left( P,P\right) ,\left( S,S\right)
\end{equation*}です。ただし、\(R\)はグー、\(P\)はパー、\(S\)はチョキを表します。
\end{equation*}で均衡するものとします。つまり、\(p:\mathbb{R} _{+}^{2}\rightarrow \mathbb{R} \)は市場の逆需要関数です。また、企業\(i\)が商品を\(a_{i}\)だけ生産するために必要な費用が、\begin{equation*}c_{i}\left( a_{i}\right) \geq 0
\end{equation*}であるものとします。つまり、\(c_{i}:\mathbb{R} _{+}\rightarrow \mathbb{R} \)は企業\(i\)の費用関数です。このとき、\(\left(a_{1},a_{2}\right) \)のもとで企業\(1\)が得る利潤は、収入から費用を差し引いて得られる、\begin{equation*}\pi _{1}\left( a_{1},a_{2}\right) =p\left( a_{1}+a_{2}\right) \cdot
a_{1}-c_{1}\left( a_{1}\right)
\end{equation*}として定まり、企業\(2\)が得る利潤は、\begin{equation*}\pi _{2}\left( a_{1},a_{2}\right) =p\left( a_{1}+a_{2}\right) \cdot
a_{2}-c_{2}\left( a_{2}\right)
\end{equation*}として定まります。
利得の表現
プレイヤーたちが選ぶそれぞれの行動の組\(a_{I}\in A_{I}\)にはゲームにおいて起こり得る結果が1つずつ対応しているため、プレイヤーがどの結果を好むかを記述する代わりに、プレイヤーがどの行動の組を好むかを記述しても一般性は失われません。そこで、プレイヤー\(i\in I\)が持つ好みの体系を行動の組からなる集合\(A_{I}\)上の二項関係\(\succsim _{i}\)として定式化し、これをプレイヤー\(i\)の選好関係(preference relation)と呼びます。具体的には、任意の2つの行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{equation*}a_{I}\succsim _{i}a_{I}^{\prime }\Leftrightarrow i\text{は}a_{I}\text{を}a_{I}^{\prime }\text{以上に好む}
\end{equation*}という関係を満たすものとして\(\succsim _{i}\)を定義します。つまり、比較対象として2つの行動の組\(a_{I},a_{I}^{\prime }\)を提示されたとき、プレイヤー\(i\)が\(a_{I}\)のもとで実現する結果を\(a_{I}^{\prime }\)のもとで実現する結果以上に好むとき、そしてその場合にのみ\(a_{I}\succsim _{i}a_{I}^{\prime }\)が成り立つものとして\(\succsim _{i}\)を定義するということです。ただし、\(a_{I}\)を\(a_{I}^{\prime }\)以上に好むとは、\(a_{I}\)を\(a_{I}^{\prime }\)よりも好むか、または\(a_{I}\)と\(a_{I}^{\prime }\)を同じ程度好むことを意味します。
プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、任意の行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{equation*}a_{I}\succ _{i}a_{I}^{\prime }\Leftrightarrow \left[ a_{I}\succsim
_{i}a_{I}^{\prime }\wedge \lnot \left( a_{I}^{\prime }\succsim
_{i}a_{I}\right) \right]
\end{equation*}という関係を満たすものとして\(A_{I}\)上の新たな二項関係\(\succ _{i}\)を定義します。これをプレイヤー\(i\)の狭義選好関係(strict preference relation)と呼びます。つまり、比較対象として2つの行動の組\(a_{I},a_{I}^{\prime }\)が提示されたとき、プレイヤー\(i\)が\(a_{I}\)を\(a_{I}^{\prime }\)以上に好むが\(a_{I}^{\prime }\)を\(a_{I}\)以上には好まないとき、そしてその場合にのみ\(a_{I}\succ _{i}a_{I}^{\prime }\)が成り立つものとして\(\succ _{i}\)を定義するということです。
プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、任意の行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{equation*}a_{I}\sim _{i}a_{I}^{\prime }\Leftrightarrow \left( a_{I}\succsim
_{i}a_{I}^{\prime }\wedge a_{I}^{\prime }\succsim _{i}a_{I}\right)
\end{equation*}という関係を満たすものとして\(A_{I}\)上の新たな二項関係\(\sim _{i}\)を定義します。これをプレイヤー\(i\)の無差別関係(indifference relation)と呼びます。つまり、比較対象として2つの行動の組\(a_{I},a_{I}^{\prime }\)が提示されたとき、プレイヤー\(i\)が\(a_{I}\)を\(a_{I}^{\prime }\)以上に好むと同時に\(a_{I}^{\prime }\)を\(a_{I}\)以上に好むとき、そしてその場合にのみ\(a_{I}\sim _{i}a_{I}^{\prime }\)が成り立つものとして\(\sim _{i}\)を定義するということです。
&\succ &_{1}\left( R,R\right) \sim _{1}\left( P,P\right) \sim _{1}\left(
S,S\right) \\
&\succ &_{1}\left( R,P\right) \sim _{1}\left( P,S\right) \sim _{1}\left(
S,R\right)
\end{eqnarray*}と記述され、プレイヤー\(2\)の選好関係\(\succsim _{2}\)は、\begin{eqnarray*}&&\left( S,R\right) \sim _{2}\left( R,P\right) \sim _{2}\left( P,S\right) \\
&\succ &_{2}\left( R,R\right) \sim _{2}\left( P,P\right) \sim _{2}\left(
S,S\right) \\
&\succ &_{2}\left( P,R\right) \sim _{2}\left( P,R\right) \sim _{2}\left(
R,S\right)
\end{eqnarray*}と記述されます。
a_{1}-c_{1}\left( a_{1}\right) \\
\pi _{2}\left( a_{1},a_{2}\right) &=&p\left( a_{1}+a_{2}\right) \cdot
a_{2}-c_{2}\left( a_{2}\right)
\end{eqnarray*}として定まります。企業の選好として典型的なものは、それぞれの企業は「自分が得る利潤がより多い結果をより好む」というものです。この場合、企業\(1\)の選好関係\(\succsim _{1}\)は、任意の2つの行動の組\(\left( a_{1},a_{2}\right),\left( a_{1}^{\prime },a_{2}^{\prime }\right) \in \mathbb{R} _{+}^{2}\)に対して、\begin{equation*}\left( a_{1},a_{2}\right) \succsim _{1}\left( a_{1}^{\prime },a_{2}^{\prime
}\right) \Leftrightarrow \pi _{1}\left( a_{1},a_{2}\right) \succsim _{1}\pi
_{1}\left( a_{1}^{\prime },a_{2}^{\prime }\right)
\end{equation*}を満たすものとして記述され、企業\(2\)の選好関係\(\succsim _{1}\)は、\begin{equation*}\left( a_{1},a_{2}\right) \succsim _{2}\left( a_{1}^{\prime },a_{2}^{\prime
}\right) \Leftrightarrow \pi _{2}\left( a_{1},a_{2}\right) \succsim _{2}\pi
_{2}\left( a_{1}^{\prime },a_{2}^{\prime }\right)
\end{equation*}を満たすものとして記述されます。
プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、任意の2つの行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、以下の関係\begin{equation*}u_{i}\left( a_{I}\right) \geq u_{i}\left( a_{I}^{\prime }\right)
\Leftrightarrow a_{I}\succsim _{i}a_{I}^{\prime }
\end{equation*}を満たす関数\begin{equation*}
u_{i}:A_{I}\rightarrow \mathbb{R} \end{equation*}が存在する場合には、これを\(\succsim _{i}\)を表現する利得関数(payoff function)と呼びます。利得関数\(u_{i}\)が行動の組\(a_{I}\)に対して定める値\(u_{i}\left( a_{I}\right) \)をプレイヤー\(i\)が\(a_{I}\)から得る利得(payoff)と呼びます。選好関係\(\succsim _{i}\)を表現する利得関数\(u_{i}\)が存在する場合、行動の組\(a_{I},a_{I}^{\prime }\)について、\(a_{I}\)が\(a_{I}^{\prime }\)以上に望ましいことと、\(a_{I}\)の利得が\(a_{I}^{\prime }\)の利得以上であることが必要十分になります。利得関数を用いれば、行動の組の間の相対的な望ましさを、行動の組がもたらす利得の大小関係として表現できるということです。
選好関係\(\succsim _{i}\)を表す利得関数\(u_{i}\)が存在する場合、任意の2つの行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{eqnarray*}u_{i}\left( a_{I}\right) &>&u_{i}\left( a_{I}^{\prime }\right)
\Leftrightarrow a_{I}\succ _{i}a_{I}^{\prime } \\
u_{i}\left( a_{I}\right) &=&u_{i}\left( a_{I}^{\prime }\right)
\Leftrightarrow a_{I}\sim _{i}a_{I}^{\prime }
\end{eqnarray*}という関係もまた成立します。
プレイヤー\(i\)の利得関数\(u_{i}\)の定義域が\(A_{I}\)であることは、プレイヤー\(i\)が得る効用\(u_{i}\left(a_{I}\right) =u_{i}\left( a_{i},a_{-i}\right) \)が自身の行動\(a_{i}\)だけに依存するのではなく、自分以外のプレイヤーたちの行動\(a_{-i}\)にも依存することを意味します。つまり、利得関数の定義域を\(A_{I}\)とすることにより、プレイヤーの間に戦略的相互依存関係が存在する状況を表現しています。
プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、それを表現する利得関数\(u_{i}\)は存在するとは限りません。利得関数が存在することを保証する上で必要とされる条件については様々なものが知られています。利得関数の存在条件については場を改めて詳しく解説します。
\begin{array}{l}
u_{1}\left( R,S\right) =u_{1}\left( P,R\right) =u_{1}\left( S,P\right) =1 \\
u_{1}\left( R,R\right) =u_{1}\left( P,P\right) =u_{1}\left( S,S\right) =0 \\
u_{1}\left( R,P\right) =u_{1}\left( P,S\right) =u_{1}\left( S,R\right) =-1\end{array}\right.
\end{equation*}を満たす関数\(u_{1}:A_{I}\rightarrow \mathbb{R} \)が考えられ、プレイヤー\(2\)の利得関数としては、\begin{equation*}\left\{
\begin{array}{l}
u_{2}\left( S,R\right) =u_{2}\left( R,P\right) =u_{2}\left( P,S\right) =1 \\
u_{2}\left( R,R\right) =u_{2}\left( P,P\right) =u_{2}\left( S,S\right) =0 \\
u_{2}\left( P,R\right) =u_{2}\left( P,R\right) =u_{2}\left( R,S\right) =-1\end{array}\right.
\end{equation*}を満たす関数\(u_{2}:A_{I}\rightarrow \mathbb{R} \)が考えられます。
u_{2}\left( a_{1},a_{2}\right) &=&\pi _{2}\left( a_{1},a_{2}\right)
\end{eqnarray*}を満たす関数\(u_{1},u_{2}:\mathbb{R} _{+}^{2}\rightarrow \mathbb{R} \)が考えられます。つまり、企業は自身が得る利潤と利得を同一視するということです。
戦略型ゲーム
繰り返しになりますが、完備情報の静学ゲームを記述するためには「プレイヤー」「行動」「結果」「利得」をそれぞれ特定する必要があります。ゲームのプレイヤーはプレイヤー集合\(I\)によって記述され、それぞれのプレイヤー\(i\in I\)の行動は行動集合\(A_{i}\)として記述されます。プレイヤーたちが選ぶ行動の組\(a_{I}\in A_{I}\)にはゲームにおいて起こり得る結果が1つずつ対応しているため、それぞれのプレイヤー\(i\)の利得は利得関数\(u_{i}:A_{I}\rightarrow \mathbb{R} \)として表現可能です。以上の要素からなるモデルを、\begin{equation*}G=(I,\left\{ A_{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in I})
\end{equation*}と表記し、これを戦略型ゲーム(game in strategic form)や標準型ゲーム(game in normal form)などと呼びます。
完備情報の静学ゲームが戦略型ゲーム\(G\)によって表現されるとき、ゲームの完備性より、\(G\)を構成するすべての要素はプレイヤーたちの共有知識です。また、ゲームの静学性より、プレイヤーたちは以下のプロセスのもとで意志決定を行います。
- それぞれのプレイヤー\(i\)は自身の行動集合\(A_{i}\)の中から特定の行動\(a_{i}\)を選択する。その際、他のプレイヤーたちが選択する行動を観察できない。
- プレイヤーたちが選択した行動の組\(a_{I}=\left( a_{i}\right) _{i\in I}\)に対して、ゲームのルールが結果を定める。
- そのゲームの結果から、それぞれのプレイヤー\(i\)は利得\(u_{i}(a_{I})\)を得る。
利得行列
戦略型ゲーム\(G\)を構成するすべての要素が有限集合である場合には\(G\)を有限ゲーム(finite game)と呼びます。つまり、戦略型ゲーム\(G\)が有限であるとは、プレイヤー集合\(I\)と任意のプレイヤー\(i\in I\)の行動集合\(A_{i}\)が有限集合であるということです。有限ゲームではプレイヤーの数が有限であるとともに、それぞれのプレイヤーが選択可能な行動の数もまた有限です。
戦略型ゲームが\(2\)人有限ゲームである場合には、その戦略型ゲームを行列を用いて表現できます。具体的には、2人のプレイヤー\(1,2\)の行動集合がそれぞれ\begin{eqnarray*}A_{1} &=&\left\{ a_{11},a_{12}\right\} \\
A_{2} &=&\left\{ a_{21},a_{22}\right\}
\end{eqnarray*}である場合、戦略型ゲーム\(G\)を以下の行列を用いて表現できます。これを利得行列(payoff matrix)と呼びます。
$$\begin{array}{ccc}
\hline
1\backslash 2 & a_{21} & a_{22} \\ \hline
a_{11} & u_{1}\left( a_{11},a_{21}\right) ,\ u_{2}\left( a_{11},a_{21}\right) & u_{1}\left( a_{11},a_{22}\right) ,\ u_{2}\left( a_{11},a_{22}\right) \\ \hline
a_{12} & u_{1}\left( a_{11},a_{21}\right) ,\ u_{2}\left( a_{11},a_{21}\right) & u_{1}\left( a_{12},a_{22}\right) ,\ u_{2}\left( a_{12},a_{22}\right) \\ \hline
\end{array}$$
上の利得行列において、プレイヤー\(1\)は行を選択し、プレイヤー\(2\)は列を選択するものとみなします。利得行列の第\(ij\)成分である、\begin{equation*}\left( u_{1}\left( a_{1i},a_{2j}\right) ,u_{2}\left( a_{1i},a_{2j}\right)
\right)
\end{equation*}は、プレイヤー\(i\)が行動\(a_{1i}\)を選びプレイヤー\(2\)が行動\(a_{2j}\)を選んだ場合に2人が直面する利得からなる組です。
$$\begin{array}{cccc}
\hline
1\backslash 2 & R & P & S \\ \hline
R & 0,0 & -1,1 & 1,-1 \\ \hline
P & 1,-1 & 0,0 & -1,1 \\ \hline
S & -1,1 & 1,-1 & 0,0 \\ \hline
\end{array}$$
として表現されます。
戦略型ゲーム\(G\)を構成する少なくとも1つの要素が無限集合である場合には\(G\)を無限ゲーム(infinite game)と呼びます。つまり、戦略型ゲーム\(G\)が無限であるとはプレイヤー集合\(I\)、もしくは少なくとも1人のプレイヤー\(i\)の行動集合\(A_{i}\)が無限集合であるということです。無限ゲームではプレイヤーの人数が無限であるか、もしくは少なくとも1人のプレイヤーには無限個の行動が選択肢として与えられています。通常、無限ゲームは利得行列を用いて表現することはできません。
\end{equation*}という無限集合であるため、この状況を表現する戦略型ゲーム\(G\)は無限ゲームであり、したがってそれを利得行列として表現するのは困難です。
演習問題
\end{equation*}として定式化してください。
\end{equation*}として定式化してください。
\end{equation*}として定式化してください。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】