WIIS

完備情報の静学ゲーム

戦略型ゲーム(標準型ゲーム)

目次

Mailで保存
Xで共有

完備情報の静学ゲーム

複数の主体が関与する問題が与えられたとき、その問題に関与するそれぞれの主体にとって、自分の行動が他者の行動に影響を与えるとともに、他者の行動が自分の行動にも影響を与える場合、主体の間には戦略的相互依存性(strategic interdependence)が成立していると言います。ゲーム理論(game theory)は、戦略的相互依存性に直面した主体による意思決定を分析する学問です。

主体の間に戦略的相互依存性が成立する状況をゲーム(game)と呼びます。ゲームをモデル化する際には、以下の要素を具体的に記述します。

  1. ゲームにおいて意思決定を行う主体は誰か。つまり、ゲームのプレイヤー(player)は誰か。
  2. プレイヤーたちはどのような順番(turn)で意思決定を行うか。
  3. プレイヤーたちが意思決定を行う際にどのような選択肢が与えられているか。つまり、プレイヤーたちはどのような行動(action)が選択可能か。
  4. プレイヤーが意思決定を行う際にどのような情報(information)が与えられているか。
  5. プレイヤーたちが意思決定を行う帰結として、どのような結果(outcome)が起こり得るか。
  6. プレイヤーたちはそれぞれの結果をどの程度評価しているか。すなわち、プレイヤーはどのような利得(payoff)の体系を持っているか。

以上の要素をゲームのルール(rule)と呼びます。ゲームの開始後、それぞれの「プレイヤー」は自身が行動する「順番」になったら、その時点においてアクセス可能な「情報」を活用しつつ、何らかの行動原理にもとづいて、与えられた選択肢の中から特定の「行動」を選択します。すべてのプレイヤーによる意志決定が終了したら、プレイヤーたちが選んだ行動の組み合わせに応じて特定の「結果」が実現し、それぞれのプレイヤーは実現した結果から「利得」を得ます。

ゲームに直面したプレイヤーたちは、自身にとってより望ましい結果を導くために、最終的な意志決定を行う前に他のプレイヤーと交渉を行う可能性があります。事前交渉の結果に対してプレイヤーたちの間に拘束的な合意が成立するのであれば、つまり、合意通りに行動せざるを得ない何らかの仕組みが存在する場合には、プレイヤーたちは集団を形成した上で協力的な意志決定を行う可能性があります。拘束的な合意が成立する場合とそうでない場合とでは、プレイヤーにとって最適な行動は変化するため、ゲームを分析する際には、プレイヤーたちの間に拘束的な合意が成立するかどうかを事前に明らかにしておく必要があります。本節の分析対象である非協力ゲーム(non-cooperative game)とは、プレイヤーたちの間に拘束的な合意が成立しない状況を想定したゲームです。非協力ゲームのプレイヤーは事前の合意通りに行動することを強制されないため、他のプレイヤーによる意志決定から独立した形で自身の意思決定を行います。このような事情を踏まえると、非協力ゲームを「プレイヤーたちがそれぞれ独立に意志決定を行うゲーム」と定義することもできます。

すべてのプレイヤーが同時に意思決定を行う状況を想定したゲームを静学ゲーム(static game)や同時手番ゲーム(simultaneous move game)などと呼びます。本節の分析対象は静学ゲームです。静学ゲームという概念はゲームのルールの中でも「順番」を基準にゲームを分類することで得られる概念ですが、「情報」によって静学ゲームという概念を特徴づけることもできます。つまり、プレイヤーたちが同時に意思決定を行うことと、プレイヤーたちが他のプレイヤーによる意思決定を観察できない状態で意思決定を行うことは実質的に等しいため、静学ゲームを「それぞれのプレイヤーが意志決定を行う際に、他のプレイヤーたちが行った意志決定に関する情報を与えられないゲーム」と定義することもできます。

プレイヤーは自身が直面しているゲームのルールを正確に把握できるとは限りません。ゲームを分析する際には、それぞれのプレイヤーがゲームのルールをどの程度正確に把握しているかを事前に明らかにしておく必要があります。問題としているゲームのルールのすべての要素からなる集合を\(P\)で表記します。すべてのプレイヤーがゲームのルールを完全に知っている場合、すなわちすべてのプレイヤーが\(P\)を知っている場合、その事実を\(P_{1}\)で表記します。また、すべてのプレイヤーが事実\(P_{1}\)を知っているという事実を\(P_{2}\)で表記します。事実\(P_{3},P_{4},\cdots \)についても同様に考えます。その上で、無限個の事実\(P_{1},P_{2},P_{3},P_{4},\cdots \)が成立する場合、ゲームのルールに相当する事実\(P\)はプレイヤーたちにとって共有知識(common knowledge)であると言います。本節の分析対象である完備情報ゲーム(game of complete information)とは、ゲームのルールのすべての要素がすべてのプレイヤーにとって共有知識であるようなゲームです。

本節の分析対象は非協力かつ静学かつ完備情報であるようなゲームです。これを完備情報の静学ゲーム(static games of complete information)と呼びます。完備情報の静学ゲームは非協力ゲームであるため、そこではプレイヤーたちの間に拘束的な合意は成立せず、それぞれのプレイヤーの意思決定は他のプレイヤーたちの意思決定からは独立した形で行われます。完備情報の静学ゲームを分析対象とする場合、ゲームのルールの中でも「順番」と「情報」は明らかです。つまり、完備情報の静学ゲームおいて、すべてのプレイヤーは同時に意思決定を行います。言い換えると、それぞれのプレイヤーは他のプレイヤーたちが選択する行動を観察できない状態で自身の行動を決定する必要があります。また、完備情報の静学ゲームのルールはすべてのプレイヤーにとって共有知識です。つまり、ゲームのルールを\(P\)で表し、すべてのプレイヤーが\(P\)を知っているという事実を\(P_{1}\)で表し、すべてのプレイヤーが\(P_{1}\)を知っているという事実を\(P_{2}\)で表し、\(\cdots \)などと表記を定めるとき、無限個の事実\(P_{1},P_{2},P_{3},P_{4},\cdots \)が成立することを仮定するということです。

以上を踏まえると、完備情報の静学ゲームを記述するためには、ゲームのルールの残りの要素である「プレイヤー」「行動」「結果」「利得」を特定する必要があります。これらの要素を記述する方法はいくつか存在しますが、以下では戦略型ゲーム(game in strategic form)と呼ばれるモデルを解説します。

 

プレイヤーの表現

完備情報の静学ゲームに参加するすべてのプレイヤーからなる集合をプレイヤー集合(player set)やプレイヤー空間(player space)などと呼び、これを、\begin{equation*}
I
\end{equation*}で表記します。

戦略的相互依存関係は複数のプレイヤーが存在することにより成立するため、プレイヤーの数が複数であることはゲームの基本的な条件となります。そこで、多くの場合、プレイヤーの人数は\(2\)以上の整数であるものと仮定します。

プレイヤーの人数が\(n\)であるとき、そのようなゲームを\(n\)人ゲーム(\(n\)-players game)と呼びます。\(n\)人ゲームのプレイヤー集合を、\begin{equation*}I=\left\{ 1,2,\cdots ,n\right\}
\end{equation*}で表記し、その要素である\(i\ \left( =1,2,\cdots ,n\right) \)番目のプレイヤーをプレイヤー\(i\)(player \(i\))と呼びます。\(i\in I\)です。

プレイヤーの単位は分析対象であるゲームに応じて変化します。個人をプレイヤーと定める場合もあれば、組織や国家などをプレイヤーとする場合もあります。重要なことは、問題としているゲームにおいて自律的な意思決定を行う最小単位をプレイヤーとみなすということです。

ゲームに関与している主体の中でも、他の主体と影響を与え合いながら意思決定を行っているのではなく、外生的に変化する状況に対応する形でのみ意志決定を行う主体はプレイヤーとはみなされず、モデルの環境変数とみなされます。

例(ジャンケンのプレイヤー)
2人がジャンケンを1回だけ行う状況を想定します。2人をそれぞれ\(1,2\)と呼ぶのであれば、このゲームのプレイヤー集合は、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}となります。

例(複占市場のプレイヤー)
複占市場において2つの企業が数量競争を行う状況を分析する際には、ゲームのプレイヤーは2つの企業であり、彼らが供給する商品の消費者はプレイヤーとはみなされません。なぜなら、複占市場では企業による競争の結果として商品の価格が決定されますが、個々の消費者はその価格を受け入れざるを得ず、その価格のもとで商品を買うかどうかを決定する一方で、個々の消費者による意思決定が企業の意思決定に影響を与えることはなく、したがって企業と個々の消費者の間には戦略的相互依存関係が成立していないからです。これをテクニカルに表現すると、複占市場のプレイヤーである企業にとって市場の需要曲線は外生的に与えられる要因であり、消費者は市場の需要曲線を形成する環境変数として位置付けられるということです。2つの企業をそれぞれ\(1,2\)と呼ぶのであれば、このゲームのプレイヤー集合は、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}となります。

 

行動の表現

完備情報の静学ゲームにおいて、プレイヤーに選択肢として与えられているすべての行動からなる集合を、そのプレイヤーの行動集合(action set)や行動空間(action space)などと呼びます。プレイヤー\(i\in I\)の行動集合を、\begin{equation*}A_{i}
\end{equation*}で表記し、プレイヤー\(i\)の個々の行動を、\begin{equation*}a_{i}
\end{equation*}で表記します。\(a_{i}\in A_{i}\)です。

すべてのプレイヤーの行動からなる組を、\begin{equation*}
a_{I}=\left( a_{i}\right) _{i\in I}
\end{equation*}で表記し、プレイヤー\(i\)以外のプレイヤーたちの行動からなる組を、\begin{equation*}a_{-i}=\left( a_{j}\right) _{j\in I\backslash \left\{ i\right\} }
\end{equation*}で表記します。\(a_{I}=\left(a_{i},a_{-i}\right) \)です。

すべてのプレイヤーの行動集合の直積を、\begin{equation*}
A_{I}=\prod\limits_{i\in I}A_{i}
\end{equation*}で表記し、プレイヤー\(i\)以外のプレイヤーたちの行動集合の直積を、\begin{equation*}A_{-i}=\prod\limits_{j\in I\backslash \left\{ i\right\} }
\end{equation*}で表記します。\(a_{I}\in A_{I}\)かつ\(a_{-i}\in A_{-i}\)です。

例(ジャンケンの行動集合)
先のジャンケンの例において、プレイヤー集合が\(I=\left\{ 1,2\right\} \)であるものとします。それぞれのプレイヤー\(i\in I\)の行動集合は、\begin{equation*}A_{i}=\left\{ R,P,S\right\}
\end{equation*}です。ただし、\(R\)はグー(Rock)、\(P\)はパー(Paper)、\(S\)はチョキ(Scissors)をそれぞれ表します。
例(複占市場の行動集合)
先の複占市場の例において、プレイヤー集合が\(I=\left\{ 1,2\right\} \)であるものとします。それぞれの企業\(i\in I\)は自身による商品の供給量として任意の非負の実数を選択可能であるならば、その行動集合は、\begin{equation*}A_{i}=\mathbb{R} _{+}
\end{equation*}となります。

 

結果の表現

完備情報の静学ゲームにおいてプレイヤーたちが行動を選択すると、それに応じて何らかの結果が実現します。つまり、プレイヤーたちが選択する行動からなるそれぞれの組\(a_{I}\in A_{I}\)に対して、ゲームの結果が1つずつ定まるということです。完備情報の静学ゲームにおいて起こり得る結果を記述することとは、\(A_{I}\)に属するそれぞれの行動の組\(a_{I}\)に対して結果を1つずつ割り当てることを意味します。ちなみに、異なる行動の組が同一の結果をもたらす状況は起こり得ます。

例(ジャンケンの結果)
先のジャンケンの例において、プレイヤー集合が\(I=\left\{ 1,2\right\} \)であるとともに、それぞれのプレイヤー\(i\in I\)の行動集合が\(A_{i}=\left\{ R,P,S\right\} \)であるものとします。ジャンケンでは2人が出す手の組み合わせ\(\left( a_{1},a_{2}\right) \in A_{1}\times A_{2}\)に応じて様々な結果が生じますが、それらは「\(1\)が勝つ」「\(2\)が勝つ」「あいこ」の3種類に分類可能です。具体的には、「\(1\)が勝つ」という結果に相当する行動の組は、\begin{equation*}\left( R,S\right) ,\left( P,R\right) ,\left( S,P\right)
\end{equation*}であり、「\(2\)が勝つ」という結果に相当する行動の組は、\begin{equation*}\left( R,P\right) ,\left( P,S\right) ,\left( S,R\right)
\end{equation*}であり、「あいこ」という結果に相当する行動の組は、\begin{equation*}
\left( R,R\right) ,\left( P,P\right) ,\left( S,S\right)
\end{equation*}です。ただし、\(R\)はグー、\(P\)はパー、\(S\)はチョキを表します。
例(複占市場の結果)
先の複占市場の例において、プレイヤー集合が\(I=\left\{ 1,2\right\} \)であるとともに、それぞれの企業\(i\in I\)の行動集合が\(A_{i}=\mathbb{R} _{+}\)であるものとします。複占市場では2つの企業が選択する生産量の組み合わせに応じて様々な結果が生じますが、ここでは企業が得る利潤に注目します。具体的には、2つの企業が選択する生産量が\(\left( a_{1},a_{2}\right)\in \mathbb{R} _{+}^{2}\)であるとき、市場への商品の総供給量は\(a_{1}+a_{2}\)となりますが、それに対して商品の市場価格は、\begin{equation*}p\left( a_{1}+a_{2}\right) >0
\end{equation*}で均衡するものとします。つまり、\(p:\mathbb{R} _{+}^{2}\rightarrow \mathbb{R} \)は市場の逆需要関数です。また、企業\(i\)が商品を\(a_{i}\)だけ生産するために必要な費用が、\begin{equation*}c_{i}\left( a_{i}\right) \geq 0
\end{equation*}であるものとします。つまり、\(c_{i}:\mathbb{R} _{+}\rightarrow \mathbb{R} \)は企業\(i\)の費用関数です。このとき、\(\left(a_{1},a_{2}\right) \)のもとで企業\(1\)が得る利潤は、収入から費用を差し引いて得られる、\begin{equation*}\pi _{1}\left( a_{1},a_{2}\right) =p\left( a_{1}+a_{2}\right) \cdot
a_{1}-c_{1}\left( a_{1}\right)
\end{equation*}として定まり、企業\(2\)が得る利潤は、\begin{equation*}\pi _{2}\left( a_{1},a_{2}\right) =p\left( a_{1}+a_{2}\right) \cdot
a_{2}-c_{2}\left( a_{2}\right)
\end{equation*}として定まります。

 

利得の表現

プレイヤーたちが選ぶそれぞれの行動の組\(a_{I}\in A_{I}\)にはゲームにおいて起こり得る結果が1つずつ対応しているため、プレイヤーがどの結果を好むかを記述する代わりに、プレイヤーがどの行動の組を好むかを記述しても一般性は失われません。そこで、プレイヤー\(i\in I\)が持つ好みの体系を行動の組からなる集合\(A_{I}\)上の二項関係\(\succsim _{i}\)として定式化し、これをプレイヤー\(i\)の選好関係(preference relation)と呼びます。具体的には、任意の2つの行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{equation*}a_{I}\succsim _{i}a_{I}^{\prime }\Leftrightarrow i\text{は}a_{I}\text{を}a_{I}^{\prime }\text{以上に好む}
\end{equation*}という関係を満たすものとして\(\succsim _{i}\)を定義します。つまり、比較対象として2つの行動の組\(a_{I},a_{I}^{\prime }\)を提示されたとき、プレイヤー\(i\)が\(a_{I}\)のもとで実現する結果を\(a_{I}^{\prime }\)のもとで実現する結果以上に好むとき、そしてその場合にのみ\(a_{I}\succsim _{i}a_{I}^{\prime }\)が成り立つものとして\(\succsim _{i}\)を定義するということです。ただし、\(a_{I}\)を\(a_{I}^{\prime }\)以上に好むとは、\(a_{I}\)を\(a_{I}^{\prime }\)よりも好むか、または\(a_{I}\)と\(a_{I}^{\prime }\)を同じ程度好むことを意味します。

プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、任意の行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{equation*}a_{I}\succ _{i}a_{I}^{\prime }\Leftrightarrow \left[ a_{I}\succsim
_{i}a_{I}^{\prime }\wedge \lnot \left( a_{I}^{\prime }\succsim
_{i}a_{I}\right) \right] \end{equation*}という関係を満たすものとして\(A_{I}\)上の新たな二項関係\(\succ _{i}\)を定義します。これをプレイヤー\(i\)の狭義選好関係(strict preference relation)と呼びます。つまり、比較対象として2つの行動の組\(a_{I},a_{I}^{\prime }\)が提示されたとき、プレイヤー\(i\)が\(a_{I}\)を\(a_{I}^{\prime }\)以上に好むが\(a_{I}^{\prime }\)を\(a_{I}\)以上には好まないとき、そしてその場合にのみ\(a_{I}\succ _{i}a_{I}^{\prime }\)が成り立つものとして\(\succ _{i}\)を定義するということです。

プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、任意の行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{equation*}a_{I}\sim _{i}a_{I}^{\prime }\Leftrightarrow \left( a_{I}\succsim
_{i}a_{I}^{\prime }\wedge a_{I}^{\prime }\succsim _{i}a_{I}\right)
\end{equation*}という関係を満たすものとして\(A_{I}\)上の新たな二項関係\(\sim _{i}\)を定義します。これをプレイヤー\(i\)の無差別関係(indifference relation)と呼びます。つまり、比較対象として2つの行動の組\(a_{I},a_{I}^{\prime }\)が提示されたとき、プレイヤー\(i\)が\(a_{I}\)を\(a_{I}^{\prime }\)以上に好むと同時に\(a_{I}^{\prime }\)を\(a_{I}\)以上に好むとき、そしてその場合にのみ\(a_{I}\sim _{i}a_{I}^{\prime }\)が成り立つものとして\(\sim _{i}\)を定義するということです。

例(ジャンケンにおける選好関係)
先のジャンケンの例において、プレイヤー集合が\(I=\left\{ 1,2\right\} \)であるとともに、それぞれのプレイヤー\(i\in I\)の行動集合が\(A_{i}=\left\{ R,P,S\right\} \)であるものとします。ジャンケンでは2人が出す手の組み合わせ\(\left( a_{1},a_{2}\right) \in A_{1}\times A_{2}\)に応じて勝者が決定されます。プレイヤーの選好として典型的なものは、それぞれのプレイヤーは「自分が勝つ」「あいこ」「相手が勝つ」の順番で好むというものです。その場合、プレイヤー\(1\)の選好関係\(\succsim _{1}\)は、\begin{eqnarray*}&&\left( R,S\right) \sim _{1}\left( P,R\right) \sim _{1}\left( S,P\right) \\
&\succ &_{1}\left( R,R\right) \sim _{1}\left( P,P\right) \sim _{1}\left(
S,S\right) \\
&\succ &_{1}\left( R,P\right) \sim _{1}\left( P,S\right) \sim _{1}\left(
S,R\right)
\end{eqnarray*}と記述され、プレイヤー\(2\)の選好関係\(\succsim _{2}\)は、\begin{eqnarray*}&&\left( S,R\right) \sim _{2}\left( R,P\right) \sim _{2}\left( P,S\right) \\
&\succ &_{2}\left( R,R\right) \sim _{2}\left( P,P\right) \sim _{2}\left(
S,S\right) \\
&\succ &_{2}\left( P,R\right) \sim _{2}\left( P,R\right) \sim _{2}\left(
R,S\right)
\end{eqnarray*}と記述されます。

例(複占市場における選好関係)
先の複占市場の例において、プレイヤー集合が\(I=\left\{ 1,2\right\} \)であるとともに、それぞれのプレイヤー\(i\in I\)の行動集合が\(A_{i}=\mathbb{R} _{+}\)であるものとします。2つの企業が選択する生産量が\(\left( a_{1},a_{2}\right) \in \mathbb{R} _{+}^{2}\)であるとき、それぞれの企業が得る利得が、\begin{eqnarray*}\pi _{1}\left( a_{1},a_{2}\right) &=&p\left( a_{1}+a_{2}\right) \cdot
a_{1}-c_{1}\left( a_{1}\right) \\
\pi _{2}\left( a_{1},a_{2}\right) &=&p\left( a_{1}+a_{2}\right) \cdot
a_{2}-c_{2}\left( a_{2}\right)
\end{eqnarray*}として定まります。企業の選好として典型的なものは、それぞれの企業は「自分が得る利潤がより多い結果をより好む」というものです。この場合、企業\(1\)の選好関係\(\succsim _{1}\)は、任意の2つの行動の組\(\left( a_{1},a_{2}\right),\left( a_{1}^{\prime },a_{2}^{\prime }\right) \in \mathbb{R} _{+}^{2}\)に対して、\begin{equation*}\left( a_{1},a_{2}\right) \succsim _{1}\left( a_{1}^{\prime },a_{2}^{\prime
}\right) \Leftrightarrow \pi _{1}\left( a_{1},a_{2}\right) \succsim _{1}\pi
_{1}\left( a_{1}^{\prime },a_{2}^{\prime }\right)
\end{equation*}を満たすものとして記述され、企業\(2\)の選好関係\(\succsim _{1}\)は、\begin{equation*}\left( a_{1},a_{2}\right) \succsim _{2}\left( a_{1}^{\prime },a_{2}^{\prime
}\right) \Leftrightarrow \pi _{2}\left( a_{1},a_{2}\right) \succsim _{2}\pi
_{2}\left( a_{1}^{\prime },a_{2}^{\prime }\right)
\end{equation*}を満たすものとして記述されます。

プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、任意の2つの行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、以下の関係\begin{equation*}u_{i}\left( a_{I}\right) \geq u_{i}\left( a_{I}^{\prime }\right)
\Leftrightarrow a_{I}\succsim _{i}a_{I}^{\prime }
\end{equation*}を満たす関数\begin{equation*}
u_{i}:A_{I}\rightarrow \mathbb{R} \end{equation*}が存在する場合には、これを\(\succsim _{i}\)を表現する利得関数(payoff function)と呼びます。利得関数\(u_{i}\)が行動の組\(a_{I}\)に対して定める値\(u_{i}\left( a_{I}\right) \)をプレイヤー\(i\)が\(a_{I}\)から得る利得(payoff)と呼びます。選好関係\(\succsim _{i}\)を表現する利得関数\(u_{i}\)が存在する場合、行動の組\(a_{I},a_{I}^{\prime }\)について、\(a_{I}\)が\(a_{I}^{\prime }\)以上に望ましいことと、\(a_{I}\)の利得が\(a_{I}^{\prime }\)の利得以上であることが必要十分になります。利得関数を用いれば、行動の組の間の相対的な望ましさを、行動の組がもたらす利得の大小関係として表現できるということです。

選好関係\(\succsim _{i}\)を表す利得関数\(u_{i}\)が存在する場合、任意の2つの行動の組\(a_{I},a_{I}^{\prime }\in A_{I}\)に対して、\begin{eqnarray*}u_{i}\left( a_{I}\right) &>&u_{i}\left( a_{I}^{\prime }\right)
\Leftrightarrow a_{I}\succ _{i}a_{I}^{\prime } \\
u_{i}\left( a_{I}\right) &=&u_{i}\left( a_{I}^{\prime }\right)
\Leftrightarrow a_{I}\sim _{i}a_{I}^{\prime }
\end{eqnarray*}という関係もまた成立します。

プレイヤー\(i\)の利得関数\(u_{i}\)の定義域が\(A_{I}\)であることは、プレイヤー\(i\)が得る効用\(u_{i}\left(a_{I}\right) =u_{i}\left( a_{i},a_{-i}\right) \)が自身の行動\(a_{i}\)だけに依存するのではなく、自分以外のプレイヤーたちの行動\(a_{-i}\)にも依存することを意味します。つまり、利得関数の定義域を\(A_{I}\)とすることにより、プレイヤーの間に戦略的相互依存関係が存在する状況を表現しています。

プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、それを表現する利得関数\(u_{i}\)は存在するとは限りません。利得関数が存在することを保証する上で必要とされる条件については様々なものが知られています。利得関数の存在条件については場を改めて詳しく解説します。

例(ジャンケンにおける利得関数)
先のジャンケンの例において、プレイヤー集合が\(I=\left\{ 1,2\right\} \)であるとともに、それぞれのプレイヤー\(i\in I\)の行動集合が\(A_{i}=\left\{ R,P,S\right\} \)であるものとします。ジャンケンでは2人が出す手の組み合わせ\(\left( a_{1},a_{2}\right) \in A_{1}\times A_{2}\)に応じて勝者が決定されます。プレイヤーの選好として典型的なものは、それぞれのプレイヤーは「自分が勝つ」「あいこ」「相手が勝つ」の順番で好むというものです。その場合、プレイヤー\(1\)の利得関数としては、\begin{equation*}\left\{
\begin{array}{l}
u_{1}\left( R,S\right) =u_{1}\left( P,R\right) =u_{1}\left( S,P\right) =1 \\
u_{1}\left( R,R\right) =u_{1}\left( P,P\right) =u_{1}\left( S,S\right) =0 \\
u_{1}\left( R,P\right) =u_{1}\left( P,S\right) =u_{1}\left( S,R\right) =-1\end{array}\right.
\end{equation*}を満たす関数\(u_{1}:A_{I}\rightarrow \mathbb{R} \)が考えられ、プレイヤー\(2\)の利得関数としては、\begin{equation*}\left\{
\begin{array}{l}
u_{2}\left( S,R\right) =u_{2}\left( R,P\right) =u_{2}\left( P,S\right) =1 \\
u_{2}\left( R,R\right) =u_{2}\left( P,P\right) =u_{2}\left( S,S\right) =0 \\
u_{2}\left( P,R\right) =u_{2}\left( P,R\right) =u_{2}\left( R,S\right) =-1\end{array}\right.
\end{equation*}を満たす関数\(u_{2}:A_{I}\rightarrow \mathbb{R} \)が考えられます。
例(複占市場における利得関数)
先の複占市場の例において、プレイヤー集合が\(I=\left\{ 1,2\right\} \)であるとともに、それぞれのプレイヤー\(i\in I\)の行動集合が\(A_{i}=\mathbb{R} _{+}\)であるものとします。複占市場では2つの企業の生産量の組み合わせ\(\left( a_{1},a_{2}\right) \in \mathbb{R} _{+}^{2}\)に応じて各企業が得る利潤が決定されます。企業の選好として典型的なものは、「自分が得る利潤がより多い結果をより好む」というものです。この場合、各企業の利得関数としては、\begin{eqnarray*}u_{1}\left( a_{1},a_{2}\right) &=&\pi _{1}\left( a_{1},a_{2}\right) \\
u_{2}\left( a_{1},a_{2}\right) &=&\pi _{2}\left( a_{1},a_{2}\right)
\end{eqnarray*}を満たす関数\(u_{1},u_{2}:\mathbb{R} _{+}^{2}\rightarrow \mathbb{R} \)が考えられます。つまり、企業は自身が得る利潤と利得を同一視するということです。

 

戦略型ゲーム

繰り返しになりますが、完備情報の静学ゲームを記述するためには「プレイヤー」「行動」「結果」「利得」をそれぞれ特定する必要があります。ゲームのプレイヤーはプレイヤー集合\(I\)によって記述され、それぞれのプレイヤー\(i\in I\)の行動は行動集合\(A_{i}\)として記述されます。プレイヤーたちが選ぶ行動の組\(a_{I}\in A_{I}\)にはゲームにおいて起こり得る結果が1つずつ対応しているため、それぞれのプレイヤー\(i\)の利得は利得関数\(u_{i}:A_{I}\rightarrow \mathbb{R} \)として表現可能です。以上の要素からなるモデルを、\begin{equation*}G=(I,\left\{ A_{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in I})
\end{equation*}と表記し、これを戦略型ゲーム(game in strategic form)や標準型ゲーム(game in normal form)などと呼びます。

完備情報の静学ゲームが戦略型ゲーム\(G\)によって表現されるとき、ゲームの完備性より、\(G\)を構成するすべての要素はプレイヤーたちの共有知識です。また、ゲームの静学性より、プレイヤーたちは以下のプロセスのもとで意志決定を行います。

  1. それぞれのプレイヤー\(i\)は自身の行動集合\(A_{i}\)の中から特定の行動\(a_{i}\)を選択する。その際、他のプレイヤーたちが選択する行動を観察できない。
  2. プレイヤーたちが選択した行動の組\(a_{I}=\left( a_{i}\right) _{i\in I}\)に対して、ゲームのルールが結果を定める。
  3. そのゲームの結果から、それぞれのプレイヤー\(i\)は利得\(u_{i}(a_{I})\)を得る。

 

利得行列

戦略型ゲーム\(G\)を構成するすべての要素が有限集合である場合には\(G\)を有限ゲーム(finite game)と呼びます。つまり、戦略型ゲーム\(G\)が有限であるとは、プレイヤー集合\(I\)と任意のプレイヤー\(i\in I\)の行動集合\(A_{i}\)が有限集合であるということです。有限ゲームではプレイヤーの数が有限であるとともに、それぞれのプレイヤーが選択可能な行動の数もまた有限です。

戦略型ゲームが\(2\)人有限ゲームである場合には、その戦略型ゲームを行列を用いて表現できます。具体的には、2人のプレイヤー\(1,2\)の行動集合がそれぞれ\begin{eqnarray*}A_{1} &=&\left\{ a_{11},a_{12}\right\} \\
A_{2} &=&\left\{ a_{21},a_{22}\right\}
\end{eqnarray*}である場合、戦略型ゲーム\(G\)を以下の行列を用いて表現できます。これを利得行列(payoff matrix)と呼びます。

$$\begin{array}{ccc}
\hline
1\backslash 2 & a_{21} & a_{22} \\ \hline
a_{11} & u_{1}\left( a_{11},a_{21}\right) ,\ u_{2}\left( a_{11},a_{21}\right) & u_{1}\left( a_{11},a_{22}\right) ,\ u_{2}\left( a_{11},a_{22}\right) \\ \hline
a_{12} & u_{1}\left( a_{11},a_{21}\right) ,\ u_{2}\left( a_{11},a_{21}\right) & u_{1}\left( a_{12},a_{22}\right) ,\ u_{2}\left( a_{12},a_{22}\right) \\ \hline
\end{array}$$

上の利得行列において、プレイヤー\(1\)は行を選択し、プレイヤー\(2\)は列を選択するものとみなします。利得行列の第\(ij\)成分である、\begin{equation*}\left( u_{1}\left( a_{1i},a_{2j}\right) ,u_{2}\left( a_{1i},a_{2j}\right)
\right)
\end{equation*}は、プレイヤー\(i\)が行動\(a_{1i}\)を選びプレイヤー\(2\)が行動\(a_{2j}\)を選んだ場合に2人が直面する利得からなる組です。

例(利得行列)
先のジャンケンの例において両プレイヤーが「自分が勝つ」「あいこ」「相手が勝つ」の順番で好む場合、戦略型ゲーム\(G\)は以下の利得行列

$$\begin{array}{cccc}
\hline
1\backslash 2 & R & P & S \\ \hline
R & 0,0 & -1,1 & 1,-1 \\ \hline
P & 1,-1 & 0,0 & -1,1 \\ \hline
S & -1,1 & 1,-1 & 0,0 \\ \hline
\end{array}$$

として表現されます。

戦略型ゲーム\(G\)を構成する少なくとも1つの要素が無限集合である場合には\(G\)を無限ゲーム(infinite game)と呼びます。つまり、戦略型ゲーム\(G\)が無限であるとはプレイヤー集合\(I\)、もしくは少なくとも1人のプレイヤー\(i\)の行動集合\(A_{i}\)が無限集合であるということです。無限ゲームではプレイヤーの人数が無限であるか、もしくは少なくとも1人のプレイヤーには無限個の行動が選択肢として与えられています。通常、無限ゲームは利得行列を用いて表現することはできません。

例(利得行列)
先の複占市場の例において、それぞれの企業\(i\in I=\left\{ 1,2\right\} \)の行動集合は、\begin{equation*}A_{i}=\mathbb{R} _{+}
\end{equation*}という無限集合であるため、この状況を表現する戦略型ゲーム\(G\)は無限ゲームであり、したがってそれを利得行列として表現するのは困難です。

 

演習問題

問題(戦略型ゲーム)
2人のプレイヤー\(1,2\)はそれぞれ\(A\)と\(B\)のどちらか一方の文字を選び、相手に見せないように紙に記します。2人とも書き終わったら、紙を開いて2人が記した文字を確認します。2人が選んだ文字が同じである場合、プレイヤー\(1\)がプレイヤー\(2\)に対して\(1\)万円を支払います。逆に、2人が選んだ文字が異なる場合、プレイヤー\(2\)がプレイヤー\(1\)に対して\(1\)万円を支払います。2人とも自身が得る金額を最大化するものと仮定します。以上の状況を戦略型ゲーム\begin{equation*}G=\left( I,\{A_{i}\}_{i\in I},\{u_{i}\}_{i\in I}\right)
\end{equation*}として定式化してください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(戦略型ゲーム)
ある道路沿いに3店のガソリンスタンドが密集して立地しています。ある日の朝、各店舗はその日のガソリン販売価格を設定しようとしています。3店とも営業開始時間は同じであるため、それぞれの店は、他の店が設定する価格を事前に知ることはできません。それぞれの店は、価格として任意の非負の実数を選べるものとします。この道路沿いにおける一日当たりのガソリン総販売額は\(6\)で一定であり、それを3つの店で奪い合う状況を想定します。すべての客は3つの店が提示する価格を観察した上で、最も安い店へ行くものとします。ただし、複数の店が同一の価格をつける場合、それらの店の間で総販売額\(6\)を等分する形になります。ガソリンの販売に必要な費用は無視します。3店とも、その日のガソリン販売額を最大化するものとします。以上の状況を戦略型ゲーム\begin{equation*}G=\left( I,\{A_{i}\}_{i\in I},\{u_{i}\}_{i\in I}\right)
\end{equation*}として定式化してください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(戦略型ゲーム)
ある企業には経営者と従業員が1人ずついます。この企業は今、ある事業を計画しています。事業に成功すれば経営者は収入\(10\)を、従業員は収入\(4\)を得ますが、事業に失敗すれば両者は収入\(0\)を得るものとします。事業が成功する確率は2人の行動に依存します。経営者に与えられている選択肢は、事業に必要な投資を行うか行わないかの2つです。従業員に与えられている選択肢は、事業のために努力するか怠けるかの2つです。経営者が投資を行い、従業員が努力する場合には、事業は確実に成功します。経営者が投資を行わず、従業員が怠ける場合、事業は確実に失敗します。また、経営者が投資を行い、従業員が怠ける場合、事業の成功確率は\(\frac{1}{2}\)であるものとします。また、経営者が投資を行わず、経営者が努力する場合、事業の成功確率は\(\frac{1}{4}\)であるものとします。経営者と従業員はともに自身が得る収入の期待値を最大化するものとします。以上の状況を戦略型ゲーム\begin{equation*}G=\left( I,\{A_{i}\}_{i\in I},\{u_{i}\}_{i\in I}\right)
\end{equation*}として定式化してください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員専用コンテンツです
ログイン】【会員登録