完備情報の静学ゲームにおける戦略
問題としている戦略的状況が完備情報の静学ゲームであるとともに、それが戦略型ゲーム\begin{equation*}
G=(I,\left\{ A_{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in I})
\end{equation*}として記述されているものとします。ただし、\(I\)はプレイヤー集合、\(A_{i}\)はプレイヤー\(i\in I\)の行動集合、\(u_{i}:A_{I}\rightarrow \mathbb{R} \)はプレイヤー\(i\)の利得関数です。では、戦略型ゲーム\(G\)におけるそれぞれのプレイヤーの意思決定をどのように定式化すればよいでしょうか。プレイヤーの意思決定は戦略(strategy)と呼ばれる概念を用いて表現します。
一般に、プレイヤーの戦略とは、プレイヤーがゲーム中に意志決定を行うそれぞれの局面において、そこで与えられた情報と行動を踏まえた上でどの行動を選ぶかをあらかじめ包括的に定める行動計画として定義されます。以上を踏まえた上で、完備情報の静学ゲームにおける戦略とは何であるかを以下で説明します。
まず、プレイヤーたちが順番に意思決定を行う動学ゲームでは、プレイヤーの戦略とは、自分とは異なるタイミングで意志決定を行う他のプレイヤーたちの選択の結果として実現し得るすべての経路を想定した上で、各経路において自分がどのような行動を選ぶかをあらかじめ包括的に定める行動計画に相当します。一方、プレイヤーたちが同時に意思決定を行う静学ゲームでは、すべてのプレイヤーが同時に1度だけ意志決定を行うため、それぞれのプレイヤーは複数の経路を想定する必要がありません。
また、ゲームのルールが共有知識ではない不完備情報ゲームでは、プレイヤーはゲームのルールについて確かな認識を持っていません。したがって、そこでのプレイヤーの戦略とは、実現し得るルールのあらゆる状態を想定した上で、それぞれの状態において自分がどのような行動を選ぶかをあらかじめ包括的に定める行動計画に相当します。一方、ゲームのルールが共有知識である完備情報ゲームでは、すべてのプレイヤーはゲームのルールについて確かな認識を持っているため、それぞれのプレイヤーは実現し得る複数の状態を想定する必要がありません。
以上を踏まえると、完備情報の静学ゲームが戦略型ゲーム\(G\)として表現されている場合、それぞれのプレイヤー\(i\in I\)の戦略とは、単純に、自身の行動集合\(A_{i}\)の中から何らかの1つの行動\(a_{i}\in A_{i}\)を指定する行動計画に相当します。
戦略型ゲームにおける純粋戦略
戦略型ゲーム\(G\)においてプレイヤー\(i\in I\)が選択可能な個々の戦略を、\begin{equation*}s_{i}
\end{equation*}で表記します。繰り返しになりますが、完備情報の静学ゲームが戦略型ゲーム\(G\)として表現される場合、プレイヤー\(i\)の戦略とは自身の行動集合\(A_{i}\)の中から1つの行動を指定する行動計画に相当します。したがって、戦略型ゲーム\(G\)においてプレイヤー\(i\)が戦略\(s_{i}\)を選ぶこととは、自身の行動集合\(A_{i}\)の中から特定の行動\(a_{i}\)を1つだけ選択し、その行動\(a_{i}\)のもとで戦略型ゲーム\(G\)に備えることを意味します。このような事情を踏まえると、戦略型ゲーム\(G\)ではプレイヤー\(i\)の戦略\(s_{i}\)と、その戦略\(s_{i}\)のもとで選ばれる行動\(a_{i}\)を同一視しても一般性は失われません。このような戦略\(s_{i}\)を純粋戦略(pure strategy)と呼びます。
すべてのプレイヤーの純粋戦略からなる組を、\begin{equation*}
s_{I}=(s_{i})_{i\in I}
\end{equation*}で表記し、プレイヤー\(i\)以外のプレイヤーたちの純粋戦略からなる組を、\begin{equation*}s_{-i}=(s_{j})_{j\in I\backslash \left\{ i\right\} }
\end{equation*}で表記します。\(s_{I}=\left(s_{i},s_{-i}\right) \)です。
プレイヤー\(i\)が選択可能なすべての純粋戦略からなる集合をプレイヤー\(i\)の純粋戦略集合(pure strategy set)や戦略集合(strategy set)などと呼び、これを、\begin{equation*}S_{i}
\end{equation*}で表記します。\(s_{i}\in S_{i}\)です。
すべてのプレイヤーの純粋戦略集合の直積を、\begin{equation*}
S_{I}=\prod_{i\in I}S_{i}
\end{equation*}で表記し、プレイヤー\(i\)以外のプレイヤーたちの純粋戦略集合の直積を、\begin{equation*}S_{-i}=\prod_{j\in I\backslash \left\{ i\right\} }S_{j}
\end{equation*}で表記します。\(s_{I}\in S_{I}\)かつ\(s_{-i}\in S_{-i}\)です。
繰り返しになりますが、戦略型ゲーム\(G\)におけるプレイヤー\(i\)の純粋戦略\(s_{i}\in S_{i}\)は、その純粋戦略\(s_{i}\in S_{i}\)のもとで選ばれる1つの行動\(a_{i}\in A_{i}\)と一致します。したがって、プレイヤー\(i\)の純粋戦略集合\(S_{i}\)と行動集合\(A_{i}\)は一致します。つまり、以下の関係\begin{equation*}S_{i}=A_{i}
\end{equation*}が成り立つということです。それにあわせて、それぞれのプレイヤー\(i\in I\)の利得関数\(u_{i}:A_{I}\rightarrow \mathbb{R} \)の定義域を\(A_{I}\)から\(S_{I}\)へと読み替えて、\begin{equation*}u_{i}:S_{I}\rightarrow \mathbb{R} \end{equation*}とすることができます。このような事情を踏まえると、問題としている戦略的状況が完備情報の静学ゲームである場合、それを表現する戦略型ゲーム\(G\)を、\begin{equation*}G=(I,\left\{ S_{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in I})
\end{equation*}と表現しても一般性は失われません。
I=\left\{ 1,2\right\}
\end{equation*}であり、それぞれのプレイヤー\(i\in I\)の行動集合は、\begin{equation*}A_{i}=\left\{ R,P,S\right\}
\end{equation*}です。ただし、\(R\)はグー(Rock)、\(P\)はパー(Paper)、\(S\)はチョキ(Scissors)を表します。プレイヤーの利得の体系として典型的なものは「自分が勝つ」「あいこ」「相手が勝つ」の順番で好むというものです。この場合、プレイヤーの利得関数は、例えば、以下の利得行列
$$\begin{array}{cccc}
\hline
1\backslash 2 & R & P & S \\ \hline
R & 0,0 & -1,1 & 1,-1 \\ \hline
P & 1,-1 & 0,0 & -1,1 \\ \hline
S & -1,1 & 1,-1 & 0,0 \\ \hline
\end{array}$$
として表現されます。それぞれのプレイヤー\(i\in I\)の純粋戦略集合は、\begin{equation*}S_{i}=A_{i}=\left\{ R,P,S\right\}
\end{equation*}であり、その要素である\(P,R,S\)が純粋戦略です。
I=\left\{ 1,2\right\}
\end{equation*}であり、それぞれの企業\(i\in I\)は商品の供給量\(q_{i}\)として任意の非負の実数を選択可能であるならば、企業\(i\)の行動集合は、\begin{equation*}A_{i}=\mathbb{R} _{+}
\end{equation*}となります。両企業が選択した供給量からなる組が\(\left( p_{1},p_{2}\right) \in \mathbb{R} _{+}^{2}\)であるとき、商品の市場価格が、\begin{equation*}p\left( q_{1}+q_{2}\right) =\left\{
\begin{array}{cc}
120-\left( q_{1}+q_{2}\right) & \left( if\ q_{1}+q_{2}\leq 120\right) \\
0 & \left( if\ q_{1}+q_{2}>120\right)
\end{array}\right.
\end{equation*}で均衡するものとします。また、企業\(i\)が商品を\(q_{i}\)だけ生産するために必要な費用が、\begin{equation*}c_{i}\left( q_{i}\right) =30q_{i}
\end{equation*}であるものとします。生産量の組\(\left( q_{1},q_{2}\right) \)のもとで企業\(1\)が得る利得は、収入から費用を差し引いて得られる利潤と一致するのであれば、企業\(1\)の利得関数\(u_{1}:\mathbb{R} _{+}^{2}\rightarrow \mathbb{R} \)がそれぞれの\(\left( q_{1},q_{2}\right)\in \mathbb{R} _{+}^{2}\)に対して定める値は、\begin{eqnarray*}u_{1}\left( q_{1},q_{2}\right) &=&p\left( q_{1}+q_{2}\right) \cdot
q_{1}-c_{1}\left( q_{1}\right) \\
&=&\left\{
\begin{array}{cc}
\left[ 120-\left( q_{1}+q_{2}\right) \right] \cdot q_{1}-30q_{1} & \left(
if\ q_{1}+q_{2}\leq 120\right) \\
-30q_{1} & \left( if\ q_{1}+q_{2}>120\right)
\end{array}\right.
\end{eqnarray*}となります。同様に、企業\(2\)の利得関数\(u_{2}:\mathbb{R} _{+}^{2}\rightarrow \mathbb{R} \)がそれぞれの\(\left( q_{1},q_{2}\right)\in \mathbb{R} _{+}^{2}\)に対して定める値は、\begin{eqnarray*}u_{2}\left( q_{1},q_{2}\right) &=&p\left( q_{1}+q_{2}\right) \cdot
q_{2}-c_{2}\left( q_{2}\right) \\
&=&\left\{
\begin{array}{cc}
\left[ 120-\left( q_{1}+q_{2}\right) \right] \cdot q_{2}-30q_{2} & \left(
if\ q_{1}+q_{2}\leq 120\right) \\
-30q_{2} & \left( if\ q_{1}+q_{2}>120\right)
\end{array}\right.
\end{eqnarray*}となります。それぞれの企業\(i\)の純粋戦略集合は、\begin{equation*}S_{i}=\mathbb{R} _{+}
\end{equation*}であり、その要素である個々の非負の実数が純粋戦略です。
純粋戦略の組のもとで実現する利得
戦略型ゲーム\(G\)において、プレイヤーたちが選択する純粋戦略からなる組が、\begin{equation*}s_{I}=\left( s_{1},\cdots ,s_{n}\right) \in S_{I}
\end{equation*}であるものとします。プレイヤー\(i\in I\)の利得関数は、\begin{equation*}u_{i}:S_{I}\rightarrow \mathbb{R} \end{equation*}であるため、先の純粋戦略の組\(s_{I}\)からプレイヤー\(i\)が得る利得は、\begin{equation*}u_{i}\left( s_{I}\right) =u_{i}\left( s_{1},\cdots ,s_{n}\right) \in \mathbb{R} \end{equation*}となります。
I=\left\{ 1,2\right\}
\end{equation*}であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は、\begin{equation*}S_{i}=\left\{ R,P,S\right\}
\end{equation*}であり、プレイヤーたちの利得関数は以下の利得行列
$$\begin{array}{cccc}
\hline
1\backslash 2 & R & P & S \\ \hline
R & 0,0 & -1,1 & 1,-1 \\ \hline
P & 1,-1 & 0,0 & -1,1 \\ \hline
S & -1,1 & 1,-1 & 0,0 \\ \hline
\end{array}$$
として表現されます。例えば、プレイヤー\(1\)がパーを出しプレイヤー\(2\)がグーを出すという純粋戦略からなる組は、\begin{equation*}\left( s_{1},s_{2}\right) =\left( P,R\right)
\end{equation*}であり、この純粋戦略の組からそれぞれのプレイヤーが得る利得は、\begin{eqnarray*}
u_{1}\left( P,R\right) &=&1 \\
u_{2}\left( P,R\right) &=&-1
\end{eqnarray*}です。また、2人がともにチョキを出すという純粋戦略からなる組は、\begin{equation*}
\left( s_{1},s_{2}\right) =\left( S,S\right)
\end{equation*}であり、この純粋戦略の組からそれぞれのプレイヤーが得る利得は、\begin{eqnarray*}
u_{1}\left( S,S\right) &=&0 \\
u_{2}\left( S,S\right) &=&0
\end{eqnarray*}です。
I=\left\{ 1,2\right\}
\end{equation*}であり、それぞれの企業\(i\in I\)の純粋戦略集合は、\begin{equation*}S_{i}=\mathbb{R} _{+}
\end{equation*}であり、企業\(1\)の利得関数\(u_{1}:\mathbb{R} _{+}^{2}\rightarrow \mathbb{R} \)がそれぞれの\(\left( q_{1},q_{2}\right)\in \mathbb{R} _{+}^{2}\)に対して定める値は、\begin{equation*}u_{1}\left( q_{1},q_{2}\right) =\left\{
\begin{array}{cc}
\left[ 120-\left( q_{1}+q_{2}\right) \right] \cdot q_{1}-30q_{1} & \left(
if\ q_{1}+q_{2}\leq 120\right) \\
-30q_{1} & \left( if\ q_{1}+q_{2}>120\right)
\end{array}\right.
\end{equation*}であり、企業\(2\)の利得関数\(u_{2}:\mathbb{R} _{+}^{2}\rightarrow \mathbb{R} \)がそれぞれの\(\left( q_{1},q_{2}\right)\in \mathbb{R} _{+}^{2}\)に対して定める値は、\begin{equation*}u_{2}\left( q_{1},q_{2}\right) =\left\{
\begin{array}{cc}
\left[ 120-\left( q_{1}+q_{2}\right) \right] \cdot q_{2}-30q_{2} & \left(
if\ q_{1}+q_{2}\leq 120\right) \\
-30q_{2} & \left( if\ q_{1}+q_{2}>120\right)
\end{array}\right.
\end{equation*}です。例えば、企業\(1\)が\(50\)だけ供給し、企業\(2\)が\(30\)だけ供給するという純粋戦略からなる組は、\begin{equation*}\left( q_{1},q_{2}\right) =\left( 50,30\right)
\end{equation*}であり、この純粋戦略の組から企業\(1\)が得る利得は、\begin{eqnarray*}u_{1}\left( 50,30\right) &=&\left[ 120-\left( 50+30\right) \right] \cdot
50-30\cdot 50 \\
&=&500
\end{eqnarray*}であり、企業\(2\)が得る利得は、\begin{eqnarray*}u_{2}\left( 50,30\right) &=&\left[ 120-\left( 50+30\right) \right] \cdot
30-30\cdot 30 \\
&=&300
\end{eqnarray*}です。また、両企業が\(100\)ずつ供給するという純粋戦略からなる組は、\begin{equation*}\left( q_{1},q_{2}\right) =\left( 100,100\right)
\end{equation*}であり、この純粋戦略の組から企業\(1\)が得る利得は、\begin{eqnarray*}u_{1}\left( 100,100\right) &=&-30\cdot 100 \\
&=&-3000
\end{eqnarray*}であり、企業\(2\)が得る利得は、\begin{eqnarray*}u_{2}\left( 100,100\right) &=&-30\cdot 100 \\
&=&-3000
\end{eqnarray*}です。
合理性の仮定
完備情報の静学ゲームを戦略型ゲーム\(G\)として表現したとき、それぞれのプレイヤー\(i\)は自身の純粋戦略集合\(S_{i}\)に含まれる何らかの純粋戦略を確定的に選ぶことが想定されています。では、プレイヤーたちはどのような原理にもとづいて意思決定を行うのでしょうか。戦略型ゲームや純粋戦略などの概念は、ゲームのルールやプレイヤーに与えられる選択肢を定式化したものであり、プレイヤーたちの行動原理については何も語っていません。プレイヤーたちの行動原理については、別途、規定する必要があります。
ゲーム理論では、ゲームに参加するプレイヤーはそれぞれ明確な目的を持ち、その目的を達成するために最適な戦略を選択するものと仮定します。この意味においてプレイヤーは合理的(rational)です。さらに、多くの場合、プレイヤーの目的は自己の利得の最大化であるものと仮定します。つまり、ゲームに参加するプレイヤーは自分の利得の最大化をめざすという意味において利己的(selfish)です。なお、合理性と利己性を総称して合理性と呼ぶこともあります。
プレイヤーの行動原理に関して合理性を仮定することは、プレイヤーが自己の利得を最大化するために最適な純粋戦略を選択することを仮定することを意味します。この仮定はどれくらい現実的でしょうか。合理性の仮定が成り立つことを保証するためには、戦略型ゲーム\begin{equation*}
G=(I,\left\{ S_{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in I})
\end{equation*}に関して、少なくとも以下を要求する必要があります。
- それぞれのプレイヤー\(i\in I\)は、自分がプレーしている戦略型ゲーム\(G\)において起こり得るすべての結果を把握している。プレイヤーたちが選択する純粋戦略の組\(s_{I}\in S_{I}\)に対してゲームの結果が1つずつ定まるため、純粋戦略の組を結果と同一視するのであれば、この仮定は、それぞれのプレイヤーが、自分を含めた全員の純戦略集合\(\left\{ S_{i}\right\} _{i\in I}\)を把握するに十分な理解力を有していることを要求する。
- それぞれのプレイヤー\(i\in I\)は、ゲームにおいて起こり得るそれぞれの結果\(s_{I}\in S_{I}\)から自身が得る利得\(u_{i}\left(s_{I}\right) \in \mathbb{R} \)を把握し、その上で、自身の利得を最大化するような純粋戦略\(s_{i}\in S_{i}\)を特定するに十分な知能を持っていることを要求する。
完備情報の静学ゲームを戦略型ゲーム\(G\)として定式化するとき、完備性の定義より、ゲームの要素であるプレイヤー集合\(I\)、プレイヤーたちの純粋戦略集合\(\left\{ S_{i}\right\} _{i\in I}\)、プレイヤーたちの利得関数\(\left\{ u_{i}\right\} _{i\in I}\)はいずれもプレイヤーたちの共有知識とみなされます。
一方、プレイヤーの合理性は戦略型ゲーム\(G\)の要素ではないため、「プレイヤーたちが合理的である」という事実は、プレイヤーたちの共有知識であることを必ずしも仮定しません。ゲーム理論では多くの場合、プレイヤーの合理性は相互知識であるものと仮定した上で分析を行います。つまり、すべてのプレイヤーが合理的であることをすべてのプレイヤーが知っていることを仮定します。プレイヤーの合理性を共有知識と仮定する場合もあります。つまり、すべてのプレイヤーが合理的であることをすべてのプレイヤーが知っており、なおかつ、その事実をすべてのプレイヤーが知っており、\(\cdots \)、という仮定を無限に積み重ねるということです。後ほど明らかになるように、プレイヤーたちの合理性を共有知識とみなすか、相互知識とみなすか、その仮定の強さによって得られる結論も変わってくるため、注意が必要です。
純粋戦略均衡
戦略型ゲーム\(G\)に直面したそれぞれのプレイヤー\(i\)は、合理性の仮定のもとで、自身が選択可能な純粋戦略の集合\(S_{i}\)の中から自身の利得を最大化する純粋戦略を選ぶものと仮定します。そのような純粋戦略を\(s_{i}^{\ast }\)で表し、これをプレイヤー\(i\)の最適戦略(best strategy)と呼びます。
プレイヤーたちが最適戦略を選ぶ目的は自身の利得の最大化ですが、最適戦略の具体的な内容は戦略型ゲーム\(G\)の要素とは別にゲームの分析者が定義する必要があります。つまり、ゲームの分析家は最適戦略の意味をあらかじめ規定した上で、そこで規定された最適戦略の概念のもとでプレイヤーたちが具体的にどのように振る舞い、そこからどのような結果がもたらされるかを分析する、ということです。したがって、同じゲーム\(G\)を分析対象とする場合でも、異なる最適戦略の概念のもとで分析を行えば異なる分析結果が得られます。分析家がどのような最適戦略の概念を採用するかは非常に重要な問題です。
最適戦略の意味を定義することとは、それぞれの戦略型ゲーム\(G\)に対して、そこでの最適戦略の組\begin{equation*}s_{I}^{\ast }=(s_{i}^{\ast })_{i\in I}\in S_{I}
\end{equation*}を特定する上での基準を定めることを意味します。そこで、そのような概念を均衡概念(equilibrium concept)や解の概念(solution concept)などと呼びます。また、均衡概念がそれぞれの戦略型ゲーム\(G\)に対して定める最適戦略の組\(s_{I}^{\ast }\)を\(G\)の均衡(equilibrium)や純粋戦略均衡(pure strategy equilibrium)などと呼び、均衡\(s_{I}^{\ast}\)を構成するプレイヤー\(i\)の最適戦略\(s_{i}^{\ast }\)を\(i\)の均衡戦略(equilibrium strategy)と呼びます。戦略型ゲーム\(G\)の均衡が\(s_{I}^{\ast }\)である場合、ゲームのルールが\(s_{I}^{\ast }\)に対して\(G\)の結果を定めます、それを\(G\)の均衡結果(equilibrium outcome)と呼びます。その上で、均衡結果からプレイヤーたちが得る利得の組を、\begin{equation*}u_{I}^{\ast }=(u_{i}(s_{I}^{\ast }))_{i\in I}\in \mathbb{R} ^{n}
\end{equation*}で表記します。これを均衡利得(equilibrium payoffs)と呼びます。
演習問題
\end{equation*}として定式化するとともに、それぞれのプレイヤー\(i\in I\)の純粋戦略集合\(S_{i}\)を明らかにしてください。その上で、「プレイヤー\(1\)が\(A\)を選びプレイヤー\(2\)が\(B\)を選ぶ」という純粋戦略の組においてそれぞれのプレイヤーが得る利得を明らかにしてください。
\end{equation*}として定式化するとともに、それぞれのプレイヤー\(i\in I\)の純粋戦略集合\(S_{i}\)を明らかにしてください。その上で、「3店がいずれも同一価格\(p\)を設定する」という純粋戦略の組においてそれぞれのプレイヤーが得る利得を明らかにしてください。
\end{equation*}として定式化するとともに、それぞれのプレイヤー\(i\in I\)の純粋戦略集合\(S_{i}\)を明らかにしてください。その上で、「経営者が投資せずに従業員が努力する」という純粋戦略の組においてそれぞれのプレイヤーが得る利得を明らかにしてください。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】