完備情報の静学ゲームにおける戦略
問題としている戦略的状況が完備情報の静学ゲームであるとともに、それが戦略型ゲーム\begin{equation*}
G=(I,\left\{ A_{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in I})
\end{equation*}として記述されているものとします。ただし、\(I\)はプレイヤー集合、\(A_{i}\)はプレイヤー\(i\in I\)の行動集合、\(u_{i}:A_{I}\rightarrow \mathbb{R} \)はプレイヤー\(i\)の利得関数です。では、戦略型ゲーム\(G\)におけるそれぞれのプレイヤーの意思決定をどのように定式化すればよいでしょうか。プレイヤーの意思決定は戦略(strategy)と呼ばれる概念を用いて表現します。
一般に、プレイヤーの戦略とは、プレイヤーがゲーム中に意志決定を行うそれぞれの局面において、そこで与えられた情報と行動を踏まえた上でどの行動を選ぶかをあらかじめ包括的に定める行動計画として定義されます。以上を踏まえた上で、完備情報の静学ゲームにおける戦略とは何であるかを以下で説明します。
まず、プレイヤーたちが順番に意思決定を行う動学ゲームでは、プレイヤーの戦略とは、自分とは異なるタイミングで意志決定を行う他のプレイヤーたちの選択の結果として実現し得るすべての経路を想定した上で、各経路において自分がどのような行動を選ぶかをあらかじめ包括的に定める行動計画に相当します。一方、プレイヤーたちが同時に意思決定を行う静学ゲームでは、すべてのプレイヤーが同時に1度だけ意志決定を行うため、それぞれのプレイヤーは複数の経路を想定する必要がありません。
また、ゲームのルールが共有知識ではない不完備情報ゲームでは、プレイヤーはゲームのルールについて確かな認識を持っていません。したがって、そこでのプレイヤーの戦略とは、実現し得るルールのあらゆる状態を想定した上で、それぞれの状態において自分がどのような行動を選ぶかをあらかじめ包括的に定める行動計画に相当します。一方、ゲームのルールが共有知識である完備情報ゲームでは、すべてのプレイヤーはゲームのルールについて確かな認識を持っているため、それぞれのプレイヤーは実現し得る複数の状態を想定する必要がありません。
以上を踏まえると、完備情報の静学ゲームが戦略型ゲーム\(G\)として表現されている場合、それぞれのプレイヤー\(i\in I\)の戦略とは、単純に、自身の行動集合\(A_{i}\)の中から何らかの1つの行動\(a_{i}\in A_{i}\)を指定する行動計画に相当します。
戦略型ゲームにおける純粋戦略
戦略型ゲーム\(G\)においてプレイヤー\(i\in I\)が選択可能な個々の戦略を、\begin{equation*}s_{i}
\end{equation*}で表記します。繰り返しになりますが、完備情報の静学ゲームが戦略型ゲーム\(G\)として表現される場合、プレイヤー\(i\)の戦略とは自身の行動集合\(A_{i}\)の中から1つの行動を指定する行動計画に相当します。したがって、戦略型ゲーム\(G\)においてプレイヤー\(i\)が戦略\(s_{i}\)を選ぶこととは、自身の行動集合\(A_{i}\)の中から特定の行動\(a_{i}\)を1つだけ選択し、その行動\(a_{i}\)のもとで戦略型ゲーム\(G\)に備えることを意味します。このような事情を踏まえると、戦略型ゲーム\(G\)ではプレイヤー\(i\)の戦略\(s_{i}\)と、その戦略\(s_{i}\)のもとで選ばれる行動\(a_{i}\)を同一視しても一般性は失われません。このような戦略\(s_{i}\)を純粋戦略(pure strategy)と呼びます。
すべてのプレイヤーの純粋戦略からなる組を\(s_{I}=(s_{i})_{i\in I}\)で表記し、プレイヤー\(i\)以外のプレイヤーたちの純粋戦略からなる組を\(s_{-i}=(s_{j})_{j\in I\backslash \left\{ i\right\} }\)で表記します。\(s_{I}=\left( s_{i},s_{-i}\right) \)です。
プレイヤー\(i\)が選択可能なすべての純粋戦略からなる集合をプレイヤー\(i\)の純粋戦略集合(pure strategy set)や戦略集合(strategy set)などと呼び、これを、\begin{equation*}S_{i}
\end{equation*}で表記します。\(s_{i}\in S_{i}\)です。
すべてのプレイヤーの純粋戦略集合の直積を\(S_{I}=\prod_{i\in I}S_{i}\)で表記し、プレイヤー\(i\)以外のプレイヤーたちの純粋戦略集合の直積を\(S_{-i}=\prod_{j\in I\backslash \left\{ i\right\} }S_{j}\)で表記します。\(s_{I}\in S_{I}\)かつ\(s_{-i}\in S_{-i}\)です。
繰り返しになりますが、戦略型ゲーム\(G\)におけるプレイヤー\(i\)の純粋戦略\(s_{i}\in S_{i}\)は、その純粋戦略\(s_{i}\in S_{i}\)のもとで選ばれる1つの行動\(a_{i}\in A_{i}\)と一致します。したがって、プレイヤー\(i\)の純粋戦略集合\(S_{i}\)と行動集合\(A_{i}\)は一致します。つまり、以下の関係\begin{equation*}S_{i}=A_{i}
\end{equation*}が成り立つということです。それにあわせて、それぞれのプレイヤー\(i\in I\)の利得関数\(u_{i}:A_{I}\rightarrow \mathbb{R} \)の定義域を\(A_{I}\)から\(S_{I}\)へと読み替えて、\begin{equation*}u_{i}:S_{I}\rightarrow \mathbb{R} \end{equation*}とすることができます。このような事情を踏まえると、問題としている戦略的状況が完備情報の静学ゲームである場合、それを表現する戦略型ゲーム\(G\)を、\begin{equation*}G=(I,\left\{ S_{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in I})
\end{equation*}と表現しても一般性は失われません。
I=\left\{ 1,2\right\}
\end{equation*}であり、それぞれのプレイヤー\(i\in I\)の行動集合は、\begin{equation*}A_{i}=\left\{ R,P,S\right\}
\end{equation*}です。ただし、\(R\)はグー(Rock)、\(P\)はパー(Paper)、\(S\)はチョキ(Scissors)を表します。プレイヤーの利得の体系として典型的なものは「自分が勝つ」「あいこ」「相手が勝つ」の順番で好むというものです。この場合、プレイヤーの利得関数は、例えば、以下の利得行列
$$\begin{array}{cccc}
\hline
1\backslash 2 & R & P & S \\ \hline
R & 0,0 & -1,1 & 1,-1 \\ \hline
P & 1,-1 & 0,0 & -1,1 \\ \hline
S & -1,1 & 1,-1 & 0,0 \\ \hline
\end{array}$$
として表現されます。それぞれのプレイヤー\(i\in I\)の純粋戦略集合は、\begin{equation*}S_{i}=A_{i}=\left\{ R,P,S\right\}
\end{equation*}であり、その要素である\(P,R,S\)が純粋戦略です。
I=\left\{ 1,2\right\}
\end{equation*}であり、それぞれの企業\(i\in I\)は商品の供給量\(q_{i}\)として任意の非負の実数を選択可能であるならば、企業\(i\)の行動集合は、\begin{equation*}A_{i}=\mathbb{R} _{+}
\end{equation*}となります。両企業が選択した供給量からなる組が\(\left( p_{1},p_{2}\right) \in \mathbb{R} _{++}^{2}\)であるとき、商品の市場価格が、\begin{equation*}p\left( q_{1}+q_{2}\right) =\left\{
\begin{array}{cc}
120-\left( q_{1}+q_{2}\right) & \left( if\ q_{1}+q_{2}\leq 120\right) \\
0 & \left( if\ q_{1}+q_{2}>120\right)
\end{array}\right.
\end{equation*}で均衡するものとします。また、企業\(i\)が商品を\(q_{i}\)だけ生産するために必要な費用が、\begin{equation*}c_{i}\left( q_{i}\right) =30q_{i}
\end{equation*}であるものとします。生産量の組\(\left( q_{1},q_{2}\right) \)のもとで企業\(1\)が得る利得は、収入から費用を差し引いて得られる利潤と一致するのであれば、企業\(1\)の利得関数\(u_{1}:\mathbb{R} _{+}^{2}\rightarrow \mathbb{R} \)がそれぞれの\(\left( q_{1},q_{2}\right)\in \mathbb{R} _{+}^{2}\)に対して定める値は、\begin{equation*}u_{1}\left( q_{1},q_{1}\right) =p\left( q_{1}+q_{2}\right) \cdot
q_{1}-c_{1}\left( q_{1}\right)
\end{equation*}となります。同様に、企業\(2\)の利得関数\(u_{2}:\mathbb{R} _{+}^{2}\rightarrow \mathbb{R} \)がそれぞれの\(\left( q_{1},q_{2}\right)\in \mathbb{R} _{+}^{2}\)に対して定める値は、\begin{equation*}u_{2}\left( q_{1},q_{1}\right) =p\left( q_{1}+q_{2}\right) \cdot
q_{2}-c_{2}\left( q_{2}\right)
\end{equation*}となります。それぞれの企業\(i\)の純粋戦略集合は、\begin{equation*}S_{i}=\mathbb{R} _{+}
\end{equation*}であり、その要素である個々の非負の実数が純粋戦略です。
純粋戦略の組のもとで実現する利得
戦略型ゲーム\(G\)において、プレイヤーたちが選択する純粋戦略からなる組が、\begin{equation*}s_{I}=\left( s_{1},\cdots ,s_{n}\right) \in S_{I}
\end{equation*}であるものとします。プレイヤー\(i\in I\)の利得関数は、\begin{equation*}u_{i}:S_{I}\rightarrow \mathbb{R} \end{equation*}であるため、先の純粋戦略の組\(s_{I}\)からプレイヤー\(i\)が得る利得は、\begin{equation*}u_{i}\left( s_{I}\right) =u_{i}\left( s_{1},\cdots ,s_{n}\right) \in \mathbb{R} \end{equation*}となります。
I=\left\{ 1,2\right\}
\end{equation*}であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は、\begin{equation*}S_{i}=\left\{ R,P,S\right\}
\end{equation*}です。プレイヤーの利得関数が以下の利得行列
$$\begin{array}{cccc}
\hline
1\backslash 2 & R & P & S \\ \hline
R & 0,0 & -1,1 & 1,-1 \\ \hline
P & 1,-1 & 0,0 & -1,1 \\ \hline
S & -1,1 & 1,-1 & 0,0 \\ \hline
\end{array}$$
として表現されます。例えば、プレイヤー\(1\)がパーを出しプレイヤー\(2\)がグーを出すという純粋戦略からなる組は、\begin{equation*}\left( s_{1},s_{2}\right) =\left( P,R\right)
\end{equation*}であり、この純粋戦略の組からそれぞれのプレイヤーが得る利得は、\begin{eqnarray*}
u_{1}\left( P,R\right) &=&1 \\
u_{2}\left( P,R\right) &=&-1
\end{eqnarray*}です。また、2人がともにチョキを出すという純粋戦略からなる組は、\begin{equation*}
\left( s_{1},s_{2}\right) =\left( S,S\right)
\end{equation*}であり、この純粋戦略の組からそれぞれのプレイヤーが得る利得は、\begin{eqnarray*}
u_{1}\left( S,S\right) &=&0 \\
u_{2}\left( S,S\right) &=&0
\end{eqnarray*}です。
I=\left\{ 1,2\right\}
\end{equation*}であり、それぞれの企業\(i\in I\)の純粋戦略集合は、\begin{equation*}S_{i}=\mathbb{R} _{+}
\end{equation*}です。両企業が選択した供給量からなる組が\(\left( q_{1},q_{2}\right) \in \mathbb{R} _{++}^{2}\)であるとき、商品の市場価格が、\begin{equation*}p\left( q_{1}+q_{2}\right) =\left\{
\begin{array}{cc}
120-\left( q_{1}+q_{2}\right) & \left( if\ q_{1}+q_{2}\leq 120\right) \\
0 & \left( if\ q_{1}+q_{2}>120\right)
\end{array}\right.
\end{equation*}で均衡します。また、企業\(i\)が商品を\(q_{i}\)だけ生産するために必要な費用は、\begin{equation*}c_{i}\left( q_{i}\right) =30q_{i}
\end{equation*}です。企業\(i\)の利得関数\(u_{i}:\mathbb{R} _{+}^{2}\rightarrow \mathbb{R} \)がそれぞれの\(\left( q_{1},q_{2}\right)\in \mathbb{R} _{+}^{2}\)に対して定める値は、\begin{equation*}u_{i}\left( q_{1},q_{1}\right) =p\left( q_{1}+q_{2}\right) \cdot
q_{i}-c_{i}\left( q_{i}\right)
\end{equation*}です。例えば、企業\(1\)が\(50\)だけ生産し、企業\(2\)が\(30\)だけ供給するという純粋戦略からなる組は、\begin{equation*}\left( q_{1},q_{2}\right) =\left( 50,30\right)
\end{equation*}であり、この純粋戦略の組から企業\(1\)が得る利得は、\begin{eqnarray*}u_{1}\left( 50,30\right) &=&p\left( 50+30\right) \cdot 50-c_{1}\left(
50\right) \\
&=&\left[ 120-\left( 50+30\right) \right] \cdot 50-30\cdot 50 \\
&=&500
\end{eqnarray*}であり、企業\(2\)が得る利得は、\begin{eqnarray*}u_{2}\left( 50,30\right) &=&p\left( 50+30\right) \cdot 30-c_{2}\left(
30\right) \\
&=&\left[ 120-\left( 50+30\right) \right] \cdot 30-30\cdot 30 \\
&=&300
\end{eqnarray*}です。
演習問題
\end{equation*}として定式化するとともに、それぞれのプレイヤー\(i\in I\)の純粋戦略集合\(S_{i}\)を明らかにしてください。その上で、「プレイヤー\(1\)が\(A\)を選びプレイヤー\(2\)が\(B\)を選ぶ」という純粋戦略の組においてそれぞれのプレイヤーが得る利得を明らかにしてください。
\end{equation*}として定式化するとともに、それぞれのプレイヤー\(i\in I\)の純粋戦略集合\(S_{i}\)を明らかにしてください。その上で、「3店がいずれも同一価格\(p\)を設定する」という純粋戦略の組においてそれぞれのプレイヤーが得る利得を明らかにしてください。
\end{equation*}として定式化するとともに、それぞれのプレイヤー\(i\in I\)の純粋戦略集合\(S_{i}\)を明らかにしてください。その上で、「経営者が投資せずに従業員が努力する」という純粋戦略の組においてそれぞれのプレイヤーが得る利得を明らかにしてください。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】