WIIS

完備情報の静学ゲーム

混合戦略と期待利得関数(戦略型ゲームの混合拡張)および期待効用仮説

目次

Mailで保存
Xで共有

混合戦略

問題としている戦略的状況が完備情報の静学ゲームであるとともに、それが戦略型ゲーム\begin{equation*}
G=(I,\left\{ S_{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in I})
\end{equation*}として記述されているものとします。ただし、\(I\)はプレイヤー集合、\(S_{i}\)はプレイヤー\(i\in I\)の純粋戦略集合、\(u_{i}:S_{I}\rightarrow \mathbb{R} \)はプレイヤー\(i\)の利得関数です。

完備情報の静学ゲームを戦略型ゲーム\(G\)として表現したとき、それぞれのプレイヤー\(i\)は自身の純粋戦略集合\(S_{i}\)に含まれる何らかの純粋戦略を確定的に選ぶことが想定されています。その一方で、プレイヤー\(i\)が何らかの確率分布にもとづいて\(S_{i}\)の中から何らかの純粋戦略をランダムに選ぶような状況を想定することもできます。そのような意思決定を混合戦略(mixed strategy)と呼びます。以下では混合戦略の概念を定式化します。

プレイヤー\(i\)が有限\(m\)個の純粋戦略を与えられている状況を想定します。つまり、プレイヤー\(i\)の純粋戦略集合が有限集合\begin{equation*}S_{i}=\left\{ s_{i1},s_{i2},\cdots ,s_{im}\right\}
\end{equation*}であるということです。このとき、プレイヤー\(i\)の混合戦略とは、\(S_{i}\)に属するそれぞれの純粋戦略\(s_{ij}\ \left(j=1,\cdots ,m\right) \)に対して、それが選ばれる確率\begin{equation*}\sigma _{i}(s_{ij})\in \mathbb{R} \end{equation*}を指定する有限型の確率測度\begin{equation*}
\sigma _{i}:S_{i}\rightarrow \mathbb{R} \end{equation*}として定義されます。ただし、確率測度の定義より、\(\sigma _{i}\)は以下の性質\begin{eqnarray*}&&\left( a\right) \ \forall j\in \left\{ 1,2,\cdots ,m\right\} :\sigma
_{i}(s_{ij})\geq 0 \\
&&\left( b\right) \ \sum\limits_{j=1}^{m}\sigma _{i}(s_{ij})=1
\end{eqnarray*}をともに満たす必要があります。条件\(\left(a\right) \)は、プレイヤー\(i\)が混合戦略\(\sigma _{i}\)のもとでそれぞれの純粋戦略を選ぶ確率が非負の実数であることを意味します。条件\(\left( b\right) \)は、混合戦略\(\sigma _{i}\)のもとでそれぞれの純粋戦略が選ばれる確率の総和をとると\(1\)になることを意味します。

プレイヤー\(i\)の純粋戦略が有限集合\(S_{i}=\left\{s_{i1},s_{i2},\cdots ,s_{im}\right\} \)である場合、混合戦略\(\sigma_{i}:S_{i}\rightarrow \mathbb{R} \)を選択することと、以下のベクトル\begin{equation*}\sigma _{i}=\left( \sigma _{i}\left( s_{i1}\right) ,\sigma _{i}\left(
s_{i2}\right) ,\cdots ,\sigma _{i}\left( s_{im}\right) \right) \in \mathbb{R} ^{m}
\end{equation*}を指定することは同じ意味を持つため、混合戦略をベクトルとみなすこともできます。ただし、このベクトルは先の条件\(\left( a\right) ,\left( b\right) \)をともに満たすものでなければなりません。

例(混合戦略)
以下の利得行列で表される完備情報の静学ゲーム\(G\)について考えます。

$$\begin{array}{cccc}
\hline
1\diagdown 2 & s_{21} & s_{22} & s_{33} \\ \hline
s_{11} & 0,0 & -1,1 & 1,-1 \\ \hline
s_{12} & 1,-1 & 0,0 & -1,1 \\ \hline
s_{13} & -1,1 & 1,-1 & 0,0 \\ \hline
\end{array}$$

プレイヤー\(1\)の純粋戦略集合は、\begin{equation*}S_{1}=\left\{ s_{11},s_{12},s_{13}\right\}
\end{equation*}であるため、プレイヤー\(1\)の混合戦略とは以下の条件\begin{eqnarray*}&&\left( a\right) \ \forall j\in \{1,2,3\}:\sigma _{1}\left( s_{1j}\right)
\geq 0 \\
&&\left( b\right) \ \sigma _{1}\left( s_{11}\right) +\sigma _{1}\left(
s_{12}\right) +\sigma _{1}\left( s_{13}\right) =1
\end{eqnarray*}を満たす確率測度\(\sigma_{1}:S_{1}\rightarrow \mathbb{R} \)として定義されます。例えば、「\(s_{11},s_{12},s_{13}\)をそれぞれ等しい確率で選ぶ」という混合戦略は、\begin{equation*}\sigma _{1}=\left( \sigma _{1}\left( s_{11}\right) ,\sigma _{1}\left(
s_{12}\right) ,\sigma _{1}\left( s_{13}\right) \right) =\left( \frac{1}{3},\frac{1}{3},\frac{1}{3}\right)
\end{equation*}と表現されます。また、「\(s_{11}\)と\(s_{12}\)をそれぞれ等しい確率で選ぶ一方で\(s_{13}\)を選ぶ可能性はない」という混合戦略は、\begin{equation*}\sigma _{1}=\left( \sigma _{1}\left( s_{11}\right) ,\sigma _{1}\left(
s_{12}\right) ,\sigma _{1}\left( s_{13}\right) \right) =\left( \frac{1}{2},\frac{1}{2},0\right)
\end{equation*}と表現されます。純粋戦略\(s_{11}\)は「\(s_{11}\)を確実に選ぶ」という混合戦略\begin{equation*}\sigma _{1}=\left( \sigma _{1}\left( s_{11}\right) ,\sigma _{1}\left(
s_{12}\right) ,\sigma _{1}\left( s_{13}\right) \right) =\left( 1,0,0\right)
\end{equation*}として表現できます。純粋戦略は特別な混合戦略であるということです。以下のベクトル\begin{equation*}
\sigma _{1}=\left( \sigma _{1}\left( s_{11}\right) ,\sigma _{1}\left(
s_{12}\right) ,\sigma _{1}\left( s_{13}\right) \right) =\left( \frac{1}{3},\frac{1}{3},0\right)
\end{equation*}は混合戦略ではありません。なぜなら、このベクトルのもとでそれぞれの純粋戦略が選ばれる確率の総和は\(\frac{1}{3}+\frac{1}{3}+0=\frac{2}{3}\)であり、条件\(\left( b\right) \)が満たされないからです。プレイヤー\(2\)の混合戦略についても同様に考えます。

例(混合戦略)
以下の利得行列で表される完備情報の静学ゲーム\(G\)について考えます。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & A & B \\ \hline
A & 5,5 & 0,8 \\ \hline
B & 8,0 & 2,2 \\ \hline
\end{array}$$

プレイヤー\(i\ (=1,2)\)の純粋戦略集合はともに、\begin{equation*}S_{i}=\left\{ A,B\right\}
\end{equation*}であるため、プレイヤー\(i\)の混合戦略は、\begin{eqnarray*}&(a)&\sigma _{i}(A)\geq 0 \\
&\left( b\right) &\sigma _{i}(B)\geq 0 \\
&\left( c\right) &\sigma _{i}(A)+\sigma _{i}(B)=1
\end{eqnarray*}を満たす確率測度\(\sigma_{i}:S_{i}\rightarrow \mathbb{R} \)として定式化されます。ただし、\(S_{i}\)の中には2つの純粋戦略\(A,B\)だけが属するため、\(\sigma _{i}\)のもとで\(A\)が選ばれる確率\(\sigma _{i}\left( A\right) \)を特定すれば、\(\sigma _{i}\)のもとで\(B\)が選ばれる確率は\(\sigma _{i}\left( B\right) =1-\sigma _{i}\left( A\right) \)として定まります。したがって、プレイヤー\(i\)の混合戦略を表現するためには、プレイヤー\(i\)が純粋戦略\(A\)を選ぶ確率だけを指定すれば十分です。具体例を挙げると、「\(A\)と\(B\)を等しい確率で選択する」という混合戦略を、\begin{equation*}\sigma _{i}=\left( \sigma _{i}\left( A\right) ,\sigma _{i}\left( B\right)
\right) =\left( \frac{1}{2},\frac{1}{2}\right)
\end{equation*}と表現するかわりに、\begin{equation*}
\sigma _{i}=\sigma _{i}\left( A\right) =\frac{1}{2}
\end{equation*}と表現しても一般性は失われないということです。

すべてのプレイヤーの混合戦略からなる組を、\begin{equation*}
\sigma _{I}=\left( \sigma _{i}\right) _{i\in I}
\end{equation*}で表記し、プレイヤー\(i\)以外のプレイヤーたちの混合戦略からなる組を、\begin{equation*}\sigma _{-i}=\left( \sigma _{j}\right) _{j\in I\backslash \left\{ i\right\} }
\end{equation*}で表記します。\(\sigma _{I}=\left(\sigma _{i},\sigma _{-i}\right) \)です。

先の例が示唆するように、プレイヤー\(i\)の純粋戦略\(s_{i}\)は、\(s_{i}\)に確率\(1\)を付与し、\(S_{i}\)に属する\(s_{i}\)以外のすべての純粋戦略に確率\(0\)を付与する混合戦略として表現されます。純粋戦略は特別な混合戦略であり、逆に、純粋戦略を一般化した概念が混合戦略です。

ところで、プレイヤーは純粋戦略ではなく混合戦略というランダムな意思決定を実際に採用するのでしょうか。純粋戦略ではなく混合戦略を採用することはプレイヤーに何らかのメリットをもたらすのでしょうか。混合戦略という概念の正当性については場を改めて議論します。

 

混合戦略集合

戦略型ゲーム\(G\)においてプレイヤー\(i\)の純粋戦略集合が、\begin{equation*}S_{i}=\left\{ s_{i1},s_{i2},\cdots ,s_{im}\right\}
\end{equation*}である場合、プレイヤー\(i\)のそれぞれの混合戦略は確率測度\begin{equation*}\sigma _{i}:S_{i}\rightarrow \mathbb{R} \end{equation*}として表現されます。したがって、プレイヤー\(i\)が選択可能なすべての混合戦略からなる集合は、\begin{equation*}\Delta \left( S_{i}\right) =\left\{ \sigma _{i}:S_{i}\rightarrow \mathbb{R} \ |\ \sigma _{i}\text{は確率測度}\right\}
\end{equation*}です。これをプレイヤー\(i\)の混合戦略集合(mixed strategy set)や純粋戦略集合\(S_{i}\)の混合拡張(mixed extension of \(S_{i}\))などと呼びます。つまり、プレイヤー\(i\)の混合戦略集合\(\Delta \left( S_{i}\right) \)とは、プレイヤー\(i\)の純粋戦略集合\(S_{i}\)上に定義された確率測度をすべて集めてできる集合です。\(\sigma _{i}\in \Delta \left( S_{i}\right) \)です。

確率測度の定義を踏まえると、プレイヤー\(i\)の混合戦略集合を、\begin{equation*}\Delta \left( S_{i}\right) =\left\{ \sigma _{i}:S_{i}\rightarrow \mathbb{R} \ |\ \sum\limits_{j=1}^{m}\sigma _{i}(s_{ij})=1\wedge \forall j\in
\{1,\cdots ,m\}:\sigma _{i}(s_{ij})\geq 0\right\}
\end{equation*}と表現できます。また、プレイヤー\(i\)の混合戦略\(\sigma _{i}:S_{i}\rightarrow \mathbb{R} \)をベクトル\begin{equation*}\sigma _{i}=\left( \sigma _{i}\left( s_{i1}\right) ,\sigma _{i}\left(
s_{i2}\right) ,\cdots ,\sigma _{i}\left( \sigma _{im}\right) \right) \in \mathbb{R} ^{m}
\end{equation*}と同一視できるため、プレイヤー\(i\)の混合戦略集合を、\begin{equation*}\Delta \left( S_{i}\right) =\left\{ \sigma _{i}\in \mathbb{R} ^{m}\ |\ \sum\limits_{j=1}^{m}\sigma _{i}(s_{ij})=1\wedge \forall j\in
\{1,\cdots ,m\}:\sigma _{i}(s_{ij})\geq 0\right\}
\end{equation*}と表現することもできます。

すべてのプレイヤーの混合戦略集合の直積を、\begin{equation*}
\Delta \left( S_{I}\right) =\prod\limits_{i\in I}\Delta \left( S_{i}\right)
\end{equation*}で表記し、プレイヤー\(i\)以外のプレイヤーたちの混合戦略集合の直積を、\begin{equation*}\Delta \left( S_{-i}\right) =\prod\limits_{j\in I\backslash \left\{
i\right\} }\Delta \left( S_{j}\right)
\end{equation*}で表記します。\(\sigma _{I}\in\Delta \left( S_{I}\right) \)かつ\(\sigma _{-i}\in \Delta \left(S_{-i}\right) \)です。

一般に、有限集合上に定義される確率測度は無限通り存在するため、純粋戦略集合\(S_{i}\)が有限集合である場合でも、混合戦略集合\(\Delta \left( S_{i}\right) \)は無限集合になります。混合戦略を選択するプレイヤーは無限個の選択肢に直面するということです。

例(混合戦略集合)
プレイヤー\(i\)が2個の純粋戦略を持つ場合、すなわち、純粋戦略集合が、\begin{equation*}S_{i}=\left\{ s_{i1},s_{i2}\right\}
\end{equation*}である場合の混合戦略集合\(\Delta \left( S_{i}\right) \)は、以下の条件\begin{eqnarray*}&&\left( a\right) \ \sigma _{i}\left( s_{i1}\right) \geq 0 \\
&&\left( b\right) \ \sigma _{i}\left( s_{i2}\right) \geq 0 \\
&&\left( c\right) \ \sigma _{i}\left( s_{i1}\right) +\sigma _{i}\left(
s_{i2}\right) =1
\end{eqnarray*}を満たす2次元ベクトル\begin{equation*}
\left( \sigma _{i}\left( s_{i1}\right) ,\sigma _{i}\left( s_{i2}\right)
\right) \in \mathbb{R} ^{2}
\end{equation*}からなる集合です。この集合\(\Delta \left( S_{i}\right) \)は下図において実線で描かれた線分として表現されます。ただし、端点を含みます。

図:1次元の基本単体
図:1次元の基本単体

この線分上に存在する点はそれぞれ異なる混合戦略を表しています。一般に、このような\(\mathbb{R} ^{2}\)の部分集合を\(\mathbf{1}\)次元の基本単体(standard \(1\)simplex)と呼びます。2つの純粋戦略を持つプレイヤーの混合戦略集合は1次元の基本単体であるということです。

例(混合戦略集合)
プレイヤー\(i\)が3個の純粋戦略を持つ場合、すなわち、純粋戦略集合が、\begin{equation*}S_{i}=\left\{ s_{i1},s_{i2},s_{i3}\right\}
\end{equation*}である場合の混合戦略集合\(\Delta \left( S_{i}\right) \)は、以下の条件\begin{eqnarray*}&&\left( a\right) \ \sigma _{i}\left( s_{i1}\right) \geq 0 \\
&&\left( b\right) \ \sigma _{i}\left( s_{i2}\right) \geq 0 \\
&&\left( c\right) \ \sigma _{i}\left( s_{i3}\right) \geq 0 \\
&&\left( c\right) \ \sigma _{i}\left( s_{i1}\right) +\sigma _{i}\left(
s_{i2}\right) +\sigma _{i}\left( s_{i3}\right) =1
\end{eqnarray*}を満たす3次元ベクトル\begin{equation*}
\left( \sigma _{i}\left( s_{i1}\right) ,\sigma _{i}\left( s_{i2}\right)
,\sigma _{i}\left( s_{i3}\right) \right) \in \mathbb{R} ^{3}
\end{equation*}からなる集合です。この集合\(\Delta \left( S_{i}\right) \)は下図においてグレーで描かれた領域として表現されます。ただし、端点を含みます。

図:2次元の基本単体
図:2次元の基本単体

この領域上に存在する点はそれぞれ異なる混合戦略を表しています。一般に、このような\(\mathbb{R} ^{3}\)の部分集合を\(\mathbf{2}\)次元の基本単体(standard \(2\)simplex)と呼びます。3つの純粋戦略を持つプレイヤーの混合戦略集合は2次元の基本単体であるということです。

 

クジとしての混合戦略の組

完備情報の静学ゲームを戦略型ゲーム\(G\)として表現した上で、プレイヤーたちが純粋戦略を採用する状況を想定します。どの結果が実際に実現するかは自分が選ぶ純粋戦略だけでなく、他のプレイヤーたちが選ぶ純粋戦略にも依存します。ただ、静学ゲームのプレイヤーは他のプレイヤーたちが実際に選ぶ純粋戦略を観察できない状態で意思決定を行う必要があるため、プレイヤーはどの結果が実際に実現するかを事前に特定できず、起こり得る結果どうしを比較しながら意思決定することになります。純粋戦略のそれぞれの組\(s_{I}\in S_{I}\)にはゲームにおいて起こり得る結果が1つずつ対応しているため、ゲームにおいて起こり得る結果どうしを比較することと、純粋戦略の組どうしを比較することは同義になります。このような事情を踏まえた上で、プレイヤーたちが純粋戦略を採用する場合には、それぞれのプレイヤー\(i\in I\)は純粋戦略の組どうしを比較する\(S_{I}\)上の選好関係\(\succsim _{i}\)を持っているものとみなすことができます。さらに、この選好関係\(\succsim _{i}\)を利得関数\begin{equation*}u_{i}:S_{I}\rightarrow \mathbb{R} \end{equation*}として表現することもできます。つまり、プレイヤーたちが選択する純粋戦略が\(s_{I}\in S_{I}\)である場合に実現する結果からプレイヤー\(i\)が得る利得は、\begin{equation*}u_{i}\left( s_{I}\right) \in \mathbb{R} \end{equation*}であるということです。プレイヤーたちが純粋戦略を採用する場合、プレイヤーは利得を最大化する形で意思決定を行うことになります。

一方、戦略型ゲーム\(G\)においてプレイヤーたちが混合戦略を採用する場合には話が少し複雑になります。繰り返しになりますが、プレイヤーたちが純粋戦略を採用する場合、プレイヤーは意思決定を行う時点において他のプレイヤーたちが選択する純粋戦略を観察できないという意味での不確実性に直面しています。ただ、全員の意思決定が完了し、全員の純粋戦略が出揃ってしまえば、その場合に実現する結果は1つだけ確定的に定まります。プレイヤーたちが混合戦略を採用する場合にも、プレイヤーは意思決定を行う時点において他のプレイヤーたちが選択する混合戦略を観察できないという意味での不確実性に直面しています。加えて、それぞれのプレイヤーは自身の混合戦略にもとづいて純粋戦略をランダムに選択することになるため、全員の意思決定が完了し、全員の混合戦略が出揃った段階においてもなお、その場合に実現する結果は確定的に定まりません。したがって、混合戦略を採用する場合、プレイヤーたちは二重の不確実性に直面することになります。

ただ、全員の混合戦略\(\sigma _{I}\)が出揃えば、それぞれの結果が実現する確率、すなわち純粋戦略のそれぞれの組\(s_{I}\)が実現する確率を特定することはできます。具体的には、それぞれのプレイヤー\(i\)が混合戦略\(\sigma_{i}\)のもとで純粋戦略\(s_{i}\)を選ぶ確率は\(\sigma _{i}(s_{i})\)であるため、混合戦略の組\(\sigma _{I}\)のもとで純粋戦略の組\(s_{I}\)が実現する確率は、\begin{eqnarray*}\sigma _{I}\left( s_{I}\right) &=&\sigma _{1}(s_{1})\times \cdots \times
\sigma _{n}(s_{n}) \\
&=&\prod_{i\in I}\sigma _{i}\left( s_{i}\right)
\end{eqnarray*}となります。

以上を踏まえると、プレイヤーたちが選択する混合戦略が\(\sigma_{I}\in \Delta \left( S_{I}\right) \)である状況を想定したとき、純粋戦略のそれぞれの組\(s_{I}\in S_{I}\)に対して、それが実現する確率\begin{equation*}\sigma _{I}\left( s_{I}\right) =\prod_{i\in I}\sigma _{i}\left( s_{i}\right)
\in \mathbb{R} \end{equation*}を特定する確率測度\begin{equation*}
\sigma _{I}:S_{I}\rightarrow \mathbb{R} \end{equation*}が定義可能です。このような意味において、混合戦略の組\(\sigma _{I}\)はクジ(lottery)とも呼ばれます。確率測度の定義より、\(\sigma _{I}\)は以下の性質\begin{eqnarray*}&&\left( a\right) \ \forall s_{I}\in S_{I}:\sigma _{I}\left( s_{I}\right)
\geq 0 \\
&&\left( b\right) \ \sum\limits_{s_{I}\in S_{I}}\sigma _{I}\left(
s_{I}\right) =1
\end{eqnarray*}をともに満たします。条件\(\left( a\right) \)は、クジ\(\sigma _{I}\)のもとで純粋戦略のそれぞれの組が実現する確率が非負の実数であることを意味します。条件\(\left( b\right) \)は、クジ\(\sigma _{I}\)のもとで純粋戦略のそれぞれの組が選ばれる確率の総和をとると\(1\)になることを意味します。

例(クジとしての混合戦略の組)
以下の利得行列で表される完備情報の静学ゲーム\(G\)について考えます。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 4,4 & 0,2 \\ \hline
B & 2,0 & 1,1 \\ \hline
\end{array}$$

このゲームにおいて起こり得る結果、すなわち純粋戦略の組は、\begin{equation*}
\left( U,L\right) ,\left( U,R\right) ,\left( B,L\right) ,\left( B,R\right)
\end{equation*}の4通りです。プレイヤー\(1,2\)の混合戦略\(\sigma_{1},\sigma _{2}\)を、\begin{eqnarray*}\sigma _{1} &=&\left( \sigma _{1}\left( U\right) ,\sigma _{1}\left( B\right)
\right) =\left( \sigma _{1},1-\sigma _{1}\right) \quad \left( 0\leq \sigma
_{1}\leq 1\right) \\
\sigma _{2} &=&\left( \sigma _{2}\left( L\right) ,\sigma _{2}\left( R\right)
\right) =\left( \sigma _{2},1-\sigma _{2}\right) \quad \left( 0\leq \sigma
_{2}\leq 1\right)
\end{eqnarray*}で表記します。2人が混合戦略\(\sigma _{1},\sigma _{2}\)を採用する場合にそれぞれの結果が実現する確率、すなわちクジ\(\left( \sigma _{1},\sigma _{2}\right) \)のもとでそれぞれの純粋戦略の組が実現する確率は以下の通りです。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & \sigma _{1}\sigma _{2} & \sigma _{1}(1-\sigma _{2}) \\ \hline
B & (1-\sigma _{1})\sigma _{2} & (1-\sigma _{1})(1-\sigma _{2}) \\
\hline
\end{array}$$

 

クジのもとでプレイヤーが直面する期待利得(期待利得関数)

ゲームのルールは純粋戦略のそれぞれの組\(s_{I}\in S_{I}\)に対してゲームの結果を1つずつ定めます。ただ、プレイヤーたちが混合戦略\(\sigma _{I}\)を採用する場合、どの純粋戦略の組が実際に実現するかを事前に確定できないため、プレイヤーたちは不確実な状況に直面します。そこで、そのような状況をクジ\(\sigma _{I}:S_{I}\rightarrow \mathbb{R} \)を用いて表現します。クジ\(\sigma _{I}\)は純粋戦略のそれぞれの組\(s_{I}\)に対してそれが起こる確率\(\sigma _{I}\left( s_{I}\right) \)を特定しますが、これはプレイヤーたちが混合戦略\(\sigma _{I}\)を選択した場合にプレイヤーたちが直面する不確実な状況を表しています。

クジが変化すればプレイヤーたちは以前とは異なる不確実な状況に直面するため、プレイヤーたちが混合戦略を採用する場合、それぞれのプレイヤーはクジどうしを比較する選好関係を持っているものとみなすことができます。具体的には、戦略型ゲーム\(G\)においてプレイヤーたちが混合戦略を採用する場合、プレイヤー\(i\)が直面し得る不確実な状況どうしを比較する選好関係は、混合戦略のすべての組からなる集合\(\Delta \left( S_{I}\right) \)上の二項関係\(\succsim _{i}\)として定式化されます。具体的には、任意の2つのクジ\(\sigma _{I},\sigma _{I}^{\prime }\in \Delta\left( S_{I}\right) \)に対して、\begin{equation*}\sigma _{I}\succsim _{i}\sigma _{I}^{\prime }\Leftrightarrow i\text{は}\sigma _{I}\text{を}\sigma _{I}^{\prime }\text{以上に好む}
\end{equation*}という条件を満たすものとして\(\succsim _{i}\)を定義します。つまり、比較対象として2つのクジ\(\sigma _{I},\sigma _{I}^{\prime }\)を提示されたとき、プレイヤー\(i\)が\(\sigma _{I}\)のもとで直面する不確実な状況を\(\sigma _{I}^{\prime }\)のもとで直面する不確実な状況を好むとき、そしてその場合にのみ\(\sigma_{I}\succsim _{i}\sigma _{I}^{\prime }\)が成り立つものとして\(\succsim _{i}\)を定義するということです。ただし、\(\sigma _{I}\)を\(\sigma _{I}^{\prime }\)以上に好むとは、\(\sigma _{I}\)を\(\sigma _{I}^{\prime }\)よりも好むか、または\(\sigma _{I}\)と\(\sigma _{I}^{\prime }\)を同じ程度好むことを意味します。

プレイヤー\(i\)が不確実な状況どうしを比較する\(\Delta \left( S_{I}\right) \)上の選好関係\(\succsim _{i}\)が与えられたとき、任意の2つのクジ\(\sigma _{I},\sigma _{I}^{\prime }\in \Delta \left(S_{I}\right) \)に対して、以下の関係\begin{equation*}\sigma _{I}\succsim _{i}\sigma _{I}^{\prime }\Leftrightarrow F_{i}\left(
\sigma _{I}\right) \geq F_{i}\left( \sigma _{I}^{\prime }\right)
\end{equation*}を満たす関数\begin{equation*}
F_{i}:\Delta \left( S_{I}\right) \rightarrow \mathbb{R} \end{equation*}が存在する場合には、これを\(\succsim _{i}\)を表現する利得関数(payoff function)と呼びます。

特に、利得関数\(F_{i}:\Delta \left(S_{I}\right) \rightarrow \mathbb{R} \)がそれぞれのクジ\(\sigma_{I}\in \Delta \left( S_{I}\right) \)に対して定める値が、プレイヤー\(i\)が純粋戦略の組どうしを比較する利得関数\(u_{i}:S_{I}\rightarrow \mathbb{R} \)を用いて、\begin{eqnarray*}F_{i}\left( \sigma _{I}\right) &=&\sum_{s_{I}\in S_{I}}\left[ \sigma
_{I}\left( s_{I}\right) \times u_{i}\left( s_{I}\right) \right] \\
&=&\sum_{\left( s_{1},\cdots ,s_{n}\right) \in S_{1}\times \cdots \times
S_{n}}[\sigma _{1}\left( s_{1}\right) \times \cdots \times \sigma _{n}\left(
s_{n}\right) \times u_{i}\left( s_{1},\cdots ,s_{n}\right) ] \end{eqnarray*}という形で表される場合、このような利得関数\(F_{i}\)を特に\(\succsim _{i}\)を表す期待利得関数(expected utility function)と呼びます。期待利得関数\(F_{i}\)がクジ\(\sigma _{I}\)に対して定める値\(F_{i}\left( \sigma _{I}\right) \)をプレイヤー\(i\)が\(\sigma _{I}\)から得る期待利得(expected utility)と呼びます。利得関数\(F_{i}\)が存在する場合、2つのクジ\(\sigma_{I},\sigma _{I}^{\prime }\)について、\(\sigma_{I}\)が\(\sigma _{I}^{\prime }\)以上に望ましいことと、\(\sigma _{I}\)の期待利得が\(\sigma _{I}^{\prime }\)の期待利得以上であることが必要十分になります。期待利得関数を用いれば、クジの間の相対的な望ましさを、クジがもたらす期待利得の大小関係として表現できるということです。

期待利得関数の意味について考えましょう。プレイヤーたちが混合戦略を採用する場合、プレイヤーたちが選ぶ混合戦略の組\(\sigma _{I}\)が得られます。プレイヤー\(i\)が混合戦略\(\sigma _{i}\)のもとで純粋戦略\(s_{i}\)を選ぶ確率は\(\sigma _{i}(s_{i})\)であるため、混合戦略の組\(\sigma _{I}\)のもとで純粋戦略の組\(s_{I}\)が実現する確率は\(\sigma _{I}\left(s_{I}\right) \)となります。さらに、この\(s_{I}\)のもとで実現する結果においてプレイヤー\(i\)が得る利得は\(u_{i}\left( s_{I}\right) \)であるため、\(\sigma _{I}\)のもとでプレイヤー\(i\)が\(s_{I}\)から得る利得の期待値は\(\sigma _{I}\left( s_{I}\right) \times u_{i}\left( s_{I}\right) \)となります。\(S_{I}\)に属するそれぞれの純粋戦略の組\(s_{I}\)に関して利得の期待値\(\sigma _{I}\left( s_{I}\right)\times u_{i}\left( s_{I}\right) \)を導出した上でそれらの総和をとれば、\(\sigma _{I}\)のもとでのプレイヤー\(i\)が直面する期待利得\begin{equation*}F_{i}\left( \sigma _{I}\right) =\sum_{s_{I}\in S_{I}}\left[ \sigma
_{I}\left( s_{I}\right) \times u_{i}\left( s_{I}\right) \right] \end{equation*}が得られます。これはプレイヤーたちが混合戦略\(\sigma _{I}\)を選択する場合にプレイヤー\(i\)が直面する期待利得に他なりません。

プレイヤー\(i\)の期待利得関数\(F_{i}\)の定義域が\(\Delta \left( S_{I}\right) \)であることは、プレイヤー\(i\)が直面する期待利得\(F_{i}\left( \sigma_{I}\right) =F_{i}\left( \sigma _{i},\sigma _{-i}\right) \)が自身の選択\(\sigma _{i}\)だけに依存するのではなく、自分以外のプレイヤーたちの選択\(\sigma _{-i}\)にも依存することを意味します。つまり、期待利得関数の定義域が\(\Delta \left( S_{i}\right) \)であることは、プレイヤーの間に戦略的相互依存関係が存在することを意味します。

プレイヤー\(i\)がクジどうしを比較する選好関係\(\succsim _{i}\)が与えられたとき、それは期待利得関数\(F_{i}\)によって表現されるとは限りません。選好関係が期待利得関数によって表現されることを保証する上で必要な条件は明らかになっています。期待効用関数の存在条件については場を改めて解説します。

例(期待利得)
以下の利得行列で表される完備情報の静学ゲーム\(G\)について考えます。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 4,4 & 0,2 \\ \hline
B & 2,0 & 1,1 \\ \hline
\end{array}$$

このゲームにおいて起こり得る結果、すなわち純粋戦略の組は、\begin{equation*}
\left( U,L\right) ,\left( U,R\right) ,\left( B,L\right) ,\left( B,R\right)
\end{equation*}の4通りです。プレイヤー\(1,2\)の混合戦略\(\sigma_{1},\sigma _{2}\)を、\begin{eqnarray*}\sigma _{1} &=&\left( \sigma _{1}\left( U\right) ,\sigma _{1}\left( B\right)
\right) =\left( \sigma _{1},1-\sigma _{1}\right) \quad \left( 0\leq \sigma
_{1}\leq 1\right) \\
\sigma _{2} &=&\left( \sigma _{2}\left( L\right) ,\sigma _{2}\left( R\right)
\right) =\left( \sigma _{2},1-\sigma _{2}\right) \quad \left( 0\leq \sigma
_{2}\leq 1\right)
\end{eqnarray*}で表記します。混合戦略の組\(\left( \sigma _{1},\sigma _{2}\right) \)のもとでそれぞれの純粋戦略の組が実現する確率は以下の通りです。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & \sigma _{1}\sigma _{2} & \sigma _{1}(1-\sigma _{2}) \\ \hline
B & (1-\sigma _{1})\sigma _{2} & (1-\sigma _{1})(1-\sigma _{2}) \\
\hline
\end{array}$$

上の2つの表より、混合戦略の組\(\left( \sigma _{1},\sigma_{2}\right) \)のもとでプレイヤー\(1\)が直面する期待利得は、\begin{align*}F_{2}(\sigma _{1},\sigma _{2})& =4\sigma _{1}\sigma _{2}+0\sigma
_{1}(1-\sigma _{2})+2(1-\sigma _{1})\sigma _{2}+1(1-\sigma _{1})(1-\sigma
_{2}) \\
& =4\sigma _{1}\sigma _{2}+2(1-\sigma _{1})\sigma _{2}+(1-\sigma
_{1})(1-\sigma _{2}) \\
& =3\sigma _{1}\sigma _{2}-\sigma _{1}+\sigma _{2}+1
\end{align*}であるのに対し、プレイヤー\(2\)が直面する期待利得は、\begin{align*}F_{1}(\sigma _{1},\sigma _{2})& =4\sigma _{1}\sigma _{2}+2\sigma
_{1}(1-\sigma _{2})+0(1-\sigma _{1})\sigma _{2}+1(1-\sigma _{1})(1-\sigma
_{2}) \\
& =4\sigma _{1}\sigma _{2}+2\sigma _{1}(1-\sigma _{2})+(1-\sigma
_{1})(1-\sigma _{2}) \\
& =3\sigma _{1}\sigma _{2}+\sigma _{1}-\sigma _{2}+1
\end{align*}です。具体例を挙げると、以下の混合戦略の組\begin{eqnarray*}
\sigma _{1} &=&\left( \sigma _{1}\left( U\right) ,\sigma _{1}\left( B\right)
\right) =\left( \frac{1}{2},\frac{1}{2}\right) \\
\sigma _{2} &=&\left( \sigma _{2}\left( L\right) ,\sigma _{2}\left( R\right)
\right) =\left( \frac{1}{3},\frac{2}{3}\right)
\end{eqnarray*}のもとで両者が直面する期待利得は、\begin{align*}
F_{1}(\sigma _{1},\sigma _{2})& =3\cdot \frac{1}{2}\cdot \frac{1}{3}-\frac{1}{2}+\frac{1}{3}+1=\frac{4}{3} \\
F_{2}(\sigma _{1},\sigma _{2})& =3\cdot \frac{1}{2}\cdot \frac{1}{3}+\frac{1}{2}-\frac{1}{3}+1=\frac{5}{3}
\end{align*}です。

 

戦略型ゲームの混合拡張

完備情報の静学ゲームにおいてそれぞれのプレイヤー\(i\in I\)が純粋戦略\(s_{i}\in S_{i}\)を採用する場合、ゲームのルールはプレイヤーたちが選択する純粋戦略の組\(s_{I}\in S_{I}\)に対して結果を1つずつ定めます。したがって、それぞれのプレイヤー\(i\)は純粋戦略の組どうしを比較する\(S_{I}\)上の選好関係\(\succsim _{i}\)、もしくはそれを表現する効用関数\(u_{i}:S_{I}\rightarrow \mathbb{R} \)を持っているものとみなされます。以上の状況は戦略型ゲーム\begin{equation*}G=\left( I,\left\{ S_{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in
I}\right)
\end{equation*}として表現されます。

一方、プレイヤーたちが混合戦略を採用する場合、どの純粋戦略の組が実際に実現するかを事前に確定することはできないため、プレイヤーたちは不確実な状況に直面します。そこで、そのような状況をクジ\(\sigma _{I}:S_{I}\rightarrow \mathbb{R} \)を用いて表現します。これは、プレイヤーたちが選択する混合戦略の組が\(\sigma _{I}=\left( \sigma_{i}\right) _{i\in I}\)であるときに、それぞれの純粋戦略の組\(s_{I}\in S_{I}\)に対して、それが起こる確率\(\sigma _{I}\left( s_{I}\right) \in \mathbb{R} \)を特定する関数です。

混合戦略の組が与えられればそれに対して1つのクジが定まります。クジが変化すればプレイヤーたちは以前とは異なる不確実な状況に直面するため、プレイヤーたちが混合戦略を採用する場合、それぞれのプレイヤーはクジどうしを比較する上の選好関係を持っているものと考えるべきです。さらに言えば、混合戦略の組が与えられればそれに対して1つのクジが定まるため、結局、プレイヤーがクジを比較する選好を、混合戦略の組どうしを比較する\(\Delta \left( S_{I}\right) \)上の選好関係、もしくはそれを表す期待効用関数\(F_{i}:\Delta \left( S_{I}\right) \rightarrow \mathbb{R} \)として表現できます。ただし、期待効用関数がそれぞれの混合戦略の組\(\sigma _{I}\in \Delta \left(S_{I}\right) \)に対して定める期待利得は、\begin{equation*}F_{i}\left( \sigma _{I}\right) =\sum_{s_{I}\in S_{I}}\left[ \sigma
_{I}\left( s_{I}\right) \cdot u_{i}(s_{I})\right] =\sum_{s_{I}\in S_{I}}\left[ \left( \prod\limits_{j\in I}\sigma _{j}(s_{j})\right) \cdot
u_{i}(s_{I})\right] \end{equation*}となります。

以上を踏まえると、混合戦略を採用するプレイヤーたちが直面する戦略的状況は、\begin{equation*}
G^{\ast }=(I,\{\Delta \left( S_{i}\right) \}_{i\in I},\{F_{i}\}_{i\in I})
\end{equation*}として表現されますが、これを戦略型ゲーム\(G\)の混合拡張(mixed extension)と呼びます。

例(混合拡張)
2人がジャンケンを1回だけ行う状況を戦略型ゲーム\begin{equation*}
G=\left( I,\left\{ S_{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in
I}\right)
\end{equation*}として定式化します。プレイヤー集合は、\begin{equation*}
I=\left\{ 1,2\right\}
\end{equation*}であり、それぞれのプレイヤー\(i\in I\)の行動集合は、\begin{equation*}A_{i}=\left\{ R,P,S\right\}
\end{equation*}です。ただし、\(R\)はグー(Rock)、\(P\)はパー(Paper)、\(S\)はチョキ(Scissors)を表します。それぞれのプレイヤー\(i\)の利得関数\(u_{i}:A_{1}\times A_{2}\rightarrow \mathbb{R} \)としては典型的なものは「自分が勝つ」「あいこ」「相手が勝つ」の順番で好むという条件を満たす関数です。このような状況は、例えば、以下の利得行列として表されます。それぞれのプレイヤー\(i\)の純粋戦略集合は\(S_{i}=A_{i}\)であり、その要素である\(R,P,S\)が純粋戦略です。

$$\begin{array}{cccc}\hline
1\backslash 2 & R & P & S \\ \hline
R & 0,0 & -1,1 & 1,-1 \\ \hline
P & 1,-1 & 0,0 & -1,1 \\ \hline
S & -1,1 & 1,-1 & 0,0 \\ \hline
\end{array}$$

続いて、この戦略型ゲーム\(G\)においてプレイヤーたちが混合戦略を選択する状況を\(G\)の混合拡張\begin{equation*}G^{\ast }=\left( I,\left\{ \Delta \left( S_{i}\right) \right\} _{i\in
I},\left\{ F_{i}\right\} _{i\in I}\right)
\end{equation*}として定式化します。プレイヤー集合\(I\)はそのまま\(G\)から引き継ぎます。それぞれのプレイヤー\(i\in I\)の混合戦略\(\sigma _{i}\)は、\begin{eqnarray*}\sigma _{1} &=&\left( \sigma _{1}\left( R\right) ,\sigma _{1}\left( P\right)
,\sigma _{1}\left( S\right) \right) \in \mathbb{R} ^{3} \\
\sigma _{2} &=&\left( \sigma _{2}\left( R\right) ,\sigma _{2}\left( P\right)
,\sigma _{2}\left( S\right) \right) \in \mathbb{R} ^{3}
\end{eqnarray*}という3次元ベクトルとして表現されます。ただし、このベクトルの任意の成分は\(0\)以上\(1\)以下の実数であり、すべての成分の和は\(1\)です。そのような条件を満たすべての\(\sigma _{i}\)からなる集合がプレイヤー\(i\)の混合戦略集合\(\Delta \left( S_{i}\right) \)です。混合戦略の組\(\left( \sigma _{1},\sigma_{2}\right) \in \Delta \left( S_{I}\right) \)のもとでそれぞれの純粋戦略の組が起こる確率は、

$$\begin{array}{cccc}
\hline
1\backslash 2 & R & P & S \\ \hline
R & \sigma _{1}\left( R\right) \sigma _{2}\left( R\right) & \sigma _{1}\left( R\right) \sigma _{2}\left( P\right) & \sigma _{1}\left( R\right) \sigma _{2}\left( S\right) \\ \hline
P & \sigma _{1}\left( P\right) \sigma _{2}\left( R\right) & \sigma _{1}\left( P\right) \sigma _{2}\left( P\right) & \sigma _{1}\left( P\right) \sigma _{2}\left( S\right) \\ \hline S & \sigma _{1}\left( S\right) \sigma _{2}\left( R\right) & \sigma _{1}\left( S\right) \sigma _{2}\left( P\right) & \sigma _{1}\left( S\right) \sigma _{2}\left( S\right) \\ \hline
\end{array}$$

であるため、プレイヤー\(i\)の期待利得関数\(F_{i}:\Delta \left( S_{I}\right) \rightarrow \mathbb{R} \)がそれぞれの混合戦略の組\(\left( \sigma _{1},\sigma _{2}\right) \in \Delta\left( S_{I}\right) \)に対して定める期待利得は、\begin{eqnarray*}F_{1}\left( \sigma _{1},\sigma _{2}\right) &=&\prod\limits_{\left(
s_{1},s_{2}\right) \in S_{1}\times S_{2}}\sigma _{1}\left( s_{1}\right)
\sigma _{2}\left( s_{2}\right) u_{1}\left( s_{1},s_{2}\right) \\
&=&-\sigma _{1}\left( R\right) \sigma _{2}\left( P\right) +\sigma _{1}\left(
R\right) \sigma _{2}\left( S\right) +\sigma _{1}\left( P\right) \sigma
_{2}\left( R\right) \\
&&-\sigma _{1}\left( P\right) \sigma _{2}\left( S\right) -\sigma _{1}\left(
S\right) \sigma _{2}\left( R\right) +\sigma _{1}\left( S\right) \sigma
_{2}\left( P\right) \\
F_{2}\left( \sigma _{1},\sigma _{2}\right) &=&\prod\limits_{\left(
s_{1},s_{2}\right) \in S_{1}\times S_{2}}\sigma _{1}\left( s_{1}\right)
\sigma _{2}\left( s_{2}\right) u_{2}\left( s_{1},s_{2}\right) \\
&=&\sigma _{1}\left( R\right) \sigma _{2}\left( P\right) -\sigma _{1}\left(
R\right) \sigma _{2}\left( S\right) -\sigma _{1}\left( P\right) \sigma
_{2}\left( R\right) \\
&&+\sigma _{1}\left( P\right) \sigma _{2}\left( S\right) +\sigma _{1}\left(
S\right) \sigma _{2}\left( R\right) -\sigma _{1}\left( S\right) \sigma
_{2}\left( P\right)
\end{eqnarray*}となります。

 

混合拡張における意思決定

戦略型ゲーム\(G\)によって表現される戦略的状況が完備情報の静学ゲームであるとき、\(G\)の要素であるプレイヤー集合\(I\)およびプレイヤーたちの純粋戦略集合\(\left\{ S_{i}\right\} _{i\in I}\)と利得関数\(\left\{ u_{i}\right\} _{i\in I}\)はいずれもプレイヤーたちの共有知識です。したがって、これらの要素を用いて間接的に定義されるプレイヤーたちの混合戦略集合\(\left\{ \Delta \left( S_{i}\right) \right\}_{i\in I}\)と期待効用関数\(\left\{F_{i}\right\} _{i\in I}\)もまたプレイヤーたちの共有知識となります。つまり、完備情報の静学ゲームにおいてプレイヤーたちが混合戦略を採用する場合、その状況を描写する混合拡張\(G^{\ast }\)の要素はいずれもプレイヤーたちの共有知識となります。

また、ゲームの静学性より、戦略型ゲーム\(G\)の混合拡張\(G^{\ast }\)においてプレイヤーたちは以下の手順で意思決定を行います。

  1. それぞれのプレイヤー\(i\)は自身の混合戦略集合\(\Delta \left( S_{i}\right) \)の中から特定の混合戦略\(\sigma _{i}\)を選択する。その際、他のプレイヤーたちが選択する混合戦略の組\(\sigma _{-i}\)を観察できない。
  2. プレイヤーたちが選択した混合戦略の組\(\sigma _{I}=\left( \sigma _{i},\sigma _{-i}\right) \)にもとづいて純粋戦略の組\(s_{I}\)が1つだけランダムに実現し、実現した\(s_{I}\)に対してゲームのルールが1つの結果を定める。
  3. そのゲームの結果から、それぞれのプレイヤー\(i\)は利得\(u_{i}\left(s_{I}\right) \)を得る。

混合拡張\(G^{\ast }\)を構成するすべての要素はプレイヤーたちの共有知識であるものの、それぞれのプレイヤー\(i\)は意思決定を行う際に、他のプレイヤーたちが選択する混合戦略\(\sigma _{-i}\)を観察できません。したがって、それぞれのプレイヤー\(i\)は、それぞれの混合戦略の組\(\sigma _{I}=\left(\sigma _{i},\sigma _{-i}\right) \)において自身が直面する期待利得\(F_{i}\left( \sigma _{I}\right) \)どうし比較した上で、何らかの混合戦略\(\sigma _{i}\)を選びます。さらに、全員の混合戦略が出そろった後、その確率分布にもとづいて特定の純戦略の組\(s_{I}\)が実現し、それぞれのプレイヤー\(i\)は利得\(u_{i}\left(s_{I}\right) \)を得ます。それぞれのプレイヤー\(i\)が意思決定を行う際に参照するのは期待利得\(F_{i}\left( \sigma _{I}\right) \)ですが、ゲームの終了時に実際に得るのは利得\(u_{i}\left(s_{I}\right) \)であることに注意してください。

 

期待効用仮説

混合拡張\(G^{\ast }\)においてそれぞれのプレイヤー\(i\)は自身の混合戦略集合\(\Delta \left( S_{i}\right) \)の中から特定の混合戦略\(\sigma _{i}\)を選択することが想定されています。では、プレイヤーたちはどのような原理にもとづいて意思決定を行うのでしょうか。混合拡張や混合戦略などの概念は、ゲームのルールやプレイヤーに与えられる選択肢を定式化したものであり、プレイヤー耐tの行動原理については何も言っていません。プレイヤーたちの行動原理については、別途、規程する必要があります。

ゲーム理論では、ゲームに参加するプレイヤーはそれぞれ明確な目的を持ち、その目的を達成するために最適な戦略を選択するものと仮定します。この意味においてプレイヤーは合理的(rational)です。さらに、多くの場合、プレイヤーの目的は自己の利得の最大化であるものと仮定します。つまり、ゲームに参加するプレイヤーは自分の利得の最大化をめざすという意味において利己的(selfish)です。なお、合理性と利己性を総称して合理性と呼ぶこともあります。

完備情報の静学ゲームを戦略型ゲーム\(G\)として定式化する場合、それぞれのプレイヤーは自己の利得を最大化するために最適な純粋戦略を選択するものと仮定します。これを合理性の仮定と呼びます。合理性の仮定が満たされるためには、それぞれのプレイヤーは、自分を含めた全員の純粋戦略集合を把握するに十分な情報理解力を持っており、他のプレイヤーたちが選び得る純粋戦略のそれぞれの組に対して自分のそれぞれの純粋戦略が自分にもたらす利得を計算する能力を持っており、その計算にもとづいて自分の利得を最大化するような純粋戦略を選ぶに足る知能を持っていることを仮定する必要があります。

プレイヤーたちが純粋戦略を採用する場合、それぞれのプレイヤーは、他のプレイヤーたちが選択する純粋戦略を事前に観察できないという意味での不確実性に直面します。しかし、ひとたび全員の純粋戦略が定まれば、ゲームのルールはそれに対して1つの結果を確定的に定めます。

一方、同じゲームにおいてプレイヤーたちが混合戦略を採用する場合、それぞれのプレイヤーは二重の意味での不確実性に直面します。1つ目は、他のプレイヤーたちが選択する混合戦略を事前に観察できないという意味での不確実性です。もう1つは、全員の混合戦略が定まった場合でも、混合戦略はランダムな意思決定であるため、その場合に実際に起こる結果は一意的に定まらないという意味での不確実性です。このような二重の意味に直面するそれぞれのプレイヤーは、自身の期待利得を指標に意思決定を行います。

以上を踏まえると、プレイヤーたちが混合戦略を採用する場合の合理性とは、自己の期待利得を最大化するために最適な混合戦略を選択することとして表現されます。これを期待効用仮説(expected utility hypothesis)と呼びます。期待効用仮説が実際に成り立つことを保証するためには、戦略型ゲーム\(G\)とその混合拡張\(G^{\ast }\)に関して、少なくとも以下を要求する必要があります。

  1. それぞれのプレイヤー\(i\in I\)は、自分がプレーしている戦略型ゲーム\(G\)において起こり得るすべての結果を把握している。プレイヤーたちが選択する純粋戦略の組\(s_{I}\in S_{I}\)に対してゲームの結果が1つずつ定まるため、純粋戦略の組を結果と同一視するのであれば、この仮定は、それぞれのプレイヤーが、自分を含めた全員の純戦略集合\(\left\{ S_{i}\right\} _{i\in I}\)を把握するに十分な情報理解力を持っていることを要求する。
  2. それぞれのプレイヤー\(i\in I\)は、ゲームにおいて起こり得るそれぞれの結果\(s_{I}\in S_{I}\)から自身が得る利得\(u_{i}\left(s_{I}\right) \in \mathbb{R} \)を把握するとともに、プレイヤーたちが選択する混合戦略の組\(\sigma _{I}\in \Delta \left( S_{I}\right) \)に対して、その場合にそれぞれの純粋戦略の組\(s_{I}\in S_{I}\)が起こる確率\(\sigma_{I}\left( s_{I}\right) \)や、その場合に自身が直面する期待利得\begin{equation*}F_{i}\left( \sigma _{I}\right) =\sum_{s_{I}\in S_{I}}\left[ \sigma_{I}\left( s_{I}\right) \cdot u_{i}(s_{I})\right] \end{equation*}を計算する能力を持っており、その上で、自身の期待利得を最大化するような混合戦略\(\sigma _{i}\in \Delta \left( S_{i}\right) \)を特定するに十分な知能を持っていることを要求する。

完備情報の静学ゲームを戦略型ゲーム\(G\)やその混合拡張\(G^{\ast }\)として定式化するとき、そのすべての要素はプレイヤーたちの共有知識とみなされます。一方、プレイヤーの合理性は\(C\)や\(G^{\ast }\)の要素ではないため、「プレイヤーたちが合理的である」という事実は、プレイヤーたちの共有知識であるとは限りません。ゲーム理論では多くの場合、プレイヤーの合理性は相互知識であるものと仮定した上で分析を行います。つまり、すべてのプレイヤーが合理的であることをすべてのプレイヤーが知っていることを仮定します。プレイヤーの合理性を共有知識と仮定する場合もあります。つまり、すべてのプレイヤーが合理的であることをすべてのプレイヤーが知っており、なおかつ、その事実をすべてのプレイヤーが知っており、\(\cdots \)、という仮定を無限に積み重ねるということです。後ほど明らかになるように、プレイヤーたちの合理性を共有知識とみなすか、相互知識とみなすか、その仮定の強さによって得られる結論も変わってくるため、注意が必要です。

 

混合戦略均衡

戦略型ゲーム\(G^{\ast }\)の混合拡張\(G^{\ast }\)に直面したそれぞれのプレイヤー\(i\)は、期待効用仮説のもとで、自身が選択可能な混合戦略の集合\(\Delta \left( S_{i}\right) \)の中から自身の期待利得を最大化する混合戦略を選ぶものと仮定します。このような混合戦略を\(\sigma _{i}^{\ast }\)で表し、これをプレイヤー\(i\)の最適戦略(best strategy)と呼びます。

プレイヤーたちが最適戦略を選ぶ目的は自身の期待利得の最大化ですが、最適戦略の具体的な内容は戦略型ゲーム\(G\)や混合拡張\(G^{\ast }\)の要素とは別に外生的に定義する必要があります。つまり、ゲームの分析家は最適戦略の意味をあらかじめ規定した上で、そこで規定された最適戦略の概念のもとでプレイヤーたちが具体的にどのように振る舞い、そこからどのような結果がもたらされるかを分析するということです。したがって、同じゲーム\(G^{\ast }\)を分析対象とする場合でも、異なる最適戦略の概念のもとでは異なる分析結果が得られます。分析家がどのような最適戦略の概念を採用するかは非常に重要な問題です。

混合戦略を許容する場合に最適戦略の意味を定義することとは、それぞれの混合拡張\(G^{\ast }\)に対して、そこでの最適戦略の組\(\sigma _{I}^{\ast }=(\sigma _{i}^{\ast })_{i\in I}\in \Delta \left(S_{I}\right) \)を定める概念を特定することを意味します。そこで、そのような概念を均衡概念(equilibrium concept)や解の概念(solution concept)などと呼びます。また、均衡概念がそれぞれの混合拡張\(G^{\ast }\)に対して定める最適戦略の組\(\sigma _{I}^{\ast }\)を\(G^{\ast }\)の均衡(equilibrium)や混合戦略均衡(mixed strategy equilibrium)などと呼び、均衡\(\sigma_{I}^{\ast }\)を構成するプレイヤー\(i\)の最適戦略\(\sigma_{i}^{\ast }\)を\(i\)の均衡戦略(equilibrium strategy)と呼びます。さらに、混合拡張\(G^{\ast }\)の均衡が\(\sigma _{I}^{\ast }\)であるとき、それぞれの純粋戦略の組\(s_{I}\in S_{I}\)が実現する確率を規定する確率分布が定まり、さらに、それぞれの純粋戦略の組\(s_{I}\)に対してゲームのルールはゲームの結果を定めるため、結局、均衡\(\sigma _{I}^{\ast }\)が与えられるとそれぞれの結果が実現する確率を規定する確率分布が定まります。そのような確率分布が\(G^{\ast }\)の均衡結果に相当します。その上で、均衡結果からプレイヤーたちが得る期待利得の組を\(F^{\ast }=(F_{i}(\sigma _{I}^{\ast}))_{i\in I}\in \mathbb{R} ^{n}\)で表します。

ある均衡概念が外生的に与えられたとき、その均衡概念のもとで、任意の混合拡張\(G^{\ast }\)に対して混合戦略均衡は存在するとは限りません。また、混合戦略均衡が存在する場合にも、それは一意的に定まるとは限りません。したがって、完備情報の静学ゲームが混合拡張として表現されるとき、均衡概念とは、それぞれの混合拡張に対してそこでの混合戦略均衡を定める対応として定式化されます。

 

演習問題

問題(混合戦略)
2人のプレイヤー\(1,2\)がジャンケンを1回だけ行い、敗者は勝者に対して\(1\)万円支払います。あいこの場合には金銭の授受は行われません。

  1. 以上の状況を完備情報の静学ゲームとして定式化してください。ただし、それぞれのプレイヤーの利得は獲得賞金と一致するものとします。
  2. プレイヤー\(1\)はグー・チョキ・パーをそれぞれ\(50\%,25\%,25\%\)の確率で出そうと考えています。これを混合戦略として定式化してください。
  3. プレイヤー\(1\)が上述の混合戦略を採用するとき、プレイヤー\(2\)がグーを出す場合、チョキを出す場合、パーを出す場合のそれぞれについて、プレイヤー\(1\)が直面する利得の期待値を求めてください。
  4. 以上の結果を踏まえた上で、プレイヤー\(1\)が純粋戦略ではなく上述の混合戦略を採用するメリットがあるか考察してください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(混合戦略と期待利得)
2 人のプレイヤー\(1,2\)はそれぞれ\(A\)と\(B\)のどちらか一方の文字を選び、それを相手に見せないようにしながら紙に記します。二人とも書き終わったら、紙を開いて二人が書いた文字を確認します。二人が書いた文字が同じである場合、\(1\)は\(2\)に対して\(1\)万円を支払います。逆に、二人が書いた文字が異なる場合、\(2\)が\(1\)に対して\(1\)万円を支払います。二人とも、このゲームから得られる金額を最大化するものと仮定します。

  1. 以上の状況を戦略型ゲームとして定式化してください。
  2. それぞれのプレイヤーの混合戦略と期待利得を定式化してください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(混合戦略と期待利得)
警察がスピード違反のドライバーを検挙しようとしています。覆面パトカーを出動させれば違反ドライバーを必ず検挙できますが、出動には費用がかかります。一方、警察がスピード違反を放置した場合、警察に寄せられる苦情への対処や、事故が起きた場合の対処など、覆面パトカーの出動費用よりも大きな費用がかかります。ドライバーに関しては、検挙されない限り、スピード違反をした方がより望ましいものとします。ただ、検挙されると多額の罰金が課されるため、その場合にはスピード違反しない方がましです。

  1. 以上の状況を戦略型ゲームとして表現してください。
  2. 警察が「\(\frac{1}{2}\)の確率で覆面パトカーを出動させる」という混合戦略を採用し、ドライバーが「確率\(\frac{2}{3}\)でスピード違反する」という混合戦略を採用するとき、それらの混合戦略の組のもとで両者が直面する期待利得をそれぞれ求めてください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員専用コンテンツです
ログイン】【会員登録