教材一覧
教材検索
STATIC GAME OF COMPLETE INFORMATION

完備情報の静学ゲームにおける混合戦略

目次

Share on twitter
Twitterで共有
Share on email
メールで共有

混合戦略

完備情報の静学ゲーム戦略型ゲーム\(G=\left( I,\{S_{i}\}_{i\in I},\{u_{i}\}_{i\in I}\right) \)として表現したとき、それぞれのプレイヤー\(i\)は自身の純粋戦略集合\(S_{i}\)に含まれる何らかの純粋戦略を確定的に選ぶことが想定されています。その一方で、プレイヤー\(i\)が何らかの確率確率にもとづいて\(S_{i}\)に属する何らかの純粋戦略をランダムに選ぶような戦略を考えることもできます。そのような戦略を混合戦略(mixed strategy)と呼びます。以下では混合戦略の概念を定式化します。

プレイヤー\(i\)が有限\(m\)個の純粋戦略を持っている状況を想定します。つまり、\begin{equation*}
S_{i}=\left\{ s_{i1},s_{i2},\cdots ,s_{im}\right\}
\end{equation*}です。このとき、プレイヤー\(i\)の混合戦略とは、\(S_{i}\)に属するそれぞれの純粋戦略\(s_{ij}\ \left( j=1,\cdots ,m\right) \)に対して、それが選ばれる確率\(\sigma _{i}(s_{ij})\in \mathbb{R}\)を定める確率関数\begin{equation*}
\sigma _{i}:S_{i}\rightarrow \mathbb{R}\end{equation*}として定義されます。ただし、確率関数の定義より、\(\sigma _{i}\)は以下の性質\begin{eqnarray*}
&&\left( a\right) \ \forall j\in \{1,\cdots ,m\}:0\leq \sigma
_{i}(s_{ij})\leq 1 \\
&&\left( b\right) \ \sum\limits_{j=1}^{m}\sigma _{i}(s_{ij})=1
\end{eqnarray*}をともに満たす必要があります。条件\(\left( a\right) \)は、混合戦略\(\sigma _{i}\)のもとで純粋戦略集合\(S_{i}\)に属するそれぞれの純粋戦略\(s_{ij}\)が選ばれる確率が\(0\)以上\(1\)以下であることを意味します。条件\(\left( b\right) \)は、混合戦略\(\sigma _{i}\)のもとで純粋戦略集合\(S_{i}\)に属するそれぞれの純粋戦略が選ばれる確率をすべて足し合わせると\(1\)になることを意味します。

プレイヤー\(i\)の純粋戦略集合が有限\(m\)個の純粋戦略を要素とする集合\(S_{i}=\{s_{i1},\cdots ,s_{im}\}\)である場合、混合戦略\(\sigma _{i}:S_{i}\rightarrow \mathbb{R}\)はそれぞれの純粋戦略\(s_{ij}\in S_{i}\)に対してそれが選ばれる確率に相当する実数\(\sigma _{i}\left( s_{ij}\right) \in \mathbb{R}\)を定めます。したがって、\(\sigma _{i}\)を指定することは、実数を成分とする\(m\)次元ベクトル\begin{equation*}
\sigma _{i}=\left( \sigma _{i}\left( s_{i1}\right) ,\cdots ,\sigma
_{i}\left( s_{im}\right) \right) \in \mathbb{R}^{m}
\end{equation*}を指定することと実質的に同じです。ただし、このベクトルは先の条件\(\left( a\right) ,\left( b\right) \)をともに満たすものでなければなりません。

例(混合戦略)
以下の利得行列で表される完備情報の静学ゲームについて考えます。

$$\begin{array}{cccc}
\hline
1\diagdown 2 & s_{21} & s_{22} & s_{33} \\ \hline
s_{11} & 0,0 & -1,1 & 1,-1 \\ \hline
s_{12} & 1,-1 & 0,0 & -1,1 \\ \hline
s_{13} & -1,1 & 1,-1 & 0,0 \\ \hline
\end{array}$$

表:利得行列

プレイヤー\(1\)の純粋戦略集合は\(S_{1}=\{s_{11},s_{12},s_{13}\}\)であるため、プレイヤー\(1\)の混合戦略とは、\begin{eqnarray*}
&&\left( a\right) \ \forall j\in \{1,2,3\}:\sigma _{1}\left( s_{1j}\right)
\geq 0 \\
&&\left( b\right) \ \sigma _{1}\left( s_{11}\right) +\sigma _{1}\left(
s_{12}\right) +\sigma _{1}\left( s_{13}\right) =1
\end{eqnarray*}を満たす確率関数\(\sigma _{1}:S_{1}\rightarrow \mathbb{R}\)として定義されます。ただし、\(\sigma _{1}\left( s_{1j}\right) \)はプレイヤー\(1\)が混合戦略\(\sigma _{1}\)のもとで純粋戦略\(s_{1j}\)を選ぶ確率です。例えば、混合戦略\begin{equation*}
\sigma _{1}=\left( \sigma _{1}\left( s_{11}\right) ,\sigma _{1}\left(
s_{12}\right) ,\sigma _{1}\left( s_{13}\right) \right) =\left( \frac{1}{3},\frac{1}{3},\frac{1}{3}\right)
\end{equation*}のもとでは、3 つの純戦略は等しい確率で選ばれます。また、混合戦略\begin{equation*}
\sigma _{1}=\left( \sigma _{1}\left( s_{11}\right) ,\sigma _{1}\left(
s_{12}\right) ,\sigma _{1}\left( s_{13}\right) \right) =\left( \frac{1}{2},\frac{1}{2},0\right)
\end{equation*}のもとでは、純戦略\(s_{11},s_{12}\)はそれぞれ確率\(\frac{1}{2}\)で選ばれますが、純戦略\(s_{13}\)が選ばれることはありません。また、混合戦略\begin{equation*}
\sigma _{1}=\left( \sigma _{1}\left( s_{11}\right) ,\sigma _{1}\left(
s_{12}\right) ,\sigma _{1}\left( s_{13}\right) \right) =\left( 1,0,0\right)
\end{equation*}のもとでは、純戦略\(s_{11}\)が確率\(1\)で選ばれるため、これは純戦略\(s_{11}\)と実質的に同じです。また、例えば、\begin{equation*}
\left( \sigma _{1}\left( s_{11}\right) ,\sigma _{1}\left( s_{12}\right)
,\sigma _{1}\left( s_{13}\right) \right) =\left( \frac{1}{3},\frac{1}{3},0\right)
\end{equation*}を満たす\(\sigma _{1}\)は条件\(\left( b\right) \)を満たしていないため、これは混合戦略ではありません。プレイヤー\(2\)の混合戦略についても同様に考えます。

例(混合戦略)
以下の利得行列で表される完備情報の静学ゲームについて考えます。

$$\begin{array}{ccc}
\hline
1\diagdown 2 & A & B \\ \hline
A & 5,5 & 0,8 \\ \hline
B & 8,0 & 2,2 \\ \hline
\end{array}$$

表:利得行列

プレイヤー\(i\ (=1,2)\)の純粋戦略集合はともに\(S_{i}=\{A,B\}\)であるため、混合戦略は、\begin{eqnarray*}
(a) &&0\leq \sigma _{i}(A)\leq 1 \\
\left( b\right) &&0\leq \sigma _{i}(B)\leq 1 \\
\left( c\right) &&\sigma _{i}(A)+\sigma _{i}(B)=1
\end{eqnarray*}を満たす確率関数\(\sigma _{i}:S_{i}\rightarrow \mathbb{R}\)として定式化されます。ただし、\(S_{i}\)の中には2つの純粋戦略\(A,B\)だけが属するため、\(\sigma _{i}\)のもとで\(A\)が選ばれる確率\(\sigma _{i}\left( A\right) \)さえ特定すれば、\(\sigma _{i}\)のもとで\(B\)が選ばれる確率は\(\sigma _{i}\left( B\right) =1-\sigma _{i}\left( A\right) \)として間接的に与えられます。したがって、このゲームにおけるプレイヤー\(i\)の混合戦略を表現するためには、プレイヤー\(i\)が純粋戦略\(A\)を選ぶ確率だけを指定すれば十分です。具体例を挙げると、プレイヤー\(i\)が\(A\)と\(B\)を同じ確率で選択するという混合戦略を、\begin{equation*}
\sigma _{i}=\left( \sigma _{i}\left( A\right) ,\sigma _{i}\left( B\right)
\right) =\left( \frac{1}{2},\frac{1}{2}\right)
\end{equation*}と表現する代わりに、\begin{equation*}
\sigma _{i}=\sigma _{i}\left( A\right) =\frac{1}{2}
\end{equation*}と表現しても一般性は失われないということです。

すべてのプレイヤーたちの混合戦略の組を\(\sigma _{I}=(\sigma _{i})_{i\in I}\)で表し、プレイヤー\(i\)以外のプレイヤーたちの混合戦略の組を\(\sigma _{-i}=(\sigma _{j})_{j\in I\backslash \left\{ i\right\} }\)で表します。\(\sigma _{I}=(\sigma _{i},\sigma _{-i})\)です。

先の最初の例が示唆するように、プレイヤー\(i\)の純粋戦略\(s_{i}\)は、\(s_{i}\)に確率\(1\)を付与し、\(S_{i}\)に属する\(s_{i}\)以外のすべての純粋戦略に対して確率\(0\)を付与する混合戦略と実質的に同じです。したがって、純粋戦略は特別な混合戦略であり、逆に、純粋戦略を一般化した概念が混合戦略です。

ところで、プレイヤーは純粋戦略ではなく混合戦略という複雑な意思決定を実際に行うのでしょうか。純粋戦略ではなく混合戦略を採用することはプレイヤーに何らかのメリットをもたらすのでしょうか。混合戦略という概念の正当性については場を改めて議論します。

 

混合戦略集合

完備情報の静学ゲームを戦略型ゲーム\(G=\left( I,\{S_{i}\}_{i\in I},\{u_{i}\}_{i\in I}\right) \)として表現したとき、有限\(m\)個の純粋戦略を含む純粋戦略集合\(S_{i}=\{s_{i1},\cdots ,s_{im}\}\)を持つプレイヤー\(i\)が選択可能なすべての混合戦略\(\sigma _{i}:S_{i}\rightarrow \mathbb{R}\)からなる集合は、\begin{equation*}
\Delta \left( S_{i}\right) =\left\{ \left( \sigma _{i}\left( s_{i1}\right)
,\cdots ,\sigma _{i}\left( s_{i1}\right) \right) \in \mathbb{R}^{m}\ \left\vert \ \sum\limits_{j=1}^{m}\sigma _{i}\left( s_{ij}\right) =1,\
\forall j\in \{1,\cdots ,m\}:0\leq \sigma _{i}\left( s_{ij}\right) \leq
1\right. \right\}
\end{equation*}と定式化されますが、これを純粋戦略集合\(S_{i}\)の混合拡張(mixed extension of \(S_{i}\))や混合戦略集合(mixed strategy set)などと呼びます。つまり、純粋戦略集合\(S_{i}\)の混合拡張\(\Delta \left( S_{i}\right) \)とは\(S_{i}\)上の確率関数をすべて集めてできる集合のことです。\(\sigma _{i}\in \Delta \left( S_{i}\right) \)です。

すべてのプレイヤーの戦略集合の混合拡張の直積を\(\Delta \left( S_{I}\right) =\prod_{i\in I}\Delta \left( S_{i}\right) \)で表します。また、\(\Delta \left( S_{-i}\right) =\prod_{j\in I\backslash \left\{ i\right\} }\Delta \left( S_{j}\right) \)とします。\(\sigma _{I}\in \Delta \left( S_{I}\right) \)かつ\(\sigma _{-i}\in \Delta \left( S_{-i}\right) \)です。

一般に、集合上に定義される確率関数は無限通り存在するため、たとえ純粋戦略集合\(S_{i}\)が有限集合である場合でも、その混合拡張\(\Delta \left( S_{i}\right) \)は無限集合になります。混合戦略を選択するプレイヤーは無限個の選択肢に直面するということです。

例(混合戦略集合)
プレイヤー\(i\)が2個の純粋戦略を持つ場合、すなわち純粋戦略集合が\(S_{i}=\{s_{i1},s_{i2}\}\)である場合の混合戦略集合\(\Delta \left( S_{i}\right) \)は、\begin{eqnarray*}
&&\left( a\right) \ 0\leq \sigma _{i}\left( s_{i1}\right) \leq 1 \\
&&\left( b\right) \ 0\leq \sigma _{i}\left( s_{i2}\right) \leq 1 \\
&&\left( c\right) \ \sigma _{i}\left( s_{i1}\right) +\sigma _{i}\left(
s_{i2}\right) =1
\end{eqnarray*}を満たす2次元ベクトル\begin{equation*}
\left( \sigma _{i}\left( s_{i1}\right) ,\sigma _{i}\left( s_{i2}\right)
\right) \in \mathbb{R}^{2}
\end{equation*}からなる集合です。これは下図において実線で描かれた線分として表現されます。ただし、端点を含みます。言い換えると、この線分上にある点はそれぞれ異なる混合戦略に対応しています。一般に、このような\(\mathbb{R} ^{2}\)の部分集合を\(\mathbf{1}\)次元の基本単体(standard \(1\) simplex)と呼びます。2つの純粋戦略を持つプレイヤーの混合戦略集合は1次元の基本単体であるということです。

図:1次元の基本単体
図:1次元の基本単体
例(混合戦略集合)
プレイヤー\(i\)が3個の純粋戦略を持つ場合、すなわち純粋戦略集合が\(S_{i}=\{s_{i1},s_{i2},s_{i3}\}\)である場合の混合戦略集合\(\Delta \left( S_{i}\right) \)は、\begin{eqnarray*}
&&\left( a\right) \ 0\leq \sigma _{i}\left( s_{i1}\right) \leq 1 \\
&&\left( b\right) \ 0\leq \sigma _{i}\left( s_{i2}\right) \leq 1 \\
&&\left( c\right) \ 0\leq \sigma _{i}\left( s_{i3}\right) \leq 1 \\
&&\left( c\right) \ \sigma _{i}\left( s_{i1}\right) +\sigma _{i}\left(
s_{i2}\right) +\sigma _{i}\left( s_{i3}\right) =1
\end{eqnarray*}を満たす3次元ベクトル\begin{equation*}
\left( \sigma _{i}\left( s_{i1}\right) ,\sigma _{i}\left( s_{i2}\right)
,\sigma _{i}\left( s_{i3}\right) \right) \in \mathbb{R}^{3}
\end{equation*}からなる集合です。これは下図においてグレーで描かれた領域として表現されます。ただし、境界を含みます。言い換えると、この領域上にある点はそれぞれ異なる混合戦略に対応しています。一般に、このような\(\mathbb{R} ^{3}\)の部分集合を\(\mathbf{2}\)次元の基本単体(standard \(2\) simplex)と呼びます。3つの純粋戦略を持つプレイヤーの混合戦略集合は2次元の基本単体であるということです。

図:2次元の基本単体
図:2次元の基本単体

 

無限個の純粋戦略が存在する場合の混合戦略

これまではプレイヤーが有限個の純粋戦略を持つ場合について考えてきましたが、プレイヤーが無限個の純粋戦略を持つ場合、混合戦略をどのように定義すればよいでしょうか。純粋戦略集合が有限集合である場合、混合戦略は純戦略集合を標本空間とする確率関数として定義しました。純粋戦略集合が無限集合である場合も同様です。

プレイヤー\(i\)の純粋戦略集合\(S_{i}\)が可算集合である場合、すなわち、\begin{equation*}
S_{i}=\{s_{i1},s_{i2},\cdots \}
\end{equation*}である場合について考えます。このとき、\(S_{i}\)上の確率関数、すなわちプレイヤー\(i\)の混合集合とは、\(S_{i}\)のベキ集合\(\mathcal{F}_{i}=2^{S_{i}}\)上に定義された集合関数\(\sigma _{i}:\mathcal{F}_{i}\rightarrow \mathbb{R}\)として定義されます。ただしこれは、\begin{eqnarray*}
&&\left( a\right) \ \forall j\in \mathbb{N} :\sigma _{i}(\{s_{ij}\})\geq 0 \\
&&\left( b\right) \ \sum\limits_{j=1}^{\infty }\sigma _{i}(\{s_{ij}\})=1 \\
&&\left( c\right) \ \forall A\in \mathcal{F}_{i}:P\left( A\right)
=\sum\limits_{s_{ij}\in A}P\left( \{s_{ij}\}\right)
\end{eqnarray*}を満たすものでなければなりません。

プレイヤー\(i\)の純粋戦略集合\(S_{i}\)が非可算集合である場合、\(S_{i}\)上の確率関数、すなわちプレイヤー\(i\)の混合集合とは、\(S_{i}\)の部分集合族\(\mathcal{F}_{i}\subset 2^{S_{i}}\)上に定義された集合関数\(\sigma _{i}:\mathcal{F}_{i}\rightarrow \mathbb{R}\)として定義されます。ただし、\(\mathcal{F}_{i}\)は\(\sigma \)-代数としての以下の性質\begin{eqnarray*}
&&\left( a\right) \ \phi \in \mathcal{F}_{i} \\
&&\left( b\right) \ \forall A\in \mathcal{F}_{i}:A^{c}\in \mathcal{F}_{i} \\
&&\left( c\right) \ \forall A_{1},A_{2},\cdots \in \mathcal{F}_{i}:\bigcup\limits_{j=1}^{\infty }A_{j}\in \mathcal{F}_{i}
\end{eqnarray*}を満たすとともに、\(\sigma _{i}\)は\(\sigma \)-加法測度としての以下の性質\begin{eqnarray*}
&&\left( a\right) \ \forall A\in \mathcal{F}_{i}:P\left( A\right) \geq 0 \\
&&\left( b\right) \ \forall \text{排反な}A_{1},A_{2},\cdots \in \mathcal{F}_{i}:P\left( \bigcup\limits_{j=1}^{\infty
}A_{j}\right) =\sum\limits_{j=1}^{\infty }P\left( A_{j}\right)
\end{eqnarray*}を満たすものでなければなりません。

 

演習問題

問題(混合戦略)
2人のプレイヤー\(1,2\)がジャンケンを1回だけ行い、敗者は勝者に対して\(1\)万円支払います。あいこの場合には金銭の授受は行われません。

  1. 以上の状況を完備情報の静学ゲームとして定式化してください。ただし、それぞれのプレイヤーの利得は獲得賞金と一致するものとします。
  2. プレイヤー\(1\)はグー・チョキ・パーをそれぞれ\(50\%,25\%,25\%\)の確率で出そうと考えています。これを混合戦略として定式化してください。
  3. プレイヤー\(1\)が上述の混合戦略を採用するとき、プレイヤー\(2\)がグーを出す場合、チョキを出す場合、パーを出す場合のそれぞれについて、プレイヤー\(1\)が直面する利得の期待値を求めてください。
  4. 以上の結果を踏まえた上で、プレイヤー\(1\)が純粋戦略ではなく上述の混合戦略を採用するメリットがあるかどうか考察してください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

次回は期待利得について解説します。

Share on twitter
Twitterで共有
Share on email
メールで共有
RELATED KNOWLEDGE

関連知識

確率質量関数

確率関数(確率質量関数)

離散型の確率変数が与えられたとき、それぞれの実数に対して、確率変数がその実数を値としてとる確率を特定する関数を確率関数や確率質量関数などと呼びます。

期待利得

完備情報の静学ゲームにおける期待利得

完備情報の静学ゲームにおいてプレイヤーたちが混合戦略を選択する場合には、プレイヤーはクジと呼ばれる不確実な状況どうしを比較することになります。この場合、プレイヤーの評価体系はクジどうしを比較する選好関係として定式化されますが、さらにこの選好関係に対応する関数を期待利得関数と呼びます。

混合戦略

戦略型ゲームの混合拡張

完備情報の静学ゲームにおいてプレイヤーたちが純戦略を選択する状況は戦略型ゲームとして表現できます。一方、プレイヤーたちが混合戦略を選択する状況は戦略型ゲームを拡張した混合拡張と呼ばれる概念として表現できます。

期待効用仮説

期待効用仮説

完備情報の静学ゲームを表現する戦略型ゲームの混合拡張に直面したそれぞれのプレイヤーは、期待効用仮説にもとづいて混合戦略集合の中から自身の期待利得を最大化する混合戦略を選びます。

有限集合

有限型確率空間

標本空間が有限集合であるとき、その任意の部分集合を事象として考察対象に含めることができます。その上で、標本空間のベキ集合上に集合関数を定義した上で、それが確率論の公理と呼ばれる性質を満たすものと定めます。こうして得られる概念を有限確率空間と呼びます。

可算集合

可算型確率空間

標本空間が可算集合であるとき、その任意の部分集合を事象として考察対象に含めることができます。その上で、標本空間のベキ集合上に集合関数を定義した上で、それが確率論の公理と呼ばれる性質を満たすものと定めます。こうして得られる概念を可算確率空間と呼びます。

確率空間

確率空間

標本空間が非可算集合であるとき、その任意の部分集合を事象として考察対象に含めると問題が生じます。そこで、σ-代数と呼ばれる集合系を事象空間として採用し、その上に確率論の公理を満たす集合関数を定義します。

ベルヌーイ分布

ベルヌーイ分布

ある確率変数が1と0の二つの値のみをとり得るとともに、1を値としてとる確率がpで、0を値としてとる確率が1-pである場合には、その確率変数はパラメーターpのベルヌーイ分布にしたがうと言います。

条件付き確率

条件付き確率

試行によって事象 A が起きているか否かは観察できないものの、何らかの事情により、別の事象 B が起きているか否かは観察可能である場合(もしくは、事象 B が起きているものと仮定する場合)には、事象 A が起こる確率を条件付き確率という概念のもとで評価することができます。

DISCUSSION

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録

完備情報の静学ゲーム