プレイヤー\(i\)がある確率分布にもとづいて純戦略集合\(S_{i}\)に属する行動の中から行動を選ぶような戦略を考えることもできます。このような戦略を混合戦略と呼びます。
次のページ >

混合戦略

完備情報の静学ゲームを戦略型ゲーム\(G=\left( I,\{S_{i}\}_{i\in I},\{u_{i}\}_{i\in I}\right) \)として表現したとき、それぞれのプレイヤー\(i\in I\)は自身の純粋戦略集合\(S_{i}\)に含まれる何らかの純粋戦略を確定的に選ぶことが想定されています。その一方で、プレイヤー\(i\)が何らかの確率分布にもとづいて、\(S_{i}\)に属する何らかの純粋戦略をランダムに選ぶような戦略を考えることもできます。そのような戦略を混合戦略(mixed strategy)と呼びます。以下では混合戦略の概念を定式化します。

プレイヤー\(i\)が有限\(m\)個の純粋戦略を持っている状況を想定します。つまり、\(S_{i}=\{s_{i1},s_{i2},\cdots ,s_{im}\}\)です。このとき、プレイヤー\(i\)の混合戦略とは、\(S_{i}\)に属するそれぞれの純粋戦略\(s_{ij}\ \left( j=1,\cdots ,m\right) \)に対して、それが選ばれる確率\(\sigma _{i}(s_{ij})\)を定める確率関数\(\sigma _{i}:S_{i}\rightarrow \mathbb{R}\)として定義されます。ただし、確率関数の定義より、\(\sigma _{i}\)は以下の性質を満たします。\begin{eqnarray*}
&&\left( a\right) \ \forall j\in \{1,\cdots ,m\}:0\leq \sigma
_{i}(s_{ij})\leq 1 \\
&&\left( b\right) \ \sum\limits_{j=1}^{m}\sigma _{i}(s_{ij})=1
\end{eqnarray*}

条件\(\left( a\right) \)は、混合戦略\(\sigma _{i}\)のもとで純粋戦略集合\(S_{i}\)に属するそれぞれの純粋戦略\(s_{ij}\)が選ばれる確率は\(0\)以上\(1\)以下であることを意味します。条件\(\left( b\right) \)は、混合戦略\(\sigma _{i}\)のもとで純粋戦略集合\(S_{i}\)に属するそれぞれの純粋戦略が選ばれる確率をすべて足すと\(1\)になることを意味します。

プレイヤー\(i\)が有限\(m\)個の純粋戦略集合\(S_{i}=\{s_{i1},\cdots ,s_{im}\}\)を持つとき、混合戦略\(\sigma _{i}:S_{i}\rightarrow \mathbb{R}\)はそれぞれの純粋戦略\(s_{ij}\in S_{i}\)に対して、それが選ばれる確率に相当する実数\(\sigma _{i}\left( s_{ij}\right) \in \mathbb{R}\)を定めます。したがって、\(\sigma _{i}\)を指定することは、実数を成分とする\(m\)次元ベクトル\begin{equation*}
\sigma _{i}=(\sigma _{i}\left( s_{i1}\right) ,\cdots \sigma _{i}\left(
s_{im}\right) )\in \mathbb{R} ^{m}
\end{equation*}を指定することを意味します。ただし、このベクトルは先の条件\(\left( a\right) ,\left( b\right) \)を満たすものでなければなりません。

例(混合戦略)
以下の利得行列で表される完備情報の静学ゲームについて考えます。
$$\begin{array}{cccc}
\hline
1\diagdown 2 & s_{21} & s_{22} & s_{33} \\ \hline
s_{11} & 0,0 & -1,1 & 1,-1 \\ \hline
s_{12} & 1,-1 & 0,0 & -1,1 \\ \hline
s_{13} & -1,1 & 1,-1 & 0,0 \\ \hline
\end{array}$$
表:利得行列

プレイヤー\(1\)の純粋戦略集合は\(S_{1}=\{s_{11},s_{12},s_{13}\}\)であるため、プレイヤー\(1\)の混合戦略とは、\begin{eqnarray*}
&&\left( a\right) \ \forall j\in \{1,2,3\}:\sigma _{1}\left( s_{1j}\right)
\geq 0 \\
&&\left( b\right) \ \sigma _{1}\left( s_{11}\right) +\sigma _{1}\left(
s_{12}\right) +\sigma _{1}\left( s_{13}\right) =1
\end{eqnarray*}を満たす確率関数\(\sigma _{1}:S_{1}\rightarrow \mathbb{R}\)として定義されます。ただし、\(\sigma _{1}\left( s_{1j}\right) \)はプレイヤー\(1\)が混合戦略\(\sigma _{1}\)のもとで純粋戦略\(s_{1j}\)を選ぶ確率です。例えば、混合戦略\begin{equation*}
\sigma _{1}=\left( \sigma _{1}\left( s_{11}\right) ,\sigma _{1}\left(
s_{12}\right) ,\sigma _{1}\left( s_{13}\right) \right) =\left( \frac{1}{3},\frac{1}{3},\frac{1}{3}\right)
\end{equation*}のもとでは、3 つの純戦略は等しい確率で選ばれます。また、混合戦略\begin{equation*}
\sigma _{1}=\left( \sigma _{1}\left( s_{11}\right) ,\sigma _{1}\left(
s_{12}\right) ,\sigma _{1}\left( s_{13}\right) \right) =\left( \frac{1}{2},\frac{1}{2},0\right)
\end{equation*}のもとでは、純戦略\(s_{11},s_{12}\)はそれぞれ確率\(\frac{1}{2}\)で選ばれますが、純戦略\(s_{13}\)が選ばれることはありません。また、混合戦略\begin{equation*}
\sigma _{1}=\left( \sigma _{1}\left( s_{11}\right) ,\sigma _{1}\left(
s_{12}\right) ,\sigma _{1}\left( s_{13}\right) \right) =\left( 1,0,0\right)
\end{equation*}のもとでは、純戦略\(s_{11}\)が確率\(1\)で選ばれるため、これは純戦略\(s_{11}\)と実質的に同じです。また、例えば、\begin{equation*}
\left( \sigma _{1}\left( s_{11}\right) ,\sigma _{1}\left( s_{12}\right)
,\sigma _{1}\left( s_{13}\right) \right) =\left( \frac{1}{3},\frac{1}{3},0\right)
\end{equation*}を満たす\(\sigma _{1}\)は条件\(\left( b\right) \)を満たしていないため、これは混合戦略ではありません。プレイヤー\(2\)の混合戦略についても同様に考えます。

例(混合戦略)
以下の利得行列で表される完備情報の静学ゲームについて考えます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & A & B \\ \hline
A & 5,5 & 0,8 \\ \hline
B & 8,0 & 2,2 \\ \hline
\end{array}$$
表:利得行列

プレイヤー\(i\ (=1,2)\)の純粋戦略集合はともに\(S_{i}=\{A,B\}\)ですから、その混合戦略は、\begin{eqnarray*}
(a) &&0\leq \sigma _{i}(A)\leq 1 \\
\left( b\right) &&0\leq \sigma _{i}(B)\leq 1 \\
\left( c\right) &&\sigma _{i}(A)+\sigma _{i}(B)=1
\end{eqnarray*}を満たす確率分布\(\sigma _{i}:S_{i}\rightarrow \mathbb{R}\)として定式化されます。ただし、\(S_{i}\)の中には 2 つの純粋戦略\(A,B\)だけが属するため、\(\sigma _{i}\)のもとで\(A\)が選ばれる確率\(\sigma _{i}\left( A\right) \)さえ特定すれば、\(\sigma _{i}\)のもとで\(B\)が選ばれる確率は\(\sigma _{i}\left( B\right) =1-\sigma _{i}\left( A\right) \)として間接的に与えられます。したがって、このゲームにおけるプレイヤー\(i\)の混合戦略を表現するためには、プレイヤー\(i\)が純粋戦略\(A\)を選ぶ確率だけを指定すれば十分です。具体例を挙げると、プレイヤー\(i\)が\(A\)と\(B\)を同じ確率で選択するという混合戦略を、\begin{equation*}
\sigma _{i}=\left( \sigma _{i}\left( A\right) ,\sigma _{i}\left( B\right)
\right) =\left( \frac{1}{2},\frac{1}{2}\right)
\end{equation*}と表現する代わりに、\begin{equation*}
\sigma _{i}=\sigma _{i}\left( A\right) =\frac{1}{2}
\end{equation*}と表現しても一般性は失われないということです。

すべてのプレイヤーたちの混合戦略の組を\(\sigma _{I}=(\sigma _{i})_{i\in I}\)で表し、プレイヤー\(i\)以外のプレイヤーたちの混合戦略の組を\(\sigma _{-i}=(\sigma _{j})_{j\in I\backslash \left\{ i\right\} }\)で表します。\(\sigma _{I}=(\sigma _{i},\sigma _{-i})\)です。

先の最初の例が示唆するように、プレイヤー\(i\)の純粋戦略\(s_{i}\)は、\(s_{i}\)に確率\(1\)を付与し、\(S_{i}\)に属する\(s_{i}\)以外のすべての純粋戦略に対して確率\(0\)を付与する混合戦略と実質的に同じです。したがって、純粋戦略は特別な混合戦略であり、逆に、純粋戦略を一般化した概念が混合戦略です。

ところで、プレイヤーは純粋戦略ではなく混合戦略という複雑な意思決定を実際に行うのでしょうか。純粋戦略ではなく混合戦略を採用することは、プレイヤーに何らかのメリットをもたらすのでしょうか。混合戦略という概念の正当性については場を改めて議論します。

 

混合戦略集合

完備情報の静学ゲームを戦略型ゲーム\(G=\left( I,\{S_{i}\}_{i\in I},\{u_{i}\}_{i\in I}\right) \)として表現したとき、有限\(m\)個の純粋戦略を含む純粋戦略集合\(S_{i}=\{s_{i1},\cdots ,s_{im}\}\)を持つプレイヤー\(i\)が選択可能なすべての混合戦略\(\sigma _{i}:S_{i}\rightarrow \mathbb{R}\)からなる集合は、\begin{equation*}
\Delta \left( S_{i}\right) =\left\{ \left( \sigma _{i}\left( s_{i1}\right)
,\cdots ,\sigma _{i}\left( s_{i1}\right) \right) \in \mathbb{R} ^{m}\ \left\vert \ \sum\limits_{j=1}^{m}\sigma _{i}\left( s_{ij}\right) =1,\
\forall j\in \{1,\cdots ,m\}:0\leq \sigma _{i}\left( s_{ij}\right) \leq
1\right. \right\}
\end{equation*}と定式化されますが、これを純粋戦略集合\(S_{i}\)の混合拡張(mixed extension of \(S_{i}\))や混合戦略集合(mixed strategy set)などと呼びます。つまり、純粋戦略集合\(S_{i}\)の混合拡張\(\Delta \left( S_{i}\right) \)とは、\(S_{i}\)上の確率分布をすべて集めてできる集合のことです。\(\sigma _{i}\in \Delta \left( S_{i}\right) \)です。

すべてのプレイヤーの戦略集合の混合拡張の直積を\(\Delta \left( S_{I}\right) =\prod_{i\in I}\Delta \left( S_{i}\right) \)で表します。また、\(\Delta \left( S_{-i}\right) =\prod_{j\in I\backslash \left\{ i\right\} }\Delta \left( S_{j}\right) \)とします。\(\sigma _{I}\in \Delta \left( S_{I}\right) \)かつ\(\sigma _{-i}\in \Delta \left( S_{-i}\right) \)です。

一般に、集合上に定義される確率分布は無限通り存在するため、たとえ純粋戦略集合\(S_{i}\)が有限集合である場合でも、その混合拡張\(\Delta \left( S_{i}\right) \)は無限集合になります。したがって、プレイヤーが混合戦略を選択する場合には、無限個の選択肢に直面することになります。

例(混合戦略集合)
プレイヤー\(i\)が 2 個の純粋戦略を持つ場合、すなわち純粋戦略集合が\(S_{i}=\{s_{i1},s_{i2}\}\)である場合の混合戦略集合\(\Delta \left( S_{i}\right) \)は、\begin{eqnarray*}
&&\left( a\right) \ 0\leq \sigma _{i}\left( s_{i1}\right) \leq 1 \\
&&\left( b\right) \ 0\leq \sigma _{i}\left( s_{i2}\right) \leq 1 \\
&&\left( c\right) \ \sigma _{i}\left( s_{i1}\right) +\sigma _{i}\left(
s_{i2}\right) =1
\end{eqnarray*}を満たす2次元ベクトル\(\left( \sigma _{i}\left( s_{i1}\right) ,\sigma _{i}\left( s_{i2}\right) \right) \in \mathbb{R} ^{2}\)からなる集合です。これは下図において実線で描かれた線分として表現されます。ただし、端点を含みます。言い換えると、この線分上にある点はそれぞれ異なる混合戦略に対応しています。一般に、このような\(\mathbb{R} ^{2}\)の部分集合を\(\mathbf{1}\)次元の基本単体(standard \(1\) simplex)と呼びます。2 つの純粋戦略を持つプレイヤーの混合戦略集合は 1 次元の基本単体です。
図:1次元の基本単体
図:1次元の基本単体
例(混合戦略集合)
プレイヤー\(i\)が 3 個の純粋戦略を持つ場合、すなわち純粋戦略集合が\(S_{i}=\{s_{i1},s_{i2},s_{i3}\}\)である場合の混合戦略集合\(\Delta \left( S_{i}\right) \)は、\begin{eqnarray*}
&&\left( a\right) \ 0\leq \sigma _{i}\left( s_{i1}\right) \leq 1 \\
&&\left( b\right) \ 0\leq \sigma _{i}\left( s_{i2}\right) \leq 1 \\
&&\left( c\right) \ 0\leq \sigma _{i}\left( s_{i3}\right) \leq 1 \\
&&\left( c\right) \ \sigma _{i}\left( s_{i1}\right) +\sigma _{i}\left(
s_{i2}\right) +\sigma _{i}\left( s_{i3}\right) =1
\end{eqnarray*}を満たす3次元ベクトル\(\left( \sigma _{i}\left( s_{i1}\right) ,\sigma _{i}\left( s_{i2}\right) ,\sigma _{i}\left( s_{i3}\right) \right) \in \mathbb{R} ^{3}\)からなる集合です。これは下図においてグレーで描かれた領域として表現されます。ただし、境界を含みます。言い換えると、この領域上にある点はそれぞれ異なる混合戦略に対応しています。一般に、このような\(\mathbb{R} ^{3}\)の部分集合を\(\mathbf{2}\)次元の基本単体(standard \(2\) simplex)と呼びます。3 つの純粋戦略を持つプレイヤーの混合戦略集合は 2 次元の基本単体です。
図:2次元の基本単体
図:2次元の基本単体

 

純粋戦略の個数が無限個の場合の混合戦略

これまではプレイヤーが有限個の純粋戦略を持つ場合について考えてきましたが、仮にプレイヤーが無限個の純粋戦略を持つ場合、混合戦略をどのように定義すればよいでしょうか。純粋戦略集合が有限集合である場合、混合戦略は純戦略集合を標本空間とする確率関数として定義しました。純粋戦略集合が無限集合である場合にも同様に考えます。

まず、プレイヤー\(i\)の純粋戦略集合\(S_{i}\)が可算集合である場合、すなわち、\(S_{i}=\{s_{i1},s_{i2},\cdots \}\)である場合について考えます。このとき、\(S_{i}\)上の確率関数、すなわちプレイヤー\(i\)の混合集合とは、\(S_{i}\)のベキ集合\(\mathcal{F}_{i}=2^{S_{i}}\)上に定義された集合関数\(\sigma _{i}:\mathcal{F}_{i}\rightarrow \mathbb{R}\)として定義されます。ただしこれは、\begin{eqnarray*}
&&\left( a\right) \ \forall j\in \mathbb{N} :\sigma _{i}(\{s_{ij}\})\geq 0 \\
&&\left( b\right) \ \sum\limits_{j=1}^{\infty }\sigma _{i}(\{s_{ij}\})=1 \\
&&\left( c\right) \ \forall A\in \mathcal{F}_{i}:P\left( A\right)
=\sum\limits_{s_{ij}\in A}P\left( \{s_{ij}\}\right)
\end{eqnarray*}を満たすものでなければなりません。

可算な標本空間上の確率空間について学ぶ

続いて、プレイヤー\(i\)の純粋戦略集合\(S_{i}\)が非可算集合である場合について考えます。このとき、\(S_{i}\)上の確率関数、すなわちプレイヤー\(i\)の混合集合とは、\(S_{i}\)の部分集合族\(\mathcal{F}_{i}\subset 2^{S_{i}}\)上に定義された集合関数\(\sigma _{i}:\mathcal{F}_{i}\rightarrow \mathbb{R}\)として定義されます。ただし、\(\mathcal{F}_{i}\)は\(\sigma \)-代数としての以下の性質\begin{eqnarray*}
&&\left( a\right) \ \mathcal{F}_{i}\not=\phi \\
&&\left( b\right) \ \forall A\in \mathcal{F}_{i}:A^{c}\in \mathcal{F}_{i} \\
&&\left( c\right) \ \forall A_{1},A_{2},\cdots \in \mathcal{F}_{i}:\bigcup\limits_{i=1}^{\infty }A_{i}\in \mathcal{F}_{i}
\end{eqnarray*}を満たすものとし、\(\sigma _{i}\)は\(\sigma \)-加法測度としての以下の性質\begin{eqnarray*}
&&\left( a\right) \ \forall A\in \mathcal{F}_{i}:P\left( A\right) \geq 0 \\
&&\left( b\right) \ \forall \text{排反な}A_{1},A_{2},\cdots \in \mathcal{F}_{i}:P\left( \bigcup\limits_{j=1}^{\infty
}A_{i}\right) =\sum\limits_{j=1}^{\infty }P\left( A_{i}\right) \\
&&\left( c\right) \ \forall A_{1},A_{2},\cdots \in \mathcal{F}_{i}:\bigcup\limits_{i=1}^{\infty }A_{i}\in \mathcal{F}_{i}
\end{eqnarray*}を満たすものでなければなりません。

非可算な標本空間上の確率空間について学ぶ

次回は期待利得について解説します。
次へ進む 質問・コメント(プレミアム会員限定) 演習問題(プレミアム会員限定)

Share on facebook
Share on twitter
Share on email
次のページ >

プレミアム会員になると、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。プレミアム会員の方は以下からログインしてください。

会員登録 | パスワードを忘れましたか?

有料のプレミアム会員になると、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

本サイトは MathJax を実装しているため、コメント文中で LaTex コマンドを利用することで美しい数式を入力できます。その際、インライン数式は\(数式\)で、ディスプレイ数式は$$数式$$という形式でそれぞれ入力してください。 例えば、\(ax^{2}+bx+c=0\)と入力すると\(ax^{2}+bx+c=0\)と表示され、$$ax^{2}+bx+c=0$$と入力すると$$ax^{2}+bx+c=0$$と表示されます。MathJax(LaTex)の文法については次のサイト( https://easy-copy-mathjax.xxxx7.com )などを参照してください。 紙に手書きした数式や図をカメラやスマホで撮影した上で、コメント欄に張り付けることもできます。その場合、コメント入力欄にある「ファイルを選択」ボタンをクリックした上で画像をアップロードしてください。アップロード可能な画像フォーマットは jpg, gif, png の 3 種類、ファイルサイズの上限は 5 MB です。PDF ファイルの添付も可能です。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員だけが質問やコメントを投稿・閲覧できます。

完備情報の静学ゲーム
アカウント
ログイン