完備情報の静学ゲームにおいてプレイヤーたちが混合戦略を選択する場合には、プレイヤーはクジと呼ばれる不確実な状況どうしを比較することになります。この場合、プレイヤーの評価体系はクジどうしを比較する選好関係として定式化されますが、さらにこの選好関係に対応する関数を期待利得関数と呼びます。
< 前のページ

クジとしての混合戦略の組

完備情報の静学ゲームを戦略型ゲーム\(G=\left( I,\{S_{i}\}_{i\in I},\{u_{i}\}_{i\in I}\right) \)として表現したとき、すべてのプレイヤーの純粋戦略の組\(s_{I}=\left( s_{i}\right) _{i\in I}\)に対してゲームのルールは結果を 1 つずつ定めます。したがって、プレイヤーたちの純粋戦略からなるそれぞれの組\(s_{I}\)を、ゲームにおいて起こり得る結果と同一視しても一般性は失われません。このような事情を踏まえると、すべてのプレイヤーが純粋戦略を採用する場合には、それぞれのプレイヤー\(i\)は純粋戦略の組どうしを比較する\(S_{I}\)上の選好関係\(\succsim _{i}\)を持っているものとみなすことができます。

一方、プレイヤーたちが混合戦略を採用する場合には話がやや複雑になります。なぜなら、その場合にもゲームのルールは相変わらず純粋戦略の組に対して結果を 1 つずつ定めるものの、プレイヤーたちが選ぶ混合戦略の組\(\sigma _{I}=\left( \sigma _{i}\right) _{i\in I}\)に対して、そのときに実際に実現する 1 つの純粋戦略の組\(s_{I}\)を事前に確定できないからです。ただ、混合戦略の組\(\sigma _{I}\)のもとで、それぞれの純戦略の組\(s_{I}\)が起こる確率を特定することはできます。具体的には、プレイヤー\(i\)が混合戦略\(\sigma _{i}\)のもとで純粋戦略\(s_{i}\)を選ぶ確率は\(\sigma _{i}(s_{i})\)ですから、混合戦略の組\(\sigma _{I}\)のもとで純粋戦略の組\(s_{I}\)が実現する確率は、\begin{equation*}
\sigma _{I}\left( s_{I}\right) =\prod_{i\in I}\sigma _{i}\left( s_{i}\right)
\end{equation*}となります。特に、プレイヤー集合が有限集合\(I=\left\{ 1,\cdots ,n\right\} \)である場合には、\begin{equation*}
\sigma _{I}\left( s_{I}\right) =\sigma _{1}(s_{1})\times \cdots \times
\sigma _{n}(s_{n})
\end{equation*}となります。

以上を踏まえると、混合戦略の組\(\sigma _{I}\)が与えられたとき、純戦略のそれぞれの組\(s_{I}\in S_{I}\)に対して、それが実現する確率\(\sigma _{I}\left( s_{I}\right) \)を定める確率関数\(\sigma _{I}:S_{I}\rightarrow \mathbb{R}\)が定義可能です。これをクジ(lottery)と呼びます。確率関数の定義より、\(\sigma _{I}\)は以下の性質を満たします。\begin{eqnarray*}
&&\left( a\right) \ \forall s_{I}\in S_{I}:0\leq \sigma _{I}\left(
s_{I}\right) \leq 1 \\
&&\left( b\right) \ \sum\limits_{s_{I}\in S_{I}}\sigma _{I}\left(
s_{I}\right) =1
\end{eqnarray*}

条件\(\left( a\right) \)は、クジ\(\sigma _{I}\)のもとでそれぞれの純粋戦略の組\(s_{I}\)が実現する確率は\(0\)以上\(1\)以下であることを意味します。条件\(\left( b\right) \)は、クジ\(\sigma _{I}\)のもとでそれぞれの純粋戦略の組が実現する確率を特定し、それらの総和をとると\(1\)になることを意味します。

例(クジとしての混合戦略の組)
以下の利得行列によって表される完備情報の静学ゲームについて考えます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 4,4 & 0,2 \\ \hline
B & 2,0 & 1,1 \\ \hline
\end{array}$$
表:利得行列

このゲームにおいて起こり得る結果は\(\left( U,L\right) ,\left( U,R\right) ,\left( B,L\right) ,\left( B,R\right) \)の4 通りです。それぞれのプレイヤー\(1,2\)の混合戦略\(\sigma _{1},\sigma _{2}\)を、\begin{eqnarray*}
\sigma _{1} &=&\left( \sigma _{1}\left( U\right) ,\sigma _{1}\left( B\right)
\right) =\left( \sigma _{1},1-\sigma _{1}\right) \quad \left( 0\leq \sigma
_{1}\leq 1\right) \\
\sigma _{2} &=&\left( \sigma _{2}\left( L\right) ,\sigma _{2}\left( R\right)
\right) =\left( \sigma _{2},1-\sigma _{2}\right) \quad \left( 0\leq \sigma
_{2}\leq 1\right)
\end{eqnarray*}で表します。2 人が混合戦略を採用する場合には、2 人の純粋戦略の各組が選ばれる確率は以下の表のように与えられます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & \sigma _{1}\sigma _{2} & \sigma _{1}(1-\sigma _{2}) \\ \hline
B & (1-\sigma _{1})\sigma _{2} & (1-\sigma _{1})(1-\sigma _{2}) \\
\hline
\end{array}$$

表:純粋戦略の各組が選ばれる確率

繰り返しになりますが、ゲームのルールはそれぞれの純粋戦略の組\(s_{I}\)に対して結果を 1 つずつ定めます。ただ、プレイヤーたちが混合戦略を採用する場合、どの純粋戦略の組が実際に実現するかを事前に確定することはできないため、プレイヤーたちは不確実な状況に直面します。そこで、そのような状況をクジ\(\sigma _{I}\)を用いて表現します。クジ\(\sigma _{I}\)とは、それぞれの純粋戦略の組\(s_{I}\)が起こる確率\(\sigma _{I}\left( s_{I}\right) \)、すなわち\(s_{I}\)に対応する結果が起こる確率を特定しますが、これは混合戦略の組\(\sigma _{I}=\left( \sigma _{i}\right) _{i\in I}\)のもとでプレイヤーたちが直面する不確実な状況を表しています。つまり、混合戦略の組が与えられればそれに対して 1 つのクジが定まります。

 

期待利得関数

クジが変化すればプレイヤーたちは以前とは異なる不確実な状況に直面するため、プレイヤーたちが混合戦略を採用する場合、それぞれのプレイヤーはクジどうしを比較する選好を持っているものと考えるべきです。さらに言えば、混合戦略の組が与えられればそれに対して 1 つのクジが定まるため、結局、プレイヤーがクジを比較する選好を、混合戦略の組どうしを比較する\(\Delta \left( S_{I}\right) \)上の選好関係と同一視しても一般性は失われません。

具体的には、戦略型ゲーム\(G\)において表される不完備情報の静学ゲームにおいてプレイヤーたちが混合戦略を採用するとき、プレイヤー\(i\)が直面し得る不確実な状況どうしを比較する選好関係は、混合戦略のすべての組からなる集合\(\Delta \left( S_{I}\right) \)上の二項関係\(\succsim _{i}\)として定式化されます。その上で、2 つの混合戦略の組\(\sigma _{I},\sigma _{I}^{\prime }\in \Delta \left( S_{I}\right) \)に対して\(\sigma _{I}\succsim _{i}\sigma _{I}^{\prime }\)が成り立つ場合には、プレイヤー\(i\)は\(\sigma _{I}\)のもとで直面する不確実な状況を、\(\sigma _{I}^{\prime }\)のもとで直面する不確実な状況以上に好ましいと考えているものと解釈します。

プレイヤー\(i\)が不確実な状況どうしを比較する\(\Delta \left( S_{I}\right) \)上の選好関係\(\succsim _{i}\)が与えられたとき、それに対して関数\(F_{i}:\Delta \left( S_{I}\right) \rightarrow \mathbb{R} \)が存在して、任意の混合戦略の組\(\sigma _{I},\sigma _{I}^{\prime }\in \Delta \left( S_{I}\right) \)に対して、\begin{equation*}
\sigma _{I}\succsim _{i}\sigma _{I}^{\prime }\ \Leftrightarrow \ F_{i}\left(
\sigma _{I}\right) \geq F_{i}\left( \sigma _{I}^{\prime }\right)
\end{equation*}という関係が成り立つ場合には、\(F_{i}\)のことを\(\succsim _{i}\)を表す期待利得関数(expected utility function)と呼びます。さらに、プレイヤー\(i\)の期待利得関数\(F_{i}\)が混合戦略の組\(\sigma _{I}\)に対して定める値\(F_{i}\left( \sigma _{I}\right) \)を、プレイヤー\(i\)が\(\sigma _{I}\)から得る期待利得(expected utility)と呼びます。

プレイヤーがクジどうしを比較する選好関係\(\succsim _{i}\)に対して、それを表す期待利得関数\(F_{i}\)は存在する場合には、それぞれのクジ\(\sigma _{I}\in \delta \left( S_{i}\right) \)に対して、\begin{equation*}
F_{i}\left( \sigma _{I}\right) =\sum_{s_{I}\in S_{I}}\left[ \sigma
_{I}\left( s_{I}\right) \cdot u_{i}(s_{I})\right] =\sum_{s_{I}\in S_{I}}\left[ \left( \prod\limits_{j\in I}\sigma _{j}(s_{j})\right) \cdot
u_{i}(s_{I})\right] \end{equation*}という関係が成り立ちます。特に、プレイヤー集合が有限集合\(I=\left\{ 1,\cdots ,n\right\} \)である場合には、\begin{equation*}
F_{i}\left( \sigma _{I}\right) =\sum_{\left( s_{1},\cdots ,s_{n}\right) \in
S_{1}\times \cdots \times S_{n}}[\sigma _{1}(s_{1})\times \cdots \times
\sigma _{n}(s_{n})\times u_{i}(s_{1},\cdots ,s_{n})] \end{equation*}となります。ただし、\(u_{i}:S_{I}\rightarrow \mathbb{R} \)はプレイヤー\(i\)が純粋戦略の組どうしを比較する利得関数です。

期待利得関数の意味について考えましょう。まず、プレイヤーたちが混合戦略を採用する場合、プレイヤーたちが選ぶ混合戦略の組\(\sigma _{I}\)が得られます。プレイヤー\(i\)が混合戦略\(\sigma _{i}\)のもとで純粋戦略\(s_{i}\)を選ぶ確率は\(\sigma _{i}(s_{i})\)ですから、混合戦略の組\(\sigma _{I}\)のもとで純粋戦略の組\(s_{I}\)が実現する確率は\(\sigma _{I}\left( s_{I}\right) =\prod_{j\in I}\sigma _{j}(s_{j})\)と特定されます。さらに、この\(s_{I}\)においてプレイヤー\(i\)は利得\(u_{i}(s_{I})\)を得るため、\(\sigma _{I}\)のもとでプレイヤー\(i\)が\(s_{I}\)から得る利得の期待値は\(\sigma _{I}\left( s_{I}\right) \cdot u_{i}(s_{I})\)となります。これを\(S_{I}\)に属するすべての純粋戦略の組\(s_{I}\)に関して導出した上で総和をとれば、\(\sigma _{I}\)のもとでのプレイヤー\(i\)の期待利得が\(\sum_{s_{I}\in S_{I}}\left[ \sigma _{I}\left( s_{I}\right) \cdot u_{i}(s_{I})\right]\)として得られます。これはプレイヤー\(i\)が混合戦略の組\(\sigma _{I}\)から得る期待利得に他なりません。

例(期待利得)
繰り返しになりますが、以下の利得行列によって表される完備情報の静学ゲームについて考えます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & 4,4 & 0,2 \\ \hline
B & 2,0 & 1,1 \\ \hline
\end{array}$$
表:利得行列

このゲームにおいて起こり得る結果は\(\left( U,L\right) ,\left( U,R\right) ,\left( B,L\right) ,\left( B,R\right) \)の4 通りです。それぞれのプレイヤー\(1,2\)の混合戦略\(\sigma _{1},\sigma _{2}\)を、\begin{eqnarray*}
\sigma _{1} &=&\left( \sigma _{1}\left( U\right) ,\sigma _{1}\left( B\right)
\right) =\left( \sigma _{1},1-\sigma _{1}\right) \quad \left( 0\leq \sigma
_{1}\leq 1\right) \\
\sigma _{2} &=&\left( \sigma _{2}\left( L\right) ,\sigma _{2}\left( R\right)
\right) =\left( \sigma _{2},1-\sigma _{2}\right) \quad \left( 0\leq \sigma
_{2}\leq 1\right)
\end{eqnarray*}で表します。2 人が混合戦略を採用する場合には、2 人の純粋戦略の各組が選ばれる確率は以下の表のように与えられます。
$$\begin{array}{ccc}
\hline
1\diagdown 2 & L & R \\ \hline
U & \sigma _{1}\sigma _{2} & \sigma _{1}(1-\sigma _{2}) \\ \hline
B & (1-\sigma _{1})\sigma _{2} & (1-\sigma _{1})(1-\sigma _{2}) \\
\hline
\end{array}$$

表:純粋戦略の各組が選ばれる確率

上の2つの表より、混合戦略の組\(\left( \sigma _{1},\sigma _{2}\right) \)におけるプレイヤー\(1\)の期待利得は、\begin{align*}
F_{2}(\sigma _{1},\sigma _{2})& =4\sigma _{1}\sigma _{2}+0\sigma
_{1}(1-\sigma _{2})+2(1-\sigma _{1})\sigma _{2}+1(1-\sigma _{1})(1-\sigma
_{2}) \\
& =4\sigma _{1}\sigma _{2}+2(1-\sigma _{1})\sigma _{2}+(1-\sigma
_{1})(1-\sigma _{2}) \\
& =3\sigma _{1}\sigma _{2}-\sigma _{1}+\sigma _{2}+1
\end{align*}であり、プレイヤー\(2\)の期待利得は、\begin{align*}
F_{1}(\sigma _{1},\sigma _{2})& =4\sigma _{1}\sigma _{2}+2\sigma
_{1}(1-\sigma _{2})+0(1-\sigma _{1})\sigma _{2}+1(1-\sigma _{1})(1-\sigma
_{2}) \\
& =4\sigma _{1}\sigma _{2}+2\sigma _{1}(1-\sigma _{2})+(1-\sigma
_{1})(1-\sigma _{2}) \\
& =3\sigma _{1}\sigma _{2}+\sigma _{1}-\sigma _{2}+1
\end{align*}となります。したがって、例えば、プレイヤー\(1\)が混合戦略\(\sigma _{1}=(\frac{1}{2},\frac{1}{2})\)を選び、プレイヤー\(2\)が混合戦略\(\sigma _{2}=(\frac{1}{3},\frac{2}{3})\)を選ぶとき、この混合戦略の組\(\left( \sigma _{1},\sigma _{2}\right) \)における両者の期待利得は、\begin{align*}
F_{1}(\sigma _{1},\sigma _{2})& =3\cdot \frac{1}{2}\cdot \frac{1}{3}-\frac{1}{2}+\frac{1}{3}+1=\frac{4}{3} \\
F_{2}(\sigma _{1},\sigma _{2})& =3\cdot \frac{1}{2}\cdot \frac{1}{3}+\frac{1}{2}-\frac{1}{3}+1=\frac{5}{3}
\end{align*}となります。

クジを比較する選好を表現する期待利得関数が存在するための条件や期待利得関数の性質などについては場を改めて詳しく解説します。とりあえず以降では、プレイヤーがクジどうしを比較する評価体系は期待利得関数によって表現されるものと仮定します。

次回は混合拡張について解説します。

次へ進む 質問・コメント(プレミアム会員限定) 演習問題(プレミアム会員限定)
Share on facebook
Share on twitter
Share on email
< 前のページ

プレミアム会員になると、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。プレミアム会員の方は以下からログインしてください。

会員登録 | パスワードを忘れましたか?

有料のプレミアム会員になると、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

本サイトは MathJax を実装しているため、コメント文中で LaTex コマンドを利用することで美しい数式を入力できます。その際、インライン数式は\(数式\)で、ディスプレイ数式は$$数式$$という形式でそれぞれ入力してください。 例えば、\(ax^{2}+bx+c=0\)と入力すると\(ax^{2}+bx+c=0\)と表示され、$$ax^{2}+bx+c=0$$と入力すると$$ax^{2}+bx+c=0$$と表示されます。MathJax(LaTex)の文法については次のサイト( https://easy-copy-mathjax.xxxx7.com )などを参照してください。 紙に手書きした数式や図をカメラやスマホで撮影した上で、コメント欄に張り付けることもできます。その場合、コメント入力欄にある「ファイルを選択」ボタンをクリックした上で画像をアップロードしてください。アップロード可能な画像フォーマットは jpg, gif, png の 3 種類、ファイルサイズの上限は 5 MB です。PDF ファイルの添付も可能です。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員だけが質問やコメントを投稿・閲覧できます。

完備情報の静学ゲーム
アカウント
ログイン