検索
Close this search box.

完備情報の静学ゲーム

純粋戦略集合が区間である場合の混合戦略と期待利得

Mailで保存
Xで共有

純粋戦略集合が区間である場合の混合戦略

問題としている戦略的状況が完備情報の静学ゲームであるとともに、それが戦略型ゲーム\begin{equation*}
G=\left( I,\left\{ S_{i}\right\} _{i\in I},\left\{ u_{i}\right\} _{i\in
I}\right)
\end{equation*}として記述されているものとします。ただし、\(I\)はプレイヤー集合、\(S_{i}\)はプレイヤー\(i\in I\)の純粋戦略集合、\(u_{i}:S_{I}\rightarrow \mathbb{R} \)はプレイヤー\(i\)の利得関数です。

これまでは純粋戦略集合\(S_{i}\)が有限集合や可算集合である状況を想定した上で混合戦略を定義し、期待利得を計算する方法を解説しました。一方、純粋戦略集合を非可算集合へと拡張する場合、期待利得を厳密に定義するためには確率論の枠組みである確率空間の再構築が必要です。混合戦略とは何らかの純粋戦略をランダムに選択する意思決定に相当します。これは標本点をランダムに抽出するという確率論の考え方そのものです。以降では、純粋戦略集合が\(\mathbb{R} \)上の区間である状況を想定した上で、確率空間を用いて混合戦略および期待利得を定式化します。

プレイヤー集合を、\begin{equation*}
I=\left\{ 1,\cdots ,n\right\}
\end{equation*}とします。また、任意のプレイヤー\(i\in I\)の純粋戦略集合\(S_{i}\)が\(\mathbb{R} \)上の区間である状況を想定します。その上で、プレイヤー\(i\)の意思決定を測度空間\begin{equation*}\left( X_{i},\mathfrak{M}_{i},\mu _{i}\right)
\end{equation*}として定式化します。

まず、集合\(X_{i}\)としてプレイヤーの純粋戦略集合\begin{equation*}X_{i}=S_{i}
\end{equation*}を採用します。

測度空間の定義より、\(X_{i}\)すなわち\(S_{i}\)の部分集合族\(\mathfrak{M}_{i}\subset 2^{S_{i}}\)は可測空間の公理\begin{eqnarray*}&&\left( M_{1}\right) \ \mathfrak{M}_{i}\not=\phi \\
&&\left( M_{2}\right) \ \forall A\in \mathfrak{M}_{i}:A^{c}\in \mathfrak{M}_{i} \\
&&\left( M_{3}\right) \ \forall \left\{ A_{n}\right\} _{n-1}^{+\infty
}\subset \mathfrak{M}_{i}:\bigcup_{n=1}^{+\infty }A_{n}\in \mathfrak{M}_{i}
\end{eqnarray*}を満たす必要があります。そこで、\(\mathfrak{M}_{i}\)として区間\(S_{i}\)上のボレル集合族\begin{equation*}\mathfrak{M}_{i}=\mathfrak{B}\left( S_{i}\right)
\end{equation*}を採用します。

測度空間の定義より、測度\(\mu _{i}:\mathfrak{M}_{i}\rightarrow \overline{\mathbb{R} }\)は測度の公理\begin{eqnarray*}&&\left( \mu _{1}\right) \ \forall A\in \mathfrak{M}_{i}:0\leq \mu
_{i}\left( A\right) \leq +\infty \\
&&\left( \mu _{2}\right) \ \mu _{i}\left( \phi \right) =0 \\
&&\left( \mu _{3}\right) \ \forall \text{排反な}\left\{
A_{n}\right\} _{n-1}^{+\infty }\subset \mathfrak{M}_{i}:\mu _{i}\left(
\bigcup_{n=1}^{+\infty }A_{n}\right) =\sum_{n=1}^{+\infty }\mu _{i}\left(
A_{n}\right)
\end{eqnarray*}を満たす必要があります。そこで、測度\(\mu_{i}\)として定義域をボレル集合族\(\mathfrak{B}\left( S_{i}\right) \)に制限したルベーグ測度\begin{equation*}\mu _{i}:\mathfrak{B}\left( S_{i}\right) \rightarrow \left[ 0,+\infty \right] \end{equation*}を採用します。

混合戦略は確率測度である一方で、区間\(S_{i}\)の選び方によってはルベーグ測度\(\mu _{i}\)は確率測度であるとは限りません。つまり、\begin{equation*}\mu _{i}\left( S_{i}\right) =1
\end{equation*}が成り立つとは限らないという問題があります。また、区間はボレル集合であるため、ルベーグ測度\(\mu_{i}\)は\(S_{i}\)の部分集合であるような区間に対して測度を定めます。特に、\(\mu _{i}\)が有界な区間に対して定める測度はその区間の長さと一致するため、\(\mu _{i}\)はプレイヤーが偏りなく戦略を選ぶ連続型一様分布の混合戦略に相当します。実際のゲームにおいて、プレイヤーは偏りのある確率分布にもとづいて意思決定を行う状況は起こり得ます。この偏りを表現するために\(\mu _{i}\)を加工する必要があります。

先の要領で構成された測度空間\begin{equation*}
\left( S_{i},\mathfrak{B}\left( S_{i}\right) ,\mu _{i}\right)
\end{equation*}が与えられた状況において、ボレル可測関数\begin{equation*}
f_{i}:\mathbb{R} \supset S_{i}\rightarrow \overline{\mathbb{R} }
\end{equation*}を導入します。ただし、\(f_{i}\)は以下の条件を満たすものとします。

1つ目の条件は、\(f\)が非負性を満たすこと、すなわち、\begin{equation*}\forall s_{i}\in S_{i}:f_{i}\left( s_{i}\right) \geq 0
\end{equation*}が成り立つということです。混合戦略のもとで任意の純粋戦略が選ばれる確率は非負でなければならないからです。

2つ目の条件は、\(f\)の区間\(S_{i}\)上でのルベーグ積分の値が、\begin{equation*}\int_{S_{i}}f\left( s_{i}\right) d\mu _{i}\left( s_{i}\right) =1
\end{equation*}を満たすということです。混合戦略は確率分布である必要があるため、すべての選択肢を足し合わせた確率は\(1\)でなければならないからです。

以上を踏まえた上で、それぞれのボレル集合\(A\in \mathfrak{B}\left( S_{i}\right) \)に対して、\begin{equation*}\sigma _{i}\left( A\right) =\int_{A}f\left( s_{i}\right) d\mu _{i}\left(
s_{i}\right)
\end{equation*}を値として定める集合関数\begin{equation*}
\sigma _{i}:\mathfrak{B}\left( S_{i}\right) \rightarrow \mathbb{R} \end{equation*}を定義すると、\(\sigma _{i}\)は確率測度の公理\begin{eqnarray*}&&\left( P_{1}\right) \ \forall A\in \mathfrak{B}\left( S_{i}\right) :\sigma
_{i}\left( A\right) \geq 0 \\
&&\left( P_{2}\right) \ \sigma _{i}\left( S_{i}\right) =1 \\
&&\left( P_{3}\right) \ \forall \text{排反な}\left\{
A_{n}\right\} _{n-1}^{+\infty }\subset \mathfrak{B}\left( I_{i}\right)
:\sigma _{i}\left( \bigcup_{n=1}^{+\infty }A_{n}\right) =\sum_{n=1}^{+\infty
}\sigma _{i}\left( A_{n}\right)
\end{eqnarray*}を満たすため、先の測度空間\(\left( S_{i},\mathfrak{B}\left(S_{i}\right) ,\mu _{i}\right) \)において\(\mu _{i}\)を\(\sigma _{i}\)に置き換えることにより得られる、\begin{equation*}\left( S_{i},\mathfrak{B}\left( S_{i}\right) ,\sigma _{i}\right)
\end{equation*}は確率空間になります。そこで、これをプレイヤー\(i\)の混合戦略と同一視します。

例(確率空間としての混合戦略)
戦略型ゲーム\(G\)において、プレイヤー\(i\in I\)の純粋戦略集合が、\(a<b\)を満たす実数\(a,b\in \mathbb{R} \)を用いて、\begin{equation*}S_{i}=\left[ a,b\right] \end{equation*}と表されるものとします。測度空間\begin{equation*}
\left( \left[ a,b\right] ,\mathfrak{B}\left( \left[ a,b\right] \right) ,\mu
_{i}\right)
\end{equation*}を構成します。さらに、それぞれの\(s_{i}\in \left[ a,b\right] \)に対して、\begin{equation*}f_{i}\left( s_{i}\right) =\frac{1}{b-a}
\end{equation*}を定める関数\(f_{i}:\mathbb{R} \supset \left[ a,b\right] \rightarrow \mathbb{R} \)を定義します。連続関数はボレル可測であるため\(f_{i}\)はボレル可測であるとともに、\begin{equation*}\forall s_{i}\in \left[ a,b\right] :f_{i}\left( s_{i}\right) \geq 0
\end{equation*}が明らかに成り立つとともに、\begin{eqnarray*}
\int_{\left[ a,b\right] }f_{i}\left( s_{i}\right) d\mu _{i}\left(
s_{i}\right) &=&\int_{\left[ a,b\right] }\frac{1}{b-a}d\mu _{i}\left(
s_{i}\right) \\
&=&\frac{1}{b-a}\int_{\left[ a,b\right] }d\mu _{i}\left( s_{i}\right) \\
&=&\frac{\mu _{i}\left( \left[ a,b\right] \right) }{b-a} \\
&=&\frac{b-a}{b-a}\quad \because \text{ルベーグ測度の性質} \\
&=&1
\end{eqnarray*}が成り立ちます。混合戦略\(\sigma _{i}:\mathfrak{B}\left( \left[ a,b\right]\right) \rightarrow \mathbb{R} \)がそれぞれの\(A\in \mathfrak{B}\left( \left[ a,b\right] \right) \)に対して定める値は、\begin{eqnarray*}\sigma _{i}\left( A\right) &=&\int_{A}f_{i}\left( s_{i}\right) d\mu
_{i}\left( s_{i}\right) \\
&=&\int_{A}\frac{1}{b-a}d\mu _{i}\left( s_{i}\right) \\
&=&\frac{1}{b-a}\int_{A}d\mu _{i}\left( s_{i}\right) \\
&=&\frac{\mu \left( A\right) }{b-a}
\end{eqnarray*}です。\(f_{i}\)の定義より、この混合戦略\(\sigma _{i}\)は区間\(\left[ a,b\right] \)上の一様分布に相当します。
例(確率空間としての混合戦略)
戦略型ゲーム\(G\)において、プレイヤー\(i\in I\)の純粋戦略集合が、\begin{equation*}S_{i}=[0,+\infty )
\end{equation*}であるものとします。測度空間\begin{equation*}
\left( \lbrack 0,+\infty ),\mathfrak{B}\left( [0,+\infty )\right) ,\mu
_{i}\right)
\end{equation*}を構成します。さらに、それぞれの\(s_{i}\in \lbrack0,+\infty )\)に対して、\begin{equation*}f_{i}\left( s_{i}\right) =e^{-s_{i}}
\end{equation*}を定める関数\(f_{i}:\mathbb{R} \supset \lbrack 0,+\infty )\rightarrow \mathbb{R} \)を定義します。連続関数はボレル可測であるため\(f_{i}\)はボレル可測であるとともに、\begin{equation*}\forall s_{i}\in \lbrack 0,+\infty ):f_{i}\left( s_{i}\right) \geq 0
\end{equation*}が明らかに成り立つとともに、\begin{eqnarray*}
\int_{\lbrack 0,+\infty )}f_{i}\left( s_{i}\right) d\mu _{i}\left(
s_{i}\right) &=&\int_{[0,+\infty )}e^{-s_{i}}d\mu _{i}\left( s_{i}\right)
\\
&=&\lim_{b\rightarrow +\infty }\int_{0}^{b}e^{-s_{i}}ds_{i}\quad \because
\text{ルベーグ積分とリーマン積分の関係} \\
&=&\lim_{b\rightarrow +\infty }\left[ -e^{-s_{i}}\right] _{0}^{b} \\
&=&\lim_{b\rightarrow +\infty }\left( -e^{-b}+e^{0}\right) \\
&=&\lim_{b\rightarrow +\infty }\left( -e^{-b}+1\right) \\
&=&0+1 \\
&=&1
\end{eqnarray*}が成り立ちます。混合戦略\(\sigma _{i}:\mathfrak{B}\left( [0,+\infty )\right)\rightarrow \mathbb{R} \)がそれぞれの\(A\in \mathfrak{B}\left([0,+\infty )\right) \)に対して定める値は、\begin{eqnarray*}\sigma _{i}\left( A\right) &=&\int_{A}f_{i}\left( s_{i}\right) d\mu
_{i}\left( s_{i}\right) \\
&=&\int_{A}e^{-s_{i}}d\mu _{i}\left( s_{i}\right)
\end{eqnarray*}です。\(f_{i}\)の定義より、この混合戦略\(\sigma _{i}\)のもとでは\(s_{i}\)の数値が大きくなるほど、その戦略が選ばれる確率は指数関数的に減少します。

 

純粋戦略集合が区間である場合の期待利得

それぞれのプレイヤー\(i\in I\)に関する測度空間\begin{equation*}\left( S_{i},\mathfrak{B}\left( S_{i}\right) ,\mu _{i}\right)
\end{equation*}が先の要領で定義された状況を想定します。ここから直積測度空間\begin{equation*}
\left( S_{I},\mathfrak{B}\left( S_{I}\right) ,\mu _{I}\right)
\end{equation*}を定義します。ただし、\begin{equation*}
S_{I}=S_{1}\times \cdots \times S_{n}
\end{equation*}はプレイヤーたちの純粋戦略集合の直積です。また、\begin{equation*}
\mathfrak{B}\left( S_{I}\right) =\mathfrak{B}\left( S_{1}\right) \otimes
\cdots \otimes \mathfrak{B}\left( S_{n}\right)
\end{equation*}はプレイヤーたちのボレル集合の直積\begin{equation*}
\mathfrak{B}\left( S_{1}\right) \times \cdots \times \mathfrak{B}\left(
S_{n}\right)
\end{equation*}から生成される直積\(\sigma \)-代数です。さらに、プレイヤーたちが互いに独立に戦略を選ぶという非協力ゲームの前提にもとづき、\begin{equation*}\mu _{I}=\mu _{1}\times \cdots \times \mu _{n}
\end{equation*}は各空間のルベーグ測度の直積である直積ルベーグ測度です。したがって、ボレル集合の組\begin{equation*}
A_{I}=A_{1}\times \cdots \times A_{n}\in \mathfrak{B}\left( S_{1}\right)
\times \cdots \times \mathfrak{B}\left( S_{n}\right)
\end{equation*}を任意に選んだとき、以下の関係\begin{equation*}
\mu _{I}\left( A_{I}\right) =\mu _{1}\left( A_{1}\right) \times \cdots
\times \mu _{n}\left( A_{n}\right)
\end{equation*}が成り立ちます。

それぞれのプレイヤー\(i\in I\)の混合戦略に相当する確率空間\begin{equation*}\left( S_{i},\mathfrak{B}\left( S_{i}\right) ,\sigma _{i}\right)
\end{equation*}が与えられた状況を想定します。ここから直積測確率空間\begin{equation*}
\left( S_{I},\mathfrak{B}\left( S_{I}\right) ,\sigma _{I}\right)
\end{equation*}を定義します。ただし、\(\left( S_{I},\mathfrak{B}\left( S_{I}\right) \right) \)は先の直積可測空間であり、さらに、\begin{equation*}\sigma _{I}=\sigma _{1}\otimes \cdots \otimes \sigma _{n}
\end{equation*}はプレイヤーたちの確率測度\(\sigma _{1},\cdots ,\sigma _{n}\)の直積測度です。プレイヤーたちが互いに独立に戦略を選ぶという非協力ゲームの前提より、ボレル集合の組\begin{equation*}A_{I}=A_{1}\times \cdots \times A_{n}\in \mathfrak{B}\left( S_{1}\right)
\times \cdots \times \mathfrak{B}\left( S_{n}\right)
\end{equation*}を任意に選んだとき、以下の関係\begin{equation*}
\sigma _{I}\left( A_{I}\right) =\sigma _{1}\left( A_{1}\right) \times \cdots
\times \sigma _{n}\left( A_{n}\right)
\end{equation*}が成り立ちます。直積測度\(\sigma _{I}\)に対応するボレル可測関数は、個々の確率測度\(\sigma _{1},\cdots,\sigma _{n}\)のもととなるボレル可測関数\(f_{1},\cdots ,f_{n}\)から、\begin{equation*}\forall s_{I}\in S_{I}:f_{I}\left( s_{I}\right) =f_{1}\left( s_{1}\right)
\times \cdots \times f\left( s_{n}\right)
\end{equation*}を満たすものとして定義される関数\begin{equation*}
f_{I}:S_{I}\rightarrow \overline{\mathbb{R} }
\end{equation*}であるため、これを用いると、\begin{eqnarray*}
\sigma _{I}\left( A_{I}\right) &=&\int_{A_{I}}f_{I}\left( s_{I}\right) d\mu
_{I}\left( s_{I}\right) \\
&=&\int_{A_{1}\times \cdots \times A_{n}}f_{1}\left( s_{1}\right) \times
\cdots \times f_{n}\left( s_{n}\right) d\mu _{I}\left( s_{1},\cdots
,s_{n}\right) \\
&=&\int_{A_{n}}\cdots \left( \int_{A_{1}}f_{1}\left( s_{1}\right) \times
\cdots \times f_{n}\left( s_{n}\right) d\mu _{1}\left( s_{1}\right) \right)
\cdots d\mu _{n}\left( s_{n}\right) \quad \because \text{フビニの定理} \\
&=&\left( \int_{A_{1}}f_{1}\left( s_{1}\right) d\mu _{1}\left( s_{1}\right)
\right) \times \cdots \times \left( \int_{A_{n}}f_{n}\left( s_{n}\right)
d\mu _{n}\left( s_{n}\right) \right) \\
&=&\sigma _{1}\left( A_{1}\right) \times \cdots \times \sigma _{n}\left(
A_{n}\right)
\end{eqnarray*}と計算できることに注意してください。

それぞれのプレイヤー\(i\in I\)の利得関数は確率変数\begin{equation*}u_{i}:S_{I}\rightarrow \mathbb{R} \end{equation*}として定義されます。ただし、\(u_{i}\)は確率変数としての条件\begin{equation*}\forall B\in \mathfrak{B}\left( \mathbb{R} \right) :u_{i}^{-1}\left( B\right) \in \mathfrak{B}\left( S_{I}\right)
\end{equation*}を満たす必要があります。

混合戦略の組\(\sigma _{I}\)のもとでプレイヤー\(i\in I\)が直面する期待利得は\(F_{i}\left( \sigma _{I}\right) \)は、\(\sigma _{I}\)に相当する直積測度のもとでの確率変数\(u_{i}\)の期待値に他ならず、ゆえに、\begin{eqnarray*}F_{i}\left( \sigma _{I}\right) &=&\int_{S_{I}}u_{i}\left( s_{I}\right)
f_{I}\left( s_{I}\right) d\mu _{I}\left( s_{I}\right) \\
&=&\int_{S_{1}\times \cdots \times S_{n}}u_{i}\left( s_{1},\cdots
,s_{n}\right) \times f_{1}\left( s_{1}\right) \times \cdots \times
f_{n}\left( s_{n}\right) d\mu _{I}\left( s_{1},\cdots ,s_{n}\right) \\
&=&\int_{S_{n}}\cdots \left( \int_{S_{1}}u_{i}\left( s_{1},\cdots
,s_{n}\right) \times f_{1}\left( s_{1}\right) \times \cdots \times
f_{n}\left( s_{n}\right) d\mu _{1}\left( s_{1}\right) \right) \cdots d\mu
_{n}\left( s_{n}\right) \quad \because \text{フビニの定理}
\end{eqnarray*}となります。さらに、\(S_{1}\times \cdots \times S_{n}\)が有界であるとともに非積分関数がリーマン積分可能である場合や、被積分関数が非負値をとる広義リーマン積分可能な関数である場合などにはリーマン積分とルベーグ積分の値は一致するため、期待利得を、\begin{eqnarray*}F_{i}\left( \sigma _{I}\right) &=&\int \cdots \int_{S_{I}}u_{i}\left(
s_{1},\cdots ,s_{n}\right) \times f_{1}\left( s_{1}\right) \times \cdots
\times f_{n}\left( s_{n}\right) ds_{1}\cdots ds_{n}\quad \because \text{多重リーマン積分} \\
&=&\int_{S_{n}}\cdots \left( \int_{S_{1}}u_{i}\left( s_{1},\cdots
,s_{n}\right) \times f_{1}\left( s_{1}\right) \times \cdots \times
f_{n}\left( s_{n}\right) ds_{1}\right) \cdots ds_{n}\quad \because \text{逐次積分への変換}
\end{eqnarray*}と計算できます。

例(期待利得)
戦略型ゲーム\(G\)において、プレイヤー集合が、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}であり、プレイヤー\(i\in I\)の純粋戦略集合が、\(a<b\)を満たす実数\(a,b\in \mathbb{R} \)を用いて、\begin{equation*}S_{i}=\left[ a,b\right] \end{equation*}と表されるものとします。測度空間\begin{equation*}
\left( \left[ a,b\right] ,\mathfrak{B}\left( \left[ a,b\right] \right) ,\mu
_{i}\right)
\end{equation*}を構成します。さらに、それぞれの\(s_{i}\in \left[ a,b\right] \)に対して、\begin{equation*}f_{i}\left( s_{i}\right) =\frac{1}{b-a}
\end{equation*}を定めるボレル測度関数\(f_{i}:\mathbb{R} \supset \left[ a,b\right] \rightarrow \mathbb{R} \)を定義します。先に示したように、混合戦略\(\sigma _{i}:\mathfrak{B}\left( \left[ a,b\right] \right)\rightarrow \mathbb{R} \)がそれぞれの\(A\in \mathfrak{B}\left( \left[ a,b\right] \right) \)に対して定める値は、\begin{equation*}\sigma _{i}\left( A\right) =\frac{\mu \left( A\right) }{b-a}
\end{equation*}です。プレイヤー\(1\)の利得関数が、\begin{equation*}u_{1}\left( s_{1},s_{2}\right) =s_{1}+s_{2}
\end{equation*}である場合、2人がともに先の混合戦略を採用した場合\(\left( \sigma _{1},\sigma_{2}\right) \)にプレイヤー\(1\)が直面する期待利得は、\begin{eqnarray*}F_{1}\left( \sigma _{1},\sigma _{2}\right) &=&\int_{S_{1}\times
S_{2}}u_{1}\left( s_{1},s_{2}\right) \times f_{1}\left( s_{1}\right) \times
f_{2}\left( s_{2}\right) d\mu _{I}\left( s_{1},s_{2}\right) \\
&=&\int_{\left[ a,b\right] \times \left[ a,b\right] }\left(
s_{1}+s_{2}\right) \times \frac{1}{b-a}\times \frac{1}{b-a}d\mu _{I}\left(
s_{1},s_{2}\right) \\
&=&\int \int_{\left[ a,b\right] \times \left[ a,b\right] }\left(
s_{1}+s_{2}\right) \times \frac{1}{\left( b-a\right) ^{2}}ds_{1}ds_{2}\quad
\because \text{多重リーマン積分} \\
&=&\int_{a}^{b}\left( \int_{a}^{b}\left( s_{1}+s_{2}\right) \times \frac{1}{\left( b-a\right) ^{2}}ds_{1}\right) ds_{2}\quad \because \text{逐次積分} \\
&=&\frac{1}{\left( b-a\right) ^{2}}\int_{a}^{b}\left( \int_{a}^{b}\left(
s_{1}+s_{2}\right) ds_{1}\right) ds_{2} \\
&=&\frac{1}{\left( b-a\right) ^{2}}\int_{a}^{b}\left( \left[ \frac{1}{2}s_{1}^{2}+s_{2}s_{1}\right] _{a}^{b}\right) ds_{2} \\
&=&\frac{1}{\left( b-a\right) ^{2}}\int_{a}^{b}\left( \left( \frac{1}{2}b^{2}+s_{2}b\right) -\left( \frac{1}{2}a^{2}+s_{2}a\right) \right) ds_{2} \\
&=&\frac{1}{\left( b-a\right) ^{2}}\int_{a}^{b}\left( \frac{b^{2}-a^{2}}{2}+s_{2}\left( b-a\right) \right) ds_{2} \\
&=&\frac{1}{\left( b-a\right) ^{2}}\left[ \int_{a}^{b}\frac{b^{2}-a^{2}}{2}ds_{2}+\int_{a}^{b}s_{2}\left( b-a\right) ds_{2}\right] \\
&=&\frac{1}{\left( b-a\right) ^{2}}\left[ \frac{b^{2}-a^{2}}{2}\int_{a}^{b}1ds_{2}+\left( b-a\right) \int_{a}^{b}s_{2}ds_{2}\right] \\
&=&\frac{1}{\left( b-a\right) ^{2}}\left[ \frac{b^{2}-a^{2}}{2}\left[ s_{2}\right] _{a}^{b}+\left( b-a\right) \left[ \frac{1}{2}s_{2}^{2}\right] _{a}^{b}\right] \\
&=&\frac{1}{\left( b-a\right) ^{2}}\left[ \frac{\left( b^{2}-a^{2}\right)
\left( b-a\right) }{2}+\frac{\left( b-a\right) \left( b^{2}-a^{2}\right) }{2}\right] \\
&=&\frac{\left( b^{2}-a^{2}\right) \left( b-a\right) }{\left( b-a\right) ^{2}} \\
&=&\frac{b^{2}-a^{2}}{b-a} \\
&=&b+a
\end{eqnarray*}となります。

例(期待利得)
戦略型ゲーム\(G\)において、プレイヤー集合が、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}であり、プレイヤー\(i\in I\)の純粋戦略集合が、\begin{equation*}S_{i}=[0,+\infty )
\end{equation*}であるものとします。測度空間\begin{equation*}
\left( \lbrack 0,+\infty ),\mathfrak{B}\left( [0,+\infty )\right) ,\mu
_{i}\right)
\end{equation*}を構成します。さらに、それぞれの\(s_{i}\in \lbrack0,+\infty )\)に対して、\begin{equation*}f_{i}\left( s_{i}\right) =e^{-s_{i}}
\end{equation*}を定めるボレル測度関数\(f_{i}:\mathbb{R} \supset \lbrack 0,+\infty )\rightarrow \mathbb{R} \)を定義します。先に示したように、混合戦略\(\sigma _{i}:\mathfrak{B}\left( [0,+\infty )\right)\rightarrow \mathbb{R} \)がそれぞれの\(A\in \mathfrak{B}\left([0,+\infty )\right) \)に対して定める値は、\begin{equation*}\sigma _{i}\left( A\right) =\int_{A}e^{-s_{i}}d\mu _{i}\left( s_{i}\right)
\end{equation*}です。プレイヤー\(1\)の利得関数が、\begin{equation*}u_{1}\left( s_{1},s_{2}\right) =s_{1}s_{2}
\end{equation*}である場合、2人がともに先の混合戦略を採用した場合\(\left( \sigma _{1},\sigma_{2}\right) \)にプレイヤー\(1\)が直面する期待利得は、\begin{eqnarray*}F_{1}\left( \sigma _{1},\sigma _{2}\right) &=&\int_{S_{1}\times
S_{2}}u_{1}\left( s_{1},s_{2}\right) \times f_{1}\left( s_{1}\right) \times
f_{2}\left( s_{2}\right) d\mu _{I}\left( s_{1},s_{2}\right) \\
&=&\int_{[0,+\infty )\times \lbrack 0,+\infty )}s_{1}s_{2}\times
e^{-s_{1}}\times e^{-s_{2}}d\mu _{I}\left( s_{1},s_{2}\right) \\
&=&\int \int_{[0,+\infty )\times \lbrack 0,+\infty )}s_{1}s_{2}\times
e^{-s_{1}}\times e^{-s_{2}}ds_{1}ds_{2}\quad \because \text{多重リーマン積分} \\
&=&\int_{0}^{+\infty }e^{-s_{2}}\left( \int_{0}^{+\infty }s_{1}s_{2}\times
e^{-s_{1}}ds_{1}\right) ds_{2}\quad \because \text{逐次積分} \\
&=&\int_{0}^{+\infty }e^{-s_{2}}s_{2}ds_{2}\quad \because \text{部分積分より}\int_{0}^{+\infty
}s_{1}e^{-s_{1}}ds_{1}=1 \\
&=&1\quad \because \text{部分積分}
\end{eqnarray*}となります。

 

演習問題

問題(一様分布にもとづく混合戦略)
戦略型ゲーム\(G\)のプレイヤー集合が、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}であるとともに、純粋戦略集合が、\begin{equation*}
S_{1}=S_{2}=\left[ 0,1\right] \end{equation*}であるものとします。任意のプレイヤー\(i\in I\)は、それぞれの\(s_{i}\in \left[ 0,1\right] \)に対して、\begin{equation*}f_{i}\left( s_{i}\right) =1
\end{equation*}を定めるボレル測度関数\(f_{i}:\mathbb{R} \supset \left[ 0,1\right] \rightarrow \mathbb{R} \)にもとづく混合戦略\(\sigma _{1},\sigma _{2}\)を選択するものとします。プレイヤー\(1\)の利得関数が、\begin{equation*}u_{1}\left( s_{1},s_{2}\right) =s_{1}s_{2}
\end{equation*}である場合のプレイヤー\(1\)の期待利得\(F_{1}\left( \sigma _{1},\sigma _{2}\right) \)を求めてください。
解答を見る

会員専用コンテンツです
ログイン】【会員登録

問題(一様分布にもとづく混合戦略)
戦略型ゲーム\(G\)のプレイヤー集合が、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}であるとともに、純粋戦略集合が、\begin{equation*}
S_{1}=S_{2}=\left[ 0,1\right] \end{equation*}であるものとします。プレイヤー\(1,2\)は、それぞれの\(s_{1},s_{2}\in \left[ 0,1\right] \)に対して、\begin{eqnarray*}f_{1}\left( s_{1}\right) &=&2s_{1} \\
f_{2}\left( s_{2}\right) &=&1
\end{eqnarray*}を定めるボレル測度関数\(f_{1},f_{2}:\mathbb{R} \supset \left[ 0,1\right] \rightarrow \mathbb{R} \)にもとづく混合戦略\(\sigma _{1},\sigma _{2}\)を選択するものとします。プレイヤー\(1\)の利得関数が、\begin{equation*}u_{1}\left( s_{1},s_{2}\right) =s_{1}s_{2}
\end{equation*}である場合のプレイヤー\(1\)の期待利得\(F_{1}\left( \sigma _{1},\sigma _{2}\right) \)を求めてください。
解答を見る

会員専用コンテンツです
ログイン】【会員登録

問題(一様分布にもとづく混合戦略)
戦略型ゲーム\(G\)のプレイヤー集合が、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}であるとともに、純粋戦略集合が、\begin{equation*}
S_{1}=S_{2}=[0,+\infty )
\end{equation*}であるものとします。任意のプレイヤー\(i\in I\)は、それぞれの\(s_{i}\in\lbrack 0,+\infty )\)に対して、\begin{equation*}f_{i}\left( s_{i}\right) =e^{-s_{i}}
\end{equation*}を定めるボレル測度関数\(f_{i}:\mathbb{R} \supset \lbrack 0,+\infty )\rightarrow \mathbb{R} \)にもとづく混合戦略\(\sigma _{1},\sigma _{2}\)を選択するものとします。プレイヤー\(1\)の利得関数が、\begin{equation*}u_{1}\left( s_{1},s_{2}\right) =s_{1}+2s_{2}
\end{equation*}である場合のプレイヤー\(1\)の期待利得\(F_{1}\left( \sigma _{1},\sigma _{2}\right) \)を求めてください。
解答を見る

会員専用コンテンツです
ログイン】【会員登録

問題(一様分布にもとづく混合戦略)
戦略型ゲーム\(G\)のプレイヤー集合が、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}であるとともに、純粋戦略集合が、\begin{equation*}
S_{1}=S_{2}=\left[ 0,1\right] \end{equation*}であるものとします。任意のプレイヤー\(i\in I\)は、それぞれの\(s_{i}\in \left[ 0,1\right] \)に対して、\begin{equation*}f_{i}\left( s_{i}\right) =1
\end{equation*}を定めるボレル測度関数\(f_{i}:\mathbb{R} \supset \left[ 0,1\right] \rightarrow \mathbb{R} \)にもとづく混合戦略\(\sigma _{1},\sigma _{2}\)を選択するものとします。プレイヤー\(1\)の利得関数が、\begin{equation*}u_{1}\left( s_{1},s_{2}\right) =\min \left\{ s_{1},s_{2}\right\}
\end{equation*}である場合のプレイヤー\(1\)の期待利得\(F_{1}\left( \sigma _{1},\sigma _{2}\right) \)を求めてください。
解答を見る

会員専用コンテンツです
ログイン】【会員登録

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

WIISでは、年齢・性別・学歴・職業・社会的立場などにかかわらず、すべてのユーザーが「学ぶ人」として対等であると考えています。ここは、知識を競う場所ではなく、互いに尊重し合いながら理解を深めていく場です。安心して思考し、質問し、考え続けられる環境を、みなさんと一緒につくっていきたいと考えています。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

会員専用コンテンツです
ログイン】【会員登録