WIIS

完備情報の動学ゲーム

行動戦略のもとでのノードへの到達可能性と期待利得

目次

関連知識

Mailで保存
Xで共有

ノードへの到達可能性

問題としている戦略的状況が完備情報の動学ゲームであり、それが展開型ゲーム\(\Gamma \)として表現されているものとします。このゲーム\(\Gamma \)においてプレイヤーたちが選択する行動戦略からなる組が\(b_{I}\in B_{I}\)である場合にノード\(x\in X\)へ到達する確率を、\begin{equation*}P\left( x|b_{I}\right)
\end{equation*}で表記します。頂点\(z\in Z\)もまたノードであるため、行動戦略の組\(b_{I}\)のもとで頂点\(z\)へ到達する確率は、\begin{equation*}P\left( z|b_{I}\right)
\end{equation*}と表記されます。この確率をどのように導出すればよいのでしょうか。順番に解説します。

初期点\(x_{0}\in X\)からノード\(x\)への経路が、\begin{equation}x_{0}\rightarrow x_{1}\rightarrow \cdots \rightarrow x_{n-1}\rightarrow
x_{n}\rightarrow x \quad \cdots (1)
\end{equation}であるものとします。ゲームの木は根付有向木であるため上の経路は一意的です。具体的には、\(x\)の直前に起こる手番\(x_{n}\)は一意的であり、そこで意思決定を行うプレイヤー\(i\left( x_{n}\right) \)は行動\(a\left( x\right) \)を選択します。同様に、\(x_{n}\)の直前に起こる手番\(x_{n-1}\)は一意的であり、そこで意思決定を行うプレイヤー\(i\left( x_{n-1}\right) \)は行動\(a\left( x_{n}\right) \)を選択します。それ以前の手番についても同様であり、結局、\(x_{1}\)の直前に起こる手番\(x_{0}\)すなわち初期点は一意的であるため、そこで意思決定を行うプレイヤー\(i\left( x_{0}\right) \)は行動\(a\left(x_{1}\right) \)を選択します。以上を踏まえると、行動戦略の組\(b_{I}\)のもとでノード\(x\)へ到達する確率\(P\left( x|b_{I}\right) \)を求めるためには、\(x\)への経路上にあるそれぞれの手番\(x_{m}\ \left( m=0,\cdots ,n\right) \)において、そこで意思決定を行うプレイヤー\(i\left( x_{m}\right) \)が自身の行動戦略\(b_{i\left( x_{m}\right) }\)のもとで行動\(a\left( x_{m}\right) \)を選択する確率をとった上で、それらの確率の積をとればよいということになります。

以上を踏まえた上で、ノード\(x\in X\)と、それより前(直前とは限らない)に起こる手番\(x^{\prime }\in X\backslash Z\)をそれぞれ任意に選びます。\(x^{\prime }\)において意思決定を行うプレイヤーが\(i\)であるものとします。つまり、\(i=i\left( x^{\prime }\right) \)であるということです。ゲームの木は根付有向木であるため、ノード\(x\)へ到達するために手番\(x^{\prime }\)においてプレイヤー\(i\)が選択する必要のある行動は一意的であるため、それを、\begin{equation*}a_{i}\left( x^{\prime }\rightarrow x\right)
\end{equation*}で表記します。ノード\(x\)への経路である\(\left(1\right) \)上にある\(n+1\)個の手番\(x_{0},x_{1},\cdots ,x_{n-1},x_{n}\)の中でも、プレイヤー\(i\)が意思決定を行う手番の個数を\(L_{i}^{x}\ \left( \leq n+1\right) \)で表記します。その上で、それらの手番を初期点から近い順に、\begin{equation}x_{i}^{1},\ x_{i}^{2},\cdots ,\ x_{i}^{L_{i}^{x}} \quad \cdots (2)
\end{equation}で表記します。ゲームがノード\(x\)へ到達するためには、それぞれのプレイヤー\(i\)は以上の\(L_{i}^{x}\)個の手番において、以下の行動\begin{equation}a_{i}\left( x_{i}^{1}\rightarrow x\right) ,\ a_{i}\left(
x_{i}^{2}\rightarrow x\right) ,\cdots ,\ a_{i}\left(
x_{i}^{L_{i}^{x}}\rightarrow x\right) \quad \cdots (3)
\end{equation}をそれぞれ選ぶ必要があります。

プレイヤー\(i\in I\)が行動戦略\(b_{i}\in B_{i}\)のもとで、\(\left( 2\right) \)中のすべての手番において\(\left( 3\right) \)中の行動をいずれも選択する確率を、\begin{equation*}P\left( x|b_{i}\right)
\end{equation*}で表記します。その値を具体的に特定するためには、\(\left( 2\right) \)中のそれぞれの手番\(x_{i}^{l}\ \left( l=1,2,\cdots ,L_{i}^{x}\right) \)について、それが属する情報集合\(h_{i}\left( x_{i}^{l}\right) \)において、行動集合\(b_{i}\)のもとで行動\(a_{i}\left( x_{i}^{l}\rightarrow x\right) \)が選ばれる確率$b_{i}\left(a_{i}\left( x_{i}^{l}\rightarrow x\right) |h_{i}\left( x_{i}^{l}\right)
\right) $をそれぞれとり、それらの積をとればよいため、\begin{equation*}P\left( x|B_{i}\right) =\prod_{l=1}^{L_{i}^{x}}b_{i}\left( a_{i}\left(
x_{i}^{l}\rightarrow x\right) |h_{i}\left( x_{i}^{l}\right) \right)
\end{equation*}となります。なお、ノード\(x\)の直前までの経路上にプレイヤー\(i\)の手番が存在しない場合には、すなわち、\begin{equation*}L_{i}^{x}=0
\end{equation*}である場合には、\begin{equation*}
P\left( x|b_{i}\right) =1
\end{equation*}と定めます。

プレイヤー\(0\)すなわち自然が自身の行動を規定する確率分布\(p\)のもとで、\(\left( 2\right) \)中のすべての手番において\(\left( 3\right) \)中の行動をいずれも選択する確率を、\begin{equation*}P\left( x|p\right)
\end{equation*}で表記します。なお、ノード\(x\)の直前までの経路上にプレイヤー\(0\)の手番が存在しない場合には、すなわち、\begin{equation*}L_{0}^{x}=0
\end{equation*}である場合には、\begin{equation*}
P\left( x|p\right) =1
\end{equation*}と定めます。

以上を踏まえると、行動戦略の組\(b_{I}\)(および自然の行動を規定する確率分布\(p\))のもとでゲームがノード\(x\)へ到達する確率を、\begin{eqnarray*}P\left( x|b_{I}\right) &=&P\left( x|p\right) \cdot \prod_{i\in I}P\left(
x|b_{i}\right) \\
&=&P\left( x|p\right) \cdot \prod_{i\in I}\left[
\prod_{l=1}^{L_{i}^{x}}b_{i}\left( a_{i}\left( x_{i}^{l}\rightarrow x\right)
|h_{i}\left( x_{i}^{l}\right) \right) \right] \end{eqnarray*}と表現できます。

行動戦略の組\(b_{I}\in B_{I}\)のもとでゲームがノード\(x\in X\)へ到達する可能性が正である場合には、すなわち、\begin{equation*}P\left( x|b_{I}\right) >0
\end{equation*}が成り立つ場合には、\(x\)\(b_{I}\)のもとで到達可能(reachable)であると言います。また、プレイヤー\(i\in I\)の行動戦略\(\sigma _{i}\in B_{i}\)に対して、他のプレイヤーたちの行動戦略の組\(b_{-i}\in B_{-i}\)が存在して、それらの組\(b_{I}=\left( b_{i},b_{-i}\right) \)のもとでノード\(x\in X\)が到達可能である場合には、すなわち、\begin{equation*}\exists b_{-i}\in B_{-i}:P\left( x|b_{I}\right) >0
\end{equation*}が成り立つ場合には、\(x\)\(b_{i}\)のもとで到達可能(reachable)であると言います。

情報集合\(H\in \mathcal{H}\)の中に、行動戦略の組\(b_{I}\in B_{I}\)のもとで到達可能であるようなノードが存在する場合には、すなわち、\begin{equation*}\exists x\in H:P\left( x|b_{I}\right) >0
\end{equation*}が成り立つ場合には、\(H\)\(b_{I}\)のもとで到達可能(reachable)であると言います。また、プレイヤー\(i\)の行動戦略\(b_{i}\in B_{i}\)に対して、他のプレイヤーたちの行動戦略の組\(b_{-i}\in B_{-i}\)が存在して、それらの組\(b_{I}=\left( b_{i},b_{-i}\right) \)のもとで情報集合\(H\in \mathcal{H}\)が到達可能である場合には、すなわち、\begin{equation*}\exists x\in H,\ \exists b_{-i}\in B_{-i}:P\left( x|b_{I}\right) >0
\end{equation*}が成り立つ場合には、\(H\)\(b_{i}\)のもとで到達可能(reachable)であると言います。

例(ノードへの到達可能性)
以下のゲームの木によって表現される展開型ゲーム\(\Gamma \)について考えます。ただし、利得を省略しています。

図:ゲームの木
図:ゲームの木

プレイヤー\(1\)の行動戦略の中でも、\begin{eqnarray*}b_{1} &=&\left( b_{1}\left( a_{11}|\left\{ x_{0}\right\} \right)
,b_{1}\left( a_{12}|\left\{ x_{0}\right\} \right) \right) \\
&=&\left( \frac{1}{2},\frac{1}{2}\right)
\end{eqnarray*}に注目し、プレイヤー\(2\)の行動戦略の中でも、\begin{eqnarray*}b_{2} &=&\left( \left( b_{2}\left( a_{21}|\left\{ x_{1}\right\} \right)
,b_{2}\left( a_{22}|\left\{ x_{1}\right\} \right) \right) ,\left(
b_{2}\left( a_{21}|\left\{ x_{2}\right\} \right) ,b_{2}\left( a_{22}|\left\{
x_{2}\right\} \right) \right) \right) \\
&=&\left( \left( \frac{1}{2},\frac{1}{2}\right) ,\left( \frac{1}{3},\frac{2}{3}\right) \right)
\end{eqnarray*}に注目します。以上の行動戦略の組\(b_{I}=\left(b_{1},b_{2}\right) \)のもとでゲームがそれぞれのノードへ到達する確率は、\begin{eqnarray*}P\left( x_{1}|b_{I}\right) &=&P\left( x_{1}|b_{1}\right) =\frac{1}{2} \\
P\left( x_{2}|b_{I}\right) &=&P\left( x_{2}|b_{1}\right) =\frac{1}{2} \\
P\left( z_{1}|b_{I}\right) &=&P\left( z_{1}|b_{1}\right) \cdot P\left(
z_{1}|b_{2}\right) =\frac{1}{2}\cdot \frac{1}{2}=\frac{1}{4} \\
P\left( z_{2}|b_{I}\right) &=&P\left( z_{2}|b_{1}\right) \cdot P\left(
z_{2}|b_{2}\right) =\frac{1}{2}\cdot \frac{1}{2}=\frac{1}{4} \\
P\left( z_{3}|b_{I}\right) &=&P\left( z_{3}|b_{1}\right) \cdot P\left(
z_{3}|b_{2}\right) =\frac{1}{2}\cdot \frac{1}{3}=\frac{1}{6} \\
P\left( z_{4}|b_{I}\right) &=&P\left( z_{4}|b_{1}\right) \cdot P\left(
z_{4}|b_{2}\right) =\frac{1}{2}\cdot \frac{2}{3}=\frac{1}{3}
\end{eqnarray*}となります。つまり、\(b_{I}\)のもとではすべてのノードと情報集合が到達可能です。

例(ノードへの到達可能性)
以下のゲームの木によって表現される展開型ゲーム\(\Gamma \)について考えます。ただし、利得を省略しています。

図:ゲームの木
図:ゲームの木

プレイヤー\(1\)の行動戦略の中でも、\begin{eqnarray*}b_{1} &=&\left( \left( b_{1}\left( a_{11}|\left\{ x_{1}\right\} \right)
,b_{1}\left( a_{12}|\left\{ x_{1}\right\} \right) \right) ,\left(
b_{1}\left( a_{13}|\left\{ x_{2}\right\} \right) ,b_{1}\left( a_{14}|\left\{
x_{2}\right\} \right) \right) \right) \\
&=&\left( \left( \frac{1}{2},\frac{1}{2}\right) ,\left( \frac{1}{3},\frac{2}{3}\right) \right)
\end{eqnarray*}に注目し、プレイヤー\(2\)の行動戦略の中でも、\begin{eqnarray*}b_{2} &=&\left( \left( b_{2}\left( a_{21}|\left\{ x_{3},x_{4}\right\}
\right) ,b_{2}\left( a_{22}|\left\{ x_{3},x_{4}\right\} \right) \right)
,\left( b_{2}\left( a_{23}|\left\{ x_{5},x_{6}\right\} \right) ,b_{2}\left(
a_{24}|\left\{ x_{5},x_{6}\right\} \right) \right) \right) \\
&=&\left( \left( \frac{1}{4},\frac{3}{4}\right) ,\left( \frac{1}{5},\frac{4}{5}\right) \right)
\end{eqnarray*}に注目します。自然による確率分布\begin{equation*}
p\left( \left\{ x_{0}\right\} ,a_{01}\right) =p\left( \left\{ x_{0}\right\}
,a_{02}\right) =\frac{1}{2}
\end{equation*}と以上の行動戦略の組\(b_{I}=\left( b_{1},b_{2}\right) \)のもとでゲームがそれぞれのノードへ到達する確率は、\begin{eqnarray*}P\left( x_{1}|b_{I}\right) &=&P\left( x_{1}|p\right) =\frac{1}{2} \\
P\left( x_{2}|b_{I}\right) &=&P\left( x_{2}|p\right) =\frac{1}{2} \\
P\left( x_{3}|b_{I}\right) &=&P\left( x_{3}|p\right) \cdot P\left(
x_{3}|b_{1}\right) =\frac{1}{2}\cdot \frac{1}{2}=\frac{1}{4} \\
P\left( x_{4}|b_{I}\right) &=&P\left( x_{4}|p\right) \cdot P\left(
x_{4}|b_{1}\right) =\frac{1}{2}\cdot \frac{1}{2}=\frac{1}{4} \\
P\left( x_{5}|b_{I}\right) &=&P\left( x_{5}|p\right) \cdot P\left(
x_{5}|b_{1}\right) =\frac{1}{2}\cdot \frac{1}{3}=\frac{1}{6} \\
P\left( x_{6}|b_{I}\right) &=&P\left( x_{6}|p\right) \cdot P\left(
x_{6}|b_{1}\right) =\frac{1}{2}\cdot \frac{2}{3}=\frac{1}{3} \\
P\left( z_{1}|b_{I}\right) &=&P\left( z_{1}|p\right) \cdot P\left(
z_{1}|b_{1}\right) \cdot P\left( z_{1}|b_{2}\right) =\frac{1}{2}\cdot \frac{1}{2}\cdot \frac{1}{4}=\frac{1}{16} \\
P\left( z_{2}|b_{I}\right) &=&P\left( z_{2}|p\right) \cdot P\left(
z_{2}|b_{1}\right) \cdot P\left( z_{2}|b_{2}\right) =\frac{1}{2}\cdot \frac{1}{2}\cdot \frac{3}{4}=\frac{3}{16} \\
P\left( z_{3}|b_{I}\right) &=&P\left( z_{3}|p\right) \cdot P\left(
z_{3}|b_{1}\right) \cdot P\left( z_{3}|b_{2}\right) =\frac{1}{2}\cdot \frac{1}{2}\cdot \frac{1}{4}=\frac{1}{16} \\
P\left( z_{4}|b_{I}\right) &=&P\left( z_{4}|p\right) \cdot P\left(
z_{4}|b_{1}\right) \cdot P\left( z_{4}|b_{2}\right) =\frac{1}{2}\cdot \frac{1}{2}\cdot \frac{3}{4}=\frac{3}{16} \\
P\left( z_{5}|b_{I}\right) &=&P\left( z_{5}|p\right) \cdot P\left(
z_{5}|b_{1}\right) \cdot P\left( z_{5}|b_{2}\right) =\frac{1}{2}\cdot \frac{1}{3}\cdot \frac{1}{5}=\frac{1}{30} \\
P\left( z_{6}|b_{I}\right) &=&P\left( z_{6}|p\right) \cdot P\left(
z_{6}|b_{1}\right) \cdot P\left( z_{6}|b_{2}\right) =\frac{1}{2}\cdot \frac{1}{3}\cdot \frac{4}{5}=\frac{2}{15} \\
P\left( z_{7}|b_{I}\right) &=&P\left( z_{7}|p\right) \cdot P\left(
z_{7}|b_{1}\right) \cdot P\left( z_{7}|b_{2}\right) =\frac{1}{2}\cdot \frac{2}{3}\cdot \frac{1}{5}=\frac{1}{15} \\
P\left( z_{8}|b_{I}\right) &=&P\left( z_{8}|p\right) \cdot P\left(
z_{8}|b_{1}\right) \cdot P\left( z_{8}|b_{2}\right) =\frac{1}{2}\cdot \frac{2}{3}\cdot \frac{4}{5}=\frac{4}{15}
\end{eqnarray*}となります。つまり、\(b_{I}\)のもとではすべてのノードと情報集合が到達可能です。

 

期待利得

展開型ゲーム\(\Gamma \)においてプレイヤーたちが行動戦略の組\(b_{I}\)を選ぶと、ゲームが頂点\(z\)へ到達する確率が、\begin{equation*}P\left( z|b_{I}\right) =P\left( z|p\right) \cdot \prod_{i\in I}P\left(
z|b_{i}\right)
\end{equation*}として定まるため、行動戦略の組\(b_{I}\)が与えられたとき、それぞれの頂点\(z\in Z\)に対して、ゲームがそこへ到達する確率\(P\left( z|b_{I}\right) \)を定める確率関数\begin{equation*}P\left( \cdot |b_{I}\right) :Z\rightarrow \mathbb{R} \end{equation*}が定義可能です。これをクジ(lottery)と呼びます。確率関数の定義より、\(P\left( \cdot |b_{I}\right) \)は以下の2つの性質\begin{eqnarray*}&&\left( a\right) \ \forall z\in Z:0\leq P\left( z|b_{I}\right) \leq 1 \\
&&\left( b\right) \ \sum_{z\in Z}P\left( z|b_{I}\right) =1
\end{eqnarray*}を満たします。条件\(\left( a\right) \)は、行動戦略の組\(b_{I}\)のもとでゲームが頂点\(z\)へ到達する確率は\(0\)以上\(1\)以下であることを意味します。条件\(\left( b\right) \)は、行動戦略の組\(b_{I}\)のもとでゲームがそれぞれの頂点へ到達する確率を特定し、それらの総和をとると\(1\)になることを意味します。

展開型ゲーム\(\Gamma \)においてプレイヤーたちが行動戦略の組\(b_{I}\)を採用する場合、最終的にどの頂点に到達するかを事前に特定できないため、プレイヤーたちは不確実な状況に直面します。そこで、そのような状況をクジ\(P\left( \cdot |b_{I}\right) \)として表現します。クジ\(P\left( \cdot |b_{I}\right) \)は行動戦略\(b_{I}\)のもとでゲームがそれぞれの頂点\(z\)へ到達する確率\(P\left(z|b_{I}\right) \)を特定しますが、これは行動戦略の組\(b_{I}\)のもとでプレイヤーたちが直面する不確実な状況を表しています。

クジが変化すればプレイヤーたちは以前とは異なる不確実な状況に直面するため、プレイヤーたちが行動戦略を採用する場合、それぞれのプレイヤーはクジどうしを比較する選好を持っているものと考えるべきです。さらに言えば、行動戦略の組が与えられればそれに対して1つのクジが定まるため、結局、プレイヤーがクジを比較する選好を、行動戦略の組どうしを比較する\(B_{I}\)上の選好関係と同一視しても一般性は失われません。

具体的には、展開型ゲーム\(\Gamma \)として表現される完備情報の動学ゲームにおいてプレイヤーたちが行動戦略を採用するとき、プレイヤー\(i\)が直面し得る不確実な状況どうしを比較する選好関係は、プレイヤーたちが選ぶ行動戦略からなる組の集合\(B_{I}\)上の二項関係\(\succsim _{i}\)として定式化されます。その上で、行動戦略からなる2つの組\(b_{I},b_{I}^{\prime }\in B_{I}\)に対して\(b_{I}\succsim _{i}b_{I}^{\prime }\)が成り立つ場合には、プレイヤー\(i\)は\(b_{I}\)のもとで直面する不確実な状況を、\(b_{I}^{\prime }\)のもとで直面する不確実な状況以上に望ましいものと考えているものと解釈します。

プレイヤー\(i\)が不確実な状況どうしを比較する\(B_{I}\)上の選好関係\(\succsim _{i}\)が与えられたとき、それに対して関数\(U_{i}:B_{I}\rightarrow \mathbb{R} \)が存在して、行動戦略の任意の組\(b_{I},b_{I}^{\prime }\in B_{I}\)に対して、\begin{equation*}b_{I}\succsim _{i}b_{I}^{\prime }\Leftrightarrow U_{i}\left( b_{I}\right)
\geq U_{i}\left( b_{I}^{\prime }\right)
\end{equation*}という関係が成り立つ場合には、\(U_{i}\)のことを\(\succsim _{i}\)を表す期待利得関数(expected utility function)と呼びます。さらに、プレイヤー\(i\)の期待利得関数\(U_{i}\)が行動戦略の組\(b_{I}\)に対して定める値\(U_{i}\left( b_{I}\right) \)を、プレイヤー\(i\)が\(b_{I}\)から得る期待利得(expected utility)と呼びます。

プレイヤー\(i\)の選好関係\(\succsim _{i}\)に対して、それを表す期待利得関数\(U_{i}\)が存在する場合には、それぞれの\(b_{I}\in B_{I}\)に対して、\begin{equation*}U_{i}\left( b_{I}\right) =\sum_{z\in Z}\left[ P\left( z|b_{I}\right) \cdot
u_{i}\left( z\right) \right] \end{equation*}を値として定めます。ただし、\(u_{i}:Z\rightarrow \mathbb{R} \)はプレイヤー\(i\)の利得関数です。これは何を意味しているのでしょうか。プレイヤーたちが選択する行動戦略からなる組が\(b_{I}\)であるとき、ゲームは確率\(P\left( z|b_{I}\right) \)で頂点\(z\)へ到達し、その頂点においてプレイヤー\(i\)は利得\(u_{i}\left( z\right) \)を得るため、\(b_{I}\)のもとでプレイヤー\(i\)が\(z\)から得る利得の期待値は\(P\left( z|b_{I}\right) \cdot u_{i}\left( z\right) \)となります。これをすべての頂点\(z\)に関して導出した上で総和をとれば、\(b_{I}\)のもとでプレイヤー\(i\)が直面する期待利得\(U_{i}\left( b_{I}\right) \)が得られます。

例(期待利得)
以下のゲームの木によって表現される展開型ゲーム\(\Gamma \)について考えます。ただし、利得を省略しています。

図:ゲームの木
図:ゲームの木

プレイヤー\(1\)の行動戦略の中でも、\begin{eqnarray*}b_{1} &=&\left( b_{1}\left( a_{11}|\left\{ x_{0}\right\} \right)
,b_{1}\left( a_{12}|\left\{ x_{0}\right\} \right) \right) \\
&=&\left( \frac{1}{2},\frac{1}{2}\right)
\end{eqnarray*}に注目し、プレイヤー\(2\)の行動戦略の中でも、\begin{eqnarray*}b_{2} &=&\left( \left( b_{2}\left( a_{21}|\left\{ x_{1}\right\} \right)
,b_{2}\left( a_{22}|\left\{ x_{1}\right\} \right) \right) ,\left(
b_{2}\left( a_{21}|\left\{ x_{2}\right\} \right) ,b_{2}\left( a_{22}|\left\{
x_{2}\right\} \right) \right) \right) \\
&=&\left( \left( \frac{1}{2},\frac{1}{2}\right) ,\left( \frac{1}{3},\frac{2}{3}\right) \right)
\end{eqnarray*}に注目します。先に明らかにしたように、以上の行動戦略の組\(b_{I}=\left( b_{1},b_{2}\right) \)のもとでゲームがそれぞれの頂点へ到達する確率は、\begin{eqnarray*}P\left( z_{1}|b_{I}\right) &=&P\left( z_{1}|b_{1}\right) \cdot P\left(
z_{1}|b_{2}\right) =\frac{1}{2}\cdot \frac{1}{2}=\frac{1}{4} \\
P\left( z_{2}|b_{I}\right) &=&P\left( z_{2}|b_{1}\right) \cdot P\left(
z_{2}|b_{2}\right) =\frac{1}{2}\cdot \frac{1}{2}=\frac{1}{4} \\
P\left( z_{3}|b_{I}\right) &=&P\left( z_{3}|b_{1}\right) \cdot P\left(
z_{3}|b_{2}\right) =\frac{1}{2}\cdot \frac{1}{3}=\frac{1}{6} \\
P\left( z_{4}|b_{I}\right) &=&P\left( z_{4}|b_{1}\right) \cdot P\left(
z_{4}|b_{2}\right) =\frac{1}{2}\cdot \frac{2}{3}=\frac{1}{3}
\end{eqnarray*}であるため、この\(b_{I}\)においてプレイヤー\(1\)が直面する期待利得は、\begin{eqnarray*}U_{1}\left( b_{I}\right) &=&\prod_{i=1}^{4}P\left( z_{i}|b_{I}\right) \cdot
u_{1}\left( z_{i}\right) \\
&=&2\cdot \frac{1}{4}+1\cdot \frac{1}{4}+3\cdot \frac{1}{6}+1\cdot \frac{1}{3} \\
&=&\frac{19}{12}
\end{eqnarray*}であり、プレイヤー\(2\)が直面する期待利得は、\begin{eqnarray*}U_{2}\left( b_{I}\right) &=&\prod_{i=1}^{4}P\left( z_{i}|b_{I}\right) \cdot
u_{2}\left( z_{i}\right) \\
&=&1\cdot \frac{1}{4}+2\cdot \frac{1}{4}+1\cdot \frac{1}{6}+3\cdot \frac{1}{3} \\
&=&\frac{23}{12}
\end{eqnarray*}となります。

例(ノードへの到達可能性)
以下のゲームの木によって表現される展開型ゲーム\(\Gamma \)について考えます。ただし、利得を省略しています。

図:ゲームの木
図:ゲームの木

プレイヤー\(1\)の行動戦略の中でも、\begin{eqnarray*}b_{1} &=&\left( \left( b_{1}\left( a_{11}|\left\{ x_{1}\right\} \right)
,b_{1}\left( a_{12}|\left\{ x_{1}\right\} \right) \right) ,\left(
b_{1}\left( a_{13}|\left\{ x_{2}\right\} \right) ,b_{1}\left( a_{14}|\left\{
x_{2}\right\} \right) \right) \right) \\
&=&\left( \left( \frac{1}{2},\frac{1}{2}\right) ,\left( \frac{1}{3},\frac{2}{3}\right) \right)
\end{eqnarray*}に注目し、プレイヤー\(2\)の行動戦略の中でも、\begin{eqnarray*}b_{2} &=&\left( \left( b_{2}\left( a_{21}|\left\{ x_{3},x_{4}\right\}
\right) ,b_{2}\left( a_{22}|\left\{ x_{3},x_{4}\right\} \right) \right)
,\left( b_{2}\left( a_{23}|\left\{ x_{5},x_{6}\right\} \right) ,b_{2}\left(
a_{24}|\left\{ x_{5},x_{6}\right\} \right) \right) \right) \\
&=&\left( \left( \frac{1}{4},\frac{3}{4}\right) ,\left( \frac{1}{5},\frac{4}{5}\right) \right)
\end{eqnarray*}に注目します。先に明らかにしたように、自然による確率分布\begin{equation*}
p\left( \left\{ x_{0}\right\} ,a_{01}\right) =p\left( \left\{ x_{0}\right\}
,a_{02}\right) =\frac{1}{2}
\end{equation*}と以上の行動戦略の組\(b_{I}=\left( b_{1},b_{2}\right) \)のもとでゲームがそれぞれの頂点へ到達する確率は、\begin{eqnarray*}P\left( z_{1}|b_{I}\right) &=&P\left( z_{1}|p\right) \cdot P\left(
z_{1}|b_{1}\right) \cdot P\left( z_{1}|b_{2}\right) =\frac{1}{2}\cdot \frac{1}{2}\cdot \frac{1}{4}=\frac{1}{16} \\
P\left( z_{2}|b_{I}\right) &=&P\left( z_{2}|p\right) \cdot P\left(
z_{2}|b_{1}\right) \cdot P\left( z_{2}|b_{2}\right) =\frac{1}{2}\cdot \frac{1}{2}\cdot \frac{3}{4}=\frac{3}{16} \\
P\left( z_{3}|b_{I}\right) &=&P\left( z_{3}|p\right) \cdot P\left(
z_{3}|b_{1}\right) \cdot P\left( z_{3}|b_{2}\right) =\frac{1}{2}\cdot \frac{1}{2}\cdot \frac{1}{4}=\frac{1}{16} \\
P\left( z_{4}|b_{I}\right) &=&P\left( z_{4}|p\right) \cdot P\left(
z_{4}|b_{1}\right) \cdot P\left( z_{4}|b_{2}\right) =\frac{1}{2}\cdot \frac{1}{2}\cdot \frac{3}{4}=\frac{3}{16} \\
P\left( z_{5}|b_{I}\right) &=&P\left( z_{5}|p\right) \cdot P\left(
z_{5}|b_{1}\right) \cdot P\left( z_{5}|b_{2}\right) =\frac{1}{2}\cdot \frac{1}{3}\cdot \frac{1}{5}=\frac{1}{30} \\
P\left( z_{6}|b_{I}\right) &=&P\left( z_{6}|p\right) \cdot P\left(
z_{6}|b_{1}\right) \cdot P\left( z_{6}|b_{2}\right) =\frac{1}{2}\cdot \frac{1}{3}\cdot \frac{4}{5}=\frac{2}{15} \\
P\left( z_{7}|b_{I}\right) &=&P\left( z_{7}|p\right) \cdot P\left(
z_{7}|b_{1}\right) \cdot P\left( z_{7}|b_{2}\right) =\frac{1}{2}\cdot \frac{2}{3}\cdot \frac{1}{5}=\frac{1}{15} \\
P\left( z_{8}|b_{I}\right) &=&P\left( z_{8}|p\right) \cdot P\left(
z_{8}|b_{1}\right) \cdot P\left( z_{8}|b_{2}\right) =\frac{1}{2}\cdot \frac{2}{3}\cdot \frac{4}{5}=\frac{4}{15}
\end{eqnarray*}であるため、この\(b_{I}\)においてプレイヤー\(1\)が直面する期待利得は、\begin{eqnarray*}U_{1}\left( b_{I}\right) &=&\prod_{i=1}^{8}P\left( z_{i}|b_{I}\right) \cdot
u_{1}\left( z_{i}\right) \\
&=&2\cdot \frac{1}{16}+1\cdot \frac{3}{16}+3\cdot \frac{1}{16}+1\cdot \frac{3}{16}+4\cdot \frac{1}{30}+1\cdot \frac{2}{15}+5\cdot \frac{1}{15}+1\cdot
\frac{4}{15} \\
&=&\frac{373}{240}
\end{eqnarray*}であり、プレイヤー\(2\)が直面する期待利得は、\begin{eqnarray*}U_{2}\left( b_{I}\right) &=&\prod_{i=1}^{8}P\left( z_{i}|b_{I}\right) \cdot
u_{2}\left( z_{i}\right) \\
&=&1\cdot \frac{1}{16}+2\cdot \frac{3}{16}+1\cdot \frac{1}{16}+3\cdot \frac{3}{16}+1\cdot \frac{1}{30}+4\cdot \frac{2}{15}+1\cdot \frac{1}{15}+5\cdot
\frac{4}{15} \\
&=&\frac{727}{240}
\end{eqnarray*}となります。

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員専用コンテンツです
ログイン】【会員登録