教材一覧
教材検索
DYNAMIC GAME OF COMPLETE INFORMATION

展開型ゲーム

目次

< 前のページ
Share on twitter
Twitterで共有
Share on email
メールで共有

完備情報の動学ゲーム

ゲーム理論(game theory)は戦略的相互依存性(strategic interdependence)が存在する状況を分析対象とする学問です。戦略的相互依存性が存在する状況とは、複数の主体が関わり合う場面において、それぞれの主体が最終的に直面する結果が自身の行動だけによって決まるのではなく、他の主体による行動にも依存するような状況を指します。戦略的相互依存関係が成立する状況をモデル化する際には、以下の要素を具体的に記述します。

  1. ゲームにおいて意思決定を行う主体は誰か。つまり、ゲームのプレイヤー(player)は誰か。
  2. プレイヤーたちはどのような順番(turn)で意思決定を行うか。
  3. プレイヤーたちが意思決定を行う際にどのような選択肢が与えられているか。つまり、プレイヤーたちはどのような行動(action)を選択可能か。
  4. プレイヤーが意思決定を行う際にどのような情報(information)が与えられているか。
  5. プレイヤーたちが意思決定を行う帰結として、どのような結果(outcome)が起こり得るか。
  6. プレイヤーたちはそれぞれの結果をどのように評価しているか。すなわち、プレイヤーはどのような利得(payoff)の体系を持っているか。

以上の要素をゲームのルール(rule)と呼びます。ゲームの開始後、それぞれの「プレイヤー」は自身が行動する「順番」になったら、その時点においてアクセス可能な「情報」を活用しつつ、何らかの行動原理にもとづいて、与えられた選択肢の中から特定の「行動」を選択します。すべてのプレイヤーによる意志決定が終了したら、プレイヤーたちが選んだ行動の組み合わせに応じて特定の「結果」が実現し、それぞれのプレイヤーは実現した結果から「利得」を得ます。

戦略的相互依存関係に直面したプレイヤーたちは、自身にとってより望ましい結果を導くために、最終的な意志決定を行う前に交渉を行う可能性があります。事前交渉の結果に対してプレイヤーたちの間に拘束的な合意が成立するのであれば、プレイヤーたちはグループを作って互いに協力的な意志決定を行う可能性があります。そして、その場合の意思決定は、プレイヤーたちの間に拘束的な合意が成立しない場合の意思決定とは異なるものになり得ます。ですから、戦略的相互依存関係を分析する際には、プレイヤーたちの間に拘束的な合意が成立するか否かを事前に明らかにしておく必要があります。本節の分析対象である非協力ゲーム(non-cooperative game)とは、プレイヤーたちの間に拘束的な合意が成立しないようなゲームです。非協力ゲームではプレイヤーたちの間に拘束的な合意が成立しないため、それぞれのプレイヤーは他のプレイヤーによる意志決定から独立した形で自身の意思決定を行います。したがって、非協力ゲームを「プレイヤーたちがそれぞれ独立に意志決定を行うゲーム」と定義することもできます。

ゲームに参加するプレイヤーが順番に意思決定を行うとき、そのゲームを動学ゲーム(dynamic game)や逐次手番ゲーム(sequential game)などと呼びます。本節の分析対象は動学ゲームです。

戦略的相互依存関係に直面したそれぞれのプレイヤーは、自分が直面しているゲームのルールを常に正確に把握できるとは限りません。戦略的相互依存関係を分析する際には、それぞれのプレイヤーがゲームのルールにどの程度精通しているかを事前に明らかにしておく必要があります。問題としているゲームのルールのすべての要素からなる集合を\(P\)で表記します。すべてのプレイヤーがゲームのルールを完全に知っている場合、すなわちすべてのプレイヤーが\(P\)を知っている場合、その事実を\(P_{1}\)で表記します。また、すべてのプレイヤーが事実\(P_{1}\)を知っているという事実を\(P_{2}\)で表記します。事実\(P_{3},P_{4},\cdots \)についても同様に考えます。その上で、無限個の事実\(P_{1},P_{2},P_{3},P_{4},\cdots \)が成立する場合、ゲームのルールに相当する事実\(P\)はプレイヤーたちにとって共有知識(common knowledge)であると言います。本節の分析対象である完備情報ゲーム(game ofcomplete information)とは、ゲームのルールのすべての要素がすべてのプレイヤーにとって共有知識であるようなゲームです。

本節の分析対象は非協力かつ動学かつ完備情報であるようなゲームです。これを完備情報の動学ゲーム(dynamic games of complete information)と呼びます。完備情報の動学ゲームを具体的に記述するためにはゲームのルール、すなわち「プレイヤー」「順番」「行動」「情報」「結果」「利得」を特定する必要がありますが、以下では展開型ゲーム(game in extensive form)と呼ばれるモデルを紹介します。

 

プレイヤーの表現

不完備情報の動学ゲームに参加するすべてのプレイヤーからなる集合をプレイヤー集合(player set)やプレイヤー空間(player space)などと呼び、これを\(I\)で表記します。プレイヤー集合\(I\)はすべてのプレイヤーにとっての共有知識であるものと仮定します。

\(n\)人のプレイヤーが参加するゲームを\(n\)人ゲーム(\(n\)-players game)と呼びます。その上で、\(n\)人ゲームのプレイヤー集合を\(I=\{1,2,\cdots ,n\}\)で表します。また、プレイヤー集合\(I\)に属する\(i\ \left( =1,2,\cdots ,n\right) \)番目のプレイヤーをプレイヤー\(i\)(player \(i\))と呼びます。\(i\in I\)です。

戦略的相互依存関係は複数のプレイヤーが存在することで初めて成立する状況であるため、プレイヤーの人数が複数であることはゲームの基本的な条件となります。そこで、多くの場合、プレイヤーの人数\(n\)は\(2\)以上の整数と仮定します。

プレイヤーの単位として何を採用するかは分析対象となる戦略的相互依存関係に応じて変化します。個人をプレイヤーの単位とする場合もあれば、組織や国家などをプレイヤーの単位とする場合もあります。プレイヤーの単位を決定する上で重要なことは、ゲームにおいて自律的な意思決定を行う最小単位がプレイヤーであるということです。

外生的に発生する出来事がプレイヤーの意思決定に与える影響を明示的に考慮したい場合には、そのような出来事の発生は何らかの偶然機構によって決定されるものと解釈します。そのような偶然機構を自然(nature)と呼び、これをプレイヤー\(0\)と表記します。つまり、プレイヤーの意思とは関係なく外生的に発生する出来事は、自然と呼ばれる仮想的なプレイヤーによる行動の結果としてもたらされるものと便宜的に解釈するということです。自然は何らかの確率分布にもとづいて自身の行動を決定するものとします。

例(プレイヤー集合)
将棋のプレイヤー集合は\(I=\left\{ 1,2\right\} \)です。先手と後手をランダムに決める状況を明示化したいのであれば、仮想的なプレイヤーである自然をモデルに加えることになります。つまり、自然に相当するプレイヤー\(0\)が何らかの確率分布にもとづいて先手を決定し、2人のプレイヤーはそれを観察した上で意思決定を行うという構造のモデルを分析対象とするということです。
例(プレイヤー集合)
ある独占市場への参入を検討している1つの企業による意思決定と、それに対する既存企業による意思決定を分析する場合、このゲームのプレイヤー集合は\(I=\left\{ 1,2\right\} \)となります。ただし、\(1\)は既存企業であり、\(2\)は潜在的な参入企業です。加えて、各企業が意思決定を行う際に相手企業による行動を考慮するだけでなく、経済全体の景気も考慮するような状況を明示的に分析したいのであれば、仮装的なプレイヤーである自然をモデルに加えることになります。つまり、自然に相当するプレイヤー\(0\)が何らかの確率分布にもとづいて景気の状態を外生的に決定し、両企業はそれを観察した上で意思決定を行うという構造のモデルを分析対象とするということです。

 

順番の表現(ゲームの木)

完備情報の動学ゲームに参加するプレイヤーによる意思決定の順番はゲームの木(game tree)と呼ばれる概念を用いて表現されます。以下で順番に解説します。

問題としているゲームにおいてそれぞれのプレイヤーや自然が意思決定を行う個々の局面や、ゲームが終了する個々の局面を総称してノード(node)と呼びます。ゲームを構成するすべてのノードからなる集合\(X\)で表記し、個々のノードを\(x\)で表記します。\(x\in X\)です。

ゲームにおいて起こり得るそれぞれの局面、すなわちノードどうしの時間的な前後関係を、ノード集合\(X\)上に定義された前後関係(precedence relation)と呼ばれる二項関係\(>\)を用いて表現します。具体的には、2つのノード\(x,x^{\prime }\in X\)を任意に選んだとき、\begin{equation*}x>x^{\prime }
\end{equation*}が成り立つことの意味を、以下の2つの条件\begin{eqnarray*}
&&\left( a\right) \ x^{\prime }\text{へ到達した場合、それ以前に必ず}x\text{へ到達している} \\
&&\left( b\right) \ x\text{へ到達した場合、それ以後に}x^{\prime }\text{へ到達する可能性がある}
\end{eqnarray*}がともに成り立つこととして定義します。その上で、ノード\(x,x^{\prime }\)に対して\(x>x^{\prime }\)が成り立つ場合には、そのことを、\(x\)は\(x^{\prime }\)の前に起こる(\(x\) is predecessorof \(x^{\prime }\))と表現します。同じことを、\(x^{\prime }\)は\(x\)の後に起こり得る(\(x^{\prime }\) is successor of \(x\))と言うこともできます。

異なる2つのノード\(x,x^{\prime }\in X\)を任意に選んだとき、\begin{equation*}x>x^{\prime }
\end{equation*}が成り立つとともに、それに対して、\begin{equation*}
x>x^{\prime \prime }>x^{\prime }
\end{equation*}を満たす別のノード\(x^{\prime \prime }\in X\)が存在しない場合には、\begin{eqnarray*}&&\left( a\right) \ x\text{へ到達した場合、その直前に必ず}x\text{へ到達している} \\
&&\left( b\right) \ x\text{へ到達した場合、それ直後に}x^{\prime }\text{へ到達する可能性がある}
\end{eqnarray*}がともに成り立つことを意味します。そこで、ノード\(x,x^{\prime }\)が以上の条件を満たす場合には、そのことを、\(x\)は\(x^{\prime }\)の直前に起こる(\(x\) is a immediate predecessor of \(x^{\prime }\))と表現します。同じことを、\(x^{\prime }\)は\(x\)の直後に起こり得る(\(x^{\prime }\) is a immediate successor of \(x\))と言うこともでき、それを、\begin{equation*}x\rightarrow x^{\prime }
\end{equation*}で表記します。ノード\(x,x^{\prime }\)に対して\(x\rightarrow x^{\prime }\)が成り立つ場合、そのことを\(x\)から\(x^{\prime }\)への(branch)が存在する、と表現する場合もあります。その上で、\(x\)から\(x^{\prime }\)への枝を点\(x\)から点\(x^{\prime }\)へ伸びる有向線分と同一視します。

ノード集合\(X\)上に定義された前後関係\(>\)は以下の3つの性質を満たすものと定めます。1つ目の性質は、\begin{equation*}\left( T_{1}\right) \ \forall x\in X:\lnot \left( x>x\right)
\end{equation*}というものです。つまり、局面\(x\)を任意に選んだとき、\(x\)の前後に\(x\)自身が起こり得る可能性をあらかじめ排除するということです。言い換えると、ゲームが進行する中で同一の局面が複数回到来することはないということです。以上の仮定を非反射律(antireflexive law)と呼びます。

前後関係\(>\)に対して要求する2つ目の性質は、\begin{equation*}\left( T_{2}\right) \ \forall x,x^{\prime },x^{\prime \prime }\in X:\left(
x>x^{\prime }\wedge x^{\prime }>x^{\prime \prime }\Rightarrow x>x^{\prime
\prime }\right)
\end{equation*}というものです。つまり、局面\(x,x^{\prime },x^{\prime \prime }\)を任意に選んだとき、\(x\)が\(x^{\prime }\)の前に起こり、\(x^{\prime }\)が\(x^{\prime \prime }\)の前に起こる場合には、\(x\)が\(x^{\prime \prime }\)の前に起こることが保証されます。以上の仮定を推移律(transitive law)と呼びます。推移律が成り立たない場合には、\begin{equation*}x>x^{\prime }>x^{\prime \prime }>x>x^{\prime }>x^{\prime \prime }>\cdots
\end{equation*}という形でゲームのプロセスが循環してしまう恐れがあります。推移律はそのような可能性を排除します。

ノード集合\(X\)に属する中でも、他の任意のノードの前に起こるノードを\(x_{0}\in X\)で表記し、これを初期点(initial node)と呼びます。初期点はゲームが始まる局面に相当します。定義より、\begin{equation*}\forall x\in X\backslash \left\{ x_{0}\right\} :x_{0}>x
\end{equation*}が成り立ちます。以上を踏まえた上で、前後関係\(>\)に対して要求する3つ目の性質は、初期点とは異なるノード\(x\in X\backslash \left\{ x_{0}\right\} \)を任意に選んだときに、それに対して、\begin{equation*}\left( T_{3}\right) \ \forall x^{\prime },x^{\prime \prime }\in X:\left[
\left( x^{\prime }>x\wedge x^{\prime \prime }>x\right) \Rightarrow \left(
x^{\prime }>x^{\prime \prime }\veebar x^{\prime \prime }>x^{\prime }\right) \right] \end{equation*}が成り立つというものです。ただし、\(\veebar \)は排他的論理和を表す記号です。以上の仮定は、ゲームの開始時点とは異なる局面を任意に選んだとき、それより前に起こる2つの任意の局面\(x^{\prime },x^{\prime \prime }\)について、\(x^{\prime }\)が\(x^{\prime \prime }\)より前に起こるか\(x^{\prime \prime }\)が\(x^{\prime }\)より前に起こるかのどちらか一方であることを意味します。言い換えると、ゲームの開始時点とは異なる局面を任意に選んだとき、その直前に起こる局面は一意的であるということです。

ノード集合\(X\)上に定義された前後関係\(>\)が以上の3つの性質を満たす場合、これらの組\(\left( X,>\right) \)をゲームの木(game tree)と呼びます。前後関係\(>\)が以上の3つの性質を満たすこととは、ゲームの木\(\left(X,>\right) \)が根付有向木(arborescence)と呼ばれるクラスの有向グラフ(directed graph)であることを意味します。

例(ゲームの木)
以下の有向グラフ\(\left(X,>\right) \)について考えます。

図:ゲームの木
図:ゲームの木

ノード集合は\(X=\left\{x_{1},x_{2},x_{3}\right\} \)であり、前後関係\(>\)が\(x_{1}>x_{2}>x_{3}>x_{1}\)を満たすことを図から確認できるため、\(>\)の推移律より\(x_{1}>x_{1}\)を得ます。これは\(>\)の非反射律と矛盾するため、この有向グラフはゲームの木ではありません。上図のような循環構造を持つ有向グラフはゲームの木とはみなされません。

例(ゲームの木)
以下の有向グラフ\(\left(X,>\right) \)について考えます。

図:ゲームの木
図:ゲームの木

ノード集合は\(X=\left\{x_{1},x_{2},x_{3}\right\} \)であり、前後関係\(>\)が\(x_{1}>x_{2}\)と\(x_{3}>x_{2}\)を満たすことを図から確認できますが、これは\(>\)が満たすべき性質\(\left( T_{3}\right) \)と矛盾するため、この有向グラフはゲームの木ではありません。上図のようにノードの直前に異なる複数のノードが存在する場合、そのような有向グラフはゲームの木とはみなされません。

例(ゲームの木)
以下の有向グラフ\(\left(X,>\right) \)について考えます。

図:ゲームの木
図:ゲームの木

ノード集合は\(X=\left\{x_{1},x_{2},x_{3}\right\} \)であり、前後関係\(>\)が\(x_{1}>x_{2}\)と\(x_{1}>x_{3}\)を満たすことを図から確認できますが、このとき\(>\)に要求される性質がすべて満たされるため(確認してください)、この有向グラフはゲームの木です。

ゲームの木\(\left( X,>\right) \)が与えられたとき、ノード\(z\in X\)の後に起こり得るノードが存在しない場合には、すなわち、\begin{equation*}\forall x\in X:\lnot \left( z>x\right)
\end{equation*}が成り立つ場合には、\(z\)を頂点(terminal node)と呼びます。頂点はゲームが終了する局面に相当します。ゲームの木\(\left( X,>\right) \)に含まれるすべての頂点からなる集合を\(Z\)で表記し、個々の頂点を\(z\)で表記します。\(z\in Z\)かつ\(Z\subset X\)です。

ゲームの木\(\left( X,>\right) \)が与えられたとき、頂点以外のノードを手番(move)と呼びます。手番はゲームにおいて何らかのプレイヤーや自然が意思決定を行う局面に相当します。すべての手番からなる集合は\(X\backslash Z\)です。定義より、初期点もまた手番の1つです。

例(ゲームの木)
以下の有向グラフ\(\left(X,>\right) \)について考えます。

図:ゲームの木
図:ゲームの木

ノード集合は\(X=\left\{x_{0},x_{1},x_{2},z_{1},z_{2},z_{3},z_{4}\right\} \)であり、前後関係\(>\)は有向線分の集まりとして表現されていますが、\(>\)に要求される性質がすべて満たされるため(確認してください)、この有向グラフはゲームの木です。図より、\(x_{0}\)は他の任意のノードの前に起こるため、これは初期点です。上図のように、初期点を白丸で表記します。図より、ノード\(z_{1},z_{2},z_{3},z_{4}\)の後に起こり得るノードは存在しないため、これらはいずれもゲームの木の頂点です。つまり、\(Z=\left\{z_{1},z_{2},z_{3},z_{4}\right\} \)です。上図のように、頂点には印をつけません。手番集合は\(X\backslash Z=\left\{x_{1},x_{2},x_{3}\right\} \)です。上図のように、初期点以外の手番を黒丸で表記します。

ゲームの木\(\left( X,>\right) \)が与えられたとき、それぞれの手番\(x\in X\backslash Z\)に対して、そこで意思決定を行うプレイヤーを、\begin{equation*}i\left( x\right) \in I\cup \left\{ 0\right\}
\end{equation*}で表記します。その上で、それぞれの手番\(x\in X\backslash Z\)に対して\(i\left(x\right) \in I\cup \left\{ 0\right\} \)を像として定める写像\begin{equation*}i:X\backslash Z\rightarrow I\cup \left\{ 0\right\}
\end{equation*}を定義します。\(i\)を写像として定義することは、それぞれの手番において意思決定を行うプレイヤーが1人だけであることを意味します。特に、手番\(x\in X\backslash Z\)に対して、\begin{equation*}i\left( x\right) =0
\end{equation*}が成り立つ場合、すなわち手番\(x\)において意思決定を行うプレイヤーが自然である場合、そのような手番\(x\)を偶然手番(chancemove)と呼びます。

ゲームの木\(\left( X,>\right) \)と、それぞれの手番において意思決定を行うプレイヤーを特定する写像\(i:X\backslash Z\rightarrow I\cup \left\{ 0\right\} \)を特定すれば、ゲームにおいてプレイヤーたちが意思決定を行う順番を完全に記述したことになります。

ゲームの木\(\left( X,>\right) \)が与えられたとき、初期点\(x_{0}\in X\)とノード\(x\in X\)を結ぶノードと枝の系列を\(x\)への経路(path)や履歴(history)などと呼びます。例えば、ノード\(x\)への経路が、\begin{equation*}x_{0}\rightarrow x_{1}\rightarrow \cdots \rightarrow x_{n-1}\rightarrow
x_{n}\rightarrow x
\end{equation*}であるものとします。ゲームの木は根付有向木であるため、\(x\)の直前に起こるノード\(x_{n}\)は一意的であり、\(x_{n}\)の直前に起こるノード\(x_{n-1}\)は一意的であり、\(\cdots \)、\(x_{1}\)の直前に起こるノード\(x_{0}\)すなわち初期点もまた一意的であるため、\(x\)への経路は一意的です。そのような事情もあり、ノード\(x\)への経路とノード\(x\)自身を同一視しても一般性は失われません。

経路の中でも特に、頂点への経路をゲームのプレー(play)と呼びます。先と同様の理由により、頂点\(z\)へのプレーと頂点\(z\)自身を同一視することができます。ゲームのプレーとは、初期点\(x_{0}\)から始まり、それぞれのノードにおいてプレイヤーが枝を選択することによりゲームが進行し、最終的に1つの頂点に到達してゲームが終了するまでの一連の流れに相当します。

例(経路とプレー)
以下の有向グラフ\(\left(X,>\right) \)について再び考えます。

図:ゲームの木
図:ゲームの木

今度はそれぞれの手番に対して、そこで意思決定を行うプレイヤーが指定されています。図より、\begin{eqnarray*}
i\left( x_{0}\right) &=&1 \\
i\left( x_{1}\right) &=&i\left( x_{2}\right) =2
\end{eqnarray*}であることを読み取れます。上図のように、それぞれのノードにおいて意思決定を行うプレイヤーをノードの近くに記入します。

 

行動の表現

完備情報の動学ゲームにおいてプレイヤーたちに選択肢として与えられているすべての行動からなる集合をゲームの行動集合(action set)や行動空間(action space)などと呼び、これを\(A\)で表記します。手番\(x\in X\backslash Z\)を任意に選んだとき、そこで意思決定を行うプレイヤー\(i\left( x\right) \in I\cup\left\{ 0\right\} \)に与えられたすべての行動からなる集合を\(A\left( x\right) \)で表記します。これをどのように定式化できるでしょうか。

それぞれのプレイヤーは自身の手番において意思決定を行いますが、それぞれの手番において与えられている個々の行動を、その手番から伸びる個々の枝と同一視します。初期点とは異なるノード\(x\in X\backslash\left\{ x_{0}\right\} \)を任意に選ぶと、ゲームの木の定義より、この\(x\)へ向かって伸びる枝は1本だけです。したがって、枝と行動を同一視することとは、ゲームが\(x\)へ到達する直前に選ばれた1つの行動と、\(x\)に向かって伸びる1本の枝を同一視することを意味します。

以上を踏まえた上で、\(x\)へ向かって伸びる枝、すなわちゲームが\(x\)へ到達する直前に選ばれる行動を、\begin{equation*}a\left( x\right) \in A
\end{equation*}で表記します。その上で、それぞれの\(x\in X\backslash \left\{ x_{0}\right\} \)に対して\(a\left(x\right) \in A\)を像として定める写像\begin{equation*}a:X\backslash \left\{ x_{0}\right\} \rightarrow A
\end{equation*}を定義します。手番\(x\in X\backslash Z\)を任意に選んだ上で、その直後に起こり得るすべてのノードからなる集合を、\begin{equation*}Y\left( x\right) \subset X
\end{equation*}で表記します。\(x\)の直後に起こり得る異なる2つのノード\(x^{\prime },x^{\prime\prime }\in Y\left( x\right) \)を任意に選びます。\(x\)から\(x^{\prime }\)へ至る行動と\(x\)から\(x^{\prime \prime}\)へ至る行動は異なるべきであるため、\begin{equation*}a\left( x^{\prime }\right) \not=a\left( x^{\prime \prime }\right)
\end{equation*}が成り立つものと定めます。つまり、手番\(x\in X\backslash Z\)を任意に選んだときに、以下の条件\begin{equation*}\forall x^{\prime },x^{\prime \prime }\in Y\left( x\right) :\left[ x^{\prime
}\not=x^{\prime \prime }\Rightarrow a\left( x^{\prime }\right) \not=a\left(
x^{\prime \prime }\right) \right] \end{equation*}が成り立つことを仮定するということです。これは、\(a\)の定義域を縮小して得られる写像\begin{equation*}a:Y\left( x\right) \rightarrow A
\end{equation*}が単射であることを意味します。以上の仮定のもとでは行動と枝が1対1で対応することが保証されるため、それぞれの手番\(x\in X\backslash \left\{ x_{0}\right\} \)において、そこで意思決定を行うプレイヤー\(i\left( x\right)\in I\cup \left\{ 0\right\} \)に与えられたすべての行動からなる集合を、\begin{eqnarray*}A\left( x\right) &=&\left\{ a\left( x^{\prime }\right) \in A\ |\ x^{\prime
}\in Y\left( x\right) \right\} \\
&=&a\left( Y\left( x\right) \right)
\end{eqnarray*}と定式化できます。このとき、\(a\)の終集合を値域に縮小して得られる写像\begin{equation*}a:Y\left( x\right) \rightarrow A\left( x\right)
\end{equation*}は全単射になります。

例(行動)
以下の有向グラフ\(\left(X,>\right) \)について再び考えます。

図:ゲームの木
図:ゲームの木

今度はそれぞれの手番に対して、そこで選択可能な行動が記されています。図より、\begin{equation*}
a\left( x_{1}\right) =a_{11},\ a\left( x_{2}\right) =a_{12},\ a\left(
z_{1}\right) =a_{21},\ a\left( z_{2}\right) =a_{22},\ a\left( z_{3}\right)
=a_{21},\ a\left( z_{4}\right) =a_{22}
\end{equation*}であることを読み取れます。手番\(x_{0}\)に関しては、\begin{equation*}Y\left( x_{0}\right) =\left\{ x_{1},x_{2}\right\}
\end{equation*}であるため、\begin{equation*}
A\left( x_{0}\right) =a\left( Y\left( x_{0}\right) \right) =\left\{
a_{11},a_{12}\right\}
\end{equation*}となります。手番\(x_{1}\)に関しては、\begin{equation*}Y\left( x_{1}\right) =\left\{ z_{1},z_{2}\right\}
\end{equation*}であるため、\begin{equation*}
A\left( x_{1}\right) =a\left( Y\left( x_{1}\right) \right) =\left\{
a_{21},a_{22}\right\}
\end{equation*}となります。手番\(x_{2}\)に関しては、\begin{equation*}Y\left( x_{2}\right) =\left\{ z_{3},z_{4}\right\}
\end{equation*}であるため、\begin{equation*}
A\left( x_{1}\right) =a\left( Y\left( x_{2}\right) \right) =\left\{
a_{21},a_{22}\right\}
\end{equation*}となります。上図のように、それぞれの枝と同一視される行動を枝の近くに記入します。

 

情報の表現(情報集合)

これまで定式化してきたプレイヤー集合\(I\)、ゲームの木\(\left( X,>\right) \)、それぞれの手番において意思決定を行うプレイヤーを特定する写像\(i:X\backslash Z\rightarrow I\)、それぞれの手番へ到達する直前に選択される行動を特定する写像\(a:X\backslash \left\{ x_{0}\right\} \rightarrow A\)などを記述すれば、プレイヤーたちがどのような順番で行動し、その際にどのような選択肢が与えられているかを完全に記述したことになります。ただ、これらの要素だけではゲームのルールを構成する「情報」を完全に記述したことにはなりません。なぜなら、プレイヤーたちが順番に行動する動学ゲームでは、それぞれのプレイヤーが意思決定を行うそれぞれの局面において、それ以前に他のプレイヤーによって行われた意思決定をどの程度観察できるかは重要な要素であるにも関わらず、上述の諸概念ではそのような情報を記述できないからです。では、このような情報をどのような形で記述すればよいでしょうか。

具体例として、プレイヤー\(i\)は自分が現在直面している手番が\(x\)と\(x^{\prime }\)のどちらか一方であることは分かっているものの、どちらであるかは分からないような状況を想定します。ゲームの木の定義より、\(x\)へ至る行動\(a\left( x\right) \)と\(x^{\prime }\)へ至る行動\(a\left( x^{\prime }\right) \)が1つずつ存在するため、プレイヤー\(i\)が\(x\)と\(x^{\prime }\)を識別できないこととは、それ以前に意思決定を行ったプレイヤーが\(a\left( x\right) \)と\(a\left(x^{\prime }\right) \)のどちらを選んだかを観察できなかったことを意味します。以上の考察を踏まえると、プレイヤーが意思決定を行うそれぞれの局面においてそれ以前に行われた意思決定の内容を観察できないこととは、そのプレイヤーがそれぞれの局面において自身が直面している手番を識別できないことして表現できそうです。このアイデアを以下で定式化します。

ゲームの木\(\left( X,>\right) \)が与えられたとき、手番集合\(X\backslash Z\)を互いに素な部分集合に分割します。つまり、以下の2つの条件\begin{eqnarray*}&&\left( a\right) \ \bigcup \mathcal{H}=X\backslash Z \\
&&\left( b\right) \ \forall H,H^{\prime }\in \mathcal{H}:\left(
H\not=H^{\prime }\Rightarrow H\cap H^{\prime }=\phi \right)
\end{eqnarray*}を満たす\(X\backslash Z\)の部分集合族\(\mathcal{H}\)を作るということです。このような集合族\(\mathcal{H}\)を情報分割(information partition)と呼び、情報分割の要素である手番集合\(H\)を情報集合(information set)と呼びます。\(H\subset X\backslash Z\)かつ\(H\in \mathcal{H}\)です。条件\(\left( a\right) \)は、それぞれの手番は必ず何らかの情報集合の要素であることを意味し、条件\(\left( b\right) \)は、同一の手番が異なる情報集合の要素にはなり得ないことを意味します。

情報分割\(\mathcal{H}\)が与えられれば、それぞれの手番\(x\in X\backslash Z\)に対して、その手番が属する情報集合が1つずつ定まるため、それを、\begin{equation*}H\left( x\right) \in \mathcal{H}
\end{equation*}で表記します。その上で、それぞれの\(x\in X\backslash Z\)に対して\(H\left( x\right) \in \mathcal{H}\)を定める写像\begin{equation*}H:X\backslash Z\rightarrow \mathcal{H}
\end{equation*}を定義します。ただし、同一の情報集合の中に異なるプレイヤーの手番が含まれるような状況をあらかじめ排除します。つまり、\begin{equation*}
\forall H\in \mathcal{H},\ \forall x,x^{\prime }\in H:i\left( x\right)
=i\left( x^{\prime }\right)
\end{equation*}を仮定するということです。プレイヤーがどの手番に直面しているかを識別できない状況は、それらの手番が同一の情報集合の要素であることとして表現されます。他方で、自然は常に自身が直面している手番を識別できるものとします。つまり、偶然手番、すなわち\(i\left( x\right) =0\)を満たす\(x\in X\backslash Z\)に関しては、\begin{equation*}H\left( x\right) =\left\{ x\right\}
\end{equation*}を仮定するということです。

プレイヤーがどの手番に直面しているかを識別できない中で意思決定を行う状況は、プレイヤーが手番ごとに行動を決定するのではなく、情報集合ごとに行動を決定せざるを得ないこととして表現されます。同一の情報集合の中に異なるプレイヤーの手番が含まれるような状況は排除されているため、それぞれの情報集合\(H\in \mathcal{H}\)に対して、そこで意思決定を行うプレイヤー\(i\left( H\right) \in I\cup \left\{0\right\} \)を特定する写像\begin{equation*}i:\mathcal{H}\rightarrow I\cup \left\{ 0\right\}
\end{equation*}を定義できます。この写像\(i\)が与えられれば、そこから逆に、それぞれのプレイヤー\(j\in I\cup \left\{ 0\right\} \)に対して、そのプレイヤーが意思決定を行う情報集合からなる集合族を、\begin{equation*}\mathcal{H}_{j}=\left\{ H\in \mathcal{H}\ |\ i\left( H\right) =j\right\}
\end{equation*}と特定できます。

繰り返しになりますが、プレイヤーがどの手番に直面しているかを識別できない中で意思決定を行う状況は、プレイヤーが情報集合ごとに行動を決定せざるを得ないこととして表現されます。ただし、この解釈を有効なものとするためには、同一の情報集合に属する手番を任意に選んだとき、それらの手番においてプレイヤーが選択可能な行動が等しくなければなりません。つまり、以下の条件\begin{equation*}
\forall x,x^{\prime }\in X\backslash Z:\left[ H\left( x\right) =H\left(
x^{\prime }\right) \Rightarrow A\left( x\right) =A\left( x^{\prime }\right) \right] \end{equation*}が成り立つことを仮定する必要があります。なぜなら、仮に手番ごとに選択可能な行動が異なるのであれば、その情報を頼りにプレイヤーは自分が実際に直面している手番を判別できてしまう可能性があるからです。以上を踏まえた上で、プレイヤーが情報集合\(H\)において選択可能な行動からなる集合を、\begin{equation*}A\left( H\right) =\left\{ A\left( x\right) \ |\ x\in H\right\}
\end{equation*}で表記します。

例(情報集合)
以下の有向グラフ\(\left(X,>\right) \)について再び考えます。

図:ゲームの木
図:ゲームの木

今度は情報分割が明示してあります。情報集合が複数の手番を要素をして持つ場合、それらの手番を点線で結びます。一方、情報集合が1点集合である場合には、何かを書き加える必要はありません。図より、\begin{equation*}
\mathcal{H}=\left\{ \left\{ x_{0}\right\} ,\left\{ x_{1},x_{2}\right\}
\right\}
\end{equation*}であるとともに、\begin{eqnarray*}
i\left( \left\{ x_{0}\right\} \right) &=&1 \\
i\left( \left\{ x_{1},x_{2}\right\} \right) &=&2
\end{eqnarray*}であることを読み取れます。つまり、プレイヤー\(2\)が情報集合\(\left\{ x_{1},x_{2}\right\} \)に属する手番に到達したとき、彼は2つの手番\(x_{1},x_{2}\)のどちらか一方へ到達したことを認識していますが、どちらへ到達したかまでは判別できません。なぜなら、プレイヤー\(1\)が情報集合\(\left\{ x_{0}\right\} \)において\(a_{11}\)と\(a_{12}\)のどちらの行動を選択したかをプレイヤー\(2\)は観察できないからです。ちなみに、プレイヤー\(2\)が手番\(x_{1}\)において選択可能な行動と手番\(x_{2}\)において選択可能な行動はともに\(\left\{a_{21},a_{22}\right\} \)であるため、選択可能な行動を頼りに、自分が\(x_{1}\)と\(x_{2}\)のどちらに直面しているかを推測することはできません。

 

自然による行動の表現

自然が意思決定を行う情報集合からなる集合族は、\begin{equation*}
\mathcal{H}_{0}=\left\{ H\in \mathcal{H}\ |\ i\left( H\right) =0\right\}
\end{equation*}です。自然は常に自身が直面している手番を識別できるため、それぞれの情報集合\(H\in \mathcal{H}_{0}\)は偶然手番を要素として持つ1点集合です。自然が情報集合\(H\in \mathcal{H}_{0}\)において選択可能な行動からなる集合は、\begin{equation*}A\left( H\right) =\left\{ A\left( x\right) \ |\ x\in H\right\}
\end{equation*}です。自然による意思決定は、それぞれの情報集合\(H\in \mathcal{H}_{0}\)において、行動\(a\in A\)が選ばれる確率\begin{equation*}p\left( H,a\right) \in \left[ 0,1\right] \end{equation*}を定める確率分布\(p:\mathcal{H}_{0}\times A\rightarrow \left[ 0,1\right] \)として記述されます。ただし、確率分布の定義より、\(p\)はそれぞれの\(H\in \mathcal{H}_{0}\)に関して以下の3つの条件\begin{eqnarray*}&&\left( a\right) \ \forall a\in A:\left[ a\not\in A\left( H\right)
\Rightarrow p\left( H,a\right) =0\right] \\
&&\left( b\right) \ \forall a\in A:\left[ a\in A\left( H\right) \Rightarrow
p\left( H,a\right) \in \left[ 0,1\right] \right] \\
&&\left( c\right) \ \sum_{a\in A\left( H\right) }p\left( H,a\right) =1
\end{eqnarray*}を満たすものでなければなりません。条件\(\left( a\right) \)は、情報集合\(H\)において選択可能ではない行動が選ばれる確率が\(0\)であることを意味し、条件\(\left( b\right) \)は、情報集合\(H\)において選択可能な行動が選ばれる確率は\(0\)以上\(1\)以下であることを意味し、条件\(\left( c\right) \)は、情報集合\(H\)において選択可能な行動が選ばれ確率の総和をとると\(1\)になることを意味します。

例(自然による行動)
以下のゲームの木\(\left(X,>\right) \)について考えます。

図:ゲームの木
図:ゲームの木

自然に相当するプレイヤー\(0\)による情報集合は\(\left\{ x_{0}\right\} \)だけであるため\(\mathcal{H}_{0}=\left\{ \left\{ x_{0}\right\} \right\} \)です。自然は確率分布\(p:\mathcal{H}_{0}\times A\rightarrow \left[ 0,1\right] \)にしたがって行動を選択します。つまり、情報集合\(\left\{ x_{0}\right\} \)において行動\(a_{01}\)を選ぶ確率は\(p\left( \left\{ x_{0}\right\} ,a_{01}\right) \)であり、行動\(a_{02}\)を選ぶ確率は\(p\left( \left\{ x_{0}\right\} ,a_{02}\right) \)です。他の任意の行動\(a\in A\)について\(p\left( \left\{ x_{0}\right\},a\right) =0\)です。プレイヤー\(1\)は自然が選択した行動を観察した上で、自身が\(\left\{ x_{1}\right\} \)と\(\left\{x_{2}\right\} \)のどちらの情報集合にいるかを認識した上で行動を選択します。一方、プレイヤー\(2\)は自然が選択した行動を観察できる一方で、それに続くプレイヤー\(1\)による行動は観察できません。したがって、自身が\(\left\{ x_{3},x_{4}\right\} \)と\(\left\{x_{5},x_{6}\right\} \)のどちらの情報集合にいるかを認識できる一方で、それぞれの場合において、自身がどの手番にいるかを認識できないまま行動を選択します。

 

結果の表現

プレイヤーたちが順番に自身の情報集合において行動を選択していくと、最終的に特定の頂点\(z\in Z\)へ到達してゲームは終了します。したがって、ゲームの木\(\left( X,>\right) \)を構成するそれぞれの頂点がゲームの結果に相当します。頂点集合\(Z\)が結果集合であるということです。ゲームの木の定義より、それぞれの頂点までのプレーとその頂点を同一視できるため、ゲームのプレーを結果とみなすこともできます。

例(ゲームの結果)
以下のゲームの木\(\left(X,>\right) \)について再び考えます。

図:ゲームの木
図:ゲームの木

このゲームには\(8\)個の頂点が存在しますが、それぞれがゲームの結果に相当します。例えば、自然が情報集合\(\left\{ x_{0}\right\} \)において行動\(a_{01}\)を選択し、続いてプレイヤー\(1\)が情報集合\(\left\{ x_{1}\right\} \)において行動\(a_{11}\)を選択し、さらにプレイヤー\(2\)が情報集合\(\left\{ x_{3},x_{4}\right\} \)において行動\(a_{21}\)を選択すれば頂点\(z_{1}\)に到達し、これが1つのゲームの結果に相当します。他の結果についても同様です。

 

利得の表現

ゲームの木\(\left( X,>\right) \)を構成する頂点がゲームの結果に相当するため、プレイヤーがどの結果を好むかを記述する代わりに、プレイヤーがどの頂点を好むかを記述しても一般性は失われません。そこで、プレイヤー\(i\)が持つ好みの体系を結果集合\(Z\)上の二項関係\(\succsim _{i}\)として定式化し、これをプレイヤー\(i\)の選好関係(preference relation)と呼びます。具体的には、任意の2つの頂点\(z,z^{\prime }\in Z\)に対して、\begin{equation*}z\succsim _{i}z^{\prime }\Leftrightarrow \text{プレイヤー}i\text{は}z\text{を}z^{\prime }\text{以上に好む}
\end{equation*}という関係を満たすものとして\(\succsim _{i}\)を定義します。つまり、比較対象として2つの頂点\(z,z^{\prime }\)を提示されたとき、プレイヤー\(i\)が\(z\)(のもとで実現する結果)を\(z^{\prime }\)(のもとで実現する結果)以上に好むとき、そしてその場合にのみ\(z\succsim _{i}z^{\prime }\)が成り立つものとして\(\succsim _{i}\)を定義するということです。ただし、\(z\)を\(z^{\prime }\)以上に好むとは、\(z\)を\(z^{\prime }\)よりも好むか、または\(z\)と\(z^{\prime }\)を同じ程度好むことを意味します。

プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、任意の2つの頂点\(z,z^{\prime }\in Z\)に対して、\begin{equation*}z\succ _{i}z^{\prime }\Leftrightarrow \left[ z\succsim _{i}z^{\prime }\wedge
\lnot \left( z^{\prime }\succsim _{i}z\right) \right] \end{equation*}という関係を満たすものとして\(Z\)上の新たな二項関係\(\succ _{i}\)を定義します。これをプレイヤー\(i\)の狭義選好関係(strict preference relation)と呼びます。つまり、比較対象として2つの頂点\(z,z^{\prime }\)が提示されたとき、プレイヤー\(i\)が\(z\)を\(z^{\prime }\)以上に好むが\(z^{\prime }\)を\(z\)以上には好まないとき、そしてその場合にのみ\(z\succ _{i}z^{\prime }\)が成り立つものとして\(\succ _{i}\)を定義するということです。

プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、任意の2つの頂点\(z,z^{\prime }\in Z\)に対して、\begin{equation*}z\sim _{i}z^{\prime }\Leftrightarrow \left( z\succsim _{i}z^{\prime }\wedge
z^{\prime }\succsim _{i}z\right)
\end{equation*}という関係を満たすものとして\(Z\)上の新たな二項関係\(\sim _{i}\)を定義します。これをプレイヤー\(i\)の無差別関係(indifference relation)と呼びます。つまり、比較対象として2つの頂点\(z,z^{\prime }\)が提示されたとき、プレイヤー\(i\)が\(z\)を\(z^{\prime }\)以上に好むと同時に\(z^{\prime }\)を\(z\)以上に好むとき、そしてその場合にのみ\(z\sim _{i}z^{\prime }\)が成り立つものとして\(\sim _{i}\)を定義するということです。

プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、ある関数\(u_{i}:Z\rightarrow \mathbb{R} \)が存在して、任意の2つの頂点\(z,z^{\prime }\in Z\)に対して、\begin{equation*}u_{i}\left( z\right) \geq u_{i}\left( z^{\prime }\right) \Leftrightarrow
z\succsim _{i}z^{\prime }
\end{equation*}という関係が成り立つ場合には、この関数\(u_{i}\)のことを\(\succsim _{i}\)を表現する利得関数(payoff function)と呼びます。また、利得関数\(u\)が頂点\(z\)に対して定める値\(u_{i}\left( z\right) \)をプレイヤー\(i\)が\(z\)から得る利得(payoff)と呼びます。つまり、選好関係\(\succsim _{i}\)を表現する利得関数\(u_{i}\)が存在する場合、頂点\(z,z^{\prime }\)について\(z\)が\(z^{\prime }\)以上に望ましいことと、\(z\)の利得が\(z^{\prime }\)の利得以上であることが必要十分になります。言い換えると、利得関数を用いれば、頂点の間の相対的な望ましさを、頂点がもたらす利得の大小関係として表現できるということです。ちなみに、選好関係\(\succsim _{i}\)を表す利得関数\(u_{i}\)が存在する場合、任意の2つの頂点\(z,z^{\prime }\in Z\)に対して、\begin{eqnarray*}u_{i}\left( z\right) &>&u_{i}\left( z^{\prime }\right) \Leftrightarrow
z\succ _{i}z^{\prime } \\
u_{i}\left( z\right) &=&u_{i}\left( z^{\prime }\right) \Leftrightarrow
z\sim _{i}z^{\prime }
\end{eqnarray*}という関係もまた成立します。

ゲームがどの頂点へ到達するかは特定のプレイヤーによる意思決定によってのみ決まるのではなく、すべてのプレイヤーによるの意思決定によって決まります。したがって、プレイヤー\(i\)の利得関数\(u_{i}\)の定義域が\(Z\)であることは、プレイヤー\(i\)の効用\(u_{i}\left( z\right) \)が自身の意思決定だけに依存するのではなく自分とは異なるプレイヤーたちの意思決定にも依存することを意味します。つまり、利得関数を上のように定義することを通じて、プレイヤー間に戦略的相互依存関係が存在する状況を表現しています。

一般に、プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、それを表現する利得関数\(u_{i}\)は存在するとは限りません。ただ、利得関数が存在することを保証する上で必要とされる条件については様々なものが知られています。利得関数の存在条件については場を改めて詳しく解説します。いずれにせよ、以降では利得関数を用いて議論を行います。

例(ゲームの利得)
以下のゲームの木\(\left(X,>\right) \)について再び考えます。

図:ゲームの木
図:ゲームの木

今度は利得が明示してあります。上図のように、プレイヤーがそれぞれの頂点から得られる利得を頂点の近くに記入します。

 

展開型ゲーム

繰り返しになりますが、完備情報の動学ゲームを記述するためには「プレイヤー」「順番」「行動」「情報」「結果」「利得」をそれぞれ特定する必要がありますが、以上の議論により、これらの要素は以下の概念を用いて表現することができます。ゲームのプレイヤーはプレイヤー集合\(I\)によって記述されます。ただし、自然を考慮する場合のプレイヤー集合は\(I\cup \left\{ 0\right\} \)です。プレイヤーたちが行動する順番と、その際に与えられている行動と情報はゲームの木\(\left(X,>\right) \)、それぞれの手番へ到達する直前に選択される行動を特定する写像\(a:X\backslash \left\{ x_{0}\right\}\rightarrow A\)、情報分割\(\mathcal{H}\)、それぞれの手番が属する情報集合を特定する写像\(H:X\backslash Z\rightarrow \mathcal{H}\)、それぞれの情報集合において意思決定を行うプレイヤーを特定する写像\(i:\mathcal{H}\rightarrow I\cup \left\{ 0\right\} \)によって記述されます。自然を考慮する場合にはその行動が確率分布\(p:\mathcal{H}_{0}\times A\rightarrow \left[ 0,1\right] \)として記述されます。ゲームの結果は頂点集合\(Z\)によって記述されますが、これはゲームの木\(\left( X,>\right) \)から導出可能です。プレイヤー\(i\)がそれぞれの結果から得る利得は利得関数\(u_{i}\)によって記述されます。以上の要素からなるモデルを、\begin{equation*}\Gamma =\left( I\cup \left\{ 0\right\} ,X,>,a,\mathcal{H},H,i,p,\left\{
u_{i}\right\} _{i\in I}\right)
\end{equation*}と表記し、これを展開型ゲーム(game in extensive form)と呼びます。

完備情報の動学ゲームが展開型ゲーム\(\Gamma \)によって表現されるとき、\(\Gamma \)を構成するすべての要素はプレイヤーたちの共有知識です。また、ゲームの動学性より、プレイヤーたちは以下の手順で意思決定を行います。

  1. 初期点\(x_{0}\)が属する情報集合\(H\left( x_{0}\right) \)において意志決定を行うプレイヤーないし\(i\left( H\left(x_{0}\right) \right) \)が、そこで選択可能な行動からなる集合\(A\left( H\left( x_{0}\right) \right) \)の中から特定の行動\(a_{0}\)を選択する。
  2. 行動\(a_{0}\)が選択されるとゲームは\(a\left( x^{\prime }\right) =a_{0}\)を満たすノード\(x^{\prime }\)へ到達するが、\(x^{\prime }\in Z\)すなわち\(x^{\prime }\)が頂点である場合にはゲームは終了する。一方、\(x^{\prime}\in X\backslash Z\)すなわち\(x^{\prime }\)が手番である場合には、\(x^{\prime }\)が属する情報集合\(H\left( x^{\prime }\right) \)において意志決定を行うプレイヤー\(i\left( H\left( x^{\prime }\right) \right) \)が,そこで選択可能な行動の集合\(A\left( H\left( x^{\prime }\right) \right) \)の中から特定の行動\(a_{1}\)を選択する。
  3. ゲームが何らかの頂点\(z\in Z\)へ到達するまで同様のプロセスを繰り返す。また、最終的に到達した頂点\(z\)に対してゲームのルールが結果を定め、その結果からそれぞれのプレイヤー\(i\in I\)は利得\(u_{i}\left( z\right) \)を獲得する。

完備情報の動学ゲームを表現する展開型ゲーム\(\Gamma \)が与えられたとき、\(\Gamma \)を構成するすべての要素はプレイヤーたちの共有知識である一方で、それぞれのプレイヤーは自分が意志決定を行う以前に他のプレイヤーたちが行った意思決定を観察できるとは限りません。観察可能性の度合いに応じて完備情報の動学ゲームは完全情報ゲームと不完全情報ゲームに分類されます。さらに、プレイヤーたちが観察した事実を記憶している度合いに応じて完全情報ゲームはさらに完全記憶ゲームと不完全記憶ゲームに分類されます。これらのゲームについては後ほど定式化を行います。

< 前のページ
Share on twitter
Twitterで共有
Share on email
メールで共有
RELATED KNOWLEDGE

関連知識

展開型ゲーム

展開型ゲームにおける純粋戦略

展開型ゲームにおけるプレイヤーの純粋戦略とは、自身のそれぞれの情報集合に対して行動を1つずつ定める行動計画として定義されます。

展開型ゲーム

純粋戦略のもとでのノードへの到達可能性と期待利得

自然が参加する展開型ゲームにおいてプレイヤーたちが純粋戦略を採用する場合、最終的にどの頂点に到達するかを確定することはできないため、プレイヤーは自身が直面する期待利得を基準に意思決定を行うことになります。

DISCUSSION

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録