WIIS

完備情報の動学ゲーム

展開型ゲームの定義

目次

Mailで保存
Xで共有

完備情報の動学ゲーム

複数の主体が関与する問題が与えられたとき、その問題に関与するそれぞれの主体にとって、自分の行動が他者の行動に影響を与えるとともに、他者の行動が自分の行動にも影響を与える場合、主体の間には戦略的相互依存性(strategic interdependence)が成立していると言います。ゲーム理論(game theory)は、戦略的相互依存性に直面した主体による意思決定を分析する学問です。

主体の間に戦略的相互依存性が成立する状況をゲーム(game)と呼びます。ゲームをモデル化する際には、以下の要素を具体的に記述します。

  1. ゲームにおいて意思決定を行う主体は誰か。つまり、ゲームのプレイヤー(player)は誰か。
  2. プレイヤーたちはどのような順番(turn)で意思決定を行うか。
  3. プレイヤーたちが意思決定を行う際にどのような選択肢が与えられているか。つまり、プレイヤーたちはどのような行動(action)が選択可能か。
  4. プレイヤーが意思決定を行う際にどのような情報(information)が与えられているか。
  5. プレイヤーたちが意思決定を行う帰結として、どのような結果(outcome)が起こり得るか。
  6. プレイヤーたちはそれぞれの結果をどの程度評価しているか。すなわち、プレイヤーはどのような利得(payoff)の体系を持っているか。

以上の要素をゲームのルール(rule)と呼びます。ゲームの開始後、それぞれの「プレイヤー」は自身が行動する「順番」になったら、その時点においてアクセス可能な「情報」を活用しつつ、何らかの行動原理にもとづいて、与えられた選択肢の中から特定の「行動」を選択します。すべてのプレイヤーによる意志決定が終了したら、プレイヤーたちが選んだ行動の組み合わせに応じて特定の「結果」が実現し、それぞれのプレイヤーは実現した結果から「利得」を得ます。

ゲームに直面したプレイヤーたちは、自身にとってより望ましい結果を導くために、最終的な意志決定を行う前に他のプレイヤーと交渉を行う可能性があります。事前交渉の結果に対してプレイヤーたちの間に拘束的な合意が成立するのであれば、つまり、合意通りに行動せざるを得ない何らかの仕組みが存在する場合には、プレイヤーたちは集団を形成した上で協力的な意志決定を行う可能性があります。拘束的な合意が成立する場合とそうでない場合とでは、プレイヤーにとって最適な行動は変化するため、ゲームを分析する際には、プレイヤーたちの間に拘束的な合意が成立するかどうかを事前に明らかにしておく必要があります。本節の分析対象である非協力ゲーム(non-cooperative game)とは、プレイヤーたちの間に拘束的な合意が成立しない状況を想定したゲームです。非協力ゲームのプレイヤーは事前の合意通りに行動することを強制されないため、他のプレイヤーによる意志決定から独立した形で自身の意思決定を行います。このような事情を踏まえると、非協力ゲームを「プレイヤーたちがそれぞれ独立に意志決定を行うゲーム」と定義することもできます。

プレイヤーたちが順番に意思決定を行う状況を想定したゲームを動学ゲーム(dynamic game)や逐次手番ゲーム(sequential game)などと呼びます。本節の分析対象は動学ゲームです。

プレイヤーは自身が直面しているゲームのルールを正確に把握できるとは限りません。ゲームを分析する際には、それぞれのプレイヤーがゲームのルールをどの程度正確に把握しているかを事前に明らかにしておく必要があります。問題としているゲームのルールのすべての要素からなる集合を\(P\)で表記します。すべてのプレイヤーがゲームのルールを完全に知っている場合、すなわちすべてのプレイヤーが\(P\)を知っている場合、その事実を\(P_{1}\)で表記します。また、すべてのプレイヤーが事実\(P_{1}\)を知っているという事実を\(P_{2}\)で表記します。事実\(P_{3},P_{4},\cdots \)についても同様に考えます。その上で、無限個の事実\(P_{1},P_{2},P_{3},P_{4},\cdots \)が成立する場合、ゲームのルールに相当する事実\(P\)はプレイヤーたちにとって共有知識(common knowledge)であると言います。本節の分析対象である完備情報ゲーム(game of complete information)とは、ゲームのルールのすべての要素がすべてのプレイヤーにとって共有知識であるようなゲームです。

本節の分析対象は非協力かつ動学かつ完備情報であるようなゲームです。これを完備情報の動学ゲーム(dynamic games of complete information)と呼びます。完備情報の動学ゲームを具体的に記述するためにはゲームのルール、すなわち「プレイヤー」「順番」「行動」「情報」「結果」「利得」を特定する必要がありますが、以下では展開型ゲーム(game in extensive form)と呼ばれるモデルを紹介します。

 

プレイヤーの表現

不完備情報の動学ゲームに参加するすべてのプレイヤーからなる集合をプレイヤー集合(player set)やプレイヤー空間(player space)などと呼び、これを、\begin{equation*}
I
\end{equation*}で表記します。

戦略的相互依存関係は複数のプレイヤーが存在することにより成立するため、プレイヤーの数が複数であることはゲームの基本的な条件となります。そこで、多くの場合、プレイヤーの人数は\(2\)以上の整数であるものと仮定します。

プレイヤーの人数が\(n\)であるとき、そのようなゲームを\(n\)人ゲーム(\(n\)-players game)と呼びます。\(n\)人ゲームのプレイヤー集合を、\begin{equation*}I=\left\{ 1,2,\cdots ,n\right\}
\end{equation*}で表記し、その要素である\(i\ \left( =1,2,\cdots ,n\right) \)番目のプレイヤーをプレイヤー\(i\)(player \(i\))と呼びます。\(i\in I\)です。

プレイヤーの単位は分析対象であるゲームに応じて変化します。個人をプレイヤーと定める場合もあれば、組織や国家などをプレイヤーとする場合もあります。重要なことは、問題としているゲームにおいて自律的な意思決定を行う最小単位をプレイヤーとみなすということです。

外生的に発生する出来事がプレイヤーの意思決定に与える影響を明示的に考慮したい場合には、そのような出来事の発生は何らかの偶然機構によって決定されるものと解釈します。そのような偶然機構を自然(nature)と呼び、これをプレイヤー\(0\)と表記します。つまり、プレイヤーの意思とは関係なく外生的に発生する出来事は、自然と呼ばれる仮想的なプレイヤー\(0\)による行動の結果としてもたらされるものと便宜的に解釈するということです。自然を含める場合のプレイヤー集合は、\begin{equation*}I\cup \left\{ 0\right\} =\left\{ 0,1,2,\cdots ,n\right\}
\end{equation*}です。自然は何らかの確率分布にもとづいて自身の行動を決定するものと仮定します。

例(将棋のプレイヤー)
2人が将棋を1局指す状況を想定します。2人をそれぞれ\(1,2\)と呼ぶのであれば、このゲームのプレイヤー集合は、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}となります。先手と後手をランダムに決める状況を明示化したい場合、仮想的なプレイヤーである自然をモデルに加えることになります。つまり、自然に相当するプレイヤー\(0\)が何らかの確率分布にもとづいて先手を決定し、2人のプレイヤーはそれを観察した上で意思決定を行うものとみなすということです。
例(市場参入のプレイヤー)
ある商品が1つの企業によって独占的に供給されているものとします。別の企業がその市場への参入を検討しています。既存企業をプレイヤー\(1\)と呼び、潜在的な参入企業をプレイヤー\(2\)と呼ぶのであれば、このゲームのプレイヤー集合は、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}となります。各企業が意思決定を行う際に相手の行動を考慮するだけでなく、経済全体の景気も考慮するような状況を明示的に分析したい場合、仮装的なプレイヤーである自然をモデルに加えることになります。つまり、自然に相当するプレイヤー\(0\)が何らかの確率分布にもとづいて景気の状態を外生的に決定し、両企業はそれを観察した上で意思決定を行うものとみなすということです。

 

順番の表現(ゲームの木)

完備情報の動学ゲームに参加するプレイヤーによる意思決定の順番はゲームの木(game tree)と呼ばれる概念を用いて表現されます。具体的には以下の通りです。

問題としているゲームにおいてそれぞれのプレイヤーや自然が意思決定を行う個々の局面や、ゲームが終了する個々の局面を総称してノード(node)と呼びます。ゲームを構成するすべてのノードからなる集合を、\begin{equation*}
X
\end{equation*}で表記し、個々のノードを、\begin{equation*}
x
\end{equation*}で表記します。\(x\in X\)です。

ゲームにおいて起こり得るそれぞれの局面、すなわちノードどうしの時間的な前後関係を、ノード集合\(X\)上に定義された前後関係(precedence relation)と呼ばれる二項関係\(>\)を用いて表現します。具体的には、2つのノード\(x,x^{\prime }\in X\)を任意に選んだとき、\begin{equation*}x>x^{\prime }
\end{equation*}が成り立つことの意味を、以下の2つの条件\begin{eqnarray*}
&&\left( a\right) \ x^{\prime }\text{へ到達した場合、それ以前に必ず}x\text{へ到達している} \\
&&\left( b\right) \ x\text{へ到達した場合、それ以後に}x^{\prime }\text{へ到達する可能性がある}
\end{eqnarray*}がともに成り立つこととして定義します。その上で、ノード\(x,x^{\prime }\)に対して\(x>x^{\prime }\)が成り立つ場合には、そのことを、\(x\)は\(x^{\prime }\)の前に起こる(\(x\) is apredecessor of \(x^{\prime }\))と表現します。同じことを、\(x^{\prime }\)は\(x\)の後に起こり得る(\(x^{\prime }\) is a successor of \(x\))と言うこともできます。

異なる2つのノード\(x,x^{\prime }\in X\)を任意に選んだとき、\begin{equation*}x>x^{\prime }
\end{equation*}が成り立つとともに、それに対して、\begin{equation*}
x>x^{\prime \prime }>x^{\prime }
\end{equation*}を満たす別のノード\(x^{\prime \prime }\in X\)が存在しない場合には、\begin{eqnarray*}&&\left( a\right) \ x^{\prime }\text{へ到達した場合、その直前に必ず}x\text{へ到達している} \\
&&\left( b\right) \ x\text{へ到達した場合、その直後に}x^{\prime }\text{へ到達する可能性がある}
\end{eqnarray*}がともに成り立つことを意味します。そこで、ノード\(x,x^{\prime }\)が以上の条件を満たす場合には、そのことを、\(x\)は\(x^{\prime }\)の直前に起こる(\(x\) is an immediate predecessor of \(x^{\prime }\))と表現します。同じことを、\(x^{\prime }\)は\(x\)の直後に起こり得る(\(x^{\prime }\) is an immediate successor of \(x\))と言うこともでき、そのことを、\begin{equation*}x\rightarrow x^{\prime }
\end{equation*}で表記します。ノード\(x,x^{\prime }\)に対して\(x\rightarrow x^{\prime }\)が成り立つ場合、そのことを、\(x\)から\(x^{\prime }\)への(branch)が存在する、と表現する場合もあります。その上で、\(x\)から\(x^{\prime }\)への枝を点\(x\)から点\(x^{\prime }\)へ伸びる有向線分と同一視します。

ノード集合\(X\)上に定義された前後関係\(>\)は以下の3つの性質を満たすものと定めます。1つ目の性質は、\begin{equation*}\left( T_{1}\right) \ \forall x\in X:\lnot \left( x>x\right)
\end{equation*}です。つまり、局面\(x\)を任意に選んだとき、\(x\)の前後に\(x\)自身が起こり得る可能性をあらかじめ排除するということです。言い換えると、ゲームが進行する中で同一の局面が複数回到来することはないということです。以上の仮定を非反射律(antireflexive law)と呼びます。

前後関係\(>\)に対して要求する2つ目の性質は、\begin{equation*}\left( T_{2}\right) \ \forall x,x^{\prime },x^{\prime \prime }\in X:\left(
x>x^{\prime }\wedge x^{\prime }>x^{\prime \prime }\Rightarrow x>x^{\prime
\prime }\right)
\end{equation*}です。つまり、局面\(x,x^{\prime },x^{\prime \prime }\)を任意に選んだとき、\(x\)が\(x^{\prime }\)の前に起こり、\(x^{\prime }\)が\(x^{\prime \prime }\)の前に起こる場合には、\(x\)が\(x^{\prime \prime }\)の前に起こることが保証されます。以上の仮定を推移律(transitive law)と呼びます。推移律が成り立たない場合には、\begin{equation*}
x>x^{\prime }>x^{\prime \prime }>x>x^{\prime }>x^{\prime \prime }>\cdots
\end{equation*}という形でゲームのプロセスが循環してしまう恐れがあります。推移律はそのような可能性を排除します。

ノード集合\(X\)に属する中でも、他の任意のノードの前に起こるノードを、\begin{equation*}x_{0}\in X
\end{equation*}で表記し、これを初期点(initial node)と呼びます。初期点はゲームが始まる局面に相当します。定義より、\begin{equation*}
\forall x\in X\backslash \left\{ x_{0}\right\} :x_{0}>x
\end{equation*}が成り立ちます。以上を踏まえた上で、前後関係\(>\)に対して要求する3つ目の性質は、初期点とは異なるノード\(x\in X\backslash \left\{ x_{0}\right\} \)を任意に選んだときに、それに対して、\begin{equation*}\left( T_{3}\right) \ \forall x^{\prime }\in X,\ \forall x^{\prime \prime
}\in X\backslash \left\{ x^{\prime }\right\} :\left[ \left( x^{\prime
}>x\wedge x^{\prime \prime }>x\right) \Rightarrow \left( x^{\prime
}>x^{\prime \prime }\veebar x^{\prime \prime }>x^{\prime }\right) \right] \end{equation*}が成り立つというものです。ただし、\(\veebar \)は排他的論理和を表す記号です。以上の仮定は、ゲームの開始時点\(x_{0}\)とは異なる局面\(x\)を任意に選んだとき、それより前に起こる2つの異なる任意の局面\(x^{\prime },x^{\prime \prime }\)について、\(x^{\prime }\)が\(x^{\prime \prime }\)より前に起こるか\(x^{\prime\prime }\)が\(x^{\prime }\)より前に起こるかのどちらか一方であることを意味します。言い換えると、ゲームの開始時点とは異なる局面を任意に選んだとき、その直前に起こる局面は一意的であるということです。

ノード集合\(X\)上に定義された前後関係\(>\)が以上の3つの性質を満たす場合、これらの組\begin{equation*}\left( X,>\right)
\end{equation*}をゲームの木(game tree)と呼びます。前後関係\(>\)が以上の3つの性質を満たすこととは、ゲームの木\(\left( X,>\right) \)が根付有向木(arborescence)と呼ばれるクラスの有向グラフ(directed graph)であることを意味します。

例(前後関係)
有向グラフ\(\left( X,>\right) \)が以下の3つのノード\(x_{1},x_{2},x_{3}\)を持つものとします。

図:前後関係
図:前後関係

図から明らかであるように、\begin{equation*}
x_{1}>x_{2}>x_{3}>x_{1}
\end{equation*}が成り立ちます。すると\(>\)の推移律より\begin{equation*}x_{1}>x_{1}
\end{equation*}を得ますが、これは\(>\)の非反射律と矛盾します。したがって、この有向グラフはゲームの木ではありません。上図のように循環構造を持つ有向グラフはゲームの木とはみなされません。

例(前後関係)
有向グラフ\(\left( X,>\right) \)が以下の3つのノード\(x_{1},x_{2},x_{3}\)を持つものとします。

図:前後関係
図:前後関係

図から明らかであるように、\begin{eqnarray*}
x_{1} &>&x_{3} \\
x_{2} &>&x_{3}
\end{eqnarray*}がともに成り立ちますが、これは\(>\)が満たすべき性質\(\left( T_{3}\right) \)と矛盾するため、この有向グラフはゲームの木ではありません。上図のようにノードの直前に異なる複数のノードが存在する場合、そのような有向グラフはゲームの木とはみなされません。

例(前後関係)
有向グラフ\(\left( X,>\right) \)が以下の3つのノード\(x_{1},x_{2},x_{3}\)を持つものとします。

図:前後関係
図:前後関係

図から明らかであるように、\begin{eqnarray*}
x_{1} &>&x_{2} \\
x_{1} &>&x_{3}
\end{eqnarray*}がともに成り立ちます。循環構造は存在せず、ノード\(x_{2}\)ないし\(x_{3}\)の直前にあるノードはそれぞれ一意的であるため、\(>\)は前後関係としての要件を満たしています。ノード\(x_{1}\)の直後に異なる2つのノード\(x_{2},x_{3}\)が存在しますが、前後関係の定義は、このような状況を排除しません。

ゲームの木\(\left( X,>\right) \)が与えられたとき、ノード\(z\in X\)の後に起こり得るノードが存在しない場合には、すなわち、\begin{equation*}\forall x\in X:\lnot \left( z>x\right)
\end{equation*}が成り立つ場合には、\(z\)を頂点(terminal node)と呼びます。頂点はゲームが終了する局面に相当します。ゲームの木\(\left( X,>\right) \)に含まれるすべての頂点からなる集合を、\begin{equation*}Z
\end{equation*}で表記し、個々の頂点を、\begin{equation*}
z
\end{equation*}で表記します。\(z\in Z\)かつ\(Z\subset X\)です。

ゲームの木\(\left( X,>\right) \)が与えられたとき、頂点以外のノードを手番(move)と呼びます。手番はゲームにおいて何らかのプレイヤーや自然が意思決定を行う局面に相当します。すべての手番からなる集合は手番集合\(X\)と頂点集合\(Z\)の差集合\begin{equation*}X\backslash Z
\end{equation*}です。定義より、初期点もまた手番の1つです。つまり、\(x_{0}\in X\backslash Z\)です。

例(ゲームの木)
以下の有向グラフ\(\left(X,>\right) \)について考えます。

図:ゲームの木
図:ゲームの木

ノード集合は、\begin{equation*}
X=\left\{ x_{0},x_{1},x_{2},z_{1},z_{2},z_{3},z_{4}\right\}
\end{equation*}であり、前後関係\(>\)は有向線分の集まりとして表現されていますが、\(>\)に要求される性質がすべて満たされるため(確認してください)、この有向グラフはゲームの木です。図より、\(x_{0}\)は他の任意のノードの前に起こるため、これは初期点です。上図のように、初期点を白丸で表記します。図より、ノード\(z_{1},z_{2},z_{3},z_{4}\)の後に起こり得るノードは存在しないため、これらはいずれもゲームの木の頂点です。つまり、\begin{equation*}Z=\left\{ z_{1},z_{2},z_{3},z_{4}\right\}
\end{equation*}です。上図のように、頂点には印をつけません。手番集合は、\begin{equation*}
X\backslash Z=\left\{ x_{0},x_{1},x_{2}\right\}
\end{equation*}です。上図のように、初期点以外の手番を黒丸で表記します。

ゲームの木\(\left( X,>\right) \)を構成するそれぞれの手番\(x\in X\backslash Z\)に対して、そこで意思決定を行うプレイヤー\begin{equation*}i\left( x\right) \in I\cup \left\{ 0\right\}
\end{equation*}を特定する写像を、\begin{equation*}
i:X\backslash Z\rightarrow I\cup \left\{ 0\right\}
\end{equation*}で表記します。\(i\)を写像として定義することは、それぞれの手番において意思決定を行うプレイヤーが1人だけであることを意味します。

特に、手番\(x\in X\backslash Z\)に対して、\begin{equation*}i\left( x\right) =0
\end{equation*}が成り立つ場合、すなわち手番\(x\)において意思決定を行うプレイヤーが自然である場合、そのような手番\(x\)を偶然手番(chance move)と呼びます。

ゲームの木\(\left( X,>\right) \)と、それぞれの手番において意思決定を行うプレイヤーを特定する写像\(i:X\backslash Z\rightarrow I\cup \left\{ 0\right\} \)を特定すれば、ゲームにおいてプレイヤーたちが意思決定を行う順番を完全に記述したことになります。

ゲームの木\(\left( X,>\right) \)が与えられたとき、初期点\(x_{0}\in X\)とノード\(x\in X\)を結ぶノードと枝の系列を\(x\)への経路(path)や履歴(history)などと呼びます。ノード\(x\)への経路が、\begin{equation*}x_{0}\rightarrow x_{1}\rightarrow \cdots \rightarrow x_{n-1}\rightarrow
x_{n}\rightarrow x
\end{equation*}であるものとします。ゲームの木は根付有向木であるため、ノード\(x\)の直前に起こるノード\(x_{n}\)は一意的であり、\(x_{n}\)の直前に起こるノード\(x_{n-1}\)は一意的であり、\(\cdots \)、\(x_{1}\)の直前に起こるノード\(x_{0}\)すなわち初期点もまた一意的であるため、\(x\)への経路は一意的です。そのような事情もあり、ノード\(x\)への経路とノード\(x\)自身を同一視しても一般性は失われません。

経路の中でも特に、頂点への経路をゲームのプレー(play)と呼びます。先と同様の理由により、頂点\(z\)へのプレーと頂点\(z\)自身を同一視できます。ゲームのプレーとは、初期点\(x_{0}\)から始まり、それぞれのノードにおいてプレイヤーが枝を選択することによりゲームが進行し、最終的に1つの頂点に到達してゲームが終了するまでの一連の流れに相当します。

例(経路とプレー)
以下の有向グラフ\(\left(X,>\right) \)について再び考えます。

図:ゲームの木
図:ゲームの木

今度はそれぞれの手番に対して、そこで意思決定を行うプレイヤーが指定されています。図より、\begin{eqnarray*}
i\left( x_{0}\right) &=&1 \\
i\left( x_{1}\right) &=&i\left( x_{2}\right) =2
\end{eqnarray*}であることを読み取れます。上図のように、それぞれのノードにおいて意思決定を行うプレイヤーをノードの近くに記入します。ゲームのプレーとしては以下の4通り\begin{eqnarray*}
x_{0} &\rightarrow &x_{1}\rightarrow z_{1} \\
x_{0} &\rightarrow &x_{1}\rightarrow z_{2} \\
x_{0} &\rightarrow &x_{2}\rightarrow z_{3} \\
x_{0} &\rightarrow &x_{2}\rightarrow z_{4}
\end{eqnarray*}が存在します。

 

行動の表現

完備情報の動学ゲームにおいてプレイヤーたちに選択肢として与えられているすべての行動からなる集合をゲームの行動集合(action set)や行動空間(action space)などと呼び、これを、\begin{equation*}
A
\end{equation*}で表記し、個々の行動を、\begin{equation*}
a
\end{equation*}で表記します。\(a\in A\)です。では、プレイヤーの行動とゲームの木をどのような形で関連付ければよいでしょうか。

ゲームの木\(\left( X,>\right) \)の手番\(x\in X\backslash Z\)を任意に選びます。この手番\(x\)において意思決定を行うのはプレイヤー\(i\left( x\right)\in I\cup \left\{ 0\right\} \)です。プレイヤー\(i\left( x\right) \)は手番\(x\)において、そこで選択可能なある行動\(a\in A\)を選べば、手番\(x\)の直後に起こり得るあるノード\(x^{\prime }\)へ到達するものとします。手番\(x\)からノード\(x^{\prime }\)への経路、すなわち枝\(x\rightarrow x^{\prime }\)は一意的であるため、以上の事実は、手番\(x\)において行動\(a\)を選べば確実にノード\(x^{\prime }\)へ到達できることを意味します。

加えて、プレイヤー\(i\left( x\right) \)が手番\(x\)において2つの異なる行動\(a^{\prime},a^{\prime \prime }\in A\)が選択可能である場合、行動\(a^{\prime }\)を選んだ場合に直後に到達するノード\(x^{\prime }\)と、行動\(a^{\prime \prime }\)を選んだ場合に直後に到達するノード\(x^{\prime \prime }\)は異なるものと仮定します。なぜなら、そうではない場合、\(a^{\prime }\)と\(a^{\prime \prime }\)のどちらを選んだ場合においても直後に同一のノードへ到達することになるため、\(a^{\prime }\)と\(a^{\prime \prime }\)をあえて区別する必要はないからです。

以上の想定のもとでは、初期点とは異なるそれぞれのノード\(x\in X\backslash \left\{ x_{0}\right\} \)に対して、\(x\)へ到達するためにその直前の手番においてプレイヤーが選択すべき行動が一意的に定まることが保証されます。そこで、それぞれの\(x\in X\backslash \left\{x_{0}\right\} \)に対して、\(x\)へ到達するためにその直前の手番においてプレイヤーが選択すべき行動\begin{equation*}a\left( x\right) \in A
\end{equation*}を特定する写像\begin{equation*}
a:X\backslash \left\{ x_{0}\right\} \rightarrow A
\end{equation*}を定義し、これをラベリング関数(labelling function)と呼びます。

2つのノード\(x^{\prime },x^{\prime \prime }\in X\backslash \left\{ x_{0}\right\} \)が以下の条件\begin{eqnarray*}&&\left( a\right) \ x\not=x^{\prime } \\
&&\left( b\right) \ x\rightarrow x^{\prime } \\
&&\left( c\right) \ x\rightarrow x^{\prime \prime }
\end{eqnarray*}を満たすものとします。つまり、\(x^{\prime }\)と\(x^{\prime \prime }\)は異なるノードである一方で、それらの直前の手番はともに\(x\)であるということです。この場合、\begin{equation*}a\left( x^{\prime }\right) \not=a\left( x^{\prime \prime }\right)
\end{equation*}が成り立ちます。なぜなら、仮に、\begin{equation*}
a\left( x^{\prime }\right) =a\left( x^{\prime \prime }\right)
\end{equation*}が成り立つものと仮定すると、\(x^{\prime }\)へ到達する直前に選んだ行動と\(x^{\prime \prime }\)へ到達する直前に選んだ行動が一致することになり、すると\(x=x^{\prime }\)となり、これは\(\left( a\right) \)と矛盾するからです。

手番\(x\in X\backslash Z\)において意思決定を行うのはプレイヤー\(i\left( x\right) \in I\cup \left\{0\right\} \)ですが、手番\(x\)の直後に到達し得るノードからなる集合を、\begin{equation*}X_{x}=\left\{ x^{\prime }\in X\ |\ x\rightarrow x^{\prime }\right\}
\end{equation*}と表記するのであれば、手番\(x\)においてプレイヤー\(i\left( x\right) \)が選択可能な行動からなる集合は、ラベリング関数\(a:X\backslash \left\{ x_{0}\right\} \rightarrow A\)を用いて、\begin{equation*}A\left( x\right) =\left\{ a\left( x^{\prime }\right) \in A\ |\ x^{\prime
}\in X_{x}\right\}
\end{equation*}と表現できます。

例(行動)
以下の有向グラフ\(\left(X,>\right) \)について再び考えます。

図:ゲームの木
図:ゲームの木

今度はそれぞれの手番に対して、そこで選択可能な行動が記されています。図より、\begin{eqnarray*}
a\left( x_{1}\right) &=&a_{11} \\
a\left( x_{2}\right) &=&a_{12} \\
a\left( z_{1}\right) &=&a\left( z_{3}\right) =a_{21} \\
a\left( z_{2}\right) &=&a\left( z_{4}\right) =a_{22}
\end{eqnarray*}であることを読み取れます。また、それぞれの手番における行動集合は、\begin{eqnarray*}
A\left( x_{0}\right) &=&\left\{ a_{11},a_{12}\right\} \\
A\left( x_{1}\right) &=&\left\{ a_{21},a_{22}\right\} \\
A\left( x_{2}\right) &=&\left\{ a_{21},a_{22}\right\}
\end{eqnarray*}です。

 

情報の表現(情報集合)

これまで定式化してきたプレイヤー集合\(I\)、ゲームの木\(\left( X,>\right) \)、それぞれの手番において意思決定を行うプレイヤーを特定する写像\(i:X\backslash Z\rightarrow I\)、行動集合\(A\)、それぞれの手番へ到達する直前に選択される行動を特定する写像\(a:X\backslash \left\{x_{0}\right\} \rightarrow A\)などを記述すれば、プレイヤーたちがどのような順番で行動し、その際にどのような選択肢が与えられているかを完全に記述したことになります。ただ、これらの要素だけではゲームのルールを構成する「情報」を完全に記述したことにはなりません。なぜなら、プレイヤーたちが順番に行動する動学ゲームでは、それぞれのプレイヤーが意思決定を行うそれぞれの局面において、それ以前に他のプレイヤーによって行われた意思決定をどの程度観察できるかは重要な要素であるにも関わらず、上述の諸概念ではそのような情報を記述できないからです。では、そのような情報をどのように記述すればよいでしょうか。

具体例として、プレイヤー\(i\)は自分が現在直面している手番が\(x\)と\(x^{\prime }\)のどちらか一方であることは分かっているものの、どちらであるかは判別できない状況を想定します。ゲームの木の定義より、\(x\)へ至る行動\(a\left( x\right) \)と\(x^{\prime }\)へ至る行動\(a\left( x^{\prime }\right) \)が1つずつ存在するため、プレイヤー\(i\)が\(x\)と\(x^{\prime }\)を識別できないこととは、それ以前に意思決定を行ったプレイヤーが\(a\left( x\right) \)と\(a\left( x^{\prime}\right) \)のどちらを選んだかをプレイヤー\(i\)が観察できないことを意味します。以上の考察を踏まえると、プレイヤーが意思決定を行うそれぞれの局面においてそれ以前に行われた意思決定の内容を観察できないこととは、そのプレイヤーがそれぞれの局面において自身が直面している手番を識別できないことして表現できそうです。このアイデアを以下で定式化します。

ゲームの木\(\left( X,>\right) \)が与えられたとき、手番集合\(X\backslash Z\)を互いに素な部分集合に分割します。つまり、以下の2つの条件\begin{eqnarray*}&&\left( a\right) \ \bigcup \mathcal{H}=X\backslash Z \\
&&\left( b\right) \ \forall H,H^{\prime }\in \mathcal{H}:\left(
H\not=H^{\prime }\Rightarrow H\cap H^{\prime }=\phi \right)
\end{eqnarray*}を満たす\(X\backslash Z\)の部分集合族\(\mathcal{H}\)を作るということです。このような集合族\begin{equation*}\mathcal{H}
\end{equation*}を情報分割(information partition)と呼び、情報分割の要素である手番集合\begin{equation*}
H
\end{equation*}を情報集合(information set)と呼びます。\(H\subset X\backslash Z\)かつ\(H\in \mathcal{H}\)です。条件\(\left( a\right) \)は、それぞれの手番は必ず何らかの情報集合の要素であることを意味し、条件\(\left( b\right) \)は、同一の手番が異なる情報集合の要素にはなり得ないことを意味します。

情報分割\(\mathcal{H}\)が与えられれば、それぞれの手番\(x\in X\backslash Z\)に対して、その手番が属する情報集合が1つずつ定まるため、それを、\begin{equation*}H\left( x\right) \in \mathcal{H}
\end{equation*}で表記します。その上で、それぞれの\(x\in X\backslash Z\)に対して\(H\left( x\right) \in \mathcal{H}\)を定める写像\begin{equation*}H:X\backslash Z\rightarrow \mathcal{H}
\end{equation*}を定義します。ただし、同一の情報集合の中に異なるプレイヤーの手番が含まれるような状況をあらかじめ排除します。つまり、\begin{equation*}
\forall H\in \mathcal{H},\ \forall x,x^{\prime }\in H:i\left( x\right)
=i\left( x^{\prime }\right)
\end{equation*}を仮定するということです。プレイヤーがどの手番に直面しているかを識別できない状況は、それらの手番が同一の情報集合の要素であることとして表現されます。他方で、自然は常に自身が直面している手番を識別できるものとします。つまり、偶然手番、すなわち\(i\left( x\right) =0\)を満たす任意の手番\(x\in X\backslash Z\)に関しては、\begin{equation*}H\left( x\right) =\left\{ x\right\}
\end{equation*}を仮定するということです。

プレイヤーがどの手番に直面しているかを識別できない中で意思決定を行う状況は、プレイヤーが手番ごとに行動を決定するのではなく、情報集合ごとに行動を決定せざるを得ないことを意味します。同一の情報集合の中に異なるプレイヤーの手番が含まれるような状況は排除されているため、それぞれの情報集合\(H\in \mathcal{H}\)に対して、そこで意思決定を行うプレイヤー\(i\left( H\right) \in I\cup \left\{ 0\right\} \)を特定する写像\begin{equation*}i:\mathcal{H}\rightarrow I\cup \left\{ 0\right\}
\end{equation*}を定義できます。この写像\(i\)が与えられれば、そこから逆に、それぞれのプレイヤー\(j\in I\cup \left\{ 0\right\} \)に対して、そのプレイヤーが意思決定を行う情報集合からなる集合族を、\begin{equation*}\mathcal{H}_{j}=\left\{ H\in \mathcal{H}\ |\ i\left( H\right) =j\right\}
\end{equation*}と特定できます。

繰り返しになりますが、プレイヤーがどの手番に直面しているかを識別できない中で意思決定を行う状況は、プレイヤーが情報集合ごとに行動を決定せざるを得ないこととして表現されます。ただし、この解釈を有効なものとするためには、同一の情報集合に属する手番を任意に選んだとき、それらの手番においてプレイヤーが選択可能な行動が等しくなければなりません。つまり、以下の条件\begin{equation*}
\forall x,x^{\prime }\in X\backslash Z:\left[ H\left( x\right) =H\left(
x^{\prime }\right) \Rightarrow A\left( x\right) =A\left( x^{\prime }\right) \right] \end{equation*}が成り立つことを仮定する必要があります。なぜなら、仮に手番ごとに選択可能な行動が異なるのであれば、その情報を頼りにプレイヤーは自分が実際に直面している手番を判別できてしまう可能性があるからです。以上を踏まえた上で、プレイヤーが情報集合\(H\)において選択可能な行動からなる集合を、\begin{equation*}A\left( H\right) =\left\{ A\left( x\right) \ |\ x\in H\right\}
\end{equation*}で表記します。

例(情報集合)
以下の有向グラフ\(\left(X,>\right) \)について再び考えます。

図:ゲームの木
図:ゲームの木

今度は情報分割が明示してあります。情報集合が複数の手番を要素をして持つ場合、それらの手番を点線で結びます。一方、情報集合が1点集合である場合には、何も書き加える必要はありません。図より、\begin{equation*}
\mathcal{H}=\left\{ \left\{ x_{0}\right\} ,\left\{ x_{1},x_{2}\right\}
\right\}
\end{equation*}であるとともに、\begin{eqnarray*}
i\left( \left\{ x_{0}\right\} \right) &=&1 \\
i\left( \left\{ x_{1},x_{2}\right\} \right) &=&2
\end{eqnarray*}であることを読み取れます。つまり、プレイヤー\(2\)が情報集合\(\left\{ x_{1},x_{2}\right\} \)に属する手番に到達したとき、彼は2つの手番\(x_{1},x_{2}\)のどちらか一方へ到達したことを認識していますが、どちらへ到達したかまでは判別できません。なぜなら、プレイヤー\(1\)が情報集合\(\left\{ x_{0}\right\} \)において\(a_{11}\)と\(a_{12}\)のどちらの行動を選択したかをプレイヤー\(2\)は観察できないからです。ちなみに、プレイヤー\(2\)が手番\(x_{1}\)において選択可能な行動と手番\(x_{2}\)において選択可能な行動はともに\(\left\{a_{21},a_{22}\right\} \)であるため、選択可能な行動を頼りに、自分が\(x_{1}\)と\(x_{2}\)のどちらに直面しているかを推測することはできません。

 

自然による行動の表現

自然が意思決定を行う情報集合からなる集合族は、\begin{equation*}
\mathcal{H}_{0}=\left\{ H\in \mathcal{H}\ |\ i\left( H\right) =0\right\}
\end{equation*}です。自然は常に自身が直面している手番を識別できるものと仮定するため、それぞれの情報集合\(H\in H_{0}\)は偶然手番を要素として持つ1点集合です。自然が情報集合\(H\in H_{0}\)において選択可能な行動からなる集合は、\begin{equation*}A\left( H\right) =\left\{ A\left( x\right) \ |\ x\in H\right\}
\end{equation*}です。自然による意思決定は、それぞれの情報集合\(H\in \mathcal{H}_{0}\)において、そこで行動\(a\in A\)が選ばれる確率\begin{equation*}p\left( H,a\right) \in \left[ 0,1\right] \end{equation*}を特定する確率分布\(p:\mathcal{H}_{0}\times A\rightarrow \left[ 0,1\right] \)として記述されます。ただし、確率分布の定義より、\(p\)はそれぞれの\(H\in \mathcal{H}_{0}\)に関して以下の3つの条件\begin{eqnarray*}&&\left( a\right) \ \forall a\in A:\left[ a\not\in A\left( H\right)
\Rightarrow p\left( H,a\right) =0\right] \\
&&\left( b\right) \ \forall a\in A:\left[ a\in A\left( H\right) \Rightarrow
p\left( H,a\right) \in \left[ 0,1\right] \right] \\
&&\left( c\right) \ \sum_{a\in A\left( H\right) }p\left( H,a\right) =1
\end{eqnarray*}を満たす必要があります。条件\(\left( a\right) \)は、情報集合\(H\)において選択可能ではない行動が選ばれる確率が\(0\)であることを意味し、条件\(\left( b\right) \)は、情報集合\(H\)において選択可能な行動が選ばれる確率は\(0\)以上\(1\)以下であることを意味し、条件\(\left( c\right) \)は、情報集合\(H\)において選択可能な行動が選ばれ確率の総和をとると\(1\)になることを意味します。

例(自然による行動)
以下のゲームの木\(\left(X,>\right) \)について考えます。

図:ゲームの木
図:ゲームの木

自然に相当するプレイヤー\(0\)による情報集合は\(\left\{ x_{0}\right\} \)だけであるため、\begin{equation*}\mathcal{H}_{0}=\left\{ \left\{ x_{0}\right\} \right\}
\end{equation*}です。自然は確率分布\(p:\mathcal{H}_{0}\times A\rightarrow \left[ 0,1\right] \)にしたがって行動を選択します。つまり、情報集合\(\left\{ x_{0}\right\} \)において行動\(a_{01}\)を選ぶ確率は\(p\left( \left\{ x_{0}\right\} ,a_{01}\right) \)であり、行動\(a_{02}\)を選ぶ確率は\(p\left( \left\{ x_{0}\right\} ,a_{02}\right) \)です。他の任意の行動\(a\in A\)について\(p\left( \left\{x_{0}\right\} ,a\right) =0\)です。プレイヤー\(1\)は自然が選択した行動を観察した上で、自身が\(\left\{ x_{1}\right\} \)と\(\left\{ x_{2}\right\} \)のどちらの情報集合にいるかを認識した上で行動を選択します。一方、プレイヤー\(2\)は自然が選択した行動を観察できる一方で、それに続くプレイヤー\(1\)による行動は観察できません。したがって、自身が\(\left\{ x_{3},x_{4}\right\} \)と\(\left\{x_{5},x_{6}\right\} \)のどちらの情報集合にいるかを認識できる一方で、それぞれの場合において、自身がどの手番にいるかを認識できないまま行動を選択します。

 

結果の表現

プレイヤーたちが順番に自身の情報集合において行動を選択していくと、最終的に特定の頂点\(z\in Z\)へ到達してゲームは終了します。したがって、ゲームの木\(\left( X,>\right) \)を構成するそれぞれの頂点がゲームの結果に相当します。頂点集合\(Z\)が結果集合であるということです。ゲームの木の定義より、それぞれの頂点までのプレーとその頂点を同一視できるため、ゲームのプレーを結果とみなすこともできます。

例(ゲームの結果)
以下のゲームの木\(\left(X,>\right) \)について再び考えます。

図:ゲームの木
図:ゲームの木

このゲームには\(8\)個の頂点が存在しますが、それぞれがゲームの結果に相当します。例えば、自然が情報集合\(\left\{ x_{0}\right\} \)において行動\(a_{01}\)を選択し、続いてプレイヤー\(1\)が情報集合\(\left\{ x_{1}\right\} \)において行動\(a_{11}\)を選択し、さらにプレイヤー\(2\)が情報集合\(\left\{ x_{3},x_{4}\right\} \)において行動\(a_{21}\)を選択すれば頂点\(z_{1}\)に到達し、これが1つのゲームの結果に相当します。他の結果についても同様です。

 

利得の表現

ゲームの木\(\left( X,>\right) \)を構成する頂点がゲームの結果に相当するため、プレイヤーがどの結果を好むかを記述する代わりに、プレイヤーがどの頂点を好むかを記述しても一般性は失われません。そこで、プレイヤー\(i\in I\)が持つ好みの体系を結果集合\(Z\)上の二項関係\(\succsim _{i}\)として定式化し、これをプレイヤー\(i\)の選好関係(preference relation)と呼びます。具体的には、任意の2つの頂点\(z,z^{\prime }\in Z\)に対して、\begin{equation*}z\succsim _{i}z^{\prime }\Leftrightarrow \text{プレイヤー}i\text{は}z\text{を}z^{\prime }\text{以上に好む}
\end{equation*}という関係を満たすものとして\(\succsim _{i}\)を定義します。つまり、比較対象として2つの頂点\(z,z^{\prime }\)を提示されたとき、プレイヤー\(i\)が\(z\)のもとで実現する結果を\(z^{\prime }\)のもとで実現する結果以上に好むとき、そしてその場合にのみ\(z\succsim _{i}z^{\prime }\)が成り立つものとして\(\succsim _{i}\)を定義するということです。ただし、\(z\)を\(z^{\prime }\)以上に好むとは、\(z\)を\(z^{\prime }\)よりも好むか、または\(z\)と\(z^{\prime }\)を同じ程度好むことを意味します。

プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、任意の2つの頂点\(z,z^{\prime }\in Z\)に対して、\begin{equation*}z\succ _{i}z^{\prime }\Leftrightarrow \left[ z\succsim _{i}z^{\prime }\wedge
\lnot \left( z^{\prime }\succsim _{i}z\right) \right] \end{equation*}という関係を満たすものとして\(Z\)上の新たな二項関係\(\succ _{i}\)を定義します。これをプレイヤー\(i\)の狭義選好関係(strict preference relation)と呼びます。つまり、比較対象として2つの頂点\(z,z^{\prime }\)が提示されたとき、プレイヤー\(i\)が\(z \)を\(z^{\prime }\)以上に好むが\(z^{\prime }\)を\(z\)以上には好まないとき、そしてその場合にのみ\(z\succ _{i}z^{\prime }\)が成り立つものとして\(\succ _{i}\)を定義するということです。

プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、任意の2つの頂点\(z,z^{\prime }\in Z\)に対して、\begin{equation*}z\sim _{i}z^{\prime }\Leftrightarrow \left( z\succsim _{i}z^{\prime }\wedge
z^{\prime }\succsim _{i}z\right)
\end{equation*}という関係を満たすものとして\(Z\)上の新たな二項関係\(\sim _{i}\)を定義します。これをプレイヤー\(i\)の無差別関係(indifference relation)と呼びます。つまり、比較対象として2つの頂点\(z,z^{\prime }\)が提示されたとき、プレイヤー\(i\)が\(z\)を\(z^{\prime }\)以上に好むと同時に\(z^{\prime }\)を\(z\)以上に好むとき、そしてその場合にのみ\(z\sim _{i}z^{\prime }\)が成り立つものとして\(\sim _{i}\)を定義するということです。

プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、任意の2つの頂点\(z,z^{\prime }\in Z\)に対して、以下の関係\begin{equation*}u_{i}\left( z\right) \geq u_{i}\left( z^{\prime }\right) \Leftrightarrow
z\succsim _{i}z^{\prime }
\end{equation*}を満たす関数\begin{equation*}
u_{i}:Z\rightarrow \mathbb{R} \end{equation*}が存在する場合には、これを\(\succsim _{i}\)を表現する利得関数(payoff function)と呼びます。利得関数\(u\)が頂点\(z\)に対して定める値\(u_{i}\left( z\right) \)をプレイヤー\(i\)が\(z\)から得る利得(payoff)と呼びます。選好関係\(\succsim _{i}\)を表現する利得関数\(u_{i}\)が存在する場合、頂点\(z,z^{\prime }\)について、\(z\)が\(z^{\prime }\)以上に望ましいことと、\(z\)の利得が\(z^{\prime }\)の利得以上であることが必要十分になります。利得関数を用いれば、頂点の間の相対的な望ましさを、頂点がもたらす利得の大小関係として表現できるということです。

選好関係\(\succsim _{i}\)を表す利得関数\(u_{i}\)が存在する場合、任意の2つの頂点\(z,z^{\prime }\in Z\)に対して、\begin{eqnarray*}u_{i}\left( z\right) &>&u_{i}\left( z^{\prime }\right) \Leftrightarrow
z\succ _{i}z^{\prime } \\
u_{i}\left( z\right) &=&u_{i}\left( z^{\prime }\right) \Leftrightarrow
z\sim _{i}z^{\prime }
\end{eqnarray*}という関係もまた成立します。

ゲームがどの頂点へ到達するかは特定のプレイヤーによる意思決定によってのみ決まるのではなく、すべてのプレイヤーによるの意思決定によって決まります。したがって、プレイヤー\(i\)の利得関数\(u_{i}\)の定義域が\(Z\)であることは、プレイヤー\(i\)の利得\(u_{i}\left( z\right) \)が自身の意思決定だけに依存するのではなく、自分以外の意思決定にも依存することを意味します。つまり、利得関数の定義域を\(Z\)とすることにより、プレイヤーの間に戦略的相互依存関係が存在する状況を表現しています。

プレイヤー\(i\)の選好関係\(\succsim _{i}\)が与えられたとき、それを表現する利得関数\(u_{i}\)は存在するとは限りません。利得関数が存在することを保証する上で必要とされる条件については様々なものが知られています。利得関数の存在条件については場を改めて詳しく解説します。

例(ゲームの利得)
以下のゲームの木\(\left(X,>\right) \)について再び考えます。

図:ゲームの木
図:ゲームの木

今度は利得が明示してあります。上図のように、プレイヤーがそれぞれの頂点から得られる利得を頂点の近くに記入します。

 

展開型ゲーム

繰り返しになりますが、完備情報の動学ゲームを記述するためには「プレイヤー」「順番」「行動」「情報」「結果」「利得」をそれぞれ特定する必要がありますが、以上の議論により、これらの要素は以下の概念を用いて表現することができます。ゲームのプレイヤーはプレイヤー集合\(I\)によって記述されます。ただし、自然を考慮する場合のプレイヤー集合は\(I\cup \left\{ 0\right\} \)です。プレイヤーたちに選択肢として与えられている行動は行動集合\(A\)として記述されます。プレイヤーたちが意思決定を行う順番と、その際に与えられている行動および情報を記述するのはゲームの木\(\left( X,>\right) \)、それぞれの手番へ到達する直前に選択される行動を特定する写像\(a:X\backslash \left\{ x_{0}\right\} \rightarrow A\)、情報分割\(\mathcal{H}\)、それぞれの情報集合において意思決定を行うプレイヤーを特定する写像\(i:\mathcal{H}\rightarrow I\cup \left\{ 0\right\} \)です。また、自然を考慮する場合にはその行動が確率分布\(p:\mathcal{H}_{0}\times A\rightarrow \left[ 0,1\right] \)として記述されます。ゲームの結果は頂点集合\(Z\)によって記述されますが、これはゲームの木\(\left( X,>\right) \)から導出可能です。プレイヤー\(i\)がそれぞれの結果から得る利得は利得関数\(u_{i}:Z\rightarrow \mathbb{R} \)によって記述されます。以上の要素からなるモデルを、\begin{equation*}\Gamma =\left( I\cup \left\{ 0\right\} ,A,X,>,a,\mathcal{H},i,p,\left\{
u_{i}\right\} _{i\in I}\right)
\end{equation*}と表記し、これを展開型ゲーム(game in extensive form)と呼びます。

完備情報の動学ゲームが展開型ゲーム\(\Gamma \)によって表現されるとき、ゲームの完備性より、\(\Gamma \)を構成するすべての要素はプレイヤーたちの共有知識です。また、ゲームの動学性より、プレイヤーたちは以下のプロセスのもとで意思決定を行います。

  1. 初期点\(x_{0}\)が属する情報集合\(H\left( x_{0}\right) \)において意志決定を行うプレイヤー\(i\left( H\left( x_{0}\right) \right) \)が、そこで選択可能な行動からなる集合\(A\left( H\left( x_{0}\right) \right) \)の中から特定の行動\(a_{0}\)を選択する。
  2. 行動\(a_{0}\)が選択されるとゲームは\(a\left( x^{\prime }\right) =a_{0}\)を満たすノード\(x^{\prime }\)へ到達する。\(x^{\prime }\in Z\)すなわち\(x^{\prime }\)が頂点である場合にはゲームは終了する。一方、\(x^{\prime }\in X\backslash Z\)すなわち\(x^{\prime }\)が手番である場合には、\(x^{\prime }\)が属する情報集合\(H\left( x^{\prime }\right) \)において意志決定を行うプレイヤー\(i\left( H\left( x^{\prime }\right) \right) \)が,そこで選択可能な行動の集合\(A\left( H\left( x^{\prime }\right) \right) \)の中から特定の行動\(a_{1}\)を選択する。
  3. ゲームが何らかの頂点\(z\in Z\)へ到達するまで同様のプロセスを繰り返す。最終的に到達した頂点\(z\)に対してゲームのルールが結果を定め、その結果からそれぞれのプレイヤー\(i\)は利得\(u_{i}\left(z\right) \)を得る。

完備情報の動学ゲームを展開型ゲーム\(\Gamma \)として表現した場合、\(\Gamma \)を構成するすべての要素はプレイヤーたちの共有知識です。その一方で、それぞれのプレイヤーは自分が意志決定を行う以前に他のプレイヤーたちが行った意思決定を観察できるとは限りません。観察可能性の度合いに応じて完備情報の動学ゲームは完全情報ゲームと不完全情報ゲームに分類されます。さらに、プレイヤーたちが観察した事実を記憶している度合いに応じて完全情報ゲームはさらに完全記憶ゲームと不完全記憶ゲームに分類されます。これらのゲームについては後ほど定式化を行います。

 

有限ゲームと無限ゲーム

展開型ゲーム\(\Gamma \)のプレイヤー集合\(I\)とノード集合\(X\)がともに有限集合である場合場合には\(\Gamma \)を有限ゲーム(finite game)と呼びます。逆に、有限ゲームではない展開型ゲーム\(\Gamma \)を無限ゲーム(infinite game)と呼びます。

プレイヤー集合\(I\)が有限集合であることは、プレイヤーの人数が有限であることを意味します。したがって、有限ゲームはプレイヤーの人数が有限であるようなゲームです。逆に、プレイヤーの人数が無限であるようなゲームは無限ゲームです。

ノード集合\(X\)が有限集合であることは、ノードの個数が有限であることを意味し、これはさらに情報集合の個数が有限であることを意味します。情報集合はプレイヤーが意思決定を行う局面に相当するため、有限ゲームにおいてそれぞれのプレイヤーが意思決定を行う局面の数は有限になります。逆に、ノード集合\(X\)が無限集合である場合には情報集合の個数もまた無限になり得るため、プレイヤーが無限回の意思決定を行う状況が起こり得ます。

ノード集合\(X\)が有限であることは、ノードの個数が有限であることを意味しますが、これはさらに情報集合において選択可能な行動の個数が有限であることを意味します。つまり、有限ゲームにおいて任意のプレイヤーは、自身が意思決定を行う任意の局面において、有限個の選択肢に直面します。逆に、ノード集合\(X\)が無限集合である場合には、あるプレイヤーが意思決定を行うある局面において無限個の選択肢に直面する事態が起こり得ます。

ノード集合\(X\)が有限であることは、ノードの個数が有限であることを意味しますが、これはさらにそれぞれの頂点に対応するプレーは有限個の手番と枝によって構成されることを意味します。したがって、有限ゲームは必ず有限ステップで終了します。逆に、ノード集合\(X\)が無限集合である場合には、ある頂点に対応するプレーが無限個の手番と枝によって構成される事態が起こり得るため、ゲームが必ず有限ステップで終了することを保証できません。

以上の議論から明らかであるように、有限ゲームとは、ゲームに参加するプレイヤーの人数、プレイヤーが意思決定を行う局面の数、また、それぞれの局面において与えられている選択肢の数など、ゲームを構成するすべての要素が有限個であるようなゲームに相当します。

 

演習問題

問題(展開型ゲーム)
2人のプレイヤー\(1,2\)が\(500\)円硬貨を1枚ずつ持っています。まず、プレイヤー\(1\)は相手に見られないようにしながら、表か裏のどちらか一方の面を上にして自分の硬貨を置きます。続いて、プレイヤー\(2\)もまた表か裏のどちらか一方の面を上にして自分の硬貨を置きます。結果を観察し、2枚の硬貨の面が一致する場合にはプレイヤー\(1\)が硬貨を2枚とも得られる一方で、2枚の硬貨の面が異なる場合にはプレイヤー\(2\)が硬貨を2枚とも得られます。プレイヤーが得る金額を利得とみなします。以上の状況を展開型ゲームとして表現してください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(展開型ゲーム)
2人の子供\(1,2\)がプレイヤーです。目の前に2枚のクッキーがあります。まず、子供\(1\)は以下の3つの選択肢の中から1つを相手に提案します。\begin{eqnarray*}&&\left( a\right) \ \text{自分が2枚のクッキーを独り占めする} \\
&&\left( b\right) \ \text{2人でクッキーを1枚ずつ分ける} \\
&&\left( c\right) \ \text{相手にクッキーを2枚ともあげる}
\end{eqnarray*}続いて、子供\(2\)が提案を受け入れるかどうか決定します。子供\(2\)が相手の提案を受け入れる場合には、提案通りにクッキーを2人でわけます。子供\(2\)が相手の提案を受け入れない場合には、2人ともクッキーをもらえません。自分が得るクッキーの枚数を利得とみなします。以上の状況を展開型ゲームとして表現してください。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員専用コンテンツです
ログイン】【会員登録