戦略型ゲーム(標準型ゲーム)
完備情報の静学ゲームを記述するためにはプレイヤー、行動、結果、利得などをそれぞれ具体的に特定する必要があります。それらの要素を記述する方法はいくつか存在しますが、ここでは戦略型ゲームと呼ばれるモデルについて解説します。
完備情報の静学ゲームを戦略型ゲームと呼ばれるモデルを用いて表現します。
完備情報の静学ゲームを記述するためにはプレイヤー、行動、結果、利得などをそれぞれ具体的に特定する必要があります。それらの要素を記述する方法はいくつか存在しますが、ここでは戦略型ゲームと呼ばれるモデルについて解説します。
ゲームに参加するプレイヤーはそれぞれ明確な目的を持ち、その目的を達成するために最適な行動を選択するものと仮定します。さらに、プレイヤーの目的は自己の利得の最大化であると仮定します。つまり、ゲームに参加するプレイヤーたちは、意志決定の際に自分の利得の最大化をめざすという意味において利己的であるものと仮定します。
完備情報の静学ゲームにおいてプレイヤーたちが混合戦略を選択する場合には、プレイヤーはクジと呼ばれる不確実な状況どうしを比較することになります。この場合、プレイヤーの評価体系はクジどうしを比較する選好関係として定式化されますが、さらにこの選好関係に対応する関数を期待利得関数と呼びます。
完備情報の静学ゲームにおいてプレイヤーたちが純戦略を選択する状況は戦略型ゲームとして表現できます。一方、プレイヤーたちが混合戦略を選択する状況は戦略型ゲームを拡張した混合拡張と呼ばれる概念として表現できます。
完備情報の静学ゲームを表現する戦略型ゲームの混合拡張に直面したそれぞれのプレイヤーは、期待効用仮説にもとづいて混合戦略集合の中から自身の期待利得を最大化する混合戦略を選びます。
戦略どうしの支配関係について解説します。
支配戦略について解説します。
支配戦略均衡について解説します。
支配される戦略の逐次消去と呼ばれる均衡概念について解説します。
与えられたゲームにおいてそれぞれのプレイヤーが何らかの戦略によって狭義支配される純粋戦略を持つ場合、それをプレイヤーの純粋戦略集合から消去することを通じてプレイヤーたちが選択し得る戦略の組を絞り込む手法を狭義支配される戦略の逐次消去と呼びます。
与えられたゲームにおいてそれぞれのプレイヤーが何らかの戦略によって広義支配される純粋戦略を持つ場合、それをプレイヤーの純粋戦略集合から消去することを通じてプレイヤーたちが選択し得る戦略の組を絞り込む手法を広義支配される戦略の逐次消去と呼びます。
プレイヤーたちが支配される戦略の逐次消去にしたがって意思決定を行うことを保証するためには、プレイヤーの合理性が共有知識であることを仮定する必要があります。
ナッシュ均衡と呼ばれる均衡概念について解説します。
戦略型ゲームにおいてプレイヤーたちの純粋戦略の組に注目したときに、その組を構成する戦略がお互いに最適反応になっているならば、その組を純粋戦略ナッシュ均衡と呼びます。純粋戦略ナッシュ均衡は存在するとは限らず、存在する場合にも一意的であるとは限りません。
戦略型ゲームにおいてプレイヤーたちの純粋戦略の組に注目したときに、その組を構成する戦略がお互いに狭義の最適反応になっているならば、その組を狭義の純粋戦略ナッシュ均衡と呼びます。
戦略型ゲームの混合拡張においてプレイヤーたちの混合戦略の組に注目したときに、その組を構成する混合戦略がお互いに広義の最適反応になっているならば、その組を広義の混合戦略ナッシュ均衡と呼びます。
戦略型ゲームの混合拡張においてプレイヤーたちの混合戦略の組に注目したときに、その組を構成する混合戦略がお互いに狭義の最適反応になっているならば、その組を狭義の混合戦略ナッシュ均衡と呼びます。
戦略型ゲームにナッシュ均衡が存在する場合、そのゲームに支配される戦略の逐次消去を適用すると、そのナッシュ均衡は最後まで残ります。特に、ゲームが逐次消去によって解ける場合、その解はゲームの一意的なナッシュ均衡であることが保証されます。
戦略型ゲームに支配戦略均衡が存在する場合、それはナッシュ均衡であることが保証されます。逆は成立するとは限りません。つまり、ナッシュ均衡は支配戦略均衡であるとは限りません。
ナッシュ均衡はどのような意味において正当化されるのでしょうか。
合理性の仮定や期待効用仮説を採用する限りにおいて、完備情報の静学ゲームにおける均衡概念はナッシュ均衡しか存在しません。しかし、これはあくまでもゲームの分析者の立場から見たときの考え方であり、プレイヤーの視点から考えてみると話が少し複雑になります。
プレイヤーたちが事前交渉を行い何らかの合意に至った場合、それを強制する仕組みが存在しないにも関わらず合意が守られるのであれば、そのような合意は自己拘束的であると言われます。自己拘束的な合意は必ずナッシュ均衡である一方、その逆は成立するとは限りません。
プレイヤーをランダムに変えて同じゲームを繰り返しプレーした結果、ある時点からプレイヤーたちが一定の戦略をプレーするよう状況が安定するのであれば、それは社会的慣習が形成されたことを意味します。社会的慣習が形成される場合、それはナッシュ均衡です。
ゲームに複数のナッシュ均衡が存在する場合、その中のどれをプレイヤーたちが実際にプレーするか必ずしも明らかではありません。
戦略型ゲームに複数のナッシュ均衡が存在する場合、プレイヤーたちはその中のどれを実際にプレーすることになるか必ずしも明らかではありません。これを複数均衡の問題や均衡選択の問題などと呼びます。
戦略型ゲームに複数のナッシュ均衡が存在するとともに、ある均衡からのプレイヤーたちの離脱損失の積が、別の均衡からのプレイヤーたちの離脱損失の積よりも大きい場合、前者の均衡は後者の均衡をリスク支配すると言います。
プレイヤーたちが相談できない状況において何らかの選択を迫られた場合に、ある選択肢が他の選択肢よりも注意を引くものであるならば、それをフォーカルポイントと呼びます。ゲームに複数のナッシュ均衡が存在する場合、その中の1つがフォーカルポイントであれば、プレイヤーたちはそれをプレーすることが予想されます。
ゲームにナッシュ均衡が存在するための条件や、ナッシュ均衡の個数に関する議論を行います。
ナッシュの定理は有限な戦略型ゲームには混合戦略ナッシュ均衡が存在するという主張です。ここでは有限とは限らない戦略型ゲーム(無限ゲーム)にナッシュ均衡が存在するための条件を明らかにします。
本節を読む上で必須となる前提知識はありません。
本節では完備情報の静学ゲームについて解説しましたが、以下では別のクラスのゲームについて学ぶことができます。
不完備情報の静学ゲームとは非協力かつ静学かつ不完備情報であるようなゲームのことです。つまり、そこではプレイヤーたちの間に拘束的な合意は成立せず(非協力)、それぞれのプレイヤーは意思決定を行う際に他のプレイヤーたちが行った意思決定を事前に観察できず(静学)、なおかつ少なくとも1人のプレイヤーがゲームのルールに関して私的情報を持ちます(不完備情報)。不完備情報ゲームにおける均衡概念はベイジアンナッシュ均衡です。