WIIS

ゲームの例

チキンゲームとコミットメント

目次

Twitter
Mailで保存

チキンゲーム

2人のドライバーがお互いに相手の車に向かって一直線に走行し、衝突寸前まで車を走らせるゲームをチキンゲーム(game of
chicken)と呼びます。

チキンゲームにおいてそれぞれのドライバーに与えられている選択肢は、衝突の寸前にそのまま直進するか、ハンドルを切って回避するかのどちらか一方です。一方のドライバーがそのまま直進し、他方のドライバーがハンドルを切って回避した場合、直進したドライバーは勝者であり、回避したドライバーは敗者です。2人ともハンドルを切って回避した場合には引き分けです。また、2人とも直進した場合には車は衝突してしまうため、勝ち負けどころではありません。

それぞれのドライバーにとって最も望ましい結果は自分だけが直進してゲームの勝者になることであり、次点で望ましい結果は2人とも回避して引き分けになることです。自分だけが回避してゲームの敗者になることは次に望ましく、2人とも直進して衝突することが最悪の結果です。

チキンゲームでは相手が回避する場合には自分は直進した方がよく、逆に相手が直進する場合には自分は回避した方がよいという構造になっています。つまり、相手とは異なる選択肢を選ぶことが最適であるということです。ただし、相手が実際にどちらを選んでくるか事前に予測できないため、話は簡単ではありません。

 

完備情報の静学ゲームとしてのチキンゲーム

チキンゲームが想定する状況を2人のドライバーをプレイヤーとするゲームと解釈します。チキンゲームが度胸試しのために行われる場合、ドライバーどうしが事前に打ち合わせを行う動機がありません。また、仮に2人のドライバーは事前に話し合いをした場合でも、その結果には拘束力がありません。したがってチキンゲームは非協力ゲームです。2人のドライバーは衝突の直前に意思決定を行いますが、その瞬間に相手の行動を観察してから自分の行動を決定することは困難であるため、実質的には2人は同時に意思決定を行うことになります。したがってチキンゲームは静学ゲームです。さらにゲームのルールが2人にとって共有知識であることを仮定するのであれば、チキンゲームを完備情報の静学ゲームとして記述することができます。

そこで、チキンゲームを以下のような戦略型ゲーム\(G\)としてモデル化します。まず、プレイヤー集合は、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}です。ただし、\(i\in I\)はドライバー\(i\)を表します。また、プレイヤー\(i\)の純粋戦略は、\begin{equation*}S_{i}=\left\{ C,D\right\}
\end{equation*}です。ただし、\(C\)は協調戦略である回避を表し(Cooperate の C)、\(D\)は裏切り戦略である直進を表します(Defect の D)。ゲームの結果は以下の行列として整理されます。

$$\begin{array}{|c|c|c|}
\hline
1\setminus 2 & C & D \\ \hline
C & 引き分け & 2の勝利(1の敗北) \\ \hline
D & 1の勝利(2の敗北)& 衝突 \\ \hline
\end{array}$$

利得関数としては様々な可能性がありますが、典型的なものは、\begin{equation*}
a>b>c>d
\end{equation*}を満たす実数\(a,b,c,d\in \mathbb{R} \)を用いて、

$$\begin{array}{|c|c|c|}
\hline
1\setminus 2 & C & D \\ \hline
C & b,b & c,a \\ \hline
D & a,c & d,d \\ \hline
\end{array}$$

として表現されます。つまり、双方のプレイヤーにとって自分が勝つことが最も望ましく(利得\(a\)を得る)、引き分けが2番目に望ましく(利得\(b\)を得る)、自分が負けることは3番目に望ましく(\(c\)を得る)、衝突することは最も望ましくありません(利得\(d\)を得る)。

例(チキンゲーム)
以下の利得行列はチキンゲームとしての条件を満たしています。

$$\begin{array}{|c|c|c|}
\hline
1\setminus 2 & C & D \\ \hline
C & 0,0 & -1,1 \\ \hline
D & 1,-1 & -10,-10 \\ \hline
\end{array}$$

例(チキンゲーム)
以下の利得行列はチキンゲームとしての条件を満たしています。

$$\begin{array}{|c|c|c|}
\hline
1\setminus 2 & C & D \\ \hline
C & 5,5 & 2,7 \\ \hline
D & 7,2 & 0,0 \\ \hline
\end{array}$$

 

チキンゲームのナッシュ均衡

チキンゲームにおいて双方のプレイヤーは支配戦略を持ちません。実際、プレイヤー\(1\)について、\begin{eqnarray*}u_{1}\left( D,C\right) &=&a>b=u_{1}\left( C,C\right) \\
u_{1}\left( C,D\right) &=&c>d=u_{1}\left( D,D\right)
\end{eqnarray*}が成り立ちますが、以上の事実は相手の\(C\)に対する最適反応が\(D\)であり、相手の\(D\)に対する最適反応が\(C\)であることを意味します。相手の戦略に応じて最適反応が変わるという事実は、プレイヤー\(1\)は支配戦略を持たないことを意味します。プレイヤー\(2\)についても同様です。したがって、チキンゲームには支配戦略均衡や支配される戦略の逐次消去による解は存在しないことが明らかになりました。

その一方で、チキンゲームには以下の2つの純粋戦略ナッシュ均衡が存在します。

命題(チキンゲームの純粋戦略ナッシュ均衡)
戦略型ゲーム\(G\)のプレイヤー集合は\(I=\left\{ 1,2\right\} \)であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は\(S_{i}=\left\{ C,D\right\} \)であり、利得関数\(u_{i}:S_{1}\times S_{2}\rightarrow \mathbb{R} \)は、\begin{equation*}a>b>c>d
\end{equation*}を満たす実数\(a,b,c,d\in \mathbb{R} \)を用いて、以下の利得行列

$$\begin{array}{|c|c|c|}
\hline
1\setminus 2 & C & D \\ \hline
C & b,b & c,a \\ \hline
D & a,c & d,d \\ \hline
\end{array}$$

によって表現されているものとする。このゲーム\(G\)には純粋戦略ナッシュ均衡が存在し、それは以下の2つ\begin{eqnarray*}\left( s_{1}^{\ast },s_{2}^{\ast }\right) &=&\left( C,D\right) \\
\left( s_{1}^{\ast },s_{2}^{\ast }\right) &=&\left( D,C\right)
\end{eqnarray*}である。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

以上の命題より、チキンゲームには2つの純粋戦略ナッシュ均衡\(\left( C,D\right) ,\left( D,C\right) \)が存在することが明らかになりました。ただし、\(\left( C,D\right) \)はプレイヤー\(1\)だけが回避する結果に相当し、\(\left( D,C\right) \)はドライバー\(2\)だけが回避する結果に相当します。

チキンゲームには先の2つの純粋戦略とは異なる混合戦略ナッシュ均衡が存在します。

命題(チキンゲームの混合戦略ナッシュ均衡)
戦略型ゲーム\(G\)のプレイヤー集合は\(I=\left\{ 1,2\right\} \)であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は\(S_{i}=\left\{ C,D\right\} \)であり、利得関数\(u_{i}:S_{1}\times S_{2}\rightarrow \mathbb{R} \)は、\begin{equation*}a>b>c>d
\end{equation*}を満たす実数\(a,b,c,d\in \mathbb{R} \)を用いて、以下の利得行列

$$\begin{array}{|c|c|c|}
\hline
1\setminus 2 & C & D \\ \hline
C & b,b & c,a \\ \hline
D & a,c & d,d \\ \hline
\end{array}$$

によって表現されているものとする。2人の混合戦略を、\begin{eqnarray*}
\sigma _{1} &=&\left( \sigma _{1}\left( C\right) ,\sigma _{1}\left( D\right)
\right) =\left( \sigma _{1},1-\sigma _{1}\right) \\
\sigma _{2} &=&\left( \sigma _{2}\left( C\right) ,\sigma _{2}\left( D\right)
\right) =\left( \sigma _{2},1-\sigma _{2}\right)
\end{eqnarray*}で表記する。このゲーム\(G\)には混合戦略ナッシュ均衡が存在し、それは以下の3つ\begin{eqnarray*}\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) &=&\left( 1,0\right)
\\
\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) &=&\left( 0,1\right)
\\
\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) &=&\left( \frac{c-d}{a-b+c-d},\frac{c-d}{a-b+c-d}\right)
\end{eqnarray*}である。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(チキンゲームのナッシュ均衡)
以下の利得行列はチキンゲームとしての条件を満たしています。

$$\begin{array}{|c|c|c|}
\hline
1\setminus 2 & C & D \\ \hline
C & 0,0 & -1,1 \\ \hline
D & 1,-1 & -10,-10 \\ \hline
\end{array}$$

先の命題より、このゲームには純粋戦略の範囲で2つのナッシュ均衡\(\left( C,D\right) ,\left( D,C\right) \)が存在するとともに、これらとは別に、混合戦略の範囲でナッシュ均衡\begin{eqnarray*}\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) &=&\left( \frac{-1+10}{1-0-1+10},\frac{-1+10}{1-0-1+10}\right) \\
&=&\left( \frac{9}{10},\frac{9}{10}\right)
\end{eqnarray*}が存在します。つまり、「\(1\)だけが\(C\)を選ぶ」と「\(2\)だけが\(C\)を選ぶ」に加えて、「\(1\)と\(2\)はともに確率\(\frac{9}{10}\)で\(C\)を選ぶ」ことがナッシュ均衡です。

例(チキンゲーム)
以下の利得行列はチキンゲームとしての条件を満たしています。

$$\begin{array}{|c|c|c|}
\hline
1\setminus 2 & C & D \\ \hline
C & 5,5 & 2,7 \\ \hline
D & 7,2 & 0,0 \\ \hline
\end{array}$$

先の命題より、このゲームには純粋戦略の範囲で2つのナッシュ均衡\(\left( C,D\right) ,\left( D,C\right) \)が存在するとともに、これらとは別に、混合戦略の範囲でナッシュ均衡\begin{eqnarray*}\left( \sigma _{1}^{\ast },\sigma _{2}^{\ast }\right) &=&\left( \frac{2-0}{7-5+2-0},\frac{2-0}{7-5+2-0}\right) \\
&=&\left( \frac{1}{2},\frac{1}{2}\right)
\end{eqnarray*}が存在します。つまり、「\(1\)だけが\(C\)を選ぶ」と「\(2\)だけが\(C\)を選ぶ」に加えて、「\(1\)と\(2\)はともに確率\(\frac{1}{2}\)で\(C\)を選ぶ」ことがナッシュ均衡です。

 

チキンゲームにおける信憑性のない脅しとコミットメント

チキンゲームにおいて一方のドライバーが相手に対して「おまえがハンドルを切らないと死ぬことになるぞ。なぜなら俺は絶対にハンドルを切らないからな。」と脅しをかけることはできるでしょうか。

プレイヤー\(1\)が先のように相手を脅した状況を想定します。仮にプレイヤー\(2\)がハンドルを切らなかった場合(\(s_{2}=D\))、プレイヤー\(1\)の利得に関して、\begin{equation*}u_{1}\left( C,D\right) =c>d=u_{1}\left( D,D\right)
\end{equation*}が成り立ちます。つまり、プレイヤー\(2\)がハンドルを切らない場合には、プレイヤー\(1\)にとって最適な選択はハンドルを切ること(\(s_{1}=C\))であるため、先の脅しには信憑性がありません。したがって、プレイヤー\(2\)は相手による脅しを真に受ける合理的な理由が存在しないことになります。

プレイヤー\(1\)が自分の脅しを信憑性のない脅しから信憑性のある脅しへ転化させるためには、自分がハンドルを切らないことにコミットする必要があります。例えば、プレイヤー\(1\)が自分の車のハンドルを破壊し、そのことを相手に知らしめることに成功した場合、プレイヤー\(1\)がハンドルを切らないことが双方の共通認識となるため、ゲームは以下の形へと変化します。

$$\begin{array}{|c|c|c|}
\hline
1\setminus 2 & C & D \\ \hline
D & a,c & d,d \\ \hline
\end{array}$$

この新たなゲームにおけるプレイヤー\(2\)の最適戦略は\(C\)であるため、プレイヤー\(1\)は「ハンドルを壊す」というコミットメントデバイスを通じて純粋戦略\(D\)へコミットすることにより、自身にとって最も望ましい結果である\(\left( D,C\right) \)を実現することに成功します。

Twitter
Mailで保存

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識

ジャンケン

2人がジャンケンを1回だけ行う状況を完備情報の静学ゲームとして定式化した上で、そこでのナッシュ均衡を求めます。

広義の純粋戦略ナッシュ均衡

戦略型ゲームにおいてプレイヤーたちの純粋戦略の組に注目したときに、その組を構成する戦略がお互いに最適反応になっているならば、その組を純粋戦略ナッシュ均衡と呼びます。純粋戦略ナッシュ均衡は存在するとは限らず、存在する場合にも一意的であるとは限りません。

広義の混合戦略ナッシュ均衡

戦略型ゲームの混合拡張においてプレイヤーたちの混合戦略の組に注目したときに、その組を構成する混合戦略がお互いに広義の最適反応になっているならば、その組を広義の混合戦略ナッシュ均衡と呼びます。

狭義のナッシュ均衡

戦略型ゲームにおいてプレイヤーたちの戦略の組に注目したときに、その組を構成する戦略がお互いに狭義の最適反応になっているならば、その組を狭義のナッシュ均衡と呼びます。

ナッシュ均衡と支配される戦略の逐次消去の関係

戦略型ゲームにナッシュ均衡が存在する場合、そのゲームに支配される戦略の逐次消去を適用すると、そのナッシュ均衡は最後まで残ります。特に、ゲームが逐次消去によって解ける場合、その解はゲームの一意的なナッシュ均衡であることが保証されます。

ナッシュ均衡と支配戦略均衡の関係

戦略型ゲームに支配戦略均衡が存在する場合、それはナッシュ均衡であることが保証されます。逆は成立するとは限りません。つまり、ナッシュ均衡は支配戦略均衡であるとは限りません。

ナッシュ均衡の正当性

合理性の仮定や期待効用仮説を採用する限りにおいて、完備情報の静学ゲームにおける均衡概念はナッシュ均衡しか存在しません。しかし、これはあくまでもゲームの分析者の立場から見たときの考え方であり、プレイヤーの視点から考えてみると話が少し複雑になります。

ナッシュ均衡と自己拘束的な合意

プレイヤーたちが事前交渉を行い何らかの合意に至った場合、それを強制する仕組みが存在しないにも関わらず合意が守られるのであれば、そのような合意は自己拘束的であると言われます。自己拘束的な合意は必ずナッシュ均衡である一方、その逆は成立するとは限りません。

ナッシュ均衡と社会的慣習

プレイヤーをランダムに変えて同じゲームを繰り返しプレーした結果、ある時点からプレイヤーたちが一定の戦略をプレーするよう状況が安定するのであれば、それは社会的慣習が形成されたことを意味します。社会的慣習が形成される場合、それはナッシュ均衡です。

複数均衡の問題

戦略型ゲームに複数のナッシュ均衡が存在する場合、プレイヤーたちはその中のどれを実際にプレーすることになるか必ずしも明らかではありません。これを複数均衡の問題や均衡選択の問題などと呼びます。

複数均衡問題と利得支配

戦略型ゲームに複数のナッシュ均衡が存在するとともに、ある均衡が別の均衡を狭義にパレート支配することを利得支配と呼びます。

複数均衡問題とリスク支配

戦略型ゲームに複数のナッシュ均衡が存在するとともに、ある均衡からのプレイヤーたちの離脱損失の積が、別の均衡からのプレイヤーたちの離脱損失の積よりも大きい場合、前者の均衡は後者の均衡をリスク支配すると言います。

複数均衡問題とフォーカルポイント

プレイヤーたちが相談できない状況において何らかの選択を迫られた場合に、ある選択肢が他の選択肢よりも注意を引くものであるならば、それをフォーカルポイントと呼びます。ゲームに複数のナッシュ均衡が存在する場合、その中の1つがフォーカルポイントであれば、プレイヤーたちはそれをプレーすることが予想されます。

コミットメント問題とコミットメントデバイス

プレイヤーが自身の選択肢を意図的に狭めることを通じて、約束を破った場合に自身がより不利になる状況を意図的に作り出し、約束に信憑性を持たようとする行動をコミットメントと呼びます。コミットメントは信憑性のない脅しを信憑性のある脅しへ転化させます。

ゲームの例