教材一覧
教材一覧
教材検索

目次

Twitter
Mailで保存

ジャンケン

2人がジャンケンを1回だけ行う状況を想定します。2人は同時に「グー」「チョキ」「パー」の3種類の手の中から1つを選択します。一方が「グー」を出し他方が「チョキ」を出した場合には「グー」を出したプレイヤーが勝者です。一方が「チョキ」を出し他方が「パー」を出した場合には「チョキ」を出したプレイヤーが勝者です。一方が「パー」を出し他方が「グー」を出した場合には「パー」を出したプレイヤーが勝者です。2人が同じ手を出した場合には引き分けです。

 

完備情報の静学ゲームとしてジャンケン

ジャンケンが想定する状況を2人をプレイヤーとするゲームと解釈します。2人が事前に相談し何らかの手を出すよう合意した場合でも、その合意には拘束力がないため、ジャンケンは非協力ゲームです。さらに、2人は同時に手を出すことが想定されているため、ジャンケンは静学ゲームです。さらにゲームのルールが2人にとって共有知識であることを仮定するのであれば、ジャンケンを完備情報の静学ゲームとして記述することができます。

そこで、ジャンケンを以下のような戦略型ゲーム\(G\)としてモデル化します。まず、プレイヤー集合は、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}です。それぞれのプレイヤー\(i\in I\)の純粋戦略集合は、\begin{equation*}S_{i}=\left\{ R,S,P\right\}
\end{equation*}です。ただし、\(R\)はグー(Rock)、\(S\)はチョキ(Scissors)、\(P\)はパー(Paper)にそれぞれ対応します。ゲームの結果は以下の行列として整理されます。

$$\begin{array}{cccc}\hline
1\backslash 2 & R & S & P \\ \hline
R & 引き分け & 1が勝ち(2が負け) & 2が勝ち(1 が負け) \\ \hline
S & 2が勝ち(1が負け) & 引き分け & 1が勝ち(2 が負け) \\ \hline
P & 1が勝ち(2が負け)& 2が勝ち(1が負け) & 引き分け \\ \hline
\end{array}$$

表:ジャンケンの結果行列

利得関数として様々な可能性がありますが、典型的なものは「自分が勝つ」「あいこ」「相手が勝つ」の順番で好むというものです。このような状況は、例えば、以下の利得行列として表されます。

$$\begin{array}{cccc}\hline
1\backslash 2 & R & S & P \\ \hline
R & 0,0 & 1,-1 & -1,1 \\ \hline
S & -1,1 & 0,0 & 1,-1 \\ \hline
P & 1,-1 & -1,1 & 0,0 \\ \hline
\end{array}$$

表:ジャンケンの利得行列

 

ジャンケンのナッシュ均衡

ジャンケンには純粋戦略の範囲でナッシュ均衡は存在しません。実際、以下の利得行列においてそれぞれのプレイヤーが最適反応を選択した場合に得られる利得に印\(\ast \)をつけていますが、利得行列から明らかであるように、最適反応の組であるような純粋戦略の組は存在しないからです。

$$\begin{array}{cccc}\hline
1\backslash 2 & R & S & P \\ \hline
R & 0,0 & 1^{\ast },-1 & -1,1^{\ast } \\ \hline
S & -1,1^{\ast } & 0,0 & 1^{\ast },-1 \\ \hline
P & 1^{\ast },-1 & -1,1^{\ast } & 0,0 \\ \hline
\end{array}$$

表:ジャンケンの利得行列

ジャンケンは有限ゲームであるため、ナッシュの定理より、混合戦略の範囲でナッシュ均衡が存在することが保証されます。実際、2人のプレイヤーがともにグー・チョキ・パーを等しい確率で出し合うことが混合戦略ナッシュ均衡になります。しかも、それ以外に混合戦略ナッシュ均衡は存在しません。

命題(ジャンケンのナッシュ均衡)
戦略型ゲーム\(G\)のプレイヤー集合は\(I=\left\{ 1,2\right\} \)であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は\(S_{i}=\left\{ R,S,P\right\} \)であり、利得関数\(u_{i}:S_{1}\times S_{2}\rightarrow \mathbb{R} \)は以下の利得行列
$$\begin{array}{cccc}\hline
1\backslash 2 & R & S & P \\ \hline
R & 0,0 & 1,-1 & -1,1 \\ \hline
S & -1,1 & 0,0 & 1,-1 \\ \hline
P & 1,-1 & -1,1 & 0,0 \\ \hline
\end{array}$$

表:ジャンケンの利得行列

によって表現されているものとする。このゲーム\(G\)の混合拡張\(G^{\ast }\)において、2人のプレイヤーがともに\(R,S,P\)を等確率で選ぶことが広義の混合戦略ナッシュ均衡である。しかも、それ以外に広義の混合戦略ナッシュ均衡は存在しない。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

 

現実のプレイヤーの振る舞い

ジャンケンにおいて、2人がともにグー・パー・チョキを等しい確率で出すことが混合戦略ナッシュ均衡になることが明らかになりました。つまり、双方にとって、相手がグー・パー・チョキを等しい確率で出す限りにおいて、自分もまたグー・パー・チョキを等しい確率で出すことが最適であり、そこから逸脱する動機を持たないということです。加えて、これはジャンケンにおける唯一のナッシュ均衡です。2人が均衡にしたがう場合、\(\frac{1}{3}\)の確率でプレイヤー\(1\)が勝ち、\(\frac{1}{3}\)の確率でプレイヤー\(2\)が勝ち、\(\frac{1}{3}\)の確率であいこになるため、均衡においてそれぞれのプレイヤーが直面する期待利得は、\begin{equation*}1\cdot \frac{1}{3}+\left( -1\right) \cdot \frac{1}{3}+0\cdot \frac{1}{3}=0
\end{equation*}となります。

ただ、現実のプレイヤーは、グー・パー・チョキを完全に等しい確率で出せるとは限りません。例えば、ジャンケンを繰り返しプレーする状況を想定したとき、プレイヤーは毎回、グー・パー・チョキを等しい確率で選んでいると思っていても、何らかの理由により、実際の確率には偏りが出てしまう場合があります。対戦相手が出す手の偏りを察知できるのであれば、もしくは何らかの方法を通じて相手が偏った手を出すように誘導できるのであれば、それに対する最適な戦略は「グー・パー・チョキを等しい確率で出す」とは異なるものになります。

例(手の偏り)
プレイヤー\(1\)は注意深い観察を通じて、プレイヤー\(2\)がグーをわずかに多く出す傾向があることに気づきました。もしくは、心理トリックなどを利用してプレイヤー\(2\)がグーをわずかに多く出す傾向があることに気づいた状況を想定します。プレイヤー\(2\)が出す手の偏りを以下のような混合戦略\begin{equation*}\sigma _{2}=\left( \sigma _{2}\left( R\right) ,\sigma _{2}\left( S\right)
,\sigma _{2}\left( P\right) \right) =\left( \frac{34}{100},\frac{33}{100},\frac{33}{100}\right)
\end{equation*}として表現します。これに対してプレイヤー\(1\)が「グー・パー・チョキを等しい確率で出す」場合、プレイヤー\(1\)の期待利得は、\begin{equation*}\frac{34}{100}\cdot \frac{1}{3}\left( 0-1+1\right) +\frac{33}{100}\cdot
\frac{1}{3}\left( 1-0-1\right) +\frac{33}{100}\cdot \frac{1}{3}\left(
-1+1+0\right) =0
\end{equation*}です。一方、プレイヤー\(1\)が「確実にパーを出す」場合、プレイヤー\(1\)の期待利得は、\begin{equation*}\frac{34}{100}\cdot 1+\frac{33}{100}\cdot \left( -1\right) +\frac{33}{100}\cdot 0=\frac{1}{100}
\end{equation*}となり、より多くの期待利得を見込めます。

理論的には、ジャンケンにおいて2人がともにグー・パー・チョキを等しい確率で出すことが混合戦略ナッシュ均衡です。ただ、現実のプレイヤーは、そのような混合戦略を実行しようとしても、多くの場合、出す手に偏りが出てしまいます。相手プレイヤーが特定の手を少しでも多く出す傾向があれば自分はその手に勝てる手を確実に出すことが最適です。ジャンケンの達人は以上のような「相手の偏り」を上手く利用しているということです。

 

演習問題

問題(非対称の利得のもとでのジャンケン)
戦略型ゲーム\(G\)のプレイヤー集合は\(I=\left\{ 1,2\right\} \)であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は\(S_{i}=\left\{ R,S,P\right\} \)であり、利得関数\(u_{i}:S_{1}\times S_{2}\rightarrow \mathbb{R} \)は以下の利得行列

$$\begin{array}{cccc}
\hline
1\backslash 2 & R & S & P \\ \hline
R & 0,0 & 2,-2 & -1,1 \\ \hline
S & -2,2 & 0,0 & 1,-1 \\ \hline
P & 1,-1 & -1,1 & 0,0 \\ \hline
\end{array}$$

によって表現されているものとします。つまり、グーでチョキで勝った場合の利益は大きく評価され、逆にチョキでグーに負けた場合の損失は大きく評価されるということです。このゲームにナッシュ均衡は存在するでしょうか。議論してください。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

Twitter
Mailで保存

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識

広義の純粋戦略ナッシュ均衡

戦略型ゲームにおいてプレイヤーたちの純粋戦略の組に注目したときに、その組を構成する戦略がお互いに最適反応になっているならば、その組を純粋戦略ナッシュ均衡と呼びます。純粋戦略ナッシュ均衡は存在するとは限らず、存在する場合にも一意的であるとは限りません。

狭義の純粋戦略ナッシュ均衡

戦略型ゲームにおいてプレイヤーたちの純粋戦略の組に注目したときに、その組を構成する戦略がお互いに狭義の最適反応になっているならば、その組を狭義の純粋戦略ナッシュ均衡と呼びます。