WIIS

ゲームの例

硬貨合わせゲーム

目次

関連知識

Mailで保存
Xで共有

硬貨合わせゲーム

2人が同じ硬貨を1枚ずつ持ち寄り、以下のようなゲームを行います。2人のプレイヤーをそれぞれ\(1,2\)と呼びます。2人はそれぞれ硬貨の表と裏のどちらか一方を選び、相手に見せないようにしながら選んだ面を上にして硬貨を同時に置きます。2枚の硬貨の面が揃っている場合にはプレイヤー\(1\)の勝ちとし、プレイヤー\(2\)は相手に自分の硬貨を渡します。2枚の硬貨の面が揃っていない場合にはプレイヤー\(2\)の勝ちとし、プレイヤー\(1\)は相手に自分の硬貨を渡します。これを硬貨合わせゲーム(matching pennies)と呼びます。

 

完備情報の静学ゲームとしての硬貨合わせゲーム

硬貨合わせゲームが想定する状況を2人をプレイヤーとするゲームと解釈します。2人が事前に相談し、どちらの面を選ぶか合意した場合でも、その合意には拘束力がないため、硬貨合わせゲームは非協力ゲームです。さらに、2人は硬貨を相手に見せないようにしながら同時に置く状況を想定しているため、硬貨合わせゲームは静学ゲームです。さらにゲームのルールが2人にとって共有知識であることを仮定するのであれば、硬貨合わせゲームを完備情報の静学ゲームとして記述することができます。

そこで、硬貨合わせゲームを以下のような戦略型ゲーム\(G\)としてモデル化します。まず、プレイヤー集合は、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}です。それぞれのプレイヤー\(i\in I\)の純粋戦略集合は、\begin{equation*}S_{i}=\left\{ H,T\right\}
\end{equation*}です。ただし、\(H\)は表(Head)、\(T\)は裏(Tail)にそれぞれ対応します。ゲームの結果は以下の行列として整理されます。

$$\begin{array}{ccc}\hline
1\backslash 2 & H & T \\ \hline
H & 1が勝ち(2が負け)
& 2が勝ち(1が負け) \\
\hline
T & 2が勝ち(1が負け)
& 1が勝ち(2が負け) \\
\hline
\end{array}$$

表:硬貨合わせゲームの結果行列

利得関数として様々な可能性がありますが、典型的なものは「自身が得る硬貨の枚数と利得を同一視する」というものです。このような状況は以下の利得行列として表されます。

$$\begin{array}{ccc}\hline
1\backslash 2 & H & T \\ \hline
H & 1,-1 & -1,1 \\ \hline
T & -1,1 & 1,-1 \\ \hline
\end{array}$$

表:硬貨合わせゲームの利得行列
例(コイン合わせゲーム)
2人のプレイヤーが持ち寄った硬貨が\(500\)円硬貨であり、なおかつ、プレイヤーの利得を「自身が得る金額」と同一視する場合、硬貨合わせゲームの利得行列は、
$$\begin{array}{ccc}\hline
1\backslash 2 & H & T \\ \hline
H & 500,-500 & -500,500 \\ \hline
T & -500,500 & 500,-500 \\ \hline
\end{array}$$

表:硬貨合わせゲームの利得行列

となります。これもまた硬貨合わせゲームです。

 

コイン合わせゲームのナッシュ均衡

コイン合わせゲームには純粋戦略の範囲でナッシュ均衡は存在しません。実際、以下の利得行列においてそれぞれのプレイヤーが最適反応を選択した場合に得られる利得に印\(\ast \)をつけていますが、利得行列から明らかであるように、最適反応の組であるような純粋戦略の組は存在しないからです。

$$\begin{array}{ccc}\hline
1\backslash 2 & H & T \\ \hline
H & 1^{\ast },-1 & -1,1^{\ast } \\ \hline
T & -1,1^{\ast } & 1^{\ast },-1 \\ \hline
\end{array}$$

表:硬貨合わせゲームの利得行列

コイン合わせゲームは有限ゲームであるため、ナッシュの定理より、混合戦略の範囲でナッシュ均衡が存在することが保証されます。実際、2人のプレイヤーがともに表と裏を等しい確率で選ぶことが混合戦略ナッシュ均衡になります。しかも、それ以外に混合戦略ナッシュ均衡は存在しません。

命題(コイン合わせゲームのナッシュ均衡)
戦略型ゲーム\(G\)のプレイヤー集合は\(I=\left\{ 1,2\right\} \)であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は\(S_{i}=\left\{ H,T\right\} \)であり、利得関数\(u_{i}:S_{1}\times S_{2}\rightarrow \mathbb{R} \)は以下の利得行列
$$\begin{array}{ccc}\hline
1\backslash 2 & H & T \\ \hline
H & 1,-1 & -1,1 \\ \hline
T & -1,1 & 1,-1 \\ \hline
\end{array}$$

表:硬貨合わせゲームの利得行列

によって表現されているものとする。このゲーム\(G\)の混合拡張\(G^{\ast }\)において、2人のプレイヤーがともに\(H,T\)を等確率で選ぶことが広義の混合戦略ナッシュ均衡である。しかも、それ以外に広義の混合戦略ナッシュ均衡は存在しない。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

 

現実のプレイヤーの振る舞い

硬貨合わせゲームにおいて、2人のプレイヤーがともに表と裏を等しい確率で選ぶことが混合戦略ナッシュ均衡になることが明らかになりました。つまり、双方にとって、相手が表と裏を等しい確率で選ぶ限りにおいて、自分もまた表と裏を等しい確率で選ぶことが最適であり、そこから逸脱する動機を持たないということです。加えて、これは硬貨合わせゲームにおける唯一のナッシュ均衡です。2人が均衡にしたがう場合、\(\frac{1}{2}\)の確率でプレイヤー\(1\)が勝ち、\(\frac{1}{2}\)の確率でプレイヤー\(2\)が勝つため、均衡においてそれぞれのプレイヤーが直面する期待利得は、\begin{equation*}1\cdot \frac{1}{2}+\left( -1\right) \cdot \frac{1}{2}=0
\end{equation*}となります。

ただ、現実のプレイヤーは、表と裏を完全に等しい確率で選ぶことができるとは限りません。例えば、硬貨合わせゲームを繰り返しプレーする状況を想定したとき、プレイヤーは毎回、表と裏を等しい確率で選んでいると思っていても、何らかの理由により、実際の確率には偏りが出てしまう場合があります。対戦相手によるプレーの偏りを察知できるのであれば、もしくは何らかの方法を通じて相手が偏ったプレーをするよう誘導できるのであれば、それに対する最適な戦略は「表と裏を等しい確率で選ぶ」とは異なるものになります。実際、プレイヤー\(2\)の混合戦略を、\begin{equation*}\sigma _{2}=(\sigma _{2}\left( H\right) ,\sigma _{2}\left( T\right)
,)=(\sigma _{2},1-\sigma _{2})
\end{equation*}で表記する場合、それに対するプレイヤー\(1\)の最適反応対応\(b_{1}:\left[ 0,1\right] \rightarrow \mathbb{R} \)は、\begin{equation*}b_{1}\left( \sigma _{2}\right) =\left\{
\begin{array}{cl}
0 & \left( if\ 0\leq \sigma _{2}<\frac{1}{2}\right) \\
\left[ 0,1\right] & \left( if\ \sigma _{2}=\frac{1}{2}\right) \\
1 & \left( if\ \frac{1}{2}<\sigma _{2}\leq 1\right)
\end{array}\right.
\end{equation*}を満たすため(演習問題)、プレイヤー\(2\)が裏を少しでも多く出す傾向があればプレイヤー\(1\)は確実に裏を出すことが最適であり、逆に、プレイヤー\(2\)が表を少しでも多く出す傾向があればプレイヤー\(1\)は確実に表を出すことが最適です。プレイヤー\(2\)の立場からも同様の議論が成り立ちます。ギャンブルの達人は以上のような「相手の偏り」を上手く利用しているということです。

 

演習問題

問題(硬貨合わせゲームにおける最適反応対応)
硬貨合わせゲームにおいて、プレイヤー\(2\)の混合戦略を、\begin{equation*}\sigma _{2}=(\sigma _{2}\left( H\right) ,\sigma _{2}\left( T\right)
,)=(\sigma _{2},1-\sigma _{2})
\end{equation*}で表記する場合、それに対するプレイヤー\(1\)の最適反応対応\(b_{1}:\left[ 0,1\right] \rightarrow \mathbb{R} \)は、\begin{equation*}b_{1}\left( \sigma _{2}\right) =\left\{
\begin{array}{cl}
0 & \left( if\ 0\leq \sigma _{2}<\frac{1}{2}\right) \\
\left[ 0,1\right] & \left( if\ \sigma _{2}=\frac{1}{2}\right) \\
1 & \left( if\ \frac{1}{2}<\sigma _{2}\leq 1\right)
\end{array}\right.
\end{equation*}であることを示してください。また、プレイヤー\(1\)の混合戦略を、\begin{equation*}\sigma _{1}=\left( \sigma _{1}\left( H\right) ,\sigma _{1}\left( T\right)
\right) =\left( \sigma _{1},1-\sigma _{1}\right)
\end{equation*}で表記する場合、それに対するプレイヤー\(2\)の最適反応対応\(b_{2}:\left[ 0,1\right] \rightarrow \mathbb{R} \)は、\begin{equation*}b_{2}\left( \sigma _{1}\right) =\left\{
\begin{array}{cl}
1 & \left( if\ 0\leq \sigma _{1}<\frac{1}{2}\right) \\
\left[ 0,1\right] & \left( if\ \sigma _{1}=\frac{1}{2}\right) \\
0 & \left( if\ \frac{1}{2}<\sigma _{1}\leq 1\right)
\end{array}\right.
\end{equation*}であることを示してください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員専用コンテンツです
ログイン】【会員登録

ゲームの例