WIIS

ゲームの例

旅行者のジレンマ(旅人のジレンマ)

目次

Mailで保存
Xで共有

旅行者のジレンマ

航空会社が2人の旅行者のスーツケースを紛失しました。2人の旅行者は知り合いではありませんが、偶然にも彼らは同じスーツケースを使っており、さらに、2つのスーツケースの中には同一の骨董品が入っていました。旅行者たちは骨董品の価値を知っていますが、航空会社の責任者は骨董品の価値を知りません。そこで責任者は旅行者に対して、それぞれ最大で\(100\)ドルまで補償金を支払う用意があると伝えました。ただし、責任者は支払額をなるべく抑えたいため、旅行者から骨董品の価値を聞き出すべく以下のように行動しました。

まず、2人の旅行者を別々の部屋へ通し、彼らがお互いに相談できない状態にします。続いて、それぞれの旅行者に対して、骨董品の価値を申告させます。ただし、申告額は\(2\)以上\(100\)以下の整数でなければなりません。2人の旅行者を\(1,2\)と呼び、彼らによる申告額をそれぞれ\(s_{1},s_{2}\)で表記します。

その際、補償額は以下のルールのもとで決定されることを旅行者に対して伝えます。

  1. 2人の申告額が一致する場合には、その金額を2人の旅行者に対してそれぞれ支払う。つまり、\(s_{1}=s_{2}\)の場合には、旅行者\(1\)は\(s_{1}\)を受け取り、旅行者\(2\)は\(s_{2}\)を受け取る(2人は同額を受け取る)。
  2. 2人の申告額が異なる場合には、まず、より低いほうの申告額を基準額として採用する。その上で、より低い金額を申告した旅行者には基準額に\(P\)ドルを上乗せした金額を支払い、より高い金額を申告した旅行者には基準額から\(P\)ドルを差し引いた金額を支払う。ただし、\(P>1\)であるとともに、旅行者に罰金が課されることはない。つまり、\(s_{1}<s_{2}\)の場合には、旅行者\(1\)は\(s_{1}+P\)ドルを受け取り、旅行者\(2\)は\(\max \left\{ s_{1}-P,0\right\} \)ドルを受け取る。逆に、\(s_{2}<s_{1}\)の場合には、旅行者\(1\)は\(\max \left\{ s_{2}-P,0\right\} \)ドルを受け取り、旅行者\(2\)は\(s_{2}+P\)ドルを受け取る。

つまり、航空会社側は補償額のつり上げを望まないため、より低い金額を申告した人に\(P\)だけ追加に報奨を与える一方で、より高い金額を申告した人に\(P\)だけペナルティーを課すということです。以上のルールを踏まえた場合、2人の旅行者はそれぞれいくらを申告すべきでしょうか。ただし、旅行者はなるべく多くの金額を受け取ることを望むものとします。

これはインドの経済学者カウシク・バスー(Kaushik Basu)が1994年に発表した旅行者のジレンマ(Traveler’s dilemma)と呼ばれる問題です。

 

完備情報の静学ゲームとして旅行者のジレンマ

旅行者のジレンマが想定する状況を2人の旅行者をプレイヤーとするゲームと解釈します。2人の旅行者は別々の部屋に隔離されているため、両者が事前交渉を行うことはできず、したがって拘束的合意は成立し得ません。仮に、2人が隔離される前に何らかの約束をしていた場合でも、その約束には拘束力がありません。したがって旅行者のジレンマは非協力ゲームです。さらに、2人は別々の部屋に隔離されているため相談できず、相手の意思決定を観察できない状態で意思決定を行うことを強いられるため、旅行者のジレンマは静学ゲームです。さらにゲームのルールが2人にとって共有知識であることを仮定するのであれば、旅行者のジレンマを完備情報の静学ゲームとして記述することができます。

そこで、旅行者のジレンマを以下のような戦略型ゲーム\(G\)としてモデル化します。まず、プレイヤー集合は、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}です。ただし、\(i\in I\)は旅行者\(i\)を表します。また、それぞれのプレイヤーの純粋戦略は申告額に相当するため、純粋戦略集合は、\begin{eqnarray*}S_{1}=S_{2} &=&\left\{ 2,3,4,\cdots ,99,100\right\} \\
&=&\left\{ z\in \mathbb{Z} \ |\ 2\leq z\leq 100\right\}
\end{eqnarray*}となります。利得関数としては様々な可能性がありますが、プレイヤーたちは自身が受け取る金額と利得を同一視する場合、プレイヤー\(1\)の利得関数\(u_{1}:S_{1}\times S_{2}\rightarrow \mathbb{R} \)が申告額の組\(\left( s_{1},s_{2}\right)\in S_{1}\times S_{2}\)に対して定める値は、\begin{equation*}u_{1}\left( s_{1},s_{2}\right) =\left\{
\begin{array}{cl}
s_{1}+P & \left( if\ s_{1}<s_{2}\right) \\
s_{1} & \left( if\ s_{1}=s_{2}\right) \\
\max \left\{ s_{2}-P,0\right\} & \left( if\ s_{1}>s_{2}\right)
\end{array}\right.
\end{equation*}である一方で、プレイヤー\(2\)の利得関数\(u_{2}:S_{1}\times S_{2}\rightarrow \mathbb{R} \)が申告額の組\(\left( s_{1},s_{2}\right)\in S_{1}\times S_{2}\)に対して定める値は、\begin{equation*}u_{2}\left( s_{1},s_{2}\right) =\left\{
\begin{array}{cl}
s_{2}+P & \left( if\ s_{2}<s_{1}\right) \\
s_{2} & \left( if\ s_{2}=s_{1}\right) \\
\max \left\{ s_{1}-P,0\right\} & \left( if\ s_{2}>s_{1}\right)
\end{array}\right.
\end{equation*}となります。ただし、\(P>1\)です。

例(旅人のジレンマ)
戦略型ゲーム\(G\)のプレイヤー集合が、\begin{equation*}I=\left\{ 1,2\right\}
\end{equation*}であり、純粋戦略集合が、\begin{equation*}
S_{1}=S_{2}=\left\{ z\in \mathbb{Z} \ |\ 2\leq z\leq 100\right\}
\end{equation*}であり、プレイヤーたちの利得関数\(u_{1},u_{2}:S_{1}\times S_{2}\rightarrow \mathbb{R} \)がそれぞれの\(\left( s_{1},s_{2}\right)\in S_{1}\times S_{2}\)に対して定める値が、\begin{eqnarray*}u_{1}\left( s_{1},s_{2}\right) &=&\left\{
\begin{array}{cl}
s_{1}+2 & \left( if\ s_{1}<s_{2}\right) \\
s_{1} & \left( if\ s_{1}=s_{2}\right) \\
s_{2}-2 & \left( if\ s_{1}>s_{2}\right)
\end{array}\right. \\
u_{2}\left( s_{1},s_{2}\right) &=&\left\{
\begin{array}{cl}
s_{2}+2 & \left( if\ s_{2}<s_{1}\right) \\
s_{2} & \left( if\ s_{2}=s_{1}\right) \\
s_{1}-2 & \left( if\ s_{2}>s_{1}\right)
\end{array}\right.
\end{eqnarray*}である場合、これは\(P=2\)の場合の旅行者のジレンマです。

 

旅行者のジレンマの均衡

旅行者のジレンマは広義支配される戦略の逐次消去によって解くことができます。

命題(旅行者のジレンマの均衡)
戦略型ゲーム\(G\)のプレイヤー集合は\(I=\left\{ 1,2\right\} \)であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は、\begin{equation*}S_{1}=S_{2}=\left\{ z\in \mathbb{Z} \ |\ 2\leq z\leq 100\right\}
\end{equation*}であり、それぞれのプレイヤー\(i\)の利得関数\(u_{i}:S_{1}\times S_{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( s_{1},s_{2}\right)\in S_{1}\times S_{2}\)に対して、\begin{eqnarray*}u_{1}\left( s_{1},s_{2}\right) &=&\left\{
\begin{array}{cl}
s_{1}+P & \left( if\ s_{1}<s_{2}\right) \\
s_{1} & \left( if\ s_{1}=s_{2}\right) \\
\max \left\{ s_{2}-P,0\right\} & \left( if\ s_{1}>s_{2}\right)
\end{array}\right. \\
u_{2}\left( s_{1},s_{2}\right) &=&\left\{
\begin{array}{cl}
s_{2}+P & \left( if\ s_{2}<s_{1}\right) \\
s_{2} & \left( if\ s_{2}=s_{1}\right) \\
\max \left\{ s_{1}-P,0\right\} & \left( if\ s_{2}>s_{1}\right)
\end{array}\right.
\end{eqnarray*}を定めるものとする。ただし、\(P>1\)である。このゲーム\(G\)は広義支配される戦略の逐次消去によって解くことができ、その解は、\begin{equation*}\left( s_{1},s_{2}\right) =\left( 2,2\right)
\end{equation*}となる。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

 

旅行者のジレンマの均衡解釈

旅行者のジレンマは広義支配される戦略の逐次消去によって解くことができるとともに、2人の旅行者がともに最低額である\(2\)を申告することが逐次消去の解になることが明らかになりました。したがって、均衡結果において2人の旅行者はともに航空会社から補償金\(2\)だけを受け取ることになります。\(P\)の水準は、より低い金額を申告した旅行者に対する追加的な報酬であるとともに、より高い金額を申告した旅行者に課すペナルティーでもあります。モデルの仮定より\(P>1\)ですが、\(P>1\)を満たす任意の金額\(P\)について同様の議論が成立するため、\(P\)の大きさは結果に影響を与えません。

航空会社はそれぞれの旅行者に対して補償金を\(100\)まで支払う用意があるにも関わらず、先述の補償額決定ルールを導入することにより、補償額を最低額に抑えることができます。この結果は現実的でしょうか。

先の命題の証明から明らかであるように、当初のゲーム\(G\)に対して広義支配される戦略の逐次消去を適用して最終的な解へ至るまでに、逐次消去を何度も繰り返す必要がありますが、その度に、プレイヤーの合理性と警戒心に関する仮定を必要な深さまで積み重ねる必要があります。

具体的には、初期ゲーム\(G\)の純粋戦略集合は、\begin{equation*}S_{1}=S_{2}=\left\{ 2,3,4,\cdots ,98,99,100\right\}
\end{equation*}ですが、初期ゲーム\(G\)に対して広義支配される戦略の逐次消去を適用することにより、第\(1\)期のゲーム\(G_{1}\)における純粋戦略集合\begin{equation*}S_{1}^{1}=S_{2}^{1}=\left\{ 2,3,4,\cdots ,98,99\right\}
\end{equation*}が得られます。ゲームが\(G\)から\(G_{1}\)へ移行し、プレイヤー\(1,2\)がともにそのことを認識し合っている状態へ到達するためには以下の仮定が必要です。

  1. \(2\)の合理性と警戒心を仮定する。このとき、自身の利得を最大化する\(2\)は\(G\)において\(100\)を選ばない。したがって、\(2\)は自身が直面するゲームが\(G\)から\(G_{1}\)へ移行することを認識できる。
  2. \(1\)が「\(2\)が合理的かつ警戒的である」ことを知っているものと仮定する。このとき\(1\)は、\(2\)が\(G\)において\(100\)を選ばないと判断できる。したがって、\(1\)は自分と相手が直面するゲームが\(G\)から\(G_{1}\)へ移行することを認識できる。
  3. \(2\)は「\(1\)が「\(2\)が合理的かつ警戒的である」ことを知っている」ことを知っているものと仮定する。このとき\(2\)は、「\(1\)は「\(2\)は\(G\)において\(100\)を選ばない」と考える」と判断できる。したがって、\(2\)は相手が直面するゲームが\(G\)から\(G_{1}\)へ移行することを認識できる。

第\(1\)期のゲーム\(G\)に対して広義支配される戦略の逐次消去を適用することにより、第\(2\)期のゲーム\(G_{2}\)における純粋戦略集合\begin{equation*}S_{1}^{2}=S_{2}^{2}=\left\{ 2,3,4,\cdots ,98\right\}
\end{equation*}が得られます。ゲームが\(G_{1}\)から\(G_{2}\)へ移行し、プレイヤー\(1,2\)がともにそのことを認識し合っている状態へ到達するためには、先の仮定よりもより深い仮定が必要です。同様のプロセスを合計\(98\)回繰り返すことにより、最終的に、第\(98\)期のゲーム\(G_{98}\)における純粋戦略集合\begin{equation*}S_{1}^{98}=S_{2}^{98}=\left\{ 2\right\}
\end{equation*}が得られるとともに、これが逐次消去の最終的な解になります。ただし、この解が実現するまでの\(98\)回の逐次消去を行っており、その度に必要な仮定は深くかつ膨大になります。したがって、現実問題として、理論的な解\(\left(2,2\right) \)は必ずしも実現しません。

 

演習問題

問題(旅行者がペナルティーを支払う可能性を認めるケース)
本文中では、旅行者\(i\)が提示した金額のほうが高い場合(\(s_{i}>s_{j}\))、旅行者\(i\)が受け取る保証額を、\begin{equation*}u_{i}\left( s_{i},s_{j}\right) =\max \left\{ s_{j}-P,0\right\}
\end{equation*}と定めました。つまり、旅行者が航空会社に対して逆に支払うような事態は起こり得ないということです。では、旅行者が航空会社に対して逆に支払いを行う事態が起こり得る場合、すなわち、\(s_{i}>s_{j}\)の場合に、\begin{equation*}u_{j}\left( s_{i},s_{j}\right) =s_{i}-P
\end{equation*}と定める場合、分析結果は変化するでしょうか。議論してください。

解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(ペナルティーが自身の申告額に対してかかるケース)
本文中では、旅行者\(i\)が提示した金額のほうが高い場合(\(s_{i}>s_{j}\))、旅行者\(i\)が受け取る保証額を、\begin{equation*}u_{i}\left( s_{i},s_{j}\right) =\max \left\{ s_{j}-P,0\right\}
\end{equation*}と定めました。つまり、旅行者\(i\)は相手の提示額\(s_{j}\)からペナルティー\(P\)を差し引いた金額を受け取るということです。また、旅行者が航空会社に対して逆に支払いを行う事態は起こり得ません。では、旅行者\(i\)は自身の提示額\(s_{i}\)からペナルティー\(P\)を差し引いた金額を受け取る場合、すなわち、\(s_{i}>s_{j}\)の場合に、\begin{equation*}u_{i}\left( s_{i},s_{j}\right) =\max \left\{ s_{i}-P,0\right\}
\end{equation*}と定める場合、分析結果は変化するでしょうか。議論してください。ただし、\(1<P<49\)が成り立つものとします。
解答を見る

プレミアム会員専用コンテンツです
ログイン】【会員登録

関連知識

Mailで保存
Xで共有

質問とコメント

プレミアム会員専用コンテンツです

会員登録

有料のプレミアム会員であれば、質問やコメントの投稿と閲覧、プレミアムコンテンツ(命題の証明や演習問題とその解答)へのアクセスなどが可能になります。

ワイズのユーザーは年齢・性別・学歴・社会的立場などとは関係なく「学ぶ人」として対等であり、お互いを人格として尊重することが求められます。ユーザーが快適かつ安心して「学ぶ」ことに集中できる環境を整備するため、広告やスパム投稿、他のユーザーを貶めたり威圧する発言、学んでいる内容とは関係のない不毛な議論などはブロックすることになっています。詳細はガイドラインをご覧ください。

誤字脱字、リンク切れ、内容の誤りを発見した場合にはコメントに投稿するのではなく、以下のフォームからご連絡をお願い致します。

プレミアム会員専用コンテンツです
ログイン】【会員登録

ゲームの例