背景
私は趣味でランニングやトレイルランニングを行っています。以前、夜間にトレイルを走っている際に足の置き場を間違えて怪我をしました。通常、放っておいても怪我は自然に治るのですが、当時は完治までに時間がかかりました。「少し良くなったら走り、結果として怪我が再発・悪化する」というプロセスを繰り返してしまったからです。その後、完全休養期間を設けたため怪我は完治しましたが、そのプロセスの中で考えたことを以下にまとめます。
怪我をしたランナーは走らない方が良い理由
怪我が完治するまでの総期間を、\begin{equation*}
T
\end{equation*}で表記し、各期間を、\begin{equation*}
t\in \left\{ 0,1,\cdots ,T\right\}
\end{equation*}で表記します。現時点\(t=0\)においては怪我をしていますが、時点\(t=T\)において怪我が完治します。完治までの期間\(T\)は定数ではなく、各期におけるランナーの選択によって変動することに注意してください。
時点\(t\)における怪我の状態を、\begin{equation*}I_{t}\geq 0
\end{equation*}で表記します。\(I_{t}\)の値が大きいほど怪我は深刻です。時点\(T\)において怪我が完治するため\(I_{T}=0\)です。
時点\(t\)においてランナーが選択するランニング時間を、\begin{equation*}s_{t}\in \left[ 0,1\right] \end{equation*}で表記します。\(s_{t}=0\)は完全休養を表し、\(s_{t}>0\)は走ることを意味します。
時点\(t\)においてランナーが直面する効用は、ランニングがもたらす快楽\(P\left( s_{t}\right) \geq 0\)と怪我の痛みがもたらす苦痛\(C\left( s_{t},I_{t}\right) \geq 0\)の差\begin{equation*}U_{t}\left( s_{t},I_{t}\right) =P\left( s_{t}\right) -C\left(
s_{t},I_{t}\right)
\end{equation*}として定義されます。ただし、ランニングがもたらす快楽\(P\left(s_{t}\right) \)とはフィットネスの維持・向上や走ること自体の喜びであり、これはランニング時間\(s_{t}\)の増加に伴い増加するものとします。つまり、\begin{equation*}\frac{d}{ds_{t}}P\left( s_{t}\right) >0
\end{equation*}を仮定するということです。一方、怪我の痛みがもたらす苦痛\(C\left( s_{t},I_{t}\right) \)はランニング時間\(s_{t}\)の増加にともない増加するとともに、怪我の重症度\(I_{t}\)が高いほど苦痛も増加するため、任意の時点\(t\)において、\begin{eqnarray*}\forall I_{t} &\in &\mathbb{R} _{+}:\frac{\partial }{\partial s_{t}}C\left( s_{t},I_{t}\right) >0 \\
\forall s_{t} &\in &\left[ 0,1\right] :\frac{\partial }{\partial I_{t}}C\left( s_{t},I_{t}\right) >0
\end{eqnarray*}がともに成り立つものとします。
来期における怪我の状態\(I_{t+1}\)は、今期における怪我の状態\(I_{t}\)とランニング時間\(s_{t}\)の選択によって決定されるものとし、そのことを、\begin{equation*}I_{t+1}=G\left( s_{t},I_{t}\right)
\end{equation*}で表記します。今期に完全休養(\(s_{t}=0\))すれば怪我は治癒に向かうため、\begin{equation*}I_{t+1}<I_{t}
\end{equation*}が成り立ちます。一方、今期にランニング(\(s_{t}>0\))すれば怪我は悪化または治癒が遅れるため、\begin{equation*}I_{t+1}\geq I_{t}
\end{equation*}が成り立ちます。
まずは、怪我をしている各期\(t<T\)における最適な意思決定を分析します。ランニング時間\(s_{t}\)の増加がもたらす限界効用は、\begin{eqnarray*}\frac{\partial }{\partial s_{t}}U_{t}\left( s_{t},I_{t}\right) &=&\frac{\partial }{\partial s_{t}}\left[ P\left( s_{t}\right) -C\left(
s_{t},I_{t}\right) \right] \\
&=&\frac{\partial }{\partial s_{t}}P\left( s_{t}\right) -\frac{\partial }{\partial s_{t}}C\left( s_{t},I_{t}\right)
\end{eqnarray*}ですが、これは限界快楽\(\frac{\partial }{\partial s_{t}}P\left( s_{t}\right) \)と限界苦痛\(\frac{\partial }{\partial s_{t}}C\left( s_{t},I_{t}\right) \)の差です。痛みを感じているとランニングを楽しめないこと、また、怪我をしている中で走っても追い込めないためフィットネスはそれほど向上しないことなどを踏まえると、任意の\(s_{t}\in (0,1]\)において、\begin{equation*}\frac{\partial }{\partial s_{t}}P\left( s_{t}\right) <\frac{\partial }{\partial s_{t}}C\left( s_{t},I_{t}\right)
\end{equation*}すなわち、\begin{equation*}
\frac{\partial }{\partial s_{t}}U_{t}\left( s_{t},I_{t}\right) <0
\end{equation*}が成り立つものと仮定するのがもっともらしいです。つまり、\(U_{t}\left( s_{t},I_{t}\right) \)は\(s_{t}\)に関する狭義単調減少関数であるため、怪我をしている期\(t<T\)では完全休養\(s_{t}=0\)が最適であることが明らかになりました。そこで、怪我をしている各期において最大化された効用を、\begin{eqnarray*}U_{t}^{Optimal} &=&U_{t}\left( 0,I_{t}\right) \\
&=&P\left( 0\right) -C\left( 0,I_{t}\right)
\end{eqnarray*}で表記します。
完治後の各期\(t\geq T\)には、ランナーは制約なく走れる(\(s_{t}=1\))とともに、怪我の苦痛は存在しない(\(C\left( 1,0\right) =0\))しないため、完治後の任意の期\(t\)において得られる効用は、\begin{eqnarray*}U_{t}\left( 1,0\right) &=&P\left( 1\right) -C\left( 1,0\right) \\
&=&P\left( 1\right)
\end{eqnarray*}ですが、これは定数であるため、これを、\begin{equation*}
U^{Max}=U_{t}\left( 1,0\right)
\end{equation*}と表記します。
完治前の各期\(t<T\)において完全休養すれば\(U_{t}^{Optimal}\)を得られる一方で、完治後の各期\(t\geq T\)において自由に走れば\(U^{Max}\)が得られますが、明らかに、\begin{equation*}U^{Max}>U_{t}^{Optimal}
\end{equation*}が成り立ちます。
ランナーの目的は、累積効用\begin{equation*}
V=\sum_{t=0}^{T-1}\delta ^{t}U_{t}\left( s_{t},I_{t}\right)
+\sum_{t=T}^{+\infty }\delta ^{t}U_{t}\left( s_{t},I_{t}\right)
\end{equation*}の最大化ですが、完治前の各期\(t<T\)では完全休養して\(U_{t}^{Optimal}\)を得ることが最適であり、完治後の各期\(t\geq T\)には\(U^{Max}\)を得ることがこれまでの議論から明らかになっているため、最大化の対象となる目的関数を、\begin{equation*}V=\sum_{t=0}^{T-1}\delta ^{t}U_{t}^{Optimal}+\sum_{t=T}^{+\infty }\delta
^{t}U^{Max}
\end{equation*}としても一般性は失われません。ただし、\(\delta >0\)は割引率です。
完治までの期間が\(T\)から\(T+1\)へ伸びてしまった場合の累積効用の差は、\begin{eqnarray*}&&\text{完治期間が}T+1\text{の場合の}V-\text{完治期間が}T\text{の場合の}V \\
&=&\left( \sum_{t=0}^{T}\delta ^{t}U_{t}^{Optimal}+\sum_{t=T+1}^{+\infty
}\delta ^{t}U^{Max}\right) -\left( \sum_{t=0}^{T-1}\delta
^{t}U_{t}^{Optimal}+\sum_{t=T}^{+\infty }\delta ^{t}U^{Max}\right) \\
&=&\delta ^{T}U_{T}^{Optimal}-\delta ^{T}U^{Max} \\
&=&\delta ^{T}\left( U_{T}^{Optimal}-U^{Max}\right) \\
&<&0\quad \because U^{Max}>U_{t}^{Optimal}\text{かつ}\delta >0
\end{eqnarray*}であるため、完治期間\(T\)が伸びると累積効用\(V\)が減少することが明らかになりました。一方、ランナーが完治前の各期\(t<T\)において最適な行動である完全休養(\(s_{t}=0\))を選択すると怪我は治癒に向かうため、\begin{equation*}I_{t+1}<I_{t}
\end{equation*}が成り立ち、ゆえに完治期間\(T\)が最短化されます。完治期間\(T\)が伸びると累積効用\(V\)が減少するのであれば、完治期間\(T\)を最短化すれば累積効用\(V\)は最大化されます。
以上の議論より、怪我をしている期間には完全休養をし、完治期間を最短化することが最適な戦略であることが明らかになりました。
怪我をしたランナーが走ってしまう理由
繰り返しになりますが、ランナーが最大化しようとする累積効用は、\begin{eqnarray*}
V &=&\sum_{t=0}^{T-1}\delta ^{t}U_{t}\left( s_{t},I_{t}\right)
+\sum_{t=T}^{+\infty }\delta ^{t}U_{t}\left( s_{t},I_{t}\right) \\
&=&\sum_{t=0}^{T-1}\delta ^{t}U_{t}\left( s_{t},I_{t}\right)
+\sum_{t=T}^{+\infty }\delta ^{t}U^{Max} \\
&=&U_{0}\left( s_{0},I_{0}\right) +\sum_{t=1}^{T-1}\delta ^{t}U_{t}\left(
s_{t},I_{t}\right) +\sum_{t=T}^{+\infty }\delta ^{t}U^{Max}
\end{eqnarray*}と表現されます。
ランナーは現時点\(t=0\)において休養する(\(s_{0}=0\))か、わずかに走る(\(s_{0}=\varepsilon >0\))かのどちらか一方を選択している状況を想定します。ただし、\(s_{0}=\varepsilon \)を選択した場合には、完治までの期間が\(T\)から\(T+1\)まで伸びてしまうものとします。加えて、来期以降(\(t\geq 1\))に得られる効用に対して適用される追加的な割引\(\beta \in \left[ 0,1\right] \)を新たに導入します。つまり、\begin{equation*}V=U_{0}\left( s_{0},I_{0}\right) +\beta \sum_{t=1}^{T-1}\delta
^{t}U_{t}\left( s_{t},I_{t}\right) +\beta \sum_{t=T}^{+\infty }\delta
^{t}U^{Max}
\end{equation*}とします。\(\beta =1\)の場合には先と同様であるため、この場合には現時点を含め、怪我が完治するまで完全休養することが最適となります。
現時点において完全休養(\(s_{0}=0\))を選んだ場合、怪我の治癒が最短期間\(T\)で達成されるため、最大化された累積効用は、\begin{equation*}V_{0}^{rest}=U_{0}\left( 0,I_{0}\right) +\beta \sum_{t=1}^{T-1}\delta
^{t}U_{t}^{Optimal}+\beta \sum_{t=T}^{+\infty }\delta ^{t}U^{Max}
\end{equation*}となります。
現時点において少し走ること(\(s_{0}=\varepsilon \))を選んだ場合、治癒までの期間が\(T+1\)に伸びるため、最大化された累積効用は、\begin{equation*}V_{0}^{run}=U_{0}\left( \varepsilon ,I_{0}\right) +\beta
\sum_{t=1}^{T}\delta ^{t}U_{t}^{Optimal}+\beta \sum_{t=T+1}^{+\infty }\delta
^{t}U^{Max}
\end{equation*}となります。
両者を比較すると、\begin{eqnarray*}
V_{0}^{run}-V_{0}^{rest} &=&\left( U_{0}\left( \varepsilon ,I_{0}\right)
+\beta \sum_{t=1}^{T}\delta ^{t}U_{t}^{Optimal}+\beta \sum_{t=T+1}^{+\infty
}\delta ^{t}U^{Max}\right) \\
&&-\left( U_{0}\left( 0,I_{0}\right) +\beta \sum_{t=1}^{T-1}\delta
^{t}U_{t}^{Optimal}+\beta \sum_{t=T}^{+\infty }\delta ^{t}U^{Max}\right) \\
&=&U_{0}\left( \varepsilon ,I_{0}\right) -U_{0}\left( 0,I_{0}\right) +\beta
\delta ^{T}U_{T}^{Optimal}-\beta \delta ^{T}U^{Max} \\
&=&U_{0}\left( \varepsilon ,I_{0}\right) -U_{0}\left( 0,I_{0}\right) +\beta
\delta ^{T}\left( U_{T}^{Optimal}-U^{Max}\right)
\end{eqnarray*}となります。その上で、\begin{eqnarray*}
P &=&U_{0}\left( \varepsilon ,I_{0}\right) -U_{0}\left( 0,I_{0}\right) >0 \\
C &=&U_{T}^{Optimal}-U^{Max}<0
\end{eqnarray*}とそれぞれおきます。\(P\)は現時点\(t=0\)におけるランニング\(\varepsilon \)がもたらす即時的な快楽である一方、\(Q\)は完治が遅れることによる将来の累積効用の損失であることに注意してください。これらの表記を用いると、先の関係を、\begin{equation*}V_{0}^{run}-V_{0}^{rest}=P+\beta \delta ^{T}C
\end{equation*}と表現できます。
\(\beta =1\)の場合には現時点においてランナーが走らないことが最適(\(V_{0}^{run}<V_{0}^{rest}\))であるため、この場合には、\begin{equation*}P+\delta ^{T}C<0
\end{equation*}すなわち、\begin{equation*}
P<-\delta ^{T}C
\end{equation*}が成り立ちます。つまり、即時的な快楽よりも将来のコストが大きいため、合理的に考えれば現時点において走りません。
しかし、人は目の前にある利益を過大評価し、将来のコストを過小評価してしまうことがあります。これを時間的不整合や現在バイアスなどと呼びます。将来のコストを過小評価することは\(\beta \)の値が小さいことを意味します。\(\beta \)が十分小さい場合には、\begin{equation*}P>-\beta \delta ^{T}C
\end{equation*}すなわち、\begin{equation*}
P+\beta \delta ^{T}C>0
\end{equation*}すなわち、\begin{equation*}
V_{0}^{run}-V_{0}^{rest}>0
\end{equation*}すなわち、\begin{equation*}
V_{0}^{run}>V_{0}^{rest}
\end{equation*}が成立するため、この人は現時点において走ってしまいます。つまり、「将来の完治の遅延」という大きなコストを過小評価する結果、「今日走る」というわずかな瞬間的な快楽がそれを上回ってしまい、非合理的な行動(今日走る)が現在の効用最大化の観点から最適になってしまいます。以上が、ランナーが「休養すべきであると分かっているのに走ってしまう」という時間不整合性の定式化です。
会員専用コンテンツです
【ログイン】【会員登録】