多変数のベクトル値関数どうしの合成関数の偏微分
多変数のベクトル値関数\(f:\mathbb{R} ^{n}\supset X\rightarrow \mathbb{R} ^{k}\)の値域が多変数のベクトル値関数\(g:\mathbb{R} ^{k}\supset Y\rightarrow \mathbb{R} ^{m}\)の定義域の部分集合である場合には、すなわち、\begin{equation*}f\left( X\right) \subset Y
\end{equation*}が成り立つ場合には合成関数\begin{equation*}
g\circ f:\mathbb{R} ^{n}\supset X\rightarrow \mathbb{R} ^{m}
\end{equation*}が定義可能であり、これはそれぞれのベクトル\(x\in X\)に対して、以下のベクトル\begin{equation*}\left( g\circ f\right) \left( x\right) =\left(
\begin{array}{c}
g_{1}\left( f_{1}\left( x_{1},\cdots ,x_{n}\right) ,\cdots ,f_{k}\left(
x_{1},\cdots ,x_{n}\right) \right) \\
\vdots \\
g_{m}\left( f_{1}\left( x_{1},\cdots ,x_{n}\right) ,\cdots ,f_{k}\left(
x_{1},\cdots ,x_{n}\right) \right)
\end{array}\right) \in \mathbb{R} ^{m}
\end{equation*}を値として定めます。ただし、\(f_{i}:\mathbb{R} \supset X\rightarrow \mathbb{R} \ \left( i=1,\cdots ,k\right) \)は\(f\)の成分関数であり、\(g_{i}:\mathbb{R} ^{k}\supset Y\rightarrow \mathbb{R} \ \left( i=1,\cdots ,m\right) \)は\(g\)の成分関数です。以上を踏まえた上で、合成関数\(g\circ f\)を構成する関数\(f,g\)に関して以下の2つの条件が成り立つものとします。
1つ目の条件は、多変数のベクトル値関数\(f\)が定義域上の点\(a\in X\)において変数\(x_{l}\)に関して偏微分可能であるということです。つまり、関数\(f\)は点\(a\)を含め周辺の任意の点において定義されているとともに、そこでの変数\(x_{l}\)に関する偏微分係数\begin{equation*}\frac{\partial f\left( a\right) }{\partial x_{l}}=\left. \frac{\partial }{\partial x_{l}}f\left( x\right) \right\vert _{x=a}
\end{equation*}が\(\mathbb{R} ^{k}\)上のベクトルとして定まるということです。
多変数のベクトル値関数\(f\)が先の点\(a\)に対して定める値\(f\left( a\right) \)は\(\mathbb{R} ^{k}\)上のベクトルですが、合成関数の定義より、この点\(f\left( a\right) \)はもう一方の多変数のベクトル値関数\(g\)の定義域\(Y\)上の点です。そこで、2つ目の条件として、関数\(g\)のすべての成分関数\(g_{i}\)が点\(f\left( a\right) \)において全微分可能であるものとします。ただし、全微分係数が存在する場合には勾配ベクトルと一致するため、以上の仮定は、関数\(g\)が点\(f\left(a\right) \)を含め周辺の任意の点において定義されているとともに、以下の行列\begin{equation*}\left(
\begin{array}{c}
\nabla g_{1}\left( f\left( a\right) \right) \\
\vdots \\
\nabla g_{m}\left( f\left( a\right) \right)
\end{array}\right) =\left(
\begin{array}{c}
\left. \nabla g_{1}\left( x\right) \right\vert _{x=f\left( a\right) } \\
\vdots \\
\left. \nabla g_{m}\left( x\right) \right\vert _{x=f\left( a\right) }\end{array}\right)
\end{equation*}が存在することが保証されます。ただし、この行列は関数\(g\)の点\(f\left( a\right) \)におけるヤコビ行列\begin{equation*}J_{g}\left( f\left( a\right) \right) =\left. J_{g}\left( x\right)
\right\vert _{x=f\left( a\right) }
\end{equation*}と一致することに注意してください。
以上の条件が満たされる場合には、合成関数\(g\circ f\)もまた点\(a\)において変数\(x_{l}\)に関して偏微分可能であることが保証されるとともに、そこでの変数\(x_{l}\)に関する偏微分係数が、\begin{eqnarray*}\frac{\partial \left( g\circ f\right) \left( a\right) }{\partial x_{l}}
&=&J_{g}\left( f\left( a\right) \right) \frac{\partial f\left( a\right) }{\partial x_{l}} \\
&=&\left. J_{g}\left( x\right) \right\vert _{x=f\left( a\right) }\left.
\frac{\partial f\left( x\right) }{\partial x_{l}}\right\vert _{x=a}
\end{eqnarray*}すなわち、\begin{eqnarray*}
\frac{\partial \left( g\circ f\right) \left( a\right) }{\partial x_{l}}
&=&\left(
\begin{array}{c}
\frac{\partial g_{1}\left( f_{1}\left( a\right) ,\cdots ,f_{k}\left(
a\right) \right) }{\partial x_{1}},\cdots ,\frac{\partial g_{1}\left(
f_{1}\left( a\right) ,\cdots ,f_{k}\left( a\right) \right) }{\partial x_{k}}
\\
\vdots \\
\frac{\partial g_{m}\left( f_{1}\left( a\right) ,\cdots ,f_{k}\left(
a\right) \right) }{\partial x_{1}},\cdots ,\frac{\partial g_{m}\left(
f_{1}\left( a\right) ,\cdots ,f_{k}\left( a\right) \right) }{\partial x_{k}}\end{array}\right) \left(
\begin{array}{c}
\frac{\partial f_{1}\left( a\right) }{\partial x_{l}} \\
\vdots \\
\frac{\partial f_{k}\left( a\right) }{\partial x_{l}}\end{array}\right) \\
&=&\left(
\begin{array}{c}
\sum_{i=1}^{k}\left( \frac{\partial g_{1}\left( f_{1}\left( a\right) ,\cdots
,f_{k}\left( a\right) \right) }{\partial x_{i}}\cdot \frac{\partial
f_{i}\left( a\right) }{\partial x_{l}}\right) \\
\vdots \\
\sum_{i=1}^{k}\left( \frac{\partial g_{m}\left( f_{1}\left( a\right) ,\cdots
,f_{k}\left( a\right) \right) }{\partial x_{i}}\cdot \frac{\partial
f_{i}\left( a\right) }{\partial x_{l}}\right)
\end{array}\right) \\
&=&\left(
\begin{array}{c}
\sum_{i=1}^{k}\left( \left. \frac{\partial g_{1}\left( x_{1},\cdots
,x_{k}\right) }{\partial x_{i}}\right\vert _{\left( x_{1},\cdots
,x_{k}\right) =\left( f_{1}\left( a\right) ,\cdots ,f_{k}\left( a\right)
\right) }\cdot \left. \frac{\partial f_{i}\left( x\right) }{\partial x_{l}}\right\vert _{x=a}\right) \\
\vdots \\
\sum_{i=1}^{k}\left( \left. \frac{\partial g_{m}\left( x_{1},\cdots
,x_{k}\right) }{\partial x_{i}}\right\vert _{\left( x_{1},\cdots
,x_{k}\right) =\left( f_{1}\left( a\right) ,\cdots ,f_{k}\left( a\right)
\right) }\cdot \left. \frac{\partial f_{i}\left( x\right) }{\partial x_{l}}\right\vert _{x=a}\right)
\end{array}\right)
\end{eqnarray*}というベクトルとして定まることが保証されます。
&=&J_{g}\left( f\left( a\right) \right) \frac{\partial f\left( a\right) }{\partial x_{l}} \\
&=&\left. J_{g}\left( x\right) \right\vert _{x=f\left( a\right) }\left.
\frac{\partial f\left( x\right) }{\partial x_{l}}\right\vert _{x=a}
\end{eqnarray*}となる。
つまり、点\(a\)において変数\(x_{l}\)に関して偏微分可能な多変数のベクトル値関数\(f\)と、点\(f\left( a\right) \)においてすべての成分関数が全微分可能であるような多変数のベクトル値関数\(g\)の合成関数であるような多変数のベクトル値関数\(g\circ f\)が与えられたとき、\(g\circ f\)もまた点\(a\)において変数\(x_{l}\)に関して偏微分可能であることが保証されるとともに、\(f\)の点\(a\)における偏微分係数\(\frac{\partial f\left( a\right) }{\partial x_{l}}\)と、\(g\)の点\(f\left( a\right) \)におけるヤコビ行列\(J_{g}\left( f\left( a\right) \right) \)の行列積をとれば、\(g\circ f\)の点\(a\)における変数\(x_{l}\)に関する偏微分係数\(\frac{\partial \left( g\circ f\right) \left( a\right) }{\partial x_{l}}\)が得られることを上の命題は保証しています。
&=&J_{g}\left( f\left( x\right) \right) \frac{\partial f\left( x\right) }{\partial x_{l}} \\
&=&\left. J_{g}\left( y\right) \right\vert _{x=f\left( x\right) }\frac{\partial f\left( x\right) }{\partial x_{l}}
\end{eqnarray*}すなわち、\begin{eqnarray*}
\frac{\partial \left( g\circ f\right) \left( x\right) }{\partial x_{l}}
&=&\left(
\begin{array}{c}
\frac{\partial g_{1}\left( f_{1}\left( x\right) ,\cdots ,f_{k}\left(
x\right) \right) }{\partial x_{1}},\cdots ,\frac{\partial g_{1}\left(
f_{1}\left( x\right) ,\cdots ,f_{k}\left( x\right) \right) }{\partial x_{k}}
\\
\vdots \\
\frac{\partial g_{m}\left( f_{1}\left( x\right) ,\cdots ,f_{k}\left(
x\right) \right) }{\partial x_{1}},\cdots ,\frac{\partial g_{m}\left(
f_{1}\left( x\right) ,\cdots ,f_{k}\left( x\right) \right) }{\partial x_{k}}\end{array}\right) \left(
\begin{array}{c}
\frac{\partial f_{1}\left( x\right) }{\partial x_{l}} \\
\vdots \\
\frac{\partial f_{k}\left( x\right) }{\partial x_{l}}\end{array}\right) \\
&=&\left(
\begin{array}{c}
\sum_{i=1}^{k}\left( \frac{\partial g_{1}\left( f_{1}\left( x\right) ,\cdots
,f_{k}\left( x\right) \right) }{\partial x_{i}}\cdot \frac{\partial
f_{i}\left( x\right) }{\partial x_{l}}\right) \\
\vdots \\
\sum_{i=1}^{k}\left( \frac{\partial g_{m}\left( f_{1}\left( x\right) ,\cdots
,f_{k}\left( x\right) \right) }{\partial x_{i}}\cdot \frac{\partial
f_{i}\left( x\right) }{\partial x_{l}}\right)
\end{array}\right) \\
&=&\left(
\begin{array}{c}
\sum_{i=1}^{k}\left( \left. \frac{\partial g_{1}\left( y_{1},\cdots
,y_{k}\right) }{\partial x_{i}}\right\vert _{\left( y_{1},\cdots
,y_{k}\right) =\left( f_{1}\left( x\right) ,\cdots ,f_{k}\left( x\right)
\right) }\cdot \frac{\partial f_{i}\left( x\right) }{\partial x_{l}}\right)
\\
\vdots \\
\sum_{i=1}^{k}\left( \left. \frac{\partial g_{m}\left( y_{1},\cdots
,y_{k}\right) }{\partial x_{i}}\right\vert _{\left( y_{1},\cdots
,y_{k}\right) =\left( f_{1}\left( x\right) ,\cdots ,f_{k}\left( x\right)
\right) }\cdot \frac{\partial f_{i}\left( x\right) }{\partial x_{l}}\right)
\end{array}\right)
\end{eqnarray*}を定めます。これを連鎖公式(chain rule)と呼びます。
\end{equation*}を定め、関数\(g:\mathbb{R} ^{2}\rightarrow \mathbb{R} ^{2}\)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}g\left( x,y\right) =\left( x^{2}y,xy^{2}\right)
\end{equation*}を定めるものとします。\(f\)は\(\mathbb{R} ^{2}\)上で変数\(x\)に関して偏微分可能であり、\(g\)の成分関数はともに\(\mathbb{R} ^{2}\)上で全微分可能であるため、先の命題より合成関数\(g\circ f:\mathbb{R} ^{2}\rightarrow \mathbb{R} ^{2}\)は\(\mathbb{R} ^{2}\)上で変数\(x\)に関して偏微分可能であり、変数\(x\)に関する偏導関数\(\frac{\partial \left( g\circ f\right) }{\partial x}:\mathbb{R} ^{2}\rightarrow \mathbb{R} ^{2}\rightarrow \mathbb{R} ^{2}\)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{eqnarray*}\frac{\partial \left( g\circ f\right) \left( x,y\right) }{\partial x}
&=&J_{g}\left( f\left( x,y\right) \right) \frac{\partial f\left( x,y\right)
}{\partial x} \\
&=&\left. J_{g}\left( v,w\right) \right\vert _{\left( v,w\right) =f\left(
x,y\right) }\frac{\partial f\left( x,y\right) }{\partial x} \\
&=&\begin{pmatrix}
\left. \frac{\partial \left( v^{2}w\right) }{\partial v}\right\vert _{\left(
v,w\right) =\left( x+y,x-y\right) } & \left. \frac{\partial \left(
v^{2}w\right) }{\partial w}\right\vert _{\left( v,w\right) =\left(
x+y,x-y\right) } \\
\left. \frac{\partial \left( vw^{2}\right) }{\partial v}\right\vert _{\left(
v,w\right) =\left( x+y,x-y\right) } & \left. \frac{\partial \left(
vw^{2}\right) }{\partial w}\right\vert _{\left( v,w\right) =\left(
x+y,x-y\right) }\end{pmatrix}\begin{pmatrix}
\frac{\partial \left( x+y\right) }{\partial x} \\
\frac{\partial \left( x-y\right) }{\partial x}\end{pmatrix}
\\
&=&\begin{pmatrix}
\left. 2vw\right\vert _{\left( v,w\right) =\left( x+y,x-y\right) } & \left.
v^{2}\right\vert _{\left( v,w\right) =\left( x+y,x-y\right) } \\
\left. w^{2}\right\vert _{\left( v,w\right) =\left( x+y,x-y\right) } &
\left. 2vw\right\vert _{\left( v,w\right) =\left( x+y,x-y\right) }\end{pmatrix}\begin{pmatrix}
1 \\
1\end{pmatrix}
\\
&=&\begin{pmatrix}
2\left( x+y\right) \left( x-y\right) & \left( x+y\right) ^{2} \\
\left( x-y\right) ^{2} & 2\left( x+y\right) \left( x-y\right)
\end{pmatrix}\begin{pmatrix}
1 \\
1\end{pmatrix}
\\
&=&\begin{pmatrix}
2\left( x-y\right) \left( x+y\right) +\left( x+y\right) ^{2} \\
2\left( x-y\right) \left( x+y\right) +\left( x-y\right) ^{2}\end{pmatrix} \\
&=&\begin{pmatrix}
3x^{2}+2xy-y^{2} \\
3x^{2}-2xy-y^{2}\end{pmatrix}\end{eqnarray*}を定めます。その一方で、合成関数\(g\circ f:\mathbb{R} ^{2}\rightarrow \mathbb{R} ^{2}\)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{eqnarray*}\left( g\circ f\right) \left( x,y\right) &=&g\left( f\left( x,y\right)
\right) \quad \because \text{合成関数の定義} \\
&=&g\left( x+y,x-y\right) \quad \because f\text{の定義} \\
&=&\left( \left( x+y\right) ^{2}\left( x-y\right) ,\left( x+y\right) \left(
x-y\right) ^{2}\right) \quad \because g\text{の定義}
\end{eqnarray*}を定めますが、これを\(x\)について偏微分すると、\begin{eqnarray*}\frac{\partial \left( g\circ f\right) \left( x,y\right) }{\partial x}
&=&\left(
\begin{array}{c}
\frac{\partial }{\partial x}\left( x+y\right) ^{2}\left( x-y\right) \\
\frac{\partial }{\partial x}\left( x+y\right) \left( x-y\right) ^{2}\end{array}\right) \\
&=&\begin{pmatrix}
3x^{2}+2xy-y^{2} \\
3x^{2}-2xy-y^{2}\end{pmatrix}\end{eqnarray*}となりますが、これは先の結果と整合的です。
多変数のベクトル値関数どうしの合成関数のヤコビ行列
先の命題より、ヤコビ行列に関する以下の命題が得られます。
J_{f}\left( a\right) \\
&=&\left. J_{g}\left( x\right) \right\vert _{x=f\left( a\right) }\left.
J_{f}\left( x\right) \right\vert _{x=a}
\end{eqnarray*}となる。
J_{f}\left( x\right) \\
&=&\left. J_{g}\left( y\right) \right\vert _{y=f\left( x\right) }J_{f}\left(
x\right)
\end{eqnarray*}を定めます。これがヤコビ行列に関する連鎖公式です。
\end{equation*}を定め、関数\(g:\mathbb{R} ^{2}\rightarrow \mathbb{R} ^{2}\)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}g\left( x,y\right) =\left( x^{2}y,xy^{2}\right)
\end{equation*}を定めるものとします。\(f\)は\(\mathbb{R} ^{2}\)上偏微分可能であり、\(g\)の成分関数はともに\(\mathbb{R} ^{2}\)上で全微分可能であるため、先の命題より合成関数\(g\circ f:\mathbb{R} ^{2}\rightarrow \mathbb{R} ^{2}\)は\(\mathbb{R} ^{2}\)上で偏微分可能であり、ヤコビ行列関数\(J_{g\circ f}:\mathbb{R} ^{2}\rightarrow M_{2}\left( \mathbb{R} \right) \)それぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{eqnarray*}J_{g\circ f}\left( x,y\right) &=&J_{g}\left( f\left( x,y\right) \right)
J_{f}\left( x,y\right) \\
&=&\left. J_{g}\left( v,w\right) \right\vert _{\left( v,w\right) =f\left(
x,y\right) }J_{f}\left( x,y\right) \\
&=&\begin{pmatrix}
\left. \frac{\partial \left( v^{2}w\right) }{\partial v}\right\vert _{\left(
v,w\right) =\left( x+y,x-y\right) } & \left. \frac{\partial \left(
v^{2}w\right) }{\partial w}\right\vert _{\left( v,w\right) =\left(
x+y,x-y\right) } \\
\left. \frac{\partial \left( vw^{2}\right) }{\partial v}\right\vert _{\left(
v,w\right) =\left( x+y,x-y\right) } & \left. \frac{\partial \left(
vw^{2}\right) }{\partial w}\right\vert _{\left( v,w\right) =\left(
x+y,x-y\right) }\end{pmatrix}\begin{pmatrix}
\frac{\partial \left( x+y\right) }{\partial x} & \frac{\partial \left(
x+y\right) }{\partial y} \\
\frac{\partial \left( x-y\right) }{\partial x} & \frac{\partial \left(
x-y\right) }{\partial y}\end{pmatrix}
\\
&=&\begin{pmatrix}
\left. 2vw\right\vert _{\left( v,w\right) =\left( x+y,x-y\right) } & \left.
v^{2}\right\vert _{\left( v,w\right) =\left( x+y,x-y\right) } \\
\left. w^{2}\right\vert _{\left( v,w\right) =\left( x+y,x-y\right) } &
\left. 2vw\right\vert _{\left( v,w\right) =\left( x+y,x-y\right) }\end{pmatrix}\begin{pmatrix}
1 & 1 \\
1 & -1\end{pmatrix}
\\
&=&\begin{pmatrix}
2\left( x+y\right) \left( x-y\right) & \left( x+y\right) ^{2} \\
\left( x-y\right) ^{2} & 2\left( x+y\right) \left( x-y\right)
\end{pmatrix}\begin{pmatrix}
1 & 1 \\
1 & -1\end{pmatrix}
\\
&=&\begin{pmatrix}
3x^{2}+2xy-y^{2} & x^{2}-2xy-3y^{2} \\
3x^{2}-2xy-y^{2} & -x^{2}-2xy+3y^{2}\end{pmatrix}\end{eqnarray*}を定めます。その一方で、合成関数\(g\circ f:\mathbb{R} ^{2}\rightarrow \mathbb{R} ^{2}\)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{eqnarray*}\left( g\circ f\right) \left( x,y\right) &=&g\left( f\left( x,y\right)
\right) \quad \because \text{合成関数の定義} \\
&=&g\left( x+y,x-y\right) \quad \because f\text{の定義} \\
&=&\left( \left( x+y\right) ^{2}\left( x-y\right) ,\left( x+y\right) \left(
x-y\right) ^{2}\right) \quad \because g\text{の定義}
\end{eqnarray*}を定めますが、これを偏微分すると、\begin{eqnarray*}
J_{g\circ f}\left( x,y\right) &=&\begin{pmatrix}
\frac{\partial \left( x+y\right) ^{2}\left( x-y\right) }{\partial x} & \frac{\partial \left( x+y\right) ^{2}\left( x-y\right) }{\partial y} \\
\frac{\partial \left( x+y\right) \left( x-y\right) ^{2}}{\partial x} & \frac{\partial \left( x+y\right) \left( x-y\right) ^{2}}{\partial y}\end{pmatrix}
\\
&=&\begin{pmatrix}
3x^{2}+2xy-y^{2} & x^{2}-2xy-3y^{2} \\
3x^{2}-2xy-y^{2} & -x^{2}-2xy+3y^{2}\end{pmatrix}\end{eqnarray*}となりますが、これは先の結果と整合的です。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】