多変数関数の最小化問題
多変数関数\(f:\mathbb{R} ^{n}\supset X\rightarrow \mathbb{R} \)の定義域上の点\(\boldsymbol{a}\in X\)が最小点であることは、変数\(\boldsymbol{x}\)が定義域\(X\)上の点をとり得る状況において、その中でも点\(\boldsymbol{a}\in X\)において\(f\left( \boldsymbol{x}\right) \)の値が最小化されること、すなわち、\begin{equation*}\exists \boldsymbol{a}\in X,\ \forall \boldsymbol{x}\in X:f\left(
\boldsymbol{a}\right) \leq f\left( \boldsymbol{x}\right)
\end{equation*}が成り立つことを意味します。関数\(f\)の最小点を特定する問題を最小化問題(minimization problem)と呼び、これを、
$$\begin{array}{cl}
\min & f\left( x\right) \\
s.t. & x\in X
\end{array}$$
で表記します。以下では最小化問題の解法を解説します。
関数\(f:\mathbb{R} ^{n}\supset X\rightarrow \mathbb{R} \)の定義域上の点\(\boldsymbol{a}\in X\)が極小点であることとは、変数\(\boldsymbol{x}\)がとり得る値の範囲を点\(\boldsymbol{a}\)を中心とする何らかの近傍に制限した場合には点\(\boldsymbol{a}\)が最小点になること、すなわち、\begin{equation*}\exists \varepsilon >0,\ \forall \boldsymbol{x}\in N_{\varepsilon }\left(
\boldsymbol{a}\right) \cap X:f\left( \boldsymbol{a}\right) \leq f\left(
\boldsymbol{x}\right)
\end{equation*}が成り立つことを意味します。ただし、\(N_{\varepsilon }\left( \boldsymbol{a}\right) \)は点\(\boldsymbol{a}\)を中心とする半径\(\varepsilon \)の近傍であり、\begin{equation*}N_{\varepsilon }\left( \boldsymbol{a}\right) =\left\{ \boldsymbol{x}\in \mathbb{R} ^{n}\ |\ \left\Vert \boldsymbol{x}-\boldsymbol{a}\right\Vert <\varepsilon
\right\}
\end{equation*}です。
関数\(f\)の定義域上の点\(\boldsymbol{a}\)が最小点である場合、その点\(\boldsymbol{a}\)は極小点でもあります。つまり、極小点だけが最小点の候補となり得るため、すべての極小点を特定した上で、その中でも\(f\left( \boldsymbol{x}\right) \)の値を最小化するものを特定すれば、それは最小点になります。したがって、最小化問題を解く準備として極小点をすべて特定する必要があります。そこで以下では、極小点を特定する方法を解説した上で、それを踏まえた上で最小点を特定する方法について解説します。
局所最小化のための1階の必要条件
多変数関数の定義域上の点が極小点である場合、それはどのような条件を満たすのでしょうか。まずは、関数の定義域上の内点が極小点であるための必要条件を特定します。
多変数関数\(f:\mathbb{R} ^{n}\supset X\rightarrow \mathbb{R} \)の定義域上の点\(\boldsymbol{a}\in X\)が\(f\)の極小点であるものとします。さらに、この点\(\boldsymbol{a}\)は以下の2つの条件を満たすものとします。
1つ目の条件は、点\(\boldsymbol{a}\)が\(f\)の定義域\(X\)の内点であるということです。この場合、\(f\)は点\(\boldsymbol{a}\)を含め周辺の任意の点において定義されていることが保証されます。
2つ目の条件は、\(f\)が点\(\boldsymbol{a}\)において偏微分可能であるということです。
以下では具体例を通じて極大点であるための必要条件を特定し、後に結果を一般化します。
\end{equation*}を定めるものとします。\(f\)のグラフは以下の通りです(図中の曲面)。
点\(\left( 0,0\right) \)は極小点であるため、変数\(\left( x,y\right) \)がとり得る値の範囲を点\(\left( 0,0\right) \)の周辺に限定した場合、\(f\left( x,y\right) \)の値は点\(\left( 0,0\right) \)において最小化されます。したがって、\(f\)のグラフの点\(\left( 0,0\right) \)における接平面は水平になるはずです(図中のメッシュ面)。\(f\)は点\(\left( 0,0\right) \)において偏微分可能であり、接平面の方程式は、\begin{eqnarray*}z &=&f\left( 0,0\right) +\nabla f\left( 0,0\right) \cdot \left(
x-0,y-0\right) \\
&=&f\left( 0,0\right) +\nabla f\left( 0,0\right) \cdot \left( x,y\right)
\end{eqnarray*}となります。一方、点\(\left( 0,0,f\left( 0,0\right) \right) \)を通る水平な平面の方程式は、\begin{equation*}z=f\left( 0,0\right)
\end{equation*}です。これらは等しいため、\begin{equation*}
\nabla f\left( 0,0\right) \cdot \left( x,y\right) =0
\end{equation*}すなわち、\begin{equation*}
\nabla f\left( 0,0\right) =\left( 0,0\right)
\end{equation*}という関係が成り立つことが予想されます。後に厳密に証明しますが、これは正しい予想です。
\end{equation*}を定めるものとします。\(f\)のグラフは以下の通りです(図中の曲面)。
任意の点\(\left( a,b\right) \in \mathbb{R} ^{2}\)は極小点であるため、変数\(\left( x,y\right) \)がとり得る値の範囲を点\(\left( a,b\right) \)の周辺に限定した場合、\(f\left( x,y\right) \)の値は点\(\left(a,b\right) \)において最小化されます。したがって、\(f\)のグラフの点\(\left(a,b\right) \)における接平面は水平になるはずです(図中のメッシュ面)。\(f\)は点\(\left( a,b\right) \)において偏微分可能であり、接平面の方程式は、\begin{equation*}z=f\left( a,b\right) +\nabla f\left( a,b\right) \cdot \left( x-a,y-b\right)
\end{equation*}となります。一方、点\(\left( a,b,f\left( a,b\right) \right) \)を通る水平な平面の方程式は、\begin{equation*}z=f\left( a,b\right)
\end{equation*}です。これらは等しいため、\begin{equation*}
\nabla f\left( a,b\right) \cdot \left( x-a,y-b\right)
\end{equation*}すなわち、\begin{equation*}
\nabla f\left( a,b\right) =\left( 0,0\right)
\end{equation*}という関係が成り立つことが予想されます。後に厳密に証明しますが、これは正しい予想です。
多変数関数\(f:\mathbb{R} ^{n}\supset X\rightarrow \mathbb{R} \)が定義域上の点\(\boldsymbol{a}\in X\)において偏微分可能であり、なおかつそこでの勾配ベクトルがゼロベクトルである場合、すなわち、\begin{equation*}\nabla f\left( \boldsymbol{a}\right) =\boldsymbol{0}
\end{equation*}が成り立つ場合には、このような点\(\boldsymbol{a}\)を関数\(f\)の停留点(stationary point)と呼びます。関数\(f\)の定義域上の内点\(\boldsymbol{a}\)が極小点である場合には、その点\(\boldsymbol{a}\)は\(f\)の停留点となります。これを局所最小化のための1階の必要条件(first order necessary condition for local minimizer)と呼びます。
\end{equation*}が成り立つ。
\end{equation*}を定めるものとします。\(f\)は多変数の多項式関数であるため偏微分可能です。点\(\left(0,0\right) \)はこの関数\(f\)の極小点です。実際、\begin{equation*}f\left( 0,0\right) =0
\end{equation*}である一方で、ゼロベクトルに限りなく近い点\(\left( h_{1},h_{2}\right) \in \mathbb{R} ^{2}\backslash \left\{ \left( 0,0\right) \right\} \)を任意に選んだとき、\begin{equation*}f\left( h_{1},h_{2}\right) =h_{1}^{2}+h_{2}^{2}>0
\end{equation*}となるため、\begin{equation*}
f\left( 0,0\right) \leq f\left( h_{1},h_{2}\right)
\end{equation*}が成り立つからです。したがって、先の命題より、点\(\left( 0,0\right) \)は局所最小化のための1階の必要条件を満たすはずです。実際、点\(\left( x,y\right) \in \mathbb{R} ^{2}\)における勾配ベクトルは、\begin{equation*}\nabla f\left( x,y\right) =\left( \frac{\partial f\left( x,y\right) }{\partial x},\frac{\partial f\left( x,y\right) }{\partial y}\right) =\left(
2x,2y\right)
\end{equation*}であることから、\begin{equation*}
\nabla f\left( 0,0\right) =\left( 0,0\right)
\end{equation*}が成り立ちます。以上の結果は先の命題の主張と整合的です。
先の命題の逆は成立するとは限りません。つまり、関数\(f\)の定義域上の内点が局所最小化のための1階の必要条件を満たす場合、すなわち内点が停留点である場合、その点は極小点であるとは限りません。以下の例より明らかです。
\end{equation*}を定めるものとします。\(f\)のグラフは以下の通りです。
点\(\left( 0,0\right) \)は\(f\)の定義域\(\mathbb{R} ^{2}\)の内点であるとともに、\(f\)は点\(\left( 0,0\right) \)において偏微分可能です。点\(\left( 0,0\right) \)における勾配ベクトルは、\begin{eqnarray*}\nabla f\left( 0,0\right) &=&\left. \left( y,x\right) \right\vert _{\left(
x,y\right) =\left( 0,0\right) }\quad \because f\text{の定義} \\
&=&\left( 0,0\right)
\end{eqnarray*}となるため点\(\left( 0,0\right) \)は\(f\)の停留点です。一方、点\(\left( 0,0\right) \)は\(f\)の極小点ではありません。実際、\begin{equation*}f\left( 0,0\right) =0
\end{equation*}である一方で、点\(\left(0,0\right) \)の周辺の点\(\left( x,y\right) \)を任意に選んだとき、\(x\)と\(y\)が同符号ならば、\begin{equation*}f\left( x,y\right) >0=f\left( 0,0\right)
\end{equation*}が成り立ち、\(x\)と\(y\)が異符号ならば、\begin{equation*}f\left( x,y\right) <0=f\left( 0,0\right)
\end{equation*}となるからです。
局所最小化のための2階の必要条件
多変数関数\(f:\mathbb{R} ^{n}\supset X\rightarrow \mathbb{R} \)の定義域上の点\(\boldsymbol{a}\in X\)が\(f\)の極小点であるものとします。さらに、この点\(\boldsymbol{a}\)は以下の2つの条件を満たすものとします。
1つ目の条件は、点\(\boldsymbol{a}\)が\(f\)の定義域\(X\)の内点であるということです。この場合、\(f\)は点\(\boldsymbol{a}\)を含め周辺の任意の点において定義されていることが保証されます。
2つ目の条件は、\(f\)が点\(\boldsymbol{a}\)を中心とする近傍において\(C^{2}\)級であるということ、すなわち、\begin{equation*}\exists \varepsilon >0:f\text{は}N_{\varepsilon }\left( \boldsymbol{a}\right) \text{において}C^{2}\text{級}
\end{equation*}が成り立つということです。\(\boldsymbol{a}\)は\(X\)の内点であるため、十分小さい半径\(\varepsilon \)のもとでは、\begin{equation*}N_{\varepsilon }\left( \boldsymbol{a}\right) \subset X
\end{equation*}が成り立つことに注意してください。
多変数関数が\(C^{2}\)級であることは偏微分可能性を含意するため、局所最小化のための1階の必要条件より、この極小点\(\boldsymbol{a}\)は停留点であることが保証されます。つまり、\begin{equation*}\nabla f\left( \boldsymbol{a}\right) =\boldsymbol{0}
\end{equation*}が成り立つということです。では、点\(\boldsymbol{a}\)が極小点であることに由来する追加的な必要条件は存在するでしょうか。\(n=1\)の場合、すなわち\(f\)が1変数関数である場合には、\(f\)が定義域の内点\(a\)を中心とする近傍において\(C^{2}\)級であるとともに点\(a\)が極小点であるならば、\begin{equation}f^{\prime \prime }\left( a\right) \geq 0 \quad \cdots (1)
\end{equation}が成り立ちます。\(n\geq 2\)の場合、すなわち\(f\)が多変数関数である場合には、\(f\)が定義域の内点\(\boldsymbol{a}\)を中心とする近傍において\(C^{2}\)級であるとともに点\(\boldsymbol{a}\)が極小点であるならば、点\(\boldsymbol{a}\)における\(f\)のヘッセ行列\(H_{f}\left( \boldsymbol{a}\right) \)が半正定値になります。すなわち、\begin{equation}\forall \boldsymbol{h}\in \mathbb{R} ^{n}\backslash \left\{ \boldsymbol{0}\right\} :\boldsymbol{h}^{t}H_{f}\left(
\boldsymbol{a}\right) \boldsymbol{h}\geq 0 \quad \cdots (2)
\end{equation}が成り立ちます。ただし、\begin{equation*}
H_{f}\left( \boldsymbol{a}\right) =\begin{pmatrix}
f_{x_{1}x_{1}}^{\prime \prime }\left( \boldsymbol{a}\right) & \cdots &
f_{x_{1}x_{n}}^{\prime \prime }\left( \boldsymbol{a}\right) \\
\vdots & \ddots & \vdots \\
f_{x_{n}x_{1}}^{\prime \prime }\left( \boldsymbol{a}\right) & \cdots &
f_{x_{n}x_{n}}^{\prime \prime }\left( \boldsymbol{a}\right)
\end{pmatrix}=\begin{pmatrix}
\frac{\partial ^{2}f\left( \boldsymbol{a}\right) }{\partial x_{1}\partial
x_{1}} & \cdots & \frac{\partial ^{2}f\left( \boldsymbol{a}\right) }{\partial x_{n}\partial x_{1}} \\
\vdots & \ddots & \vdots \\
\frac{\partial ^{2}f\left( \boldsymbol{a}\right) }{\partial x_{1}\partial
x_{n}} & \cdots & \frac{\partial ^{2}f\left( \boldsymbol{a}\right) }{\partial x_{n}\partial x_{n}}\end{pmatrix}\end{equation*}です。実際、\(n=1\)の場合、\(\left( 2\right) \)は、\begin{equation*}\forall h\in \mathbb{R} \backslash \left\{ \boldsymbol{0}\right\} :f^{\prime \prime }\left( a\right)
\cdot h^{2}\geq 0
\end{equation*}となりますが、これは\(\left( 1\right) \)と必要十分であるため、\(\left( 2\right) \)は\(\left(1\right) \)の一般化になっています。
結論をまとめると、多変数関数\(f:\mathbb{R} ^{n}\supset X\rightarrow \mathbb{R} \)の定義域上の内点\(\boldsymbol{a}\in X^{i}\)が極小点であり、なおかつその点\(\boldsymbol{a}\)を中心とする近傍\(N_{\varepsilon }\left( \boldsymbol{a}\right) \)において\(f\)が\(C^{2}\)級である場合には、\begin{eqnarray*}&&\left( a\right) \ \nabla f\left( \boldsymbol{a}\right) =\boldsymbol{0} \\
&&\left( b\right) \ \forall \boldsymbol{h}\in \mathbb{R} ^{n}\backslash \left\{ \boldsymbol{0}\right\} :\boldsymbol{h}^{t}H_{f}\left(
\boldsymbol{a}\right) \boldsymbol{h}\geq 0
\end{eqnarray*}がともに成り立ちます。これを局所最小化のための2階の必要条件(second order necessary condition for local minimizer)と呼びます。証明ではテイラーの定理を利用します。
&&\left( b\right) \ \forall \boldsymbol{h}\in \mathbb{R} ^{n}\backslash \left\{ \boldsymbol{0}\right\} :\boldsymbol{h}^{t}H_{f}\left(
\boldsymbol{a}\right) \boldsymbol{h}\geq 0
\end{eqnarray*}がともに成り立つ。
多変数関数\(f\)が\(C^{2}\)級である場合、そのヘッセ行列\(H_{f}\left( \boldsymbol{a}\right) \)は対称行列になります。対称行列\(H_{f}\left( \boldsymbol{a}\right) \)に関しては以下の関係\begin{eqnarray*}H_{f}\left( \boldsymbol{a}\right) \text{は半正定値} &\Leftrightarrow &H_{f}\left( \boldsymbol{a}\right) \text{の固有値がすべて非負} \\
&\Leftrightarrow &H_{f}\left( \boldsymbol{a}\right) \text{のすべての主座小行列式が非負}
\end{eqnarray*}が成り立つため、固有値や主座小行列式の符号を観察することによって\(H_{f}\left( \boldsymbol{a}\right) \)が半正定値であることを判定できます。
\end{equation*}を定めるものとします。\(f\)は多変数の多項式関数であるため\(C^{2}\)級です。先に確認したように、点\(\left( 0,0\right) \)は\(f\)の極小点であるとともに局所最小化のための1階の必要条件\begin{equation*}\nabla f\left( 0,0\right) =\left( 0,0\right)
\end{equation*}を満たします。加えて、先の命題より、点\(\left( 0,0\right) \)は局所最小化のための2階の必要条件を満たすはずです。実際、点\(\left( 0,0\right) \)におけるヘッセ行列は、\begin{equation*}H_{f}\left( 0,0\right) =\begin{pmatrix}
f_{xx}^{\prime \prime }\left( 0,0\right) & f_{xy}^{\prime \prime }\left(
0,0\right) \\
f_{yx}^{\prime \prime }\left( 0,0\right) & f_{yy}^{\prime \prime }\left(
0,0\right)
\end{pmatrix}=\begin{pmatrix}
2 & 0 \\
0 & 2\end{pmatrix}\end{equation*}であるため、\(H_{f}\left( 0,0\right) \)の1次の主座小行列式は、\begin{eqnarray*}\left\vert A_{1}\right\vert &=&\left\vert 2\right\vert =2\geq 0 \\
\left\vert A_{2}\right\vert &=&\left\vert 2\right\vert =2\geq 0
\end{eqnarray*}を満たし、2次の主座小行列式は、\begin{equation*}
\left\vert A_{1,2}\right\vert =\begin{vmatrix}
2 & 0 \\
0 & 2\end{vmatrix}=4\geq 0
\end{equation*}を満たすため\(H_{f}\left( 0,0\right) \)は半正定値をとり、したがって点\(\left( 0,0\right) \)は最小化のための2階の必要条件を満たします。以上の結果は先の命題の主張と整合的です。
局所最小化のための2階の十分条件
関数の定義域の内点が極小点であるための必要条件が明らかになりました。関数が極小点であるような内点において偏微分可能である場合には局所最小化のための必要条件が成り立つため、関数が偏微分可能な内点の中から極小点を探す際には、局所最小化のための必要条件を満たす内点だけが候補になります。ただ、局所最小化のための必要条件を満たす内点の中には極小点ではないものが存在する可能性があります。では、関数の定義域の内点が極小点であるための十分条件を特定できるのでしょうか。
多変数関数\(f:\mathbb{R} ^{n}\supset X\rightarrow \mathbb{R} \)が定義域の内点\(\boldsymbol{a}\in X^{i}\)を中心とする近傍において\(C^{2}\)級である場合、以下の条件\begin{eqnarray*}&&\left( a\right) \ \nabla f\left( \boldsymbol{a}\right) =\boldsymbol{0} \\
&&\left( b\right) \ \forall \boldsymbol{h}\in \mathbb{R} ^{n}\backslash \left\{ \boldsymbol{0}\right\} :\boldsymbol{h}^{t}H_{f}\left(
\boldsymbol{a}\right) \boldsymbol{h}\geq 0
\end{eqnarray*}が成り立つことは、点\(\boldsymbol{a}\)が\(f\)の極小点であるための必要条件であることは先に示した通りです。一方、十分条件は、\begin{eqnarray*}&&\left( a\right) \ \nabla f\left( \boldsymbol{a}\right) =\boldsymbol{0} \\
&&\left( b\right) \ \forall \boldsymbol{h}\in \mathbb{R} ^{n}\backslash \left\{ \boldsymbol{0}\right\} :\boldsymbol{h}^{t}H_{f}\left(
\boldsymbol{a}\right) \boldsymbol{h}>0
\end{eqnarray*}となります。必要条件ではヘッセ行列が半正定値であることを要求する一方で、十分条件では正定値であることを要求していることに注意してください。これを局所最小化のための2階の十分条件(second order sufficient condition for local minimizer)と呼びます。
&&\left( b\right) \ \forall \boldsymbol{h}\in \mathbb{R} ^{n}\backslash \left\{ \boldsymbol{0}\right\} :\boldsymbol{h}^{t}H_{f}\left(
\boldsymbol{a}\right) \boldsymbol{h}>0
\end{eqnarray*}がともに成り立つならば、点\(\boldsymbol{a}\)は\(f\)の極小点である。
多変数関数\(f\)が\(C^{2}\)級である場合、そのヘッセ行列\(H_{f}\left( \boldsymbol{a}\right) \)は対称行列になります。対称行列\(H_{f}\left( \boldsymbol{a}\right) \)に関しては以下の関係\begin{eqnarray*}H_{f}\left( \boldsymbol{a}\right) \text{は正定値}
&\Leftrightarrow &H_{f}\left( \boldsymbol{a}\right) \text{の固有値がすべて正} \\
&\Leftrightarrow &H_{f}\left( \boldsymbol{a}\right) \text{のすべての主座小行列式が正} \\
&\Leftrightarrow &H_{f}\left( \boldsymbol{a}\right) \text{のすべての狭義の主座小行列式が正}
\end{eqnarray*}が成り立つため、固有値や主座小行列式、もしくは狭義の主座小行列式の符号を観察することによって\(H_{f}\left( \boldsymbol{a}\right) \)が正定値であることを判定できます。
\end{equation*}を定めるものとします。\(f\)は多変数の多項式関数であるため\(C^{2}\)級です。先に確認したように、点\(\left( 0,0\right) \)は\(f\)の極大点であるとともに、局所最小化のための必要条件を満たします。加えて、点\(\left( 0,0\right) \)が局所最小化のための十分条件を満たすことを示します。点\(\left( 0,0\right) \)におけるヘッセ行列は、\begin{equation*}H_{f}\left( 0,0\right) =\begin{pmatrix}
f_{xx}^{\prime \prime }\left( 0,0\right) & f_{xy}^{\prime \prime }\left(
0,0\right) \\
f_{yx}^{\prime \prime }\left( 0,0\right) & f_{yy}^{\prime \prime }\left(
0,0\right)
\end{pmatrix}=\begin{pmatrix}
2 & 0 \\
0 & 2\end{pmatrix}\end{equation*}であるため、\(H_{f}\left( 0,0\right) \)の1次の狭義の主座小行列式は、\begin{equation*}\left\vert A_{1}\right\vert =\left\vert 2\right\vert =2>0
\end{equation*}を満たし、2次の狭義の主座小行列式は、\begin{equation*}
\left\vert A_{2}\right\vert =\begin{vmatrix}
2 & 0 \\
0 & 2\end{vmatrix}=4>0
\end{equation*}を満たすため\(H_{f}\left( 0,0\right) \)は正定値であり、したがって点\(\left( 0,0\right) \)は最小化のための十分条件を満たします。以上の結果は先の命題の主張と整合的です。
最小化問題の解法
関数\(f\)の最小点は極小点でもあるため、極小点をすべて特定した上で、その中でも\(f\left( x\right) \)の値を最小化するような点を特定すれば、それは必然的に最小点になります。ただ、以下の例が示唆するようにそもそも最小点は存在するとは限りません。したがって、極小点の中から最小点を探す前に、そもそも関数の最小点が存在することを確認する必要があります。その際、最大値・最小値の定理などが役に立ちます。
\end{equation*}を定めるものとします。\(f\)は連続関数ですが定義域\(\mathbb{R} _{++}^{2}\)はコンパクト集合ではないため最大値・最小値の定理を適用できません。加えて、\begin{eqnarray*}\lim_{\left( x,y\right) \rightarrow \left( \infty ,\infty \right) }f\left(
x,y\right) &=&\lim_{x\rightarrow \infty }\left[ -\ln \left( x\right) \right] +\lim_{y\rightarrow \infty }\left[ -\ln \left( y\right) \right] \quad
\because f\text{の定義} \\
&=&\left( -\infty \right) +\left( -\infty \right) \\
&=&-\infty
\end{eqnarray*}となるため、\(f\)は最小点を持ちません。
関数の最小点が存在することが確認できたら、極小点を特定する作業へ移ります。なぜなら、極小点だけが最小点の候補だからです。局所最小化のための十分条件を満たす内点は極小点ですが、局所最小化のための十分条件を満たさない一方で必要条件を満たす内点もまた極小点になり得ます。したがって、結局、局所最小化のための必要条件を満たす内点をすべて特定し、それらを最小点の候補とする必要があります。
局所最小化のための必要条件ないし十分条件は、関数が偏微分可能(または\(C^{2}\)級)な内点を対象とした条件であり、関数が偏微分可能ではない内点については何も言っていません。以下の例が示唆するように、関数が偏微分可能ではない内点もまた極小点となり得るため、そのようなすべての点も最小点の候補に加える必要があります。
y\right\vert
\end{equation*}を定めるものとします。点\(\left( 0,0\right) \)は\(f\)の定義域の内点であるとともに極小点でもありますが、\(f\)は点\(\left(0,0\right) \)において偏微分可能ではありません(演習問題)。したがって、点\(\left( 0,0\right) \)は局所最小化のための必要条件を満たしません。
これまでは関数の定義域の内点のみを対象とした議論を行ってきましたが、以下の例が示唆するように、関数の定義域の境界点が極小点になることもあります。したがって、関数の定義域が境界点を要素をとして持つ場合、そのようなすべての点も最小点の候補に加える必要があります。
\end{equation*}を定めるものとします。この関数\(f\)の定義域\(\left[ 0,1\right] \times \left[ 0,1\right] \)の内点には極小点は存在しない一方で、定義域の境界点である点\(\left( 1,\frac{1}{2}\right) \)は\(f\)の極小点です(演習問題)。
以上を踏まえると、関数の最小点を求めるためには以下の手順にしたがう必要があります。
- 関数\(f\)の最小点が存在することを確認する。その際、最大値・最小値の定理などを利用する。
- 関数\(f\)の定義域\(X\)の内点の中でも、局所最小化のための必要条件を満たす点をすべて特定する。特に、その中でも局所最小化のための十分条件を満たす内点は極小点であることが確定する。
- 関数\(f\)の定義域\(X\)の内点の中でも、関数が偏微分可能ではない点をすべて特定する。
- 関数\(f\)の定義域\(X\)に含まれる境界点をすべて特定する。
- 以上の点の中でも\(f\left( x\right) \)の値を最小化する点が最小点である。
特に、関数\(f\)の定義域\(X \)が\(\mathbb{R} \)上の開集合であるとともに、\(f\)が\(X\)上の任意の点において偏微分可能である場合には、関数\(f\)が偏微分可能ではない点や、関数\(f\)の定義域\(X\)に含まれる境界点は存在しないことが保証されるため、最小点を特定するためには以下の手順にしたがえばよいということになります。
- 関数\(f\)の最小点が存在することを確認する。
- 関数\(f\)の定義域\(X\)の点の中から、局所最小化のための必要条件を満たす点をすべて特定する。特に、その中でも局所最小化のための十分条件を満たす内点は極小点であることが確定する。
- 以上の点の中でも\(f\left( x\right) \)の値を最小化する点が最小点である。
演習問題
\end{equation*}を定めるものとします。最小点は存在しますか。存在する場合には具体的に求めてください。
\end{equation*}を定めるものとします。最小点は存在しますか。存在する場合には具体的に求めてください。
\end{equation*}を定めるものとします。最小点は存在しますか。存在する場合には具体的に求めてください。
\end{equation*}を定めるものとします。最小点は存在しますか。存在する場合には具体的に求めてください。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】