偏微分を用いた多変数の狭義凸関数の判定
凸集合上に定義された多変数関数\(f:\mathbb{R} ^{n}\supset X\rightarrow \mathbb{R} \)が狭義凸関数であることは、\begin{equation*}\forall x\in X,\ \forall y\in X\backslash \left\{ x\right\} ,\ \forall
\lambda \in \left( 0,1\right) :\lambda f\left( x\right) +\left( 1-\lambda
\right) f\left( y\right) >f\left( \lambda x+\left( 1-\lambda \right)
y\right)
\end{equation*}が成り立つこととして定義されますが、以上の定義にもとづいて関数が狭義凸であることを示す作業は煩雑になりがちです。多変数関数が偏微分可能である場合、それが狭義凸関数であることを比較的容易に示すことができます。順番に解説します。
凸集合上に定義された関数\(f:\mathbb{R} ^{n}\supset X\rightarrow \mathbb{R} \)が狭義凸関数であるものとします。\(f\)の定義域である凸集合上の異なる2つの点\(x,y\in X\)を任意に選んだ上で、これらの点を端点とする閉じた線分\begin{equation*}\left[ x,y\right] =\left\{ \lambda x+\left( 1-\lambda \right) y\in X\ |\
\lambda \in \left[ 0,1\right] \right\}
\end{equation*}をとります。その上で、それぞれの\(\lambda \in \left[0,1\right] \)に対して、\begin{equation*}f_{x,y}\left( \lambda \right) =f\left( \lambda x+\left( 1-\lambda \right)
y\right)
\end{equation*}を値として定める1変数関数\begin{equation*}
f_{x,y}:\mathbb{R} \supset \left[ 0,1\right] \rightarrow \mathbb{R} \end{equation*}を定義します。多変数関数\(f\)が狭義凸関数であることは、任意の異なる\(x,y\in X\)に対して上のように定義される1変数関数\(f_{x,y}\)がいずれも狭義凸関数であることと必要十分です。
y\right)
\end{equation*}を定める1変数関数\(f_{x,y}:\mathbb{R} \supset \left[ 0,1\right] \rightarrow \mathbb{R} \)を定義する。任意の異なる\(x,y\in X\)について\(f_{x,y}\)が狭義凸関数であることは、\(f\)が狭義凸関数であるための必要十分条件である。
多変数関数\(f:\mathbb{R} ^{n}\supset X\rightarrow \mathbb{R} \)が以下の3つの性質を満たすものとします。1つ目の性質は、\(f\)の定義域\(X\)が非空の凸集合であるとともに\(\mathbb{R} ^{n}\)上の開集合であるということです。2つ目の性質は、\(f\)が\(C^{1}\)級であるということです。つまり、\(f\)は定義域上の任意の点\(x\in X\)において任意の変数\(x_{k}\) \(\left(k=1,\cdots ,n\right) \)に関して偏微分可能であるとともに、偏導関数\(f_{x_{k}}:\mathbb{R} ^{n}\supset X\rightarrow \mathbb{R} \)が連続です。3つ目の性質は、\(f\)が狭義凸関数であるということです。
\(n=2\)である場合、狭義凸関数\(f\)のグラフはお椀型の曲面であるため、グラフ上の点を任意に選んだとき、そこでの接平面全体が\(f\)のグラフの下方に位置するはずです。つまり、\(f\)の定義域上の点\(x\in X\)を任意に選んだとき、この点における\(f\)のグラフの接平面の方程式は、\begin{equation*}z=\nabla f\left( x\right) \cdot \left( y-x\right) +f\left( x\right)
\end{equation*}で与えられますが、\(f\)が狭義凸関数である場合には、この接平面全体が接点を除いて\(f\)のグラフの下方にあること、すなわち、任意の\(y\in X\backslash \left\{ x\right\} \)について、\begin{equation*}f\left( y\right) >\nabla f\left( x\right) \cdot \left( y-x\right) +f\left(
x\right)
\end{equation*}が成り立つはずです。これは正しい主張です。しかも、逆の議論もまた成立します。証明では先に示した命題を利用します。
y\right) >\nabla f\left( x\right) \cdot \left( y-x\right) +f\left( x\right)
\end{equation*}が成り立つことは、\(f\)が狭義凸関数であるための必要十分条件である。
多変数関数\(f\)が\(C^{2}\)級である場合には、\(f\)が狭義凸関数であるための十分条件が以下のようになります。
\end{equation*}が成り立つならば、\(f\)は狭義凸関数である。ただし、\begin{equation*}H_{f}\left( x\right) =\begin{pmatrix}
f_{x_{1}x_{1}}^{\prime \prime }\left( x\right) & f_{x_{1}x_{2}}^{\prime
\prime }\left( x\right) & \cdots & f_{x_{1}x_{n}}^{\prime \prime }\left(
x\right) \\
f_{x_{2}x_{1}}^{\prime \prime }\left( x\right) & f_{x_{2}x_{2}}^{\prime
\prime }\left( x\right) & \cdots & f_{x_{2}x_{n}}^{\prime \prime }\left(
x\right) \\
\vdots & \vdots & \ddots & \vdots \\
f_{x_{n}x_{1}}^{\prime \prime }\left( x\right) & f_{x_{n}x_{2}}^{\prime
\prime }\left( x\right) & \cdots & f_{x_{n}x_{n}}^{\prime \prime }\left(
x\right)
\end{pmatrix}\end{equation*}である。
多変数関数\(f\)が\(C^{2}\)級である場合、そのヘッセ行列\(H_{f}\left( x\right) \)は対称行列になります。対称行列に関しては、それが正定値であることと、その任意の首座小行列の行列式の値が正であることは必要十分であるため、先の命題を以下のように言い換えることができます。
A_{k}\left( x\right) \right) >0
\end{equation*}が成り立つならば、\(f\)は狭義凸関数である。ただし、\(A_{k}\left( x\right) \)は\(f\)の点\(x\)におけるヘッセ行列\begin{equation*}H_{f}\left( x\right) =\begin{pmatrix}
f_{x_{1}x_{1}}^{\prime \prime }\left( x\right) & f_{x_{1}x_{2}}^{\prime
\prime }\left( x\right) & \cdots & f_{x_{1}x_{n}}^{\prime \prime }\left(
x\right) \\
f_{x_{2}x_{1}}^{\prime \prime }\left( x\right) & f_{x_{2}x_{2}}^{\prime
\prime }\left( x\right) & \cdots & f_{x_{2}x_{n}}^{\prime \prime }\left(
x\right) \\
\vdots & \vdots & \ddots & \vdots \\
f_{x_{n}x_{1}}^{\prime \prime }\left( x\right) & f_{x_{n}x_{2}}^{\prime
\prime }\left( x\right) & \cdots & f_{x_{n}x_{n}}^{\prime \prime }\left(
x\right)
\end{pmatrix}\end{equation*}の\(k\)次首座小行列式であり、具体的には、\begin{equation*}A_{k}\left( x\right) =\begin{pmatrix}
f_{x_{1}x_{1}}^{\prime \prime }\left( x\right) & f_{x_{1}x_{2}}^{\prime
\prime }\left( x\right) & \cdots & f_{x_{1}x_{k}}^{\prime \prime }\left(
x\right) \\
f_{x_{2}x_{1}}^{\prime \prime }\left( x\right) & f_{x_{2}x_{2}}^{\prime
\prime }\left( x\right) & \cdots & f_{x_{2}x_{k}}^{\prime \prime }\left(
x\right) \\
\vdots & \vdots & \ddots & \vdots \\
f_{x_{k}x_{1}}^{\prime \prime }\left( x\right) & f_{x_{k}x_{2}}^{\prime
\prime }\left( x\right) & \cdots & f_{x_{k}x_{k}}^{\prime \prime }\left(
x\right)
\end{pmatrix}\end{equation*}である。
\end{equation*}を定めるものとします。\(f\)の定義域\(\mathbb{R} ^{2}\)は非空の凸な開集合です。\(f\)は多変数の多項式関数であるため\(C^{2}\)級であり、点\(\left( x,y\right) \in \mathbb{R} ^{2}\)におけるヘッセ行列は、\begin{equation*}H_{f}\left( x,y\right) =\begin{pmatrix}
f_{xx}^{\prime \prime }\left( x,y\right) & f_{xy}^{\prime \prime }\left(
x,y\right) \\
f_{yx}^{\prime \prime }\left( x,y\right) & f_{yy}^{\prime \prime }\left(
x,y\right)
\end{pmatrix}=\begin{pmatrix}
2 & 0 \\
0 & 2\end{pmatrix}\end{equation*}です。首座小行列式の値は、\begin{eqnarray*}
\det \left( A_{1}\left( x,y\right) \right) &=&\det \left( 2\right) =2>0 \\
\det \left( A_{2}\left( x,y\right) \right) &=&\det
\begin{pmatrix}
2 & 0 \\
0 & 2\end{pmatrix}=4>0
\end{eqnarray*}を満たすため、\(f\)は狭義凸関数です。
\end{equation*}を定めるものとします。\(f\)の定義域\(\mathbb{R} ^{3}\)は非空の凸な開集合です。\(f\)は多変数の多項式関数であるため\(C^{2}\)級であり、勾配ベクトル場\(\nabla f:\mathbb{R} ^{3}\rightarrow \mathbb{R} ^{3}\)はそれぞれの\(\left( x,y,z\right)\in \mathbb{R} ^{3}\)に対して、\begin{eqnarray*}\nabla f\left( x,y,z\right) &=&\left( \frac{\partial f\left( x,y,z\right) }{\partial x},\frac{\partial f\left( x,y,z\right) }{\partial y},\frac{\partial
f\left( x,y,z\right) }{\partial z}\right) \\
&=&\left( 2x+2y+2z,4y+2x,6z+2x\right)
\end{eqnarray*}を定め、ヘッセ行列関数\(H_{f}:\mathbb{R} ^{3}\rightarrow M_{3,3}\left( \mathbb{R} \right) \)はそれぞれの点\(\left(x,y,z\right) \in \mathbb{R} ^{3}\)に対して、\begin{eqnarray*}H_{f}\left( x,y,z\right) &=&\begin{pmatrix}
f_{xx}^{\prime \prime }\left( x,y,z\right) & f_{xy}^{\prime \prime }\left(
x,y,z\right) & f_{xz}^{\prime \prime }\left( x,y,z\right) \\
f_{yx}^{\prime \prime }\left( x,y,z\right) & f_{yy}^{\prime \prime }\left(
x,y,z\right) & f_{yz}^{\prime \prime }\left( x,y,z\right) \\
f_{zx}^{\prime \prime }\left( x,y,z\right) & f_{zy}^{\prime \prime }\left(
x,y,z\right) & f_{zz}^{\prime \prime }\left( x,y,z\right)
\end{pmatrix}
\\
&=&\begin{pmatrix}
2 & 2 & 2 \\
2 & 4 & 0 \\
2 & 0 & 6\end{pmatrix}\end{eqnarray*}を定めます。首座小行列式の値は、\begin{eqnarray*}
\det \left( A_{1}\left( x,y,z\right) \right) &=&\det \left( 2\right) =2>0 \\
\det \left( A_{2}\left( x,y,z\right) \right) &=&\det
\begin{pmatrix}
2 & 2 \\
2 & 4\end{pmatrix}=4>0 \\
\det \left( A_{3}\left( x,y,z\right) \right) &=&\det
\begin{pmatrix}
2 & 2 & 2 \\
2 & 4 & 0 \\
2 & 0 & 6\end{pmatrix}=8>0
\end{eqnarray*}を満たすため、\(f\)は狭義凸関数です。
先の命題の逆は成り立つとは限りません。つまり、狭義凸関数の任意の点におけるヘッセ行列は正定値であるとは限らないということです。以下の例より明らかです。
\end{equation*}を定めるものとします。\(f\)の定義域\(\mathbb{R} ^{2}\)は非空の凸な開集合です。\(f\)は多変数の多項式関数であるため\(C^{2}\)級であり、点\(\left( x,y\right) \in \mathbb{R} ^{2}\)におけるヘッセ行列は、\begin{equation*}H_{f}\left( x,y\right) =\begin{pmatrix}
f_{xx}^{\prime \prime }\left( x,y\right) & f_{xy}^{\prime \prime }\left(
x,y\right) \\
f_{yx}^{\prime \prime }\left( x,y\right) & f_{yy}^{\prime \prime }\left(
x,y\right)
\end{pmatrix}=\begin{pmatrix}
12x^{2} & 0 \\
0 & 12y^{2}\end{pmatrix}\end{equation*}です。したがって、点\(\left( 0,0\right) \)における首座小行列式の値は、\begin{eqnarray*}\det \left( A_{1}\left( 0,0\right) \right) &=&\det \left( 0\right) =0 \\
\det \left( A_{2}\left( 0,0\right) \right) &=&\det
\begin{pmatrix}
0 & 0 \\
0 & 0\end{pmatrix}=0
\end{eqnarray*}となります。その一方で、\(f\)は狭義凸関数です(演習問題)。
偏微分を用いた多変数の狭義凹関数の判定
多変数関数\(f:\mathbb{R} ^{n}\supset X\rightarrow \mathbb{R} \)が狭義凹関数であることは、定義域\(X\)が凸集合であるとともに、\begin{equation*}\forall x\in X,\ \forall y\in X\backslash \left\{ x\right\} ,\ \forall
\lambda \in \left( 0,1\right) :\lambda f\left( x\right) +\left( 1-\lambda
\right) f\left( y\right) <f\left( \lambda x+\left( 1-\lambda \right)
y\right)
\end{equation*}が成り立つこととして定義されます。狭義凸関数に関する先の議論において不等号の向きを逆にすればそのまま狭義凹関数に関する議論になります。したがって、偏微分可能な関数が狭義凹関数であることを以下のような形で特徴づけられます。
y\right)
\end{equation*}を定める1変数関数\(f_{x,y}:\mathbb{R} \supset \left[ 0,1\right] \rightarrow \mathbb{R} \)を定義する。任意の異なる\(x,y\in X\)について\(f_{x,y}\)が狭義凹関数であることは、\(f\)が狭義凹関数であるための必要十分条件である。
多変数関数\(f:\mathbb{R} ^{n}\supset X\rightarrow \mathbb{R} \)が以下の3つの性質を満たすものとします。1つ目の性質は、\(f\)の定義域\(X\)が非空の凸集合であるとともに\(\mathbb{R} ^{n}\)上の開集合であるということです。2つ目の性質は、\(f\)が\(C^{1}\)級であるということです。つまり、\(f\)は定義域上の任意の点\(x\in X\)において任意の変数\(x_{k}\) \(\left(k=1,\cdots ,n\right) \)に関して偏微分可能であるとともに、偏導関数\(f_{x_{k}}:\mathbb{R} ^{n}\supset X\rightarrow \mathbb{R} \)が連続です。3つ目の性質は、\(f\)が狭義凹関数であるということです。以上の条件のもと、先の命題より以下が導かれます。
y\right) <\nabla f\left( x\right) \cdot \left( y-x\right) +f\left( x\right)
\end{equation*}が成り立つことは、\(f\)が狭義凹関数であるための必要十分条件である。
多変数関数\(f\)が\(C^{2}\)級である場合には、\(f\)が狭義凹関数であるための十分条件が以下のようになります。
\end{equation*}が成り立つならば、\(f\)は狭義凹関数である。ただし、\begin{equation*}H_{f}\left( x\right) =\begin{pmatrix}
f_{x_{1}x_{1}}^{\prime \prime }\left( x\right) & f_{x_{1}x_{2}}^{\prime
\prime }\left( x\right) & \cdots & f_{x_{1}x_{n}}^{\prime \prime }\left(
x\right) \\
f_{x_{2}x_{1}}^{\prime \prime }\left( x\right) & f_{x_{2}x_{2}}^{\prime
\prime }\left( x\right) & \cdots & f_{x_{2}x_{n}}^{\prime \prime }\left(
x\right) \\
\vdots & \vdots & \ddots & \vdots \\
f_{x_{n}x_{1}}^{\prime \prime }\left( x\right) & f_{x_{n}x_{2}}^{\prime
\prime }\left( x\right) & \cdots & f_{x_{n}x_{n}}^{\prime \prime }\left(
x\right)
\end{pmatrix}\end{equation*}である。
多変数関数\(f\)が\(C^{2}\)級である場合、そのヘッセ行列\(H_{f}\left( x\right) \)は対称行列になります。対称行列に関しては、それが負定値であることと、その第\(k\)次の首座小行列の行列式の値に\(\left( -1\right) ^{k}\)をかけて得られる値が正であることは必要十分であるため、先の命題を以下のように言い換えることができます。
^{k}\det \left( A_{k}\left( x\right) \right) >0
\end{equation*}が成り立つならば、\(f\)は狭義凹関数である。ただし、\(A_{k}\left( x\right) \)は\(f\)の点\(x\)におけるヘッセ行列\begin{equation*}H_{f}\left( x\right) =\begin{pmatrix}
f_{x_{1}x_{1}}^{\prime \prime }\left( x\right) & f_{x_{1}x_{2}}^{\prime
\prime }\left( x\right) & \cdots & f_{x_{1}x_{n}}^{\prime \prime }\left(
x\right) \\
f_{x_{2}x_{1}}^{\prime \prime }\left( x\right) & f_{x_{2}x_{2}}^{\prime
\prime }\left( x\right) & \cdots & f_{x_{2}x_{n}}^{\prime \prime }\left(
x\right) \\
\vdots & \vdots & \ddots & \vdots \\
f_{x_{n}x_{1}}^{\prime \prime }\left( x\right) & f_{x_{n}x_{2}}^{\prime
\prime }\left( x\right) & \cdots & f_{x_{n}x_{n}}^{\prime \prime }\left(
x\right)
\end{pmatrix}\end{equation*}の\(k\)次首座小行列式であり、具体的には、\begin{equation*}A_{k}\left( x\right) =\begin{pmatrix}
f_{x_{1}x_{1}}^{\prime \prime }\left( x\right) & f_{x_{1}x_{2}}^{\prime
\prime }\left( x\right) & \cdots & f_{x_{1}x_{k}}^{\prime \prime }\left(
x\right) \\
f_{x_{2}x_{1}}^{\prime \prime }\left( x\right) & f_{x_{2}x_{2}}^{\prime
\prime }\left( x\right) & \cdots & f_{x_{2}x_{k}}^{\prime \prime }\left(
x\right) \\
\vdots & \vdots & \ddots & \vdots \\
f_{x_{k}x_{1}}^{\prime \prime }\left( x\right) & f_{x_{k}x_{2}}^{\prime
\prime }\left( x\right) & \cdots & f_{x_{k}x_{k}}^{\prime \prime }\left(
x\right)
\end{pmatrix}\end{equation*}である。
\end{equation*}を定めるものとします。\(f\)の定義域\(\mathbb{R} ^{2}\)は凸集合です。\(f\)は多変数の多項式関数であるため\(C^{2}\)級であり、点\(\left( x,y\right) \in \mathbb{R} ^{2}\)におけるヘッセ行列は、\begin{equation*}H_{f}\left( x,y\right) =\begin{pmatrix}
f_{xx}^{\prime \prime }\left( x,y\right) & f_{xy}^{\prime \prime }\left(
x,y\right) \\
f_{yx}^{\prime \prime }\left( x,y\right) & f_{yy}^{\prime \prime }\left(
x,y\right)
\end{pmatrix}=\begin{pmatrix}
-2 & 0 \\
0 & -2\end{pmatrix}\end{equation*}です。首座小行列式の値について、\begin{eqnarray*}
-\det \left( A_{1}\left( x,y\right) \right) &=&-\det \left( -2\right) =2>0
\\
\det \left( A_{2}\left( x,y\right) \right) &=&\det
\begin{pmatrix}
-2 & 0 \\
0 & -2\end{pmatrix}=4>0
\end{eqnarray*}が成り立つため、\(f\)は狭義凹関数です。
\end{equation*}を定めるものとします。\(f\)の定義域\(\mathbb{R} ^{3}\)は凸集合です。\(f\)は多変数の多項式関数であるため\(C^{2}\)級であり、点\(\left( x,y,z\right) \in \mathbb{R} ^{3}\)におけるヘッセ行列は、\begin{equation*}H_{f}\left( x,y\right) =\begin{pmatrix}
f_{xx}^{\prime \prime }\left( x,y,z\right) & f_{xy}^{\prime \prime }\left(
x,y,z\right) & f_{xz}^{\prime \prime }\left( x,y,z\right) \\
f_{yx}^{\prime \prime }\left( x,y,z\right) & f_{yy}^{\prime \prime }\left(
x,y,z\right) & f_{yz}^{\prime \prime }\left( x,y,z\right) \\
f_{zx}^{\prime \prime }\left( x,y,z\right) & f_{zy}^{\prime \prime }\left(
x,y,z\right) & f_{zz}^{\prime \prime }\left( x,y,z\right)
\end{pmatrix}=\begin{pmatrix}
-2 & -2 & -2 \\
-2 & -4 & 0 \\
-2 & 0 & -6\end{pmatrix}\end{equation*}です。首座小行列式の値について、\begin{eqnarray*}
-\det \left( A_{1}\left( x,y,z\right) \right) &=&-\det \left( -2\right) =2>0
\\
\det \left( A_{2}\left( x,y,z\right) \right) &=&\det
\begin{pmatrix}
-2 & -2 \\
-2 & -4\end{pmatrix}=4>0 \\
-\det \left( A_{3}\left( x,y,z\right) \right) &=&\det
\begin{pmatrix}
-2 & -2 & -2 \\
-2 & -4 & 0 \\
-2 & 0 & -6\end{pmatrix}=8>0
\end{eqnarray*}が成り立つため、\(f\)は狭義凹関数です。
先の命題の逆は成り立つとは限りません。つまり、狭義凹関数の任意の点におけるヘッセ行列は負定値であるとは限らないということです。以下の例より明らかです。
\end{equation*}を定めるものとします。\(f\)の定義域\(\mathbb{R} ^{2}\)は非空の凸な開集合です。\(f\)は多変数の多項式関数であるため\(C^{2}\)級であり、点\(\left( x,y\right) \in \mathbb{R} ^{2}\)におけるヘッセ行列は、\begin{equation*}H_{f}\left( x,y\right) =\begin{pmatrix}
f_{xx}^{\prime \prime }\left( x,y\right) & f_{xy}^{\prime \prime }\left(
x,y\right) \\
f_{yx}^{\prime \prime }\left( x,y\right) & f_{yy}^{\prime \prime }\left(
x,y\right)
\end{pmatrix}=\begin{pmatrix}
-12x^{2} & 0 \\
0 & -12y^{2}\end{pmatrix}\end{equation*}です。したがって、点\(\left( 0,0\right) \)における首座小行列式の値は、\begin{eqnarray*}\det \left( A_{1}\left( 0,0\right) \right) &=&\det \left( 0\right) =0 \\
\det \left( A_{2}\left( 0,0\right) \right) &=&\det
\begin{pmatrix}
0 & 0 \\
0 & 0\end{pmatrix}=0
\end{eqnarray*}となります。その一方で、\(f\)は狭義凹関数です(演習問題)。
演習問題
\end{equation*}を定めるものとします。\(f\)が狭義凹関数であることを示してください。
\end{equation*}を定めるものとします。\(f\)が狭義凹関数であることを示してください。
\end{equation*}を定めるものとします。\(f\)が狭義凸関数であることを示してください。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】