1変数の狭義凸関数
実数空間\(\mathbb{R} \)もしくは区間を定義域とする関数\(f:\mathbb{R} \supset I\rightarrow \mathbb{R} \)について、\begin{equation*}\forall x_{1}\in I,\ \forall x_{2}\in I\backslash \left\{ x_{1}\right\} ,\
\forall \lambda \in \left( 0,1\right) :\lambda f\left( x_{1}\right) +\left(
1-\lambda \right) f\left( x_{2}\right) >f\left( \lambda x_{1}+\left(
1-\lambda \right) x_{2}\right)
\end{equation*}が成り立つ場合、\(f\)を狭義凸関数(strictly convexfunction)と呼びます。
関数\(f:\mathbb{R} \supset I\rightarrow \mathbb{R} \)が狭義凸関数であることの意味を視覚的に理解します(上図)。狭義凸関数\(f\)のグラフ上の異なる2つの点\begin{eqnarray*}A &:&\left( x_{1},f\left( x_{1}\right) \right) \\
B &:&\left( x_{2},f\left( x_{2}\right) \right)
\end{eqnarray*}を任意に選びます。この2つの点を結ぶ線分から端点を除いた部分に存在するそれぞれの点\(P\)の座標は、何らかのスカラー\(\lambda \in\left( 0,1\right) \)を用いて、\begin{equation*}P:\left( \lambda x_{1}+\left( 1-\lambda \right) x_{2},\lambda f\left(
x_{1}\right) +\left( 1-\lambda \right) f\left( x_{2}\right) \right)
\end{equation*}と表すことができます。一方、点\(P\)と\(x\)座標を共有する関数\(f\)のグラフ上の点\(Q\)の座標は、\begin{equation*}Q:\left( \lambda x_{1}+\left( 1-\lambda \right) x_{2},f\left( \lambda
x_{1}+\left( 1-\lambda \right) x_{2}\right) \right)
\end{equation*}ですが、狭義凸関数の定義より、点\(P\)の\(y\)座標が点\(Q\)の\(y\)座標より大きいこと、すなわち点\(P\)の位置は点\(Q\)の位置よりも上方であることが保証されます。任意の\(\lambda \)について同様の議論が成り立つため、線分\(AB\)から端点を除いた部分に存在する任意の点の位置は\(f\)のグラフよりも上方であることが保証されます。関数\(f\)のグラフ上の任意の異なる2つの点\(A,B\)についても同様の議論が成立するため、結局、\(f\)が狭義凸関数である場合、そのグラフは谷型の曲線になります。
狭義凸関数は凸関数と何が違うのでしょうか。区間を定義域とする関数\(f:\mathbb{R} \supset I\rightarrow \mathbb{R} \)が凸関数であることとは、\begin{equation*}\forall x_{1},x_{2}\in I,\ \forall \lambda \in \left[ 0,1\right] :\lambda
f\left( x_{1}\right) +\left( 1-\lambda \right) f\left( x_{2}\right) \geq
f\left( \lambda x_{1}+\left( 1-\lambda \right) x_{2}\right)
\end{equation*}が成り立つことを意味する一方、\(f\)が狭義凸関数であることとは、\begin{equation*}\forall x_{1}\in I,\ \forall x_{2}\in I\backslash \left\{ x_{1}\right\} ,\
\forall \lambda \in \left( 0,1\right) :\lambda f\left( x_{1}\right) +\left(
1-\lambda \right) f\left( x_{2}\right) >f\left( \lambda x_{1}+\left(
1-\lambda \right) x_{2}\right)
\end{equation*}が成り立つことを意味します。最も大きな違いは、凸関数は大小関係\(\geq \)を用いて定義されているのに対し、狭義凸関数は狭義大小関係\(>\)を用いて定義されているという点です。それにあわせて、狭義凸関数の定義中の点\(x_{1},x_{2}\)は\(I\)の異なる点であるとともに、スカラー\(\lambda \)が動く範囲は閉区間\(\left[ 0,1\right] \)ではなく開区間\(\left( 0,1\right) \)へと制限されています。なぜなら、仮に\(x_{1}\)と\(x_{2}\)が同じ点であるならば、狭義凸関数を定義する不等式は、\begin{equation*}\lambda f\left( x_{1}\right) +\left( 1-\lambda \right) f\left( x_{1}\right)
>f\left( \lambda x_{1}+\left( 1-\lambda \right) x_{1}\right)
\end{equation*}すなわち、\begin{equation*}
f\left( x_{1}\right) >f\left( x_{1}\right)
\end{equation*}となり、定義そのものが意味をなさなくなってしまうからです。また、仮に\(\lambda \)が\(0\)や\(1\)を値としてとり得ることを認めてしまうと、狭義凸関数を定義する不等式は、\begin{eqnarray*}0f\left( x_{1}\right) +\left( 1-0\right) f\left( x_{2}\right) &>&f\left(
0x_{1}+\left( 1-0\right) x_{2}\right) \\
1f\left( x_{1}\right) +\left( 1-1\right) f\left( x_{2}\right) &>&f\left(
1x_{1}+\left( 1-1\right) x_{2}\right)
\end{eqnarray*}すなわち、\begin{eqnarray*}
f\left( x_{2}\right) &>&f\left( x_{2}\right) \\
f\left( x_{1}\right) &>&f\left( x_{1}\right)
\end{eqnarray*}などとなり、この場合にも定義そのものが意味をなさなくなってしまいます。
凸関数と同様、狭義凸関数の定義域もまた区間である必要があります。つまり、関数\(f\)が狭義凸関数であることとは、定義域の異なる点\(x_{1},x_{2}\in I\)とスカラー\(\lambda \in \left( 0,1\right) \)をそれぞれ任意に選んだとき、不等式\begin{equation*}\lambda f\left( x_{1}\right) +\left( 1-\lambda \right) f\left( x_{2}\right)
>f\left( \lambda x_{1}+\left( 1-\lambda \right) x_{2}\right)
\end{equation*}が成り立つことを意味しますが、そもそも上の不等式が成立することを検討するためには右辺の値\(f\left(\lambda x_{1}+\left( 1-\lambda \right) x_{2}\right) \)が存在すること、すなわち関数\(f\)が点\(\lambda x_{1}+\left( 1-\lambda \right)x_{2}\)において定義されている必要があります。関数\(f\)の定義域\(I\)が区間であれば\(\lambda x_{1}+\left( 1-\lambda \right) x_{2}\in I\)であること、すなわち関数\(f\)が点\(\lambda x_{1}+\left( 1-\lambda \right) x_{2}\)において定義されていることが保証されます。逆に、関数\(f\)の定義域\(I\)が区間でない場合、ある\(x_{1},x_{2},\lambda \)に対して\(f\left( \lambda x_{1}+\left( 1-\lambda \right) x_{2}\right) \)が存在しない事態が起こり得るため、そもそも上の不等式が意味をなさなくなってしまいます。
\end{equation*}を定めるものとします。この関数\(f\)のグラフは以下の通りです。
\(f\)の定義域\(\mathbb{R} \)は区間です。\(f\)のグラフは下に凸な放物線であるため\(f\)は狭義凸関数であることが予測されます。実際、定義域上の異なる点\(x_{1},x_{2}\in \mathbb{R} \)とスカラー\(\lambda \in \left( 0,1\right) \)をそれぞれ任意に選んだとき、\begin{eqnarray*}&&\lambda f\left( x_{1}\right) +\left( 1-\lambda \right) f\left(
x_{2}\right) -f\left( \lambda x_{1}+\left( 1-\lambda \right) x_{2}\right) \\
&=&\lambda x_{1}^{2}+\left( 1-\lambda \right) x_{2}^{2}-\left[ \lambda
x_{1}+\left( 1-\lambda \right) x_{2}\right] ^{2}\quad \because f\text{の定義} \\
&=&\lambda x_{1}^{2}+x_{2}^{2}-\lambda x_{2}^{2}-\lambda
^{2}x_{1}^{2}-2\lambda x_{1}x_{2}+2\lambda ^{2}x_{1}x_{2}-x_{2}^{2}+2\lambda
x_{2}^{2}-\lambda ^{2}x_{2}^{2} \\
&=&\left( \lambda -\lambda ^{2}\right) x_{1}^{2}-2\left( \lambda -\lambda
^{2}\right) x_{1}x_{2}+\left( \lambda -\lambda ^{2}\right) x_{2}^{2} \\
&=&\left( \lambda -\lambda ^{2}\right) \left(
x_{1}^{2}-2x_{1}x_{2}+x_{2}^{2}\right) \\
&=&\lambda \left( 1-\lambda \right) \left( x_{1}-x_{2}\right) ^{2} \\
&>&0\quad \because \lambda \in \left( 0,1\right) ,x_{1}\not=x_{2}
\end{eqnarray*}すなわち、\begin{equation*}
\lambda f\left( x_{1}\right) +\left( 1-\lambda \right) f\left( x_{2}\right)
>f\left( \lambda x_{1}+\left( 1-\lambda \right) x_{2}\right)
\end{equation*}となるため、\(f\)が狭義凸関数であることが示されました。
上の例が示唆するように、定義にもとづいて関数が狭義凸であることを示す作業は煩雑になりがちです。より扱いやすい狭義凸関数の判定条件が存在するため、多くの場合、それらを利用することになります。詳細は場を改めて解説します。
狭義凸関数は凸関数であることが保証されます。
上の命題の逆は成立するとは限りません。つまり、凸関数は狭義凸関数であるとは限りません。以下の例より明らかです。
\end{equation*}を定めるものとします。この関数\(f\)のグラフは以下の通りです。
この関数\(f\)は凸関数である一方で狭義凸関数ではありません(演習問題)。
1変数の狭義凹関数
実数空間\(\mathbb{R} \)もしくは区間を定義域とする関数\(f:\mathbb{R} \supset I\rightarrow \mathbb{R} \)について、\begin{equation*}\forall x_{1}\in I,\ \forall x_{2}\in I\backslash \left\{ x_{1}\right\} ,\
\forall \lambda \in \left( 0,1\right) :\lambda f\left( x_{1}\right) +\left(
1-\lambda \right) f\left( x_{2}\right) <f\left( \lambda x_{1}+\left(
1-\lambda \right) x_{2}\right)
\end{equation*}が成り立つ場合、\(f\)を狭義凹関数(strictly concavefunction)と呼びます。
関数\(f:\mathbb{R} \supset I\rightarrow \mathbb{R} \)が狭義凹関数であることの意味を視覚的に理解します(上図)。狭義凹関数\(f\)のグラフ上の異なる2つの点\begin{eqnarray*}A &:&\left( x_{1},f\left( x_{1}\right) \right) \\
B &:&\left( x_{2},f\left( x_{2}\right) \right)
\end{eqnarray*}を任意に選びます。この2つの点を結ぶ線分から端点を除いた部分に存在するそれぞれの点\(Q\)の座標は、何らかのスカラー\(\lambda \in\left( 0,1\right) \)を用いて、\begin{equation*}Q:\left( \lambda x_{1}+\left( 1-\lambda \right) x_{2},\lambda f\left(
x_{1}\right) +\left( 1-\lambda \right) f\left( x_{2}\right) \right)
\end{equation*}と表すことができます。一方、点\(Q\)と\(x\)座標を共有する関数\(f\)のグラフ上の点\(P\)の座標は、\begin{equation*}P:\left( \lambda x_{1}+\left( 1-\lambda \right) x_{2},f\left( \lambda
x_{1}+\left( 1-\lambda \right) x_{2}\right) \right)
\end{equation*}ですが、狭義凹関数の定義より、点\(Q\)の\(y\)座標が点\(P\)の\(y\)座標より小さいこと、すなわち点\(Q\)の位置は点\(P\)の位置より下方であることが保証されます。任意の\(\lambda \)について同様の議論が成り立つため、線分\(AB\)から端点を除いた部分に存在する任意の点の位置は関数\(f\)のグラフよりも下方であることが保証されます。関数\(f\)のグラフ上の任意の異なる2つの点\(A,B\)についても同様の議論が成立するため、結局、\(f\)が狭義凹関数である場合、そのグラフは山型の曲線になります。
狭義凹関数は凹関数と何が違うのでしょうか。区間を定義域とする関数\(f:\mathbb{R} \supset I\rightarrow \mathbb{R} \)が凹関数であることとは、\begin{equation*}\forall x_{1},x_{2}\in I,\ \forall \lambda \in \left[ 0,1\right] :\lambda
f\left( x_{1}\right) +\left( 1-\lambda \right) f\left( x_{2}\right) \leq
f\left( \lambda x_{1}+\left( 1-\lambda \right) x_{2}\right)
\end{equation*}が成り立つことを意味する一方、\(f\)が狭義凹関数であることとは、\begin{equation*}\forall x_{1}\in I,\ \forall x_{2}\in I\backslash \left\{ x_{1}\right\} ,\
\forall \lambda \in \left( 0,1\right) :\lambda f\left( x_{1}\right) +\left(
1-\lambda \right) f\left( x_{2}\right) <f\left( \lambda x_{1}+\left(
1-\lambda \right) x_{2}\right)
\end{equation*}が成り立つことを意味します。最も大きな違いは、凹関数は大小関係\(\geq \)を用いて定義されているのに対し、狭義凹関数は狭義大小関係\(>\)を用いて定義されているという点です。それにあわせて、狭義凹関数の定義中の点\(x_{1},x_{2}\)は\(I\)の異なる点であるとともに、スカラー\(\lambda \)が動く範囲は閉区間\(\left[ 0,1\right] \)ではなく開区間\(\left( 0,1\right) \)へと制限されています。なぜなら、仮に\(x_{1}\)と\(x_{2}\)が同じ点であるならば、狭義凹関数を定義する不等式は、\begin{equation*}\lambda f\left( x_{1}\right) +\left( 1-\lambda \right) f\left( x_{1}\right)
<f\left( \lambda x_{1}+\left( 1-\lambda \right) x_{1}\right)
\end{equation*}すなわち、\begin{equation*}
f\left( x_{1}\right) <f\left( x_{1}\right)
\end{equation*}となり、定義そのものが意味をなさなくなってしまうからです。また、仮に\(\lambda \)が\(0\)や\(1\)を値としてとり得ることを認めてしまうと、狭義凸関数を定義する不等式は、\begin{eqnarray*}0f\left( x_{1}\right) +\left( 1-0\right) f\left( x_{2}\right) &<&f\left(
0x_{1}+\left( 1-0\right) x_{2}\right) \\
1f\left( x_{1}\right) +\left( 1-1\right) f\left( x_{2}\right) &<&f\left(
1x_{1}+\left( 1-1\right) x_{2}\right)
\end{eqnarray*}すなわち、\begin{eqnarray*}
f\left( x_{2}\right) &<&f\left( x_{2}\right) \\
f\left( x_{1}\right) &<&f\left( x_{1}\right)
\end{eqnarray*}などとなり、この場合にも定義そのものが意味をなさなくなってしまいます。
凹関数と同様、狭義凹関数の定義域もまた区間である必要があります。つまり、関数\(f\)が狭義凹関数であることとは、定義域の異なる点\(x_{1},x_{2}\in I\)とスカラー\(\lambda \in \left( 0,1\right) \)をそれぞれ任意に選んだとき、不等式\begin{equation*}\lambda f\left( x_{1}\right) +\left( 1-\lambda \right) f\left( x_{2}\right)
<f\left( \lambda x_{1}+\left( 1-\lambda \right) x_{2}\right)
\end{equation*}が成り立つことを意味しますが、そもそも上の不等式が成立することを検討するためには右辺の値\(f\left(\lambda x_{1}+\left( 1-\lambda \right) x_{2}\right) \)が存在すること、すなわち関数\(f\)が点\(\lambda x_{1}+\left( 1-\lambda \right)x_{2}\)において定義されている必要があります。関数\(f\)の定義域\(I\)が区間であれば\(\lambda x_{1}+\left( 1-\lambda \right) x_{2}\in I\)であること、すなわち関数\(f\)が点\(\lambda x_{1}+\left( 1-\lambda \right) x_{2}\)において定義されていることが保証されます。逆に、関数\(f\)の定義域\(I\)が区間でない場合、ある\(x_{1},x_{2},\lambda \)に対して\(f\left( \lambda x_{1}+\left( 1-\lambda \right) x_{2}\right) \)が存在しない事態が起こり得るため、そもそも上の不等式が意味をなさなくなってしまいます。
\end{equation*}を定めるものとします。この関数\(f\)のグラフは以下の通りです。
\(f\)の定義域\(\mathbb{R} \)は区間です。\(f\)のグラフは上に凸な放物線であるため\(f\)は狭義凹関数であることが予測されます。実際、定義域上の異なる点\(x_{1},x_{2}\in \mathbb{R} \)とスカラー\(\lambda \in \left( 0,1\right) \)をそれぞれ任意に選んだとき、\begin{eqnarray*}&&f\left( \lambda x_{1}+\left( 1-\lambda \right) x_{2}\right) -\left[
\lambda f\left( x_{1}\right) +\left( 1-\lambda \right) f\left( x_{2}\right) \right] \\
&=&-\left[ \lambda x_{1}+\left( 1-\lambda \right) x_{2}\right] ^{2}-\left[
-\lambda x_{1}^{2}-\left( 1-\lambda \right) x_{2}^{2}\right] \\
&=&\lambda x_{1}^{2}+x_{2}^{2}-\lambda x_{2}^{2}-\lambda
^{2}x_{1}^{2}-2\lambda x_{1}x_{2}+2\lambda ^{2}x_{1}x_{2}-x_{2}^{2}+2\lambda
x_{2}^{2}-\lambda ^{2}x_{2}^{2} \\
&=&\left( \lambda -\lambda ^{2}\right) x_{1}^{2}-2\left( \lambda -\lambda
^{2}\right) x_{1}x_{2}+\left( \lambda -\lambda ^{2}\right) x_{2}^{2} \\
&=&\left( \lambda -\lambda ^{2}\right) \left(
x_{1}^{2}-2x_{1}x_{2}+x_{2}^{2}\right) \\
&=&\lambda \left( 1-\lambda \right) \left( x_{1}-x_{2}\right) ^{2} \\
&>&0\quad \because \lambda \in \left( 0,1\right) \text{および}x_{1}\not=x_{2}
\end{eqnarray*}すなわち、\begin{equation*}
f\left( \lambda x_{1}+\left( 1-\lambda \right) x_{2}\right) >\lambda f\left(
x_{1}\right) +\left( 1-\lambda \right) f\left( x_{2}\right)
\end{equation*}となるため、\(f\)が狭義凹関数であることが示されました。
上の例が示唆するように、定義にもとづいて関数が狭義凹であることを示す作業は煩雑になりがちです。より扱いやすい狭義凹関数の判定条件が存在するため、多くの場合、それらを利用することになります。詳細は場を改めて解説します。
狭義凹関数は凹関数であることが保証されます。
上の命題の逆は成立するとは限りません。つまり、凹関数は狭義凹関数であるとは限りません。以下の例より明らかです。
\end{equation*}を定めるものとします。この関数\(f\)のグラフは以下の通りです。
この関数\(f\)は凹関数である一方で狭義凹関数ではありません(演習問題)。
狭義凸関数と狭義凹関数の関係
区間上に定義された関数\(f:\mathbb{R} \supset I\rightarrow \mathbb{R} \)が与えられたとき、それぞれの\(x\in I\)に対して、\begin{equation*}\left( -f\right) \left( x\right) =-f\left( x\right)
\end{equation*}を定める関数\begin{equation*}
-f:\mathbb{R} \supset I\rightarrow \mathbb{R} \end{equation*}が定義可能です。\(f\)が狭義凸関数であることは\(-f\)が狭義凹関数であることと必要十分であり、また、\(f\)が狭義凹関数であることは\(-f\)が狭義凸関数であることと必要十分になります。
&&\left( b\right) \ f\text{が狭義凹関数}\Leftrightarrow -f\text{が狭義凸関数}
\end{eqnarray*}がともに成り立つ。
\end{equation*}を定めるものとします。先に示したように\(f\)は狭義凸関数です。したがって上の命題より、それぞれの\(x\in \mathbb{R} \)に対して、\begin{equation*}-f\left( x\right) =-x^{2}
\end{equation*}を定める関数\(-f:\mathbb{R} \rightarrow \mathbb{R} \)は狭義凹関数ですが、これは先の例と整合的です。
演習問題
\end{equation*}を定めるものとします。\(f\)は凸関数かつ凹関数である一方で、狭義凸関数と狭義凹関数のどちらでもないことを示してください。
\end{equation*}を定めるものとします。\(f\)は狭義凸関数、狭義凹関数、狭義凸関数と狭義凹関数のどちらでもない、のどれでしょうか。議論してください。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】