WIIS

教材一覧
教材一覧
教材検索
CONVEX FUNCTION

多変数の凸関数・凹関数

目次

Share on twitter
Twitterで共有
Share on email
メールで共有

多変数の凸関数

ユークリッド空間\(\mathbb{R} ^{n}\)もしくはその部分集合を定義域とする多変数関数\(f:\mathbb{R} ^{n}\supset X\rightarrow \mathbb{R} \)について、定義域\(X\)が凸集合であるとともに、\begin{equation*}\forall x_{1},x_{2}\in X,\ \forall \lambda \in \left[ 0,1\right] :\lambda
f\left( x_{1}\right) +\left( 1-\lambda \right) f\left( x_{2}\right) \geq
f\left( \lambda x_{1}+\left( 1-\lambda \right) x_{2}\right)
\end{equation*}が成り立つ場合、\(f\)を凸関数(convex function)と呼びます。

凸関数\(f:\mathbb{R} ^{n}\supset X\rightarrow \mathbb{R} \)のグラフ上の2つの点\begin{equation*}A:\left( x_{1},f\left( x_{1}\right) \right) ,\quad B:\left( x_{2},f\left(
x_{2}\right) \right)
\end{equation*}を任意に選びます。この2つの点を結ぶ線分上に存在するそれぞれの点\(P\)の座標は、何らかのスカラー\(\lambda \in \left[ 0,1\right] \)を用いて、\begin{equation*}\left( \lambda x_{1}+\left( 1-\lambda \right) x_{2},\lambda f\left(
x_{1}\right) +\left( 1-\lambda \right) f\left( x_{2}\right) \right)
\end{equation*}と表すことができます。一方、点\(P\)と\(x\)座標を共有する関数\(f\)のグラフ上の点\(Q\)の座標は、\begin{equation*}\left( \lambda x_{1}+\left( 1-\lambda \right) x_{2},f\left( \lambda
x_{1}+\left( 1-\lambda \right) x_{2}\right) \right)
\end{equation*}ですが、凸関数の定義より、点\(P\)の\(y\)座標が点\(Q\)の\(y\)座標以上であること、すなわち点\(P\)の位置は点\(Q\)の位置と同じもしくは点\(Q\)より上方であることが保証されます。任意の\(\lambda \)について同様の議論が成り立つため、線分\(AB\)上の任意の点の位置は\(f\)のグラフ上もしくはそれより上方であることが保証されます。

凸関数の定義域は凸集合である必要がありますが、その理由は以下の通りです。関数\(f\)が凸関数であることとは、定義域の点\(x_{1},x_{2}\in X\)とスカラー\(\lambda\in \left[ 0,1\right] \)をそれぞれ任意に選んだとき、不等式\begin{equation*}\lambda f\left( x_{1}\right) +\left( 1-\lambda \right) f\left( x_{2}\right)
\geq f\left( \lambda x_{1}+\left( 1-\lambda \right) x_{2}\right)
\end{equation*}が成り立つことを意味しますが、そもそも上の不等式が成立することを検討するためには右辺の値\(f\left(\lambda x_{1}+\left( 1-\lambda \right) x_{2}\right) \)が存在すること、すなわち\(f\)が点\(\lambda x_{1}+\left( 1-\lambda \right) x_{2}\)において定義されている必要があります。\(f\)の定義域\(I\)が凸集合であれば\(\lambda x_{1}+\left( 1-\lambda \right) x_{2}\in X\)であること、すなわち\(f\)が点\(\lambda x_{1}+\left( 1-\lambda \right) x_{2}\)において定義されていることが保証されます。逆に、\(f\)の定義域\(X\)が凸集合でない場合、ある\(x_{1},x_{2},\lambda \)に対して\(f\left( \lambda x_{1}+\left( 1-\lambda \right) x_{2}\right) \)が存在しない事態が起こり得るため、そもそも上の不等式が意味をなさなくなってしまいます。

例(凸関数)
関数\(f:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f\left( x,y\right) =x^{2}+y^{2}
\end{equation*}を定めるものとします。\(f\)のグラフは以下の通りです。

図:凸関数
図:凸関数

\(f\)の定義域\(\mathbb{R} ^{2}\)は凸集合です。定義域上の点\(\left( x_{1},y_{1}\right) ,\left(x_{2},y_{2}\right) \in \mathbb{R} \)とスカラー\(\lambda \in \left[ 0,1\right] \)をそれぞれ任意に選んだとき、\begin{eqnarray*}&&\lambda f\left( x_{1},y_{1}\right) +\left( 1-\lambda \right) f\left(
x_{2},y_{2}\right) -f\left( \lambda \left( x_{1},y_{1}\right) +\left(
1-\lambda \right) \left( x_{2},y_{2}\right) \right) \\
&=&\lambda \left( x_{1}^{2}+y_{1}^{2}\right) +\left( 1-\lambda \right)
\left( x_{2}^{2}+y_{2}^{2}\right) -\left\{ \left[ \lambda x_{1}+\left(
1-\lambda \right) x_{2}\right] ^{2}+\left[ \lambda y_{1}+\left( 1-\lambda
\right) y_{2}\right] ^{2}\right\} \\
&=&\lambda \left( x_{1}^{2}+y_{1}^{2}\right) +\left( 1-\lambda \right)
\left( x_{2}^{2}+y_{2}^{2}\right) -\left[ \lambda ^{2}\left(
x_{1}^{2}+y_{1}^{2}\right) +2\lambda \left( 1-\lambda \right) \left(
x_{1}x_{2}+y_{1}y_{2}\right) +\left( 1-\lambda \right) ^{2}\left(
x_{2}^{2}+y_{2}^{2}\right) \right] \\
&=&\left( \lambda -\lambda ^{2}\right) \left( x_{1}^{2}+y_{1}^{2}\right) +
\left[ \left( 1-\lambda \right) -\left( 1-\lambda \right) ^{2}\right] \left(
x_{2}^{2}+y_{2}^{2}\right) -2\lambda \left( 1-\lambda \right) \left(
x_{1}x_{2}+y_{1}y_{2}\right) \\
&=&\lambda \left( 1-\lambda \right) \left( x_{1}^{2}+y_{1}^{2}\right)
+\lambda \left( 1-\lambda \right) \left( x_{2}^{2}+y_{2}^{2}\right)
-2\lambda \left( 1-\lambda \right) \left( x_{1}x_{2}+y_{1}y_{2}\right) \\
&=&\lambda \left( 1-\lambda \right) \left[ \left( x_{1}^{2}+y_{1}^{2}\right)
+\left( x_{2}^{2}+y_{2}^{2}\right) -2\left( x_{1}x_{2}+y_{1}y_{2}\right) \right] \\
&=&\lambda \left( 1-\lambda \right) \left[ \left( x_{1}-x_{1}\right)
^{2}+\left( y_{1}-y_{2}\right) ^{2}\right] \\
&\geq &0\quad \because \lambda \in \left[ 0,1\right] \end{eqnarray*}すなわち、\begin{equation*}
\lambda f\left( x_{1},y_{1}\right) +\left( 1-\lambda \right) f\left(
x_{2},y_{2}\right) \geq f\left( \lambda \left( x_{1},y_{1}\right) +\left(
1-\lambda \right) \left( x_{2},y_{2}\right) \right)
\end{equation*}が成り立つため\(f\)は凸関数であることが示されました。

例(凸関数)
関数\(f:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f\left( x,y\right) =x+y
\end{equation*}を定めるものとします。\(f\)のグラフは以下の通りです。

図:凸関数
図:凸関数

\(f\)の定義域\(\mathbb{R} ^{2}\)は凸集合です。定義域上の点\(\left( x_{1},y_{1}\right) ,\left(x_{2},y_{2}\right) \in \mathbb{R} \)とスカラー\(\lambda \in \left[ 0,1\right] \)をそれぞれ任意に選んだとき、\begin{eqnarray*}&&\lambda f\left( x_{1},y_{1}\right) +\left( 1-\lambda \right) f\left(
x_{2},y_{2}\right) -f\left( \lambda \left( x_{1},y_{1}\right) +\left(
1-\lambda \right) \left( x_{2},y_{2}\right) \right) \\
&=&\lambda \left( x_{1}+y_{1}\right) +\left( 1-\lambda \right) \left(
x_{2}+y_{2}\right) -\left\{ \left[ \lambda x_{1}+\left( 1-\lambda \right)
x_{2}\right] +\left[ \lambda y_{1}+\left( 1-\lambda \right) y_{2}\right] \right\} \\
&=&0
\end{eqnarray*}すなわち、\begin{equation*}
\lambda f\left( x_{1},y_{1}\right) +\left( 1-\lambda \right) f\left(
x_{2},y_{2}\right) =f\left( \lambda \left( x_{1},y_{1}\right) +\left(
1-\lambda \right) \left( x_{2},y_{2}\right) \right)
\end{equation*}が成り立つため\(f\)は凸関数であることが示されました。この例は、グラフが平面であるような関数、もしくはグラフに平面部分が存在するような関数もまた凸関数になり得ることを示唆しています。

これまで提示した例から明らかであるように、定義にもとづいて関数が凸であることを示す作業は煩雑になりがちです。より扱い凸関数の判定条件が存在するため、多くの場合、それらを利用することになります。詳細は場を改めて解釈します。

 

多変数の凹関数

ユークリッド空間\(\mathbb{R} ^{n}\)もしくはその部分集合を定義域とする多変数関数\(f:\mathbb{R} ^{n}\supset X\rightarrow \mathbb{R} \)について、定義域\(X\)が凸集合であるとともに、\begin{equation*}\forall x_{1},x_{2}\in X,\ \forall \lambda \in \left[ 0,1\right] :\lambda
f\left( x_{1}\right) +\left( 1-\lambda \right) f\left( x_{2}\right) \leq
f\left( \lambda x_{1}+\left( 1-\lambda \right) x_{2}\right)
\end{equation*}が成り立つ場合、\(f\)を凹関数(concave function)と呼びます。

凹関数\(f:\mathbb{R} ^{n}\supset X\rightarrow \mathbb{R} \)のグラフ上の2つの点\begin{equation*}A:\left( x_{1},f\left( x_{1}\right) \right) ,\quad B:\left( x_{2},f\left(
x_{2}\right) \right)
\end{equation*}を任意に選びます。この2つの点を結ぶ線分上に存在するそれぞれの点\(Q\)の座標は、何らかのスカラー\(\lambda \in \left[ 0,1\right] \)を用いて、\begin{equation*}\left( \lambda x_{1}+\left( 1-\lambda \right) x_{2},\lambda f\left(
x_{1}\right) +\left( 1-\lambda \right) f\left( x_{2}\right) \right)
\end{equation*}と表すことができます。一方、点\(Q\)と\(x\)座標を共有する関数\(f\)のグラフ上の点\(P\)の座標は、\begin{equation*}\left( \lambda x_{1}+\left( 1-\lambda \right) x_{2},f\left( \lambda
x_{1}+\left( 1-\lambda \right) x_{2}\right) \right)
\end{equation*}ですが、凹関数の定義より、点\(Q\)の\(y\)座標が点\(P\)の\(y\)座標以上であること、すなわち点\(Q\)の位置は点\(P\)の位置と同じもしくは点\(P\)より上方であることが保証されます。任意の\(\lambda \)について同様の議論が成り立つため、線分\(AB\)上の任意の点の位置は\(f\)のグラフ上もしくはそれより下方であることが保証されます。

凹関数の定義域は凸集合である必要がありますが、その理由は凸関数の定義域が凸集合でなければならない理由と同様です。つまり、\(f\)の定義域\(X\)が凸集合であれば任意の\(x_{1},x_{2},\lambda \)に対して\(f\)が点\(\lambda x_{1}+\left( 1-\lambda \right) x_{2}\)において定義されることが保証されるため、凹関数の定義を構成する不等式が成立するか検討できます。

例(凹関数)
関数\(f:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f\left( x,y\right) =-x^{2}-y^{2}
\end{equation*}を定めるものとします。\(f\)のグラフは以下の通りです。

図:凹関数
図:凹関数

\(f\)の定義域\(\mathbb{R} ^{2}\)は凸集合です。定義域上の点\(\left( x_{1},y_{1}\right) ,\left(x_{2},y_{2}\right) \in \mathbb{R} \)とスカラー\(\lambda \in \left[ 0,1\right] \)をそれぞれ任意に選んだとき、\begin{eqnarray*}&&\lambda f\left( x_{1},y_{1}\right) +\left( 1-\lambda \right) f\left(
x_{2},y_{2}\right) -\left[ f\left( \lambda \left( x_{1},y_{1}\right) +\left(
1-\lambda \right) \left( x_{2},y_{2}\right) \right) \right] \\
&=&-\left[ \lambda \left( x_{1}^{2}+y_{1}^{2}\right) +\left( 1-\lambda
\right) \left( x_{2}^{2}+y_{2}^{2}\right) \right] -\left\{ -\left[ \lambda
x_{1}+\left( 1-\lambda \right) x_{2}\right] ^{2}+-\left[ \lambda
y_{1}+\left( 1-\lambda \right) y_{2}\right] ^{2}\right\} \\
&=&-\lambda \left( x_{1}^{2}+y_{1}^{2}\right) -\left( 1-\lambda \right)
\left( x_{2}^{2}+y_{2}^{2}\right) +\left[ \lambda ^{2}\left(
x_{1}^{2}+y_{1}^{2}\right) +2\lambda \left( 1-\lambda \right) \left(
x_{1}x_{2}+y_{1}y_{2}\right) +\left( 1-\lambda \right) ^{2}\left(
x_{2}^{2}+y_{2}^{2}\right) \right] \\
&=&-\left( \lambda -\lambda ^{2}\right) \left( x_{1}^{2}+y_{1}^{2}\right) –
\left[ \left( 1-\lambda \right) -\left( 1-\lambda \right) ^{2}\right] \left(
x_{2}^{2}+y_{2}^{2}\right) +2\lambda \left( 1-\lambda \right) \left(
x_{1}x_{2}+y_{1}y_{2}\right) \\
&=&-\lambda \left( 1-\lambda \right) \left( x_{1}^{2}+y_{1}^{2}\right)
-\lambda \left( 1-\lambda \right) \left( x_{2}^{2}+y_{2}^{2}\right)
+2\lambda \left( 1-\lambda \right) \left( x_{1}x_{2}+y_{1}y_{2}\right) \\
&=&-\lambda \left( 1-\lambda \right) \left[ \left(
x_{1}^{2}+y_{1}^{2}\right) +\left( x_{2}^{2}+y_{2}^{2}\right) -2\left(
x_{1}x_{2}+y_{1}y_{2}\right) \right] \\
&=&-\lambda \left( 1-\lambda \right) \left[ \left( x_{1}-x_{1}\right)
^{2}+\left( y_{1}-y_{2}\right) ^{2}\right] \\
&\leq &0\quad \because \lambda \in \left[ 0,1\right] \end{eqnarray*}すなわち、\begin{equation*}
\lambda f\left( x_{1},y_{1}\right) +\left( 1-\lambda \right) f\left(
x_{2},y_{2}\right) \leq f\left( \lambda \left( x_{1},y_{1}\right) +\left(
1-\lambda \right) \left( x_{2},y_{2}\right) \right)
\end{equation*}が成り立つため\(f\)は凸関数であることが示されました。

例(凹関数)
関数\(f:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f\left( x,y\right) =x+y
\end{equation*}を定めるものとします。\(f\)のグラフは以下の通りです。

図:凹関数
図:凹関数

\(f\)の定義域\(\mathbb{R} ^{2}\)は凸集合です。先ほどこの関数\(f\)が凸関数であることを示しましたが、これは凹関数でもあります。実際、定義域上の点\(\left(x_{1},y_{1}\right) ,\left( x_{2},y_{2}\right) \in \mathbb{R} \)とスカラー\(\lambda \in \left[ 0,1\right] \)をそれぞれ任意に選んだとき、\begin{eqnarray*}&&\lambda f\left( x_{1},y_{1}\right) +\left( 1-\lambda \right) f\left(
x_{2},y_{2}\right) -f\left( \lambda \left( x_{1},y_{1}\right) +\left(
1-\lambda \right) \left( x_{2},y_{2}\right) \right) \\
&=&\lambda \left( x_{1}+y_{1}\right) +\left( 1-\lambda \right) \left(
x_{2}+y_{2}\right) -\left\{ \left[ \lambda x_{1}+\left( 1-\lambda \right)
x_{2}\right] +\left[ \lambda y_{1}+\left( 1-\lambda \right) y_{2}\right] \right\} \\
&=&0
\end{eqnarray*}すなわち、\begin{equation*}
\lambda f\left( x_{1},y_{1}\right) +\left( 1-\lambda \right) f\left(
x_{2},y_{2}\right) =f\left( \lambda \left( x_{1},y_{1}\right) +\left(
1-\lambda \right) \left( x_{2},y_{2}\right) \right)
\end{equation*}が成り立つため\(f\)は凹関数であることが示されました。この例は、グラフが平面であるような関数、もしくはグラフに平面部分が存在するような関数もまた凹関数になり得ることを示唆しています。また、凸関数かつ凹関数であるような関数が存在することも示唆しています。

これまで提示した例から明らかであるように、定義にもとづいて関数が凸であることを示す作業は煩雑になりがちです。より扱い凸関数の判定条件が存在するため、多くの場合、それらを利用することになります。詳細は場を改めて解釈します。

 

凸関数と凹関数の関係

凸集合上に定義された関数\(f:\mathbb{R} ^{n}\supset X\rightarrow \mathbb{R} \)が与えられたとき、それぞれの\(x\in X\)に対して、\begin{equation*}\left( -f\right) \left( x\right) =-f\left( x\right)
\end{equation*}を定める関数\(-f:\mathbb{R} ^{n}\supset X\rightarrow \mathbb{R} \)が定義可能です。\(f\)が凸関数であることは\(-f\)が凹関数であることと必要十分であり、また、\(f\)が凹関数であることは\(-f\)が凸関数であることと必要十分です。

命題(凸関数と凹関数の関係)
凸集合上に定義された関数\(f:\mathbb{R} ^{n}\supset X\rightarrow \mathbb{R} \)に関して、\begin{eqnarray*}&&\left( a\right) \ f\text{が凸関数}\Leftrightarrow
-f\text{が凹関数} \\
&&\left( b\right) \ f\text{が凹関数}\Leftrightarrow
-f\text{が凸関数}
\end{eqnarray*}がともに成り立つ。

証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

例(凸関数と凹関数の関係)
関数\(f:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f\left( x,y\right) =x^{2}+y^{2}
\end{equation*}を定めるものとします。先に示したように\(f\)は凸関数です。したがって上の命題より、それぞれの\(\left( x,y\right)\in \mathbb{R} ^{2}\)に対して、\begin{equation*}-f\left( x,y\right) =-x^{2}-y^{2}
\end{equation*}を定める関数\(-f:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)は凹関数ですが、これは先の例と整合的です。
例(凸関数と凹関数の関係)
関数\(f:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f\left( x,y\right) =x+y
\end{equation*}を定めるものとします。先に示したように\(f\)は凸関数かつ凹関数です。したがって、上の命題より、それぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}-f\left( x,y\right) =-x-y
\end{equation*}を定める関数\(-f:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)は凸関数かつ凹関数です。

関数は凸関数や凹関数であるとは限りません。以下の例から明らかです。

例(凸関数や凹関数ではない関数)
関数\(f:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f\left( x,y\right) =xy
\end{equation*}を定めるものとします。\(f\)の定義域\(\mathbb{R} ^{2}\)は凸集合ですが、\(f\)は凸関数と凹関数のいずれでもありません(演習問題)。

 

演習問題

問題(凸関数・凹関数)
凸集合上に定義された関数\(f:\mathbb{R} ^{n}\supset X\rightarrow \mathbb{R} \)について以下の問いに答えてください。

  1. \(f\)が凸関数ではないという主張を定式化してください。
  2. \(f\)が凹関数ではないという主張を定式化してください。
  3. \(f\)が凸関数と凹関数のどちらでもないような状況は起こり得るでしょうか。議論してください。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

問題(凸関数・凹関数)
多変数関数\(f:\mathbb{R} ^{2}\rightarrow \mathbb{R} \)はそれぞれの\(\left( x,y\right) \in \mathbb{R} ^{2}\)に対して、\begin{equation*}f\left( x,y\right) =\left( x+y\right) ^{2}
\end{equation*}を定めるものとします。\(f\)は凸関数、凹関数、凸関数と凹関数のどちらでもない、のどれでしょうか。議論してください。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

次回は多変数の狭義凸関数・狭義凹関数について解説します。

Share on twitter
Twitterで共有
Share on email
メールで共有
DISCUSSION

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録

RELATED KNOWLEDGE

関連知識

凸関数・凹関数
1変数の凸関数・凹関数

定義域が区間であるとともに、そのグラフが直線もしくは谷型の曲線になるような関数を凸関数と呼び、グラフが直線もしくは山型の曲線になるような関数を凹関数と呼びます。

凸関数・凹関数
1変数の狭義凸関数・狭義凹関数

定義域が区間であるとともに、そのグラフが谷型の曲線になるような関数を狭義凸関数と呼び、グラフが山型の曲線になるような関数を狭義凹関数と呼びます。

凸関数・凹関数
微分可能な1変数の凸関数・凹関数

微分可能な関数が凸関数であることは、導関数が単調増加関数であることと必要十分です。また、微分可能な関数が凹関数であることは、導関数が単調減少関数であることと必要十分です。

2階の必要条件
1変数凸関数・凹関数の無制約最適化

1変数の凸関数を目的関数とする制約条件のない最小化問題や、1変数の凹関数を目的関数とする制約条件のない最大化問題を解く方法を解説します。

凸関数・凹関数
多変数の狭義凸関数・狭義凹関数

定義域がユークリッド空間上の凸集合であるとともに、そのグラフが下に凸であるような関数を狭義凸関数と呼びます。また、グラフが上に凸であるよう関数を狭義凹関数と呼びます。

凸関数・凹関数
連続微分可能な多変数の凸関数・凹関数

定義域がユークリッド空間上の非空な開凸集合であるとともに連続微分可能である場合に、その関数が(狭義)凸関数であることや(狭義)凹関数であることを判定する方法を解説します。

凸関数・凹関数
多変数凸関数・凹関数の無制約最適化

多変数の凸関数を目的関数とする制約条件のない最小化問題や、多変数の凹関数を目的関数とする制約条件のない最大化問題を解く方法を解説します。