超平面による集合と点の狭義分離
ユークリッド空間\(\mathbb{R} ^{n}\)における超平面とは、非ゼロの法線ベクトル\(a\in \mathbb{R} ^{n}\backslash \left\{ 0\right\} \)とスカラー\(c\in \mathbb{R} \)から、\begin{equation*}H\left( a,c\right) =\left\{ x\in \mathbb{R} ^{n}\ |\ a\cdot x=c\right\}
\end{equation*}と定義される\(\mathbb{R} ^{n}\)の部分集合です。超平面\(H\left( a,c\right) \)が与えられれば空間\(\mathbb{R} ^{n}\)を開半空間\begin{eqnarray*}H^{++}\left( a,c\right) &=&\left\{ x\in \mathbb{R} ^{n}\ |\ a\cdot x>c\right\} \\
H^{− −}\left( a,c\right) &=&\left\{ x\in \mathbb{R} ^{n}\ |\ a\cdot x<c\right\}
\end{eqnarray*}へと分割することができます。空間\(\mathbb{R} ^{n}\)は超平面\(H\left( a,c\right) \)と上半空間\(H^{++}\left( a,c\right) \)と下半空間\(H^{− −}\left( a,c\right) \)に分割されます。これら3つの集合は互いに素です。
ユークリッド空間上の集合\(X\subset \mathbb{R} ^{n}\)と点\(y\in \mathbb{R} ^{n}\)および超平面\(H\left( a,c\right) \)が与えられたとき、開上半空間\(H^{++}\left( a,c\right) \)と開下半空間\(H^{− −}\left( a,c\right) \)のどちらか一方が集合\(X\)を部分集合として含むとともに、開上半空間と開下半空間のうち\(X\)を部分集合として含まないほうが点\(y\)を要素として含む場合には、すなわち、以下の2つの条件\begin{eqnarray*}&&\left( a\right) \ X\subset H^{++}\left( a,c\right) \wedge y\in
H^{− −}\left( a,c\right) \\
&&\left( b\right) \ X\subset H^{− −}\left( a,c\right) \wedge y\in
H^{++}\left( a,c\right)
\end{eqnarray*}のどちらか一方が成り立つ場合には、集合\(X\)と点\(y\)は超平面\(H\left(a,c\right) \)によって狭義分離される(strictly separated)または強分離されるなどと言います。開半空間の定義より、上の2つの条件を、\begin{eqnarray*}&&\left( a\right) \ \left( \forall x\in X:a\cdot x>c\right) \wedge a\cdot y<c
\\
&&\left( b\right) \ \left( \forall x\in X:a\cdot x<c\right) \wedge a\cdot y>c
\end{eqnarray*}とそれぞれ表現することもできます。
\(\mathbb{R} ^{2}\)における超平面は直線です。上図中の直線に相当する超平面\(H\left( a,c\right) \)に注目します。上半空間\(H^{+}\left( a,c\right) \)から超平面\(H\left( a,c\right) \)を除いた集合が開上半空間\(H^{++}\left( a,c\right) \)であり、下半空間\(H^{-}\left( a,c\right) \)から超平面\(H\left( a,c\right) \)を除いた集合が開下半空間\(H^{− −}\left( a,c\right) \)です。上図から明らかであるように、\(X\)は\(H^{++}\left( a,c\right) \)の部分集合である一方で\(y\)は\(H^{− −}\left( a,c\right) \)の要素であるため、\(X\)と\(y\)は\(H\left( a,c\right) \)によって狭義分離されています。
\(\mathbb{R} ^{2}\)における超平面は直線です。集合\(X\)は閉集合ではなく境界点を要素として持ちません。つまり、\(X\)はその内部\(X^{i}\)と一致し、その全体が開上半空間\(H^{++}\left( a,c\right) \)に含まれているため\(X\)は\(H^{++}\left( a,c\right) \)の部分集合です。同時に\(y\)は\(H^{− −}\left( a,c\right) \)の要素であるため、\(X\)と\(y\)は\(H\left( a,c\right) \)によって狭義分離されています。
集合と点は超平面によって狭義分離可能であるとは限りません。以下の例より明らかです。
\(\mathbb{R} ^{2}\)における超平面は直線です。\(\mathbb{R} ^{2}\)上のいかなる直線によっても集合\(X\)と点\(y\)を狭義分離することはできません。具体例として、上図中の直線に相当する超平面\(H\left( a,c\right) \)に注目すると、点\(y\)は開下半空間\(H^{− −}\left( a,c\right) \)の点である一方で集合\(X\)は開上半空間\(H^{++}\left( a,c\right) \)の部分集合ではありません。他の任意の超平面\(H\left( a,c\right) \)についても同様です。したがって、この集合\(X\)と点\(y\)はいかなる超平面によっても狭義分離することはできません。この例は、集合とその境界点は超平面によって狭義分離できないことを示唆しています。
\(\mathbb{R} ^{2}\)における超平面は直線です。\(\mathbb{R} ^{2}\)上のいかなる直線によっても集合\(X\)と点\(y\)を狭義分離することはできません。具体例として、上図中の直線に相当する超平面\(H\left( a,c\right) \)に注目すると、点\(y\)は開下半空間\(H^{− −}\left( a,c\right) \)の要素であるものの、集合\(X\)は開上半空間\(H^{++}\left( a,c\right) \)の部分集合ではありません。他の任意の超平面\(H\left( a,c\right) \)についても同様です。したがって、この集合\(X\)と点\(y\)はいかなる超平面によっても狭義分離することはできません。この例は、集合とその内点は超平面によって狭義分離できないことを示唆しています。
\(\mathbb{R} ^{2}\)における超平面は直線です。\(\mathbb{R} ^{2}\)上のいかなる直線によっても集合\(X\)と点\(y\)を狭義分離することはできません。具体例として、上図中の直線に相当する超平面\(H\left( a,c\right) \)に注目すると、点\(y\)は開下半空間\(H^{− −}\left( a,c\right) \)の要素であるものの、集合\(X\)は開上半空間\(H^{++}\left( a,c\right) \)の部分集合ではありません。他の任意の超平面\(H\left( a,c\right) \)についても同様です。したがって、この集合\(X\)と点\(y\)はいかなる超平面によっても狭義分離することはできません。この例は、非凸集合と点は超平面によって狭義分離できないことを示唆しています。
狭義分離超平面定理
先の例が示唆するように、ユークリッド空間上の集合\(X\subset \mathbb{R} ^{n}\)が凸集合ではない場合や、点\(y\in \mathbb{R} ^{n}\)が問題としている集合\(X\)の内点や境界点である場合などには、集合\(X\)と点\(y\)はいかなる超平面によっても狭義分離できない可能性があります。では、逆に、集合\(X\)が凸集合であり、なおかつ点\(y\)が問題としている凸集合\(X\)の内点や境界点ではない場合には、すなわち\(y\)が凸集合\(X\)の外点である場合には、集合\(X\)と点\(y\)は何らかの超平面によって狭義分離されるとまで言えるのでしょうか。この問いに答えるのが以下の命題です。これを狭義分離超平面定理(strictly separating hyperplane theorem)と呼びます。
\end{equation*}すなわち、\begin{equation*}
a\cdot y>c\wedge \left( \forall x\in X:a\cdot x<c\right)
\end{equation*}を満たす法線ベクトル\(a\in \mathbb{R} ^{n}\backslash \left\{ 0\right\} \)とスカラー\(c\in \mathbb{R} \)が存在する。
上の命題の結論\begin{equation*}
a\cdot y>c\wedge \left( \forall x\in X:a\cdot x<c\right)
\end{equation*}を1つにまとめると、\begin{equation*}
\forall x\in X:a\cdot x<a\cdot y
\end{equation*}すなわち、\begin{equation*}
\forall x\in X:a\cdot \left( x-y\right) <0
\end{equation*}となります。これは、非空な凸集合\(X\)の外点\(y\)が与えられたとき、その点から集合\(X\)上の点\(x\)へ伸びる任意のベクトル\(x-y\)との角度が鋭角になるようなベクトル\(a\)が存在するという主張です。
狭義分離超平面定理の言い換え
先の命題において存在が保証される法線ベクトル\(a\in \mathbb{R} ^{n}\backslash \left\{ 0\right\} \)とスカラー\(c\in \mathbb{R} \)を踏まえた上で、新たな法線ベクトル\(a^{\prime }\)とスカラー\(c^{\prime }\)をそれぞれ、\begin{eqnarray*}a^{\prime } &=&-a\in \mathbb{R} ^{n}\backslash \left\{ 0\right\} \\
c^{\prime } &=&-c\in \mathbb{R} \end{eqnarray*}と定義します。この新たな法線ベクトル\(a^{\prime }\)とスカラー\(c\)のもとでの超平面は、\begin{equation*}H\left( a^{\prime },c^{\prime }\right) =\left\{ x\in \mathbb{R} ^{n}\ |\ a^{\prime }\cdot x=c^{\prime }\right\}
\end{equation*}となりますが、\begin{eqnarray*}
a^{\prime }\cdot x=c^{\prime } &\Leftrightarrow &-a\cdot x=-c \\
&\Leftrightarrow &a\cdot x=c
\end{eqnarray*}という関係が成り立つため、\begin{equation*}
H\left( a^{\prime },c^{\prime }\right) =H\left( a,c\right)
\end{equation*}となります。つまり、法線ベクトルとスカラーを\(\left( a,c\right) \)から\(\left(a^{\prime },c^{\prime }\right) =\left( -a,-c\right) \)へ入れ替えても超平面としては変わらないということです。ただし、\(a^{\prime }\ \left( =-a\right) \)は\(a\)とは逆向きのベクトルであるため、開上半空間と開下半空間は逆転します。つまり、\begin{eqnarray*}H^{++}\left( a^{\prime },c^{\prime }\right) &=&H^{− −}\left( a,c\right) \\
H^{− −}\left( a^{\prime },c^{\prime }\right) &=&H^{++}\left( a,c\right)
\end{eqnarray*}という関係が成り立つということです。
以上を踏まえた上で、先の命題の結論中の不等式の両辺をスカラー\(-1\)倍すると、\begin{equation*}-a\cdot y<-c\wedge \left( \forall x\in X:-a\cdot x>c\right)
\end{equation*}すなわち、\begin{equation*}
a^{\prime }\cdot y<c^{\prime }\wedge \left( \forall x\in X:a^{\prime }\cdot
x>c^{\prime }\right)
\end{equation*}すなわち、\begin{equation*}
y\in H^{− −}\left( a^{\prime },c^{\prime }\right) \wedge X\subset
H^{++}\left( a^{\prime },c^{\prime }\right)
\end{equation*}を得ます。\(\left( a,c\right) \)が存在する場合には\(\left( a^{\prime},c^{\prime }\right) =\left( -a,-c\right) \)もまた存在するため、先の命題を以下のように表現することもできます。
\end{equation*}すなわち、\begin{equation*}
a\cdot y<c\wedge \left( \forall x\in X:a\cdot x>c\right)
\end{equation*}を満たす法線ベクトル\(a\in \mathbb{R} ^{n}\backslash \left\{ 0\right\} \)とスカラー\(c\in \mathbb{R} \)が存在する。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】