点のアフィン結合
ユークリッド上の有限個の点\(\boldsymbol{x}_{1},\cdots ,\boldsymbol{x}_{k}\in \mathbb{R} ^{n}\)が与えられたとき、スカラー\(\lambda _{1},\cdots ,\lambda _{k}\in \mathbb{R} \)を用いて、\begin{equation*}\lambda _{1}\boldsymbol{x}_{1}+\cdots +\lambda _{k}\boldsymbol{x}_{k}
\end{equation*}という形で表される\(\mathbb{R} ^{n}\)の点を\(\boldsymbol{x}_{1},\cdots ,\boldsymbol{x}_{k}\)の線型結合(linear combination)と呼びます。特に、スカラー\(\lambda _{1},\cdots ,\lambda_{k}\in \mathbb{R} \)が以下の条件\begin{equation*}\lambda _{1}+\cdots +\lambda _{k}=1
\end{equation*}すなわち、\begin{equation*}
\sum_{i=1}^{k}\lambda _{i}=1
\end{equation*}を満たす場合には、つまり、すべてのスカラーの和が\(1\)である場合には、線型結合のことをアフィン結合(affine combination)と呼びます。
\boldsymbol{y} &=&\left( y_{1},y_{2}\right) \in \mathbb{R} ^{2}
\end{eqnarray*}のアフィン結合は、\(\lambda _{1}+\lambda _{2}=1\)を満たすスカラー\(\lambda _{1},\lambda _{2}\in \mathbb{R} \)を用いて、\begin{eqnarray*}\lambda _{1}\boldsymbol{x}+\lambda _{2}\boldsymbol{y} &=&\lambda _{1}\left(
x_{1},x_{2}\right) +\lambda _{2}\left( y_{1},y_{2}\right) \quad \because
\boldsymbol{x},\boldsymbol{y}\text{の定義} \\
&=&\left( \lambda _{1}x_{1},\lambda _{1}x_{2}\right) +\left( \lambda
_{2}y_{1},\lambda _{2}y_{2}\right) \quad \because \text{ベクトルのスカラー倍の定義} \\
&=&\left( \lambda _{1}x_{1}+\lambda _{2}y_{1},\lambda _{1}x_{2}+\lambda
_{2}y_{2}\right) \quad \because \text{ベクトルの和の定義}
\end{eqnarray*}と表されます。また、3つの点\begin{eqnarray*}
\boldsymbol{x} &=&\left( x_{1},x_{2}\right) \in \mathbb{R} ^{2} \\
\boldsymbol{y} &=&\left( y_{1},y_{2}\right) \in \mathbb{R} ^{2} \\
\boldsymbol{z} &=&\left( z_{1},z_{2}\right) \in \mathbb{R} ^{2}
\end{eqnarray*}のアフィン結合は、\(\lambda _{1}+\lambda _{2}+\lambda _{3}=1\)を満たすスカラー\(\lambda _{1},\lambda _{2},\lambda _{3}\in \mathbb{R} \)を用いて、\begin{eqnarray*}\lambda _{1}\boldsymbol{x}+\lambda _{2}\boldsymbol{y}+\lambda _{3}\boldsymbol{z} &=&\lambda _{1}\left( x_{1},x_{2}\right) +\lambda _{2}\left(
y_{1},y_{2}\right) +\lambda _{3}\left( z_{1},z_{2}\right) \quad \because
\boldsymbol{x},\boldsymbol{y},\boldsymbol{z}\text{の定義}
\\
&=&\left( \lambda _{1}x_{1},\lambda _{1}x_{2}\right) +\left( \lambda
_{2}y_{1},\lambda _{2}y_{2}\right) +\left( \lambda _{3}z_{1},\lambda
_{3}z_{2}\right) \quad \because \text{ベクトルのスカラー倍の定義} \\
&=&\left( \lambda _{1}x_{1}+\lambda _{2}y_{1}+\lambda _{3}z_{1},\lambda
_{1}x_{2}+\lambda _{2}y_{2}+\lambda _{3}z_{2}\right) \quad \because \text{ベクトルの和の定義}
\end{eqnarray*}と表されます。
\end{equation}という形で表される\(\mathbb{R} ^{n}\)の点ですが、\begin{equation}\lambda _{2}=1-\lambda _{1} \quad \cdots (2)
\end{equation}であることを踏まえた上で\(\left( 1\right) \)を言い換えると、\begin{equation*}\lambda _{1}\boldsymbol{x}_{1}+\left( 1-\lambda _{1}\right) \boldsymbol{x}_{2}
\end{equation*}と言い換えることができます。つまり、2つの点のアフィン結合を表現するためにはスカラーが1つあれば十分です。以上の議論を踏まえた上で改めて整理すると、2つの点\(\boldsymbol{x}_{1},\boldsymbol{x}_{2}\in \mathbb{R} ^{n}\)のアフィン結合は、スカラー\(\lambda \in \mathbb{R} \)を用いて、\begin{equation*}\lambda \boldsymbol{x}_{1}+\left( 1-\lambda \right) \boldsymbol{x}_{2}
\end{equation*}という形で表される\(\mathbb{R} ^{n}\)の点です。
アフィン集合
ユークリッド空間の部分集合\(A\subset \mathbb{R} ^{n}\)が与えられたとき、その2つの要素\(\boldsymbol{x}_{1},\boldsymbol{x}_{2}\in A\)を任意に選びます。このとき、これらの任意のアフィン結合が\(A\)の要素になることが保証されるならば、すなわち、\begin{equation*}\forall \boldsymbol{x}_{1}\in A,\ \forall \boldsymbol{x}_{2}\in A,\ \forall
\lambda \in \mathbb{R} :\lambda \boldsymbol{x}_{1}+\left( 1-\lambda \right) \boldsymbol{x}_{2}\in A
\end{equation*}が成り立つ場合には、\(A\)をアフィン集合(affine set)と呼びます。
\end{equation*}が成り立つからです。
\(\mathbb{R} ^{n}\)の部分集合\(A\)が複数の要素を持つ場合には、\(A\)がアフィン集合であることを以下のように表現できます。
\left\{ \boldsymbol{x}_{1}\right\} ,\ \forall \lambda \in \mathbb{R} :\lambda \boldsymbol{x}_{1}+\left( 1-\lambda \right) \boldsymbol{x}_{2}\in A
\end{equation*}が成り立つことは、\(A\)がアフィン集合であるための必要十分条件である。
つまり、\(\mathbb{R} ^{n}\)の部分集合\(A\)が複数の要素を持つ場合には、\(A\)の異なる2つの点を任意に選んだ上で、それらの任意のアフィン結合が\(A\)の要素であることを示せば、\(A\)がアフィン集合であることを示したことになるということです。
アフィン集合の幾何学的解釈
ユークリッド空間上の2つの点\(\boldsymbol{x}_{1},\boldsymbol{x}_{2}\in \mathbb{R} ^{n}\)のアフィン結合はスカラー\(\lambda \in \mathbb{R} \)を用いて、\begin{equation*}\lambda \boldsymbol{x}_{1}+\left( 1-\lambda \right) \boldsymbol{x}_{2}
\end{equation*}という形で表される\(\mathbb{R} ^{n}\)の点です。\(\boldsymbol{x}_{1}=\boldsymbol{x}_{2}\)の場合、これらのアフィン結合は、\begin{equation*}\lambda \boldsymbol{x}_{1}+\left( 1-\lambda \right) \boldsymbol{x}_{1}=\boldsymbol{x}_{1}
\end{equation*}であり、これは点\(\boldsymbol{x}_{1}\)と一致します。\(\boldsymbol{x}_{1}\not=\boldsymbol{x}_{2}\)の場合、スカラー\(\lambda \)を変数とみなして\(\mathbb{R} \)内で自由に動かすと、\(\boldsymbol{x}_{1}\)と\(\boldsymbol{x}_{2}\)のアフィン結合はどのような軌跡を描くでしょうか。見通しを良くするためアフィン結合を変形すると、\begin{equation*}\boldsymbol{x}_{2}+\lambda \left( \boldsymbol{x}_{1}-\boldsymbol{x}_{2}\right)
\end{equation*}を得ますが、これは点\(\boldsymbol{x}_{2}\)を通りベクトル\(\boldsymbol{x}_{1}-\boldsymbol{x}_{2}\)と平行な直線のベクトル方程式です。
特に、\(\lambda =0\)の場合にこれは点\(\boldsymbol{x}_{2}\)と一致し、\(\lambda =1\)の場合には点\(\boldsymbol{x}_{1}\)と一致するため、\(\lambda \)を動かすと\(\boldsymbol{x}_{1}\)と\(\boldsymbol{x}_{2}\)のアフィン結合は点\(\boldsymbol{x}_{1},\boldsymbol{x}_{2}\)を通過する直線の上を移動します(上図)。以上を踏まえると、\(\mathbb{R} ^{n}\)の部分集合\(A\)がアフィン集合であることとは、\(A\)に属する異なる2つの点を任意に選んだときに、それらを通過する直線が必ず\(A\)の部分集合になることを意味します。
アフィン集合の特徴づけ
ユークリッド空間\(\mathbb{R} ^{n}\)の部分集合\(A\)がアフィン集合である場合には、\(A\)の2つの点の任意のアフィン結合が\(A\)の要素になるだけでなく、\(A\)の任意個の点の任意のアフィン結合もまた\(A\)の要素になります。ただし、\(A\)の点のアフィン結合は\(A\)の有限個の点に対して定義される概念であることを踏まえると、これは、自然数\(k\)を任意に選んだ上で、さらに\(k\)個の点\(\boldsymbol{x}_{1},\cdots ,\boldsymbol{x}_{k}\in A\)を任意に選んだとき、\begin{equation*}\sum_{i=1}^{k}\lambda _{i}=1
\end{equation*}を満たす任意のスカラー\(\lambda _{1},\cdots ,\lambda _{k}\in \mathbb{R} \)に対して、\begin{equation*}\lambda _{1}\boldsymbol{x}_{1}+\cdots +\lambda _{k}\boldsymbol{x}_{k}\in A
\end{equation*}が成り立つという主張になります。\(A\)がアフィン集合である場合には以上の条件が成り立つということです(演習問題)。
逆に、任意の自然数\(k\)について、\(k\)個の任意の\(A\)の点のアフィン結合が\(A\)の要素である場合、その特殊ケースとして、\(2\)個の任意の\(A\)の点のアフィン結合は\(A\)の要素になりますが、これは\(A\)がアフィン集合であることの定義に他なりません。したがって以下を得ます。
アフィン部分空間としてのアフィン集合
非空のアフィン集合\(A\subset \mathbb{R} ^{n}\)が与えられた状況においてその要素\(\boldsymbol{x}_{0}\in A\)を任意に選びます。その上で、\(A\)の要素であるそれぞれのベクトルから\(\boldsymbol{x}_{0}\)を引くことにより得られるベクトルからなる集合\begin{equation*}V=\left\{ \boldsymbol{x}-\boldsymbol{x}_{0}\in \mathbb{R} ^{n}\ |\ \boldsymbol{x}\in A\right\}
\end{equation*}を定義すれば、これは実ベクトル空間\(\mathbb{R} ^{n}\)の部分空間になります。つまり、以下の条件\begin{eqnarray*}&&\left( a\right) \ V\not=\phi \\
&&\left( b\right) \ \forall \boldsymbol{x},\boldsymbol{y}\in V:\boldsymbol{x}+\boldsymbol{y}\in V \\
&&\left( c\right) \ \forall \lambda \in \mathbb{R} ,\ \forall \boldsymbol{x}\in V:\lambda \boldsymbol{x}\in V
\end{eqnarray*}がすべて成り立つということです。
\end{equation*}は実ベクトル空間\(\mathbb{R} ^{n}\)の部分空間である。
非空のアフィン集合\(A\subset \mathbb{R} ^{n}\)とその要素\(\boldsymbol{x}_{0}\in A\)が与えられれば、実ベクトル空間\(\mathbb{R} ^{n}\)の部分空間\begin{equation*}V=\left\{ \boldsymbol{x}-\boldsymbol{x}_{0}\in \mathbb{R} ^{n}\ |\ \boldsymbol{x}\in A\right\}
\end{equation*}が常に定義可能であることが明らかになりました。この部分空間\(V\)の要素であるそれぞれのベクトルに\(\boldsymbol{x}_{0}\)を加えることにより得られるベクトルからなる集合は、\begin{eqnarray*}\boldsymbol{x}_{0}+V &=&\left\{ \boldsymbol{x}_{0}+\left( \boldsymbol{x}-\boldsymbol{x}_{0}\right) \in \mathbb{R} ^{n}\ |\ \boldsymbol{x}\in A\right\} \\
&=&\left\{ \boldsymbol{x}\in \mathbb{R} ^{n}\ |\ \boldsymbol{x}\in A\right\} \\
&=&A
\end{eqnarray*}となります。つまり、非空のアフィン集合\(A\)とベクトル\(\boldsymbol{x}_{0}\in A\)が与えられれば、部分空間\(V\subset \mathbb{R} ^{n}\)が存在して、\begin{eqnarray*}A &=&\boldsymbol{x}_{0}+V \\
&=&\left\{ \boldsymbol{x}_{0}+\boldsymbol{x}\in \mathbb{R} ^{n}\ |\ \boldsymbol{x}\in V\right\}
\end{eqnarray*}という形で表すことができます。以上の事実は、アフィン空間\(A\)が実ベクトル空間\(\mathbb{R} ^{n}\)のアフィン部分空間であることを意味します。以上の議論は任意の点\(\boldsymbol{x}_{0}\in A\)に関して成立することに注意してください。
先の命題の逆もまた成立します。つまり、アフィン部分空間はアフィン集合です。
以上の2つの命題より、非空集合を対象とした場合、アフィン集合とアフィン部分空間は概念として一致することが明らかになりました。
連立1次方程式の解集合としてのアフィン集合
変数\(x_{1},x_{2},\cdots ,x_{n}\in \mathbb{R} \)に関する\(\mathbb{R} \)上の連立1次方程式\begin{equation}\left\{
\begin{array}{c}
a_{11}x_{1}+a_{12}x_{2}+\cdots +a_{1n}x_{n}=b_{1} \\
a_{21}x_{1}+a_{22}x_{2}+\cdots +a_{2n}x_{n}=b_{2} \\
\vdots \\
a_{m1}x_{1}+a_{m2}x_{2}+\cdots +a_{mn}x_{n}=b_{m}\end{array}\right. \quad \cdots (1)
\end{equation}が与えられているものとします。ただし、\(a_{ij}\in \mathbb{R} \)は係数、\(b_{i}\in \mathbb{R} \)は定数項、\(x_{j}\in \mathbb{R} \)は変数です。変数の個数\(n\)と方程式の個数\(m\)はともに自然数であり、それぞれ任意に選ぶことができます。
連立1次方程式\(\left( 1\right) \)の係数を並べることにより以下のような\(m\times n\)行列\begin{equation*}A=\begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\cdots & \cdots & \cdots & \cdots \\
a_{m1} & a_{m2} & \cdots & a_{mn}\end{pmatrix}\in M_{m,n}\left( \mathbb{R} \right)
\end{equation*}が得られます。これを連立1次方程式\(\left( 1\right) \)の係数行列(coefficient matrix)と呼びます。
連立1次方程式\(\left( 1\right) \)の変数を並べることにより以下のような\(n\)次の列ベクトル\begin{equation*}\boldsymbol{x}=\begin{pmatrix}
x_{1} \\
x_{2} \\
\cdots \\
x_{n}\end{pmatrix}\in M_{n,1}\left( \mathbb{R} \right)
\end{equation*}が得られます。これを連立1次方程式\(\left( 1\right) \)の変数ベクトル(variable vector)と呼びます。
連立1次方程式\(\left( 1\right) \)の定数項を並べることにより以下のような\(n\)次の列ベクトル\begin{equation*}\boldsymbol{b}=\begin{pmatrix}
b_{1} \\
b_{2} \\
\vdots \\
b_{m}\end{pmatrix}\end{equation*}が得られます。これを連立1次方程式\(\left( 1\right) \)の定数ベクトル(constant vector)と呼びます。
連立1次方程式\(\left( 1\right) \)の係数行列\(A\in M_{m,n}\left( \mathbb{R} \right) \)の列の個数と変数ベクトル\(\boldsymbol{x}\in M_{n,1}\left( \mathbb{R} \right) \)の行の個数はともに\(n\)で等しいため、行列積\begin{equation*}A\boldsymbol{x}\in M_{m,1}\left( \mathbb{R} \right)
\end{equation*}が定義可能であり、具体的には、\begin{eqnarray*}
A\boldsymbol{x} &=&\begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn}\end{pmatrix}\begin{pmatrix}
x_{1} \\
x_{2} \\
\vdots \\
x_{n}\end{pmatrix}\quad \because A,\boldsymbol{x}\text{の定義} \\
&=&\left(
\begin{array}{c}
a_{11}x_{1}+a_{12}x_{2}+\cdots +a_{1n}x_{n} \\
a_{21}x_{1}+a_{22}x_{2}+\cdots +a_{2n}x_{n} \\
\vdots \\
a_{m1}x_{1}+a_{m2}x_{2}+\cdots +a_{mn}x_{n}\end{array}\right) \quad \because \text{行列積}
\end{eqnarray*}という\(m\)次元の列ベクトルになります。連立1次方程式\(\left( 1\right) \)の定数ベクトル\(\boldsymbol{b}\in M_{m,1}\left( \mathbb{R} \right) \)もまた\(m\)次元の列ベクトルであるため、行列方程式\begin{equation}A\boldsymbol{x}=\boldsymbol{b} \quad \cdots (2)
\end{equation}すなわち、\begin{equation*}
\begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn}\end{pmatrix}\begin{pmatrix}
x_{1} \\
x_{2} \\
\vdots \\
x_{n}\end{pmatrix}=\begin{pmatrix}
b_{1} \\
b_{2} \\
\vdots \\
b_{m}\end{pmatrix}\end{equation*}が定義可能です。これを連立1次方程式\(\left(1\right) \)の行列表示(matrixrepresentation)と呼びます。
行ベクトル\(\boldsymbol{x}\in M_{n,1}\left( \mathbb{R} \right) \)が連立1次方程式\(\left(1\right) \)の解であることと、\(\boldsymbol{x}\)が行列方程式\(\left( 2\right) \)の解であることは必要十分であるため、連立1次方程式\(\left(1\right) \)の解集合は行列方程式\(\left( 2\right) \)の解集合\begin{equation*}\left\{ \boldsymbol{x}\in \mathbb{R} ^{n}\ |\ A\boldsymbol{x}=\boldsymbol{b}\right\}
\end{equation*}と一致します。このような事情を踏まえると、連立1次方程式\(\left( 1\right) \)と行列方程式\(\left(2\right) \)を同一視できます。
連立1次方程式の解集合はアフィン集合です。
\end{equation*}が与えられているものとする。ただし、\(A\in M_{m,n}\left( \mathbb{R} \right) \)は係数行列であり、\(\boldsymbol{b}\in \mathbb{R} ^{m}\)は定数ベクトルである。この行列方程式の解集合\begin{equation*}\left\{ \boldsymbol{x}\in \mathbb{R} ^{n}\ |\ A\boldsymbol{x}=\boldsymbol{b}\right\}
\end{equation*}はアフィン集合である。
先の命題の逆もまた成立します。つまり、アフィン集合が与えられたとき、それは何らかの連立1次方程式の解集合です。
\end{equation*}を満たす係数行列\(A\in M_{m,n}\left( \mathbb{R} \right) \)および定数ベクトル\(\boldsymbol{b}\in \mathbb{R} ^{m}\)が存在する。
\end{equation*}を、1個の方程式だけからなる連立1次方程式\begin{equation*}
\left\{
\begin{array}{r}
a_{1}x_{1}+\cdots +a_{n}x_{n}=b\end{array}\right.
\end{equation*}と同一視することができます。したがって、1次方程式の解集合\begin{equation*}
\left\{ \left( x_{1},\cdots ,x_{n}\right) \in \mathbb{R} ^{n}\ |\ a_{1}x_{1}+\cdots +a_{n}x_{n}=b\right\}
\end{equation*}すなわち、\begin{equation*}
\left\{ \boldsymbol{x}\in \mathbb{R} ^{n}\ |\ \boldsymbol{a}\cdot \boldsymbol{x}=b\right\}
\end{equation*}を連立1次方程式の解集合とみなすことができるため、先の命題より、これはアフィン集合です。これを超平面(hyperplane)と呼びます。
\begin{array}{r}
x+y=7 \\
2x+4y=18\end{array}\right.
\end{equation*}の解集合は、\begin{equation*}
S=\left\{ \left(
\begin{array}{c}
5 \\
2\end{array}\right) \right\}
\end{equation*}ですが、先の命題より、これは\(\mathbb{R} ^{2}\)上のアフィン集合です。実際、1点集合はアフィン集合であるため\(S\)はアフィン集合です。
\begin{array}{r}
3x-y=1 \\
0x+0y=2\end{array}\right.
\end{equation*}の解集合は、\begin{equation*}
S=\phi
\end{equation*}ですが、先の命題より、これは\(\mathbb{R} ^{2}\)上のアフィン集合です。実際、空集合はアフィン集合であるため\(S\)はアフィン集合です。
\begin{array}{r}
x-y=1 \\
-2x+2y=-2\end{array}\right.
\end{equation*}の解集合は、\begin{equation*}
S=\left\{ \left(
\begin{array}{c}
t \\
t-1\end{array}\right) \in \mathbb{R} ^{2}\ |\ t\in \mathbb{R} \right\}
\end{equation*}ですが、先の命題より、これは\(\mathbb{R} ^{2}\)上のアフィン集合です。実際、2つの解\(\left(s,s-1\right) ,\left( t,t-1\right) \in S\)を任意に選んだとき、任意のスカラー\(\lambda \in \mathbb{R} \)のもとで、\begin{eqnarray*}\lambda \left(
\begin{array}{c}
s \\
s-1\end{array}\right) +\left( 1-\lambda \right) \left(
\begin{array}{c}
t \\
t-1\end{array}\right) &=&\left(
\begin{array}{c}
\lambda s+\left( 1-\lambda \right) t \\
\lambda \left( s-1\right) +\left( 1-\lambda \right) \left( t-1\right)
\end{array}\right) \\
&=&\left(
\begin{array}{c}
\lambda s+\left( 1-\lambda \right) t \\
\lambda s+\left( 1-\lambda t\right) -1\end{array}\right) \\
&\in &S\quad \because S\text{の定義}
\end{eqnarray*}が成り立つため、\(S\)はアフィン集合です。
アフィン集合は凸集合
アフィン集合は凸集合です。つまり、アフィン集合\(A\subset \mathbb{R} ^{n}\)が与えられたとき、\begin{equation*}\forall \boldsymbol{x}_{1}\in A,\ \forall \boldsymbol{x}_{2}\in A,\ \forall
\lambda \in \left[ 0,1\right] :\lambda \boldsymbol{x}_{1}+\left( 1-\lambda
\right) \boldsymbol{x}_{2}\in A
\end{equation*}が成り立ちます。
凸集合はアフィン集合であるとは限らない
アフィン集合は凸集合であることが明らかになりましたが、その逆は成り立つとは限りません。凸集合はアフィン集合であるとは限らないということです。以下の例より明らかです。
\boldsymbol{x}_{1}+\left( 1-\lambda \right) \boldsymbol{x}_{2}\ |\ \lambda
\in \left[ 0,1\right] \right\}
\end{equation*}と定義されます。\(\left[ \boldsymbol{x}_{1},\boldsymbol{x}_{2}\right] \)は凸集合である一方でアフィン集合ではありません(演習問題)。
演習問題
\boldsymbol{x}_{1}+\left( 1-\lambda \right) \boldsymbol{x}_{2}\ |\ \lambda
\in \left[ 0,1\right] \right\}
\end{equation*}と定義されます。\(\left[ \boldsymbol{x}_{1},\boldsymbol{x}_{2}\right] \)は凸集合である一方でアフィン集合ではないことを示してください。
プレミアム会員専用コンテンツです
【ログイン】【会員登録】