Aliavaruus¶

Siirrytään sitten tutkimaan niitä avaruuden \(\mathbb R^n\) osia, jotka toteuttavat tietyt, algebrallisesti tärkeät ehdot. Avaruuden \(\mathbb R^n\) vektoreille ominaista on, että niiden summat ja skalaarikertolaskun tulokset ovat edelleen saman avaruuden vektoreita. Tästä seuraa myös se, että vektoreiden \(\mathbf{x}\) ja \(\mathbf{y}\) kaikki lineaarikombinaatiot \(\alpha\mathbf{x}+ \beta\mathbf{y}\) ovat myös saman avaruuden vektoreita. Tämä ominaisuus ilmaistaan lyhyesti sanomalla, että avaruus \(\mathbb R^n\) on suljettu summan ja skalaarilla kertomisen suhteen.

Seuraavaksi voidaan kysyä toteutuuko edellä kuvattu ominaisuus myös joillekin avaruuden \(\mathbb R^n\) osille. Esimerkiksi kolmiulotteisessa avaruudessa voidaan tutkia suoria, käyriä, tasoja ja pintoja. Algebrallisesti mielenkiintoisia ja helpoimmin käsiteltäviä ovat ne avaruuden osat (joukot), jotka ovat suljettuja summan ja skalaarilla kertomisen suhteen. Nämä perusominaisuudet mahdollistavat vektorilaskennan halutussa avaruuden osassa ikään kuin koko avaruus olisi käytettävissä.

Määritelmä.

Avaruuden \(\mathbb R^n\) osajoukko \(S\) on avaruuden \(\mathbb R^n\) aliavaruus, jos

se on epätyhjä, eli \(S\) sisältää vähintään jonkun vektorin,
joukon \(S\) vektoreita \(\mathbf{x}\) ja \(\mathbf{y}\) kohti myös \(\mathbf{x}+ \mathbf{y}\) on joukossa \(S\),
joukon \(S\) vektoria \(\mathbf{x}\) ja reaalilukua \(r\) kohti myös \(r\mathbf{x}\) on joukossa \(S\).

Tässä joukkoon kuulumisella tarkoitetaan sitä, että alkiot \(\mathbf{x}+ \mathbf{y}\) ja \(r\mathbf{x}\) toteuttavat joukkoon \(S\) liittyvän säännön.

Huomautus.

\(\mathbb{R}^n\) ja \(\{\mathbf{0}\}\) ovat niin sanottuja triviaaleja aliavaruuksia. Joukot kirjoitetaan aaltosulkeiden \(\{\cdot\}\) väliin.

Lause.

Vektorien \(\mathbf{v}_1, \mathbf{v}_2, \ldots, \mathbf{v}_k\) virittämä joukko \(\operatorname{span}\{\mathbf{v}_1, \mathbf{v}_2, \ldots, \mathbf{v}_k\}\) on aliavaruus.

Todistus.

Aiemmassa lauseessa todettiin, että nollavektori \(\mathbf{0}\), summa \(\mathbf{x}+ \mathbf{y}\) ja tulo \(r\mathbf{x}\) ovat joukossa \(\operatorname{span}\{\mathbf{v}_1, \mathbf{v}_2, \ldots, \mathbf{v}_k\}\) aina, kun \(\mathbf{x}\) ja \(\mathbf{y}\) ovat tässä joukossa ja \(r\) on reaaliluku. \(\square\)

Tämä lause voidaan ilmaista lyhyesti sanomalla, että vektorit \(\mathbf{v}_1, \mathbf{v}_2, \ldots, \mathbf{v}_k\) virittävät aliavaruuden \(\operatorname{span}\{\mathbf{v}_1, \mathbf{v}_2, \ldots, \mathbf{v}_k\}\).

Huomautus.

Nollavektori sisältyy mihin tahansa aliavaruuteen. Tämän vuoksi on usein hyödyllistä valita tarkasteltavaksi \(\mathbf{0}\), kun osoitetaan jonkin aliavaruuden epätyhjyyttä. Geometrisesti tämä tarkoittaa sitä, että aliavaruuden on ”kuljettava” origon kautta.

Tarkastellaan aliavaruutta \(\operatorname{span}\{\mathbf{v}\}\), eli yhden vektorin \(\mathbf{v}\) lineaarikombinaatioita

\[\mathbf{x}=t\mathbf{v},\]

missä \(t\) on reaaliluku. Kun muistetaan avaruuksien \(\mathbb R^2\) ja \(\mathbb R^3\) suoran yhtälön vektorimuoto, huomataan lineaarikombinaatioiden edustavan origon kautta kulkevaa suoraa. Toinen geometrisesti merkittävä aliavaruus muodostuu nollasta poikkeavien vektoreiden \(\mathbf{u}\) ja \(\mathbf{v}\) lineaarikombinaatioista

\[\mathbf{x}=s\mathbf{u}+t\mathbf{v},\]

missä \(s\) ja \(t\) ovat reaalilukuja. Vertaamalla avaruuden \(\mathbb R^3\) tason yhtälön vektorimuotoon nähdään, että tämän aliavaruuden paikkavektorit määräävät origon kautta kulkevan tason.

Nämä geometriset tulkinnat voidaan myös kääntää, eli jokaista origon kautta kulkevaa suoraa, tasoa tai niiden korkeampiulotteista yleistystä vastaa jokin aliavaruus.

Esimerkki.

Tarkastellaan tason \(\mathbb R^2\) suoraa \(y=x\). Osoita, että suoran paikkavektorit muodostavat aliavaruuden ja määritä sen virittävät vektorit.

Ratkaisu.

Merkitään yleistä tason \(\mathbb R^2\) vektoria \(\mathbf{x}= (x, y)\). Suoralla \(y = x\) yleisen vektorin, eli suoran pisteen paikkavektorin on oltava muotoa \(\mathbf{x}= (x, x)\) jollakin reaaliluvulla \(x\). Osoitetaan, että kaikki tällaiset paikkavektorit muodostavat aliavaruuden.

Nollavektori \(\mathbf{0}= (0, 0)\) on selvästi suoralla \(y = x\).
Oletetaan, että \(\mathbf{a}\) ja \(\mathbf{b}\) ovat suoralla \(y = x\). Tällöin \(\mathbf{a}= (a, a)\) ja \(\mathbf{b}= (b, b)\), missä \(a\) ja \(b\) ovat reaalilukuja, ja summa

\[\begin{split}\mathbf{a}+ \mathbf{b}= \begin{bmatrix} a \\ a \end{bmatrix} + \begin{bmatrix} b \\ b \end{bmatrix} = \begin{bmatrix} a + b \\ a + b \end{bmatrix}\end{split}\]

on sekin suoralla \(y = x\).
Oletetaan, että \(\mathbf{a}\) on suoralla \(y = x\) ja että \(r\) on reaaliluku. Tällöin \(\mathbf{a}= (a, a)\), missä \(a\) on reaaliluku, ja tulo

\[\begin{split}r\mathbf{a}= r \begin{bmatrix} a \\ a \end{bmatrix} = \begin{bmatrix} ra \\ ra \end{bmatrix}\end{split}\]

on sekin suoralla \(y = x\).

Suora \(y = x\) toteuttaa siis aliavaruuden kriteerit. Koska suoran yleinen piste on \(\mathbf{x}= (x, x)\), ne kaikki saadaan esimerkiksi vektorin \((1, 1)\) lineaarikombinaatioina \(\mathbf{x}= x(1, 1)\). Suora \(y = x\) on siis aliavaruus

\[\begin{split}\operatorname{span}\left\{\begin{bmatrix} 1 \\ 1 \end{bmatrix}\right\}.\end{split}\]

Matriiseihin liitetään seuraavat aliavaruudet.

Määritelmä.

Olkoon \(A\) \(m \times n\)-matriisi. Matriisin \(A\) nolla-avaruus (null space), eli ydin on kaikkien niiden avaruuden \(\mathbb R^n\) vektoreiden \(\mathbf{x}\) kokoelma, joille \(A\mathbf{x}= \mathbf{0}\). Tätä merkitään

\[\mathcal{N}(A) = \{\mathbf{x}\text{ avaruudessa } \mathbb R^n : A\mathbf{x}= \mathbf{0}\}.\]

Matriisin \(A\) sarakeavaruus (column space), eli kuva-avaruus on kaikkien niiden avaruuden \(\mathbb R^m\) vektoreiden \(\mathbf{y}\) kokoelma, joille \(\mathbf{y}= A\mathbf{x}\) jotakin avaruuden \(\mathbb R^n\) vektoria \(\mathbf{x}\) kohti. Tätä merkitään

\[\mathcal{R}(A) = \{\mathbf{y}\text{ avaruudessa } \mathbb R^m : \mathbf{y}= A\mathbf{x}, \text{ kun } \mathbf{x}\text{ on avaruudessa } \mathbb R^n\}.\]

Nolla- ja sarakeavaruuksien käsitteet ovat hyvin tärkeitä jatkon kannalta, joten käytä riittävästi aikaa niiden omaksumiseen.

Huomautus.

Kun muistetaan matriisin \(A\) rooli lineaarikuvauksena, siihen liittyviä nolla- ja sarakeavaruuksia voidaan luonnehtia vielä seuraavasti. Sanotaan, että \(m \times n\)-matriisi \(A\) kuvaa avaruuden \(\mathbb R^n\) vektorin \(\mathbf{x}\) avaruuden \(\mathbb R^m\) vektorille \(\mathbf{y}\), jos \(\mathbf{y}= A\mathbf{x}\).

Nolla-avaruus \(\mathcal{N}(A)\) koostuu kaikista niistä avaruuden \(\mathbb R^n\) vektoreista \(\mathbf{x}\), jotka matriisi \(A\) kuvaa avaruuden \(\mathbb R^m\) nollavektorille. Sarakeavaruus \(\mathbb R^m\) puolestaan koostuu kaikista niistä avaruuden \(\mathbb R^m\) vektoreista \(\mathbf{y}\), jotka ovat jonkun avaruuden \(\mathbb R^n\) vektorin \(\mathbf{x}\) kuvia matriisin \(A\) suhteen.

Perustellaan vielä, miksi olioita \(\mathcal{N}(A)\) ja \(\mathcal{R}(A)\) kutsutaan avaruuksiksi.

Lause.

Olkoon \(A\) \(m \times n\)-matriisi. Tällöin \(\mathcal{N}(A)\) on avaruuden \(\mathbb R^n\) ja \(\mathcal{R}(A)\) avaruuden \(\mathbb R^m\) aliavaruus.

Todistus.

Jätetään hyödylliseksi harjoitustehtäväksi. Muista, että osoitettaessa joukkoa \(S\) aliavaruudeksi on todistettava, että

\(S\) on epätyhjä (kokeile, onko nollavektori joukossa \(S\)),
summa \(\mathbf{x}+ \mathbf{y}\) on joukossa \(S\) aina, kun \(\mathbf{x}\) ja \(\mathbf{y}\) ovat joukossa \(S\)
tulo \(r\mathbf{x}\) on joukossa \(S\) aina, kun \(\mathbf{x}\) on joukossa \(S\) ja \(r\) on reaaliluku.

Miten muotoilisit joukkoihin \(\mathcal{N}(A)\) ja \(\mathcal{R}(A)\) liittyvät säännöt? \(\square\)

Jos \(m \times n\)-matriisi \(A\) esitetään sarakkeidensa \(\mathbf{a}_1, \mathbf{a}_2, \ldots, \mathbf{a}_n\) avulla, niin

\[\begin{split}A\mathbf{x}= \begin{bmatrix} \mathbf{a}_1 & \mathbf{a}_2 & \cdots & \mathbf{a}_n \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix} = x_1\mathbf{a}_1 + x_2\mathbf{a}_2 + \cdots + x_n\mathbf{a}_n.\end{split}\]

Vektori \(\mathbf{x}\) on siis matriisin \(A\) nolla-avaruudessa täsmälleen silloin, kun sen komponentit toteuttavat vektoriyhtälön

\[x_1\mathbf{a}_1 + x_2\mathbf{a}_2 + \cdots + x_n\mathbf{a}_n = \mathbf{0}.\]

Vastaavasti vektori \(\mathbf{y}\) on matriisin \(A\) sarakeavaruudessa täsmälleen silloin, kun se on matriisin \(A\) sarakkeiden jokin lineaarikombinaatio

\[\mathbf{y}= x_1\mathbf{a}_1 + x_2\mathbf{a}_2 + \cdots + x_n\mathbf{a}_n.\]

Matriisin \(A\) sarakeavaruus koostuu toisin sanoen kaikista sarakkeiden \(\mathbf{a}_1, \mathbf{a}_2, \ldots, \mathbf{a}_n\) lineaarikombinaatioista, eli

\[\mathcal{R}(A)=\operatorname{span}\{\mathbf{a}_1, \mathbf{a}_2, \ldots, \mathbf{a}_n\}.\]

Tarkastellaan näihin aliavaruuksiin sisältyvää informaatiota matriisiyhtälön \(A\mathbf{x}= \mathbf{b}\) ratkaisun näkökulmasta.

Sarakeavaruus \(\mathcal{R}(A)\) koostuu niistä vektoreista \(\mathbf{b}\), joita kohden yhtälöllä \(A\mathbf{x}= \mathbf{b}\) on vähintään yksi ratkaisu. Jos siis \(\mathcal{R}(A)\) on tiedossa, voidaan ainakin periaatteessa selvittää heti, onko yhtälö (yhtälöryhmä) ratkeava.
Nolla-avaruus \(\mathcal{N}(A)\) puolestaan koostuu kaikista homogeenisen yhtälön \(A\mathbf{x}= \mathbf{0}\) ratkaisuista. Oletetaan, että vektori \(\mathbf{y}\) on nolla-avaruudessa, eli \(A\mathbf{y}= \mathbf{0}\) ja että \(\mathbf{x}_0\) on jokin yhtälön \(A\mathbf{x}= \mathbf{b}\) ratkaisu. Tällöin

\[A(\mathbf{x}_0 + \mathbf{y}) = A\mathbf{x}_0 + A\mathbf{y}= \mathbf{b}+ \mathbf{0}= \mathbf{b},\]

eli vektori \(\mathbf{x}_0 + \mathbf{y}\) on myös yhtälön \(A\mathbf{x}= \mathbf{b}\) ratkaisu. Myös kaikki saman yhtälön ratkaisut voidaan esittää tässä muodossa. Jos nimittäin \(\mathbf{x}_1\) on toinen yhtälön \(A\mathbf{x}= \mathbf{b}\) ratkaisu, niin

\[A(\mathbf{x}_1 - \mathbf{x}_0) = A\mathbf{x}_1 - A\mathbf{x}_0 = \mathbf{b}- \mathbf{b}= \mathbf{0},\]

eli \(\mathbf{x}_1 - \mathbf{x}_0 = \mathbf{y}\) jollekin nolla-avaruuden vektorille \(\mathbf{y}\). Tätä yhtälön \(A\mathbf{x}= \mathbf{b}\) yleistä ratkaisua merkitään joskus

\[\mathbf{x}_0 + \mathcal{N}(A) = \{\mathbf{x}_0 + \mathbf{y}: A\mathbf{y}= \mathbf{0}\}.\]

Koska nolla-avaruuden vektorit ovat homogeenisen yhtälön \(A\mathbf{x}= \mathbf{0}\) ratkaisuja, epähomogeenisen yhtälön \(A\mathbf{x}= \mathbf{0}\) yleinen ratkaisu voidaan muotoilla yksittäisen ratkaisun ja homogeenisen yhtälön yleisen ratkaisun summana.

Yhdistetään edellisen päättelyn kohdat seuraavaksi yhtälön \(A\mathbf{x}= \mathbf{b}\) ratkaisuja koskevaksi tulokseksi. Huomaa, että koska lineaariset yhtälöryhmät ja vektoriyhtälöt voidaan tulkita tämänmuotoisina yhtälöinä, myös niiden ratkaisuille on voimassa sama tulos.

Lause.

Olkoon \(A\) \(m \times n\)-matriisi, sekä \(\mathbf{b}\) avaruuden \(\mathbb R^m\) vektori. Tällöin seuraavat väitteet ovat voimassa yhtälölle \(A\mathbf{x}= \mathbf{b}\).

Yhtälöllä on ratkaisuja jos ja vain jos \(\mathbf{b}\) on sarakeavaruudessa \(\mathcal{R}(A)\).
Jos \(\mathbf{x}_0\) on ratkaisu, niin yleinen ratkaisu on \(\mathbf{x}_0 + \mathcal{N}(A)\).

Lopulta voidaan osoittaa, että lineaarisella yhtälöryhmällä on täsmälleen nolla, yksi tai ääretön määrä ratkaisuja.

Lause.

Olkoon \(A\) \(m \times n\)-matriisi, sekä \(\mathbf{b}\) avaruuden \(\mathbb R^m\) vektori. Tällöin täsmälleen yksi seuraavista väitteistä on voimassa yhtälölle \(A\mathbf{x}= \mathbf{b}\).

Yhtälöllä ei ole ratkaisuja.
Yhtälöllä on yksikäsitteinen ratkaisu.
Yhtälöllä on äärettömän monta ratkaisua.

Todistus.

Yhtälö \(A\mathbf{x}= \mathbf{b}\) on joko ratkeava tai ristiriitainen, joten sillä joko on ratkaisuja tai ei ole ratkaisuja. Riittää siis osoittaa, että ratkaisujen löytyessä niitä on joko yksi tai ääretön määrä.

Oletetaan, että \(\mathbf{x}_0\) on eräs yhtälön ratkaisu. Matriisin \(A\) nolla-avaruus \(\mathcal{N}(A)\) on joko triviaali tai epätriviaali, eli se joko koostuu vain nollavektorista tai sitten ei. Ensimmäisessä tapauksessa siis homogeenisen yhtälön \(A\mathbf{x}= \mathbf{0}\) yleinen ratkaisu on \(\mathbf{0}\), joten yhtälön \(A\mathbf{x}= \mathbf{b}\) yleiseksi ratkaisuksi saadaan \(\mathbf{x}_0 + \mathbf{0}= \mathbf{x}_0\). Yhtälöllä on yksikäsitteinen ratkaisu. Jälkimmäisessä tapauksessa nolla-avaruudesta löydetään vektori \(\mathbf{y}\not= 0\). Koska \(\mathcal{N}(A)\) on aliavaruus, niin myös vektori \(r\mathbf{y}\) on nolla-avaruudessa jokaista reaalilukua \(r\) kohti. Täten jokainen vektoreista \(\mathbf{x}_0 + r\mathbf{y}\), missä \(r\) voidaan valita äärettömän monella tavalla, on yhtälön \(A\mathbf{x}= \mathbf{b}\) ratkaisu. Yhtälöllä on siis äärettömän monta ratkaisua. \(\square\)

Esimerkki.

Olkoon

\[\begin{split}A = \begin{bmatrix} 1 & 2 & 2 & 0 \\ 1 & -2 & 1 & 1 \\ \end{bmatrix}\qquad\text{ja}\qquad \mathbf{b}= \begin{bmatrix} 1 \\ -1 \end{bmatrix}.\end{split}\]

Esitä yhtälön \(A\mathbf{x}= \mathbf{b}\) ratkaisut muodossa \(\mathbf{x}_0 + \mathbf{y}\), missä \(\mathbf{x}_0\) on yksittäisratkaisu ja \(\mathbf{y}\) homogeenisen yhtälön yleinen ratkaisu.

Ratkaisu.

Annettu yhtälö on ratkaistu jo aiemmassa esimerkissä, jolloin löydettiin ratkaisuksi

\[\begin{split}\mathbf{x}= \begin{bmatrix} 0 \\ \frac{1}{2}\\ 0 \\0 \end{bmatrix} +t\begin{bmatrix} -\frac{3}{2} \\ -\frac{1}{4}\\ 1 \\0 \end{bmatrix} +s\begin{bmatrix} -\frac{1}{2} \\ \frac{1}{4}\\ 0 \\1 \end{bmatrix}.\end{split}\]

Merkitään tämän esityksen vakiovektoria \(\mathbf{x}_0\) ja loppuosaa \(\mathbf{y}\), ja tarkistetaan niiden toteuttavan vaaditut ehdot.

\[\begin{split}\begin{aligned} A\mathbf{x}_0 &= \begin{bmatrix} 1 & 2 & 2 & 0 \\ 1 & -2 & 1 & 1 \\ \end{bmatrix} \begin{bmatrix} 0 \\ \frac{1}{2}\\ 0 \\0 \end{bmatrix} = \begin{bmatrix} 1 \\ -1 \end{bmatrix} = \mathbf{b}\\ A\mathbf{y}&= \begin{bmatrix} 1 & 2 & 2 & 0 \\ 1 & -2 & 1 & 1 \end{bmatrix} \begin{bmatrix} -\frac{1}{2}(3t + s) \\ -\frac{1}{4}(t - s) \\ t \\ s \end{bmatrix} = \begin{bmatrix} -\frac{1}{2}(3t + s) - \frac{1}{2}(t - s) + 2t \\ -\frac{1}{2}(3t + s) + \frac{1}{2}(t - s) + t + s \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \end{bmatrix} = \mathbf{0},\end{aligned}\end{split}\]

joten haluttu esitys on löydetty. Sivutuotteena löydettiin myös nolla-avaruudelle esitys vektoreiden virittämänä joukkona

\[\begin{split}\mathcal{N}(A)=\operatorname{span}\left\{\begin{bmatrix} -\frac{3}{2} \\ -\frac{1}{4}\\ 1 \\0 \end{bmatrix},\begin{bmatrix} -\frac{1}{2} \\ \frac{1}{4}\\ 0 \\1 \end{bmatrix}\right\}.\end{split}\]

Tämän tuloksen merkitystä pohditaan seuraavissa osioissa.