\[\newcommand{\N}{\mathbb N} \newcommand{\Z}{\mathbb Z} \newcommand{\Q}{\mathbb Q} \newcommand{\R}{\mathbb R} \newcommand{\C}{\mathbb C} \newcommand{\ba}{\mathbf{a}} \newcommand{\bb}{\mathbf{b}} \newcommand{\bc}{\mathbf{c}} \newcommand{\bd}{\mathbf{d}} \newcommand{\be}{\mathbf{e}} \newcommand{\bff}{\mathbf{f}} \newcommand{\bh}{\mathbf{h}} \newcommand{\bi}{\mathbf{i}} \newcommand{\bj}{\mathbf{j}} \newcommand{\bk}{\mathbf{k}} \newcommand{\bN}{\mathbf{N}} \newcommand{\bn}{\mathbf{n}} \newcommand{\bo}{\mathbf{0}} \newcommand{\bp}{\mathbf{p}} \newcommand{\bq}{\mathbf{q}} \newcommand{\br}{\mathbf{r}} \newcommand{\bs}{\mathbf{s}} \newcommand{\bT}{\mathbf{T}} \newcommand{\bu}{\mathbf{u}} \newcommand{\bv}{\mathbf{v}} \newcommand{\bw}{\mathbf{w}} \newcommand{\bx}{\mathbf{x}} \newcommand{\by}{\mathbf{y}} \newcommand{\bz}{\mathbf{z}} \newcommand{\bzero}{\mathbf{0}} \newcommand{\nv}{\mathbf{0}} \newcommand{\cA}{\mathcal{A}} \newcommand{\cB}{\mathcal{B}} \newcommand{\cC}{\mathcal{C}} \newcommand{\cD}{\mathcal{D}} \newcommand{\cE}{\mathcal{E}} \newcommand{\cF}{\mathcal{F}} \newcommand{\cG}{\mathcal{G}} \newcommand{\cH}{\mathcal{H}} \newcommand{\cI}{\mathcal{I}} \newcommand{\cJ}{\mathcal{J}} \newcommand{\cK}{\mathcal{K}} \newcommand{\cL}{\mathcal{L}} \newcommand{\cM}{\mathcal{M}} \newcommand{\cN}{\mathcal{N}} \newcommand{\cO}{\mathcal{O}} \newcommand{\cP}{\mathcal{P}} \newcommand{\cQ}{\mathcal{Q}} \newcommand{\cR}{\mathcal{R}} \newcommand{\cS}{\mathcal{S}} \newcommand{\cT}{\mathcal{T}} \newcommand{\cU}{\mathcal{U}} \newcommand{\cV}{\mathcal{V}} \newcommand{\cW}{\mathcal{W}} \newcommand{\cX}{\mathcal{X}} \newcommand{\cY}{\mathcal{Y}} \newcommand{\cZ}{\mathcal{Z}} \newcommand{\pv}{\overline} \newcommand{\iu}{\mathrm{i}} \newcommand{\ju}{\mathrm{j}} \newcommand{\re}{\operatorname{Re}} \newcommand{\im}{\operatorname{Im}} \newcommand{\arsinh}{\operatorname{ar\,sinh}} \newcommand{\arcosh}{\operatorname{ar\,cosh}} \newcommand{\artanh}{\operatorname{ar\,tanh}} \newcommand{\sgn}{\operatorname{sgn}} \newcommand{\diag}{\operatorname{diag}} \newcommand{\proj}{\operatorname{proj}} \newcommand{\rref}{\operatorname{rref}} \newcommand{\rank}{\operatorname{rank}} \newcommand{\Span}{\operatorname{span}} \newcommand{\vir}{\operatorname{span}} \renewcommand{\dim}{\operatorname{dim}} \newcommand{\alg}{\operatorname{alg}} \newcommand{\geom}{\operatorname{geom}} \newcommand{\id}{\operatorname{id}} \newcommand{\norm}[1]{\lVert #1 \rVert} \newcommand{\tp}[1]{#1^{\top}} \renewcommand{\d}{\mathrm{d}} \newcommand{\sij}[2]{\bigg/_{\mspace{-15mu}#1}^{\,#2}} \newcommand{\abs}[1]{\lvert#1\rvert} \newcommand{\pysty}[1]{\left[\begin{array}{@{}r@{}}#1\end{array}\right]} \newcommand{\piste}{\cdot} \newcommand{\qedhere}{} \newcommand{\taumatrix}[1]{\left[\!\!#1\!\!\right]} \newenvironment{augmatrix}[1]{\left[\begin{array}{#1}}{\end{array}\right]} \newenvironment{vaugmatrix}[1]{\left|\begin{array}{#1}}{\end{array}\right|}\]

Ominaisarvon määritelmä¶

Tässä luvussa ryhdytään käsittelemään ominaisarvoja ja -vektoreita. Voit aloittaa tutustumisen näihin käsitteisiin katsomalla seuraavaa videota:

Videon loppupuolella käsitellään ominaisarvojen määrittämistä determinantin avulla sekä diagonalisointia. Niihin perehdytään tarkemmin vasta myöhemmissä luvuissa.

Pohdi 6.4.1

Kun eräällä \(2\times 2\)-matriisilla \(B\) kerrotaan tason \(\R^2\) vektoreita, ne peilautuvat pysty-akselin suhteen (kuva 1).

Kuva 1. Matriisi \(B\) peilaa vektorit pysty-akselin suhteen.

Pohdi kuvan avulla seuraavia kysymyksiä:

Mitkä vektorit pysyvät paikoillaan (eli tulevat kerrotuiksi skalaarilla \(1\)), kun niitä kerrotaan matriisilla \(B\)?
Mitkä vektorit kuvautuvat vastavektoreikseen (eli tulevat kerrotuiksi skalaarilla \(-1\)), kun niitä kerrotaan matriisilla \(B\)?

Pohdi 6.4.2

Eräs kukkakasvi lisääntyy siementen avulla. Jokainen kukinto tuottaa noin \(100\) siementä. Seuraavana vuonna \(50~\%\) siemenistä itää kukintokasveiksi ja \(25~\%\) säilyy siemeinä seuraavaan vuoteen. Nämä itämättömät siemenet voivat itää vielä seuraavana vuonna. Kukintoja ei säily seuraavalle vuodelle.

Kuva 2. Kasvin vuosittaista elinkiertoa kuvaava kaavio.

Kasvipopulaation tilaa jonakin tiettynä vuonna voidaan kuvata vektorilla \(\bx=(s,k)\), missä \(s\) on siementen lukumäärä ja \(k\) on kukintojen lukumäärä. Esimerkiksi tila \((3000,40)\) tarkoittaa, että populaatiossa on \(3000\) siementä ja \(40\) kukintoa. Toisaalta populaation vuosittaista muutosta voidaan kuvata matriisilla

\[\begin{split}A=\begin{augmatrix}{cc} 0{,}25 & 100 \\ 0{,}5 & 0 \\ \end{augmatrix}.\end{split}\]

Jos jonakin vuonna populaation tila on \(\bx=(s,k)\), seuraavana vuonna se on

\[\begin{split}A\bx= \begin{augmatrix}{cc} 0{,}25 & 100 \\ 0{,}5 & 0 \\ \end{augmatrix} \begin{augmatrix}{c} s \\ k \end{augmatrix}= \begin{augmatrix}{c} 0{,}25s + 100k \\ 0{,}5s \\ \end{augmatrix}.\end{split}\]

Seuraavan vuoden tila saadaan siis kertomalla matriisilla \(A\).

Halutaan löytää niin sanottu tasapainotila, josta populaation tila ei muutu seuraavana vuonna. Toisin sanoen on löydettävä sellainen tila \((s,k)\) että myös seuraavana vuonna populaation tila on \((s,k)\). Millaista yhtälöä on ryhdyttävä ratkomaan? (Yhtälöä ei tarvitse ratkaista.)
Halutaan löytää tila, josta lähdettäessä populaation koko kaksinkertaistuu. Toisin sanoen on löydettävä sellainen tila \((s,k)\) että myös seuraavana vuonna sekä siemeniä että kukintoja on kaksinkertainen määrä. Millaista yhtälöä on ryhdyttävä ratkomaan? (Yhtälöä ei tarvitse ratkaista.)

Matriisin ja vektorin kertolasku on melko monimutkainen operaatio, mutta toisinaan se sievenee hyvin helppoon muotoon. Tutkitaan vaikkapa matriisia

\[\begin{split}A=\begin{augmatrix}{cc} 1 & 2 \\ 2 & 4 \end{augmatrix}\end{split}\]

ja vektoria \((1,2)\). Niiden tulo on

\[\begin{split}\begin{augmatrix}{cc} 1 & 2 \\ 2 & 4 \end{augmatrix} \begin{augmatrix}{c} 1 \\ 2 \end{augmatrix}= \begin{augmatrix}{c} 5 \\ 10 \end{augmatrix}.\end{split}\]

Toisin sanoen \(A\bv=5\bv\). Matriisilla \(A\) kertominen vastaa vektorin \((1,2)\) tapauksessa skalaarilla viisi kertomista. Sanotaan, että matriisilla \(A\) on ominaisarvo \(5\), johon liittyy ominaisvektori \((1,2)\).

Kaikilla vektoreilla kertolasku ei kuitenkaan saa näin yksinkertaista muotoa. Esimerkiksi

\[\begin{split}\begin{augmatrix}{cc} 1 & 2 \\ 2 & 4 \end{augmatrix} \begin{augmatrix}{r} 1 \\ -1 \end{augmatrix}= \begin{augmatrix}{r} -1 \\ -2 \end{augmatrix},\end{split}\]

joten vektori \((1,-1)\) ei tule kerrotuksi luvulla \(5\) eikä millään muullakaan reaaliluvulla.

Matriisin ominaisarvoista puhutaan siis silloin, kun matriisilla kertominen vaikuttaa johonkin vektoriin samalla tavalla kuin skalaarilla kertominen. Tuo vektori on silloin matriisin ominaisvektori ja vastaava skalaari on matriisin ominaisarvo.

Määritelmä 6.4.3

Oletetaan, että \(A\) on \(n \times n\) -neliömatriisi. Luku \(\lambda \in \R\) on matriisin \(A\) ominaisarvo, jos on olemassa sellainen vektori \(\bv \in \R^n\), että

\[\bv \neq \nv \ \text{ ja } \ A\bv=\lambda \bv.\]

Vektoria \(\bv\), joka toteuttaa yllä mainitut ehdot, kutsutaan ominaisarvoon \(\lambda\) liittyväksi ominaisvektoriksi.

Edellinen määritelmä on sekä ominaisarvon että ominaisvektorin määritelmä. Ominaisarvoa ei voida määritellä ilman ominaisvektoreita eikä ominaisvektoreista voida puhua mainitsematta, mihin ominaisarvoon ne liittyvät.

Nollavektorin ei haluta olevan ominaisvektori, sillä jos niin olisi, kaikki reaaliluvut olisivat kaikkien matriisien ominaisarvoja, koska \(A\nv=\lambda\nv\) kaikilla \(\lambda\in\R\).

Esimerkki 6.4.4

Matriisilla

\[\begin{split}A=\begin{augmatrix}{cc} 3 & 1 \\ 1 & 3 \end{augmatrix}\end{split}\]

on ominaisarvo \(4\), johon liittyy ominaisvektori \(\bv_1 = (1,1)\). Tämä nähdään laskemalla matriisin \(A\) ja vektorin \(\bv_1\) tulo:

\[\begin{split}A\bv_1 = \begin{augmatrix}{cc} 3 & 1 \\ 1 & 3 \end{augmatrix} \begin{augmatrix}{c} 1 \\ 1 \end{augmatrix} = \begin{augmatrix}{c} 4 \\ 4 \end{augmatrix}= 4\begin{augmatrix}{c} 1 \\ 1 \end{augmatrix} = 4\bv_1.\end{split}\]

Tilannetta on havainnollistettu kuvassa 3.

Samaa ominaisarvoa voi vastata useampi eri ominaisvektori. Esimerkiksi \(3\bv_1 = (3,3)\) on myös matriisin \(A\) ominaisarvoa \(4\) vastaava ominaisvektori, sillä

\[A(3\bv_1) = 3(A\bv_1) = 3(4\bv_1) = 12\bv_1 = 4(3\bv_1).\]

Matriisilla \(A\) on ominaisarvon \(4\) lisäksi toinenkin ominaisarvo. Jos nimittäin valitaan \(\bv_2 = (1,-1)\), saadaan

\[\begin{split}A\bv_2 = \begin{augmatrix}{cc} 3 & 1 \\ 1 & 3 \end{augmatrix} \begin{augmatrix}{r} 1 \\ -1 \end{augmatrix}= \begin{augmatrix}{r} 2 \\ -2 \end{augmatrix}= 2\begin{augmatrix}{r} 1 \\ -1 \end{augmatrix} = 2\bv_2.\end{split}\]

Siten myös luku \(2\) on matriisin \(A\) ominaisarvo ja \(\bv_2 = (1,-1)\) on yksi siihen liittyvä ominaisvektori. (Matriisin ominaisarvot opetellaan etsimään seuraavassa luvussa).

Kuva 3. Vektori \(\bv_1=(1,1)\) on matriisin \(A\) ominaisvektori, sillä \(A\bv_1 = 4\bv_1\) on vektorin \(\bv_1\) virittämällä suoralla. Samoin vektori \(\bv_2=(1,-1)\) on matriisin \(A\) ominaisvektori, sillä \(A\bv_2 = 2\bv_2\) on vektorin \(\bv_2\) virittämällä suoralla.

Kun matriisilla kertoo ominaisvektoria \(\bv\), tuloksena on vektorin \(\bv\) skalaarimonikerta. Toisin sanoen tulos on vektorin \(\bv\) virittämällä suoralla (ks. kuva 3).

Tutkitaan vielä lopuksi, onko vektori \(\bw=(2,1)\) matriisin \(A\) ominaisvektori.

\[\begin{split}A\bw = \begin{augmatrix}{cc} 3 & 1 \\ 1 & 3 \end{augmatrix} \begin{augmatrix}{c} 2 \\ 1 \end{augmatrix}= \begin{augmatrix}{c} 7 \\ 5 \end{augmatrix}.\end{split}\]

Nähdään, että \(A\bw\) ei ole vektorin \(\bw\) skalaarimonikerta, joten \(\bw\) ei ole matriisin \(A\) ominaisvektori. Tätä on havainnollistettu kuvassa 4.

Kuva 4. Vektori \(\bw=(2,1)\) ei ole matriisin \(A\) ominaisvektori, sillä \(A\bw\) ei ole vektorin \(\bw\) virittämällä suoralla.

Kuten edellinen esimerkki osoittaa, matriisilla voi olla useampi kuin yksi ominaisarvo. Kuhunkin ominaisarvoon liittyy useita ominaisvektoreita. Kaikkien tietyä ominaisarvoa vastaavien ominaisvektorien joukko muodostaa niin kutsutun ominaisavaruuden. Siihen otetaan mukaan myös nollavektori, vaikka se ei olekaan ominaisvektori.

Määritelmä 6.4.5

Oletetaan, että matriisilla \(A \in \R^{n \times n}\) on ominaisarvo \(\lambda \in \R\). Ominaisarvoa \(\lambda\) vastaava ominaisavaruus on joukko

\[\{\bv \in \R^n \mid A\bv=\lambda \bv.\}\]

Seuraava esimerkki näyttää, miten tiettyyn ominaisarvoon liittyvä ominaisavaruus eli kaikki ominaisarvoa vastaavat ominaisvektorit löydetään.

Esimerkki 6.4.6

Jatketaan edellistä esimerkkiä ja etsitään kaikki matriisin \(A\) ominaisarvoa \(4\) vastaavat ominaisvektorit. Määritetään siis ominaisarvoa \(4\) vastaava ominaisavaruus.

On ratkaistava yhtälöstä \(A\bv=4\bv\) tuntematon \(\bv\). Yhtälö saadaan muotoon

\[A\bv-4\bv=\nv.\]

Tästä yhtälöstä haluttaisiin nyt ottaa yhteiseksi tekijäksi \(\bv\), mutta se ei onnistu, sillä \(A\) on matriisi ja \(4\) on reaaliluku, eikä niitä voi vähentää toisistaan. Huomataan kuitenkin, että skalaarimatriisilla \(4I\) kertominen vaikuttaa vektoriin \(\bv\) samalla tavalla kuin luvulla \(4\) kertominen:

\[\begin{split}4I\bv = \begin{augmatrix}{cc} 4 & 0 \\ 0 & 4 \end{augmatrix} \begin{augmatrix}{c} v_1\\ v_2 \end{augmatrix} = \begin{augmatrix}{c} 4v_1 + 0\\ 0 + 4v_2 \end{augmatrix} = \begin{augmatrix}{c} 4v_1\\ 4v_2 \end{augmatrix} = 4\bv.\end{split}\]

Nyt yhtälö saadaan muotoon \(A\bv-4I\bv=\nv\), josta seuraa

\[(A-4I)\bv=\nv.\]

Sijoitetaan yhtälöön matriisi \(A\):

\[\begin{split}\left(\begin{augmatrix}{cc} 3 & 1 \\ 1 & 3 \end{augmatrix}- \begin{augmatrix}{cc} 4 & 0 \\ 0 & 4 \end{augmatrix}\right) \begin{augmatrix}{c} v_1 \\ v_2 \end{augmatrix} = \begin{augmatrix}{c} 0 \\ 0 \end{augmatrix}.\end{split}\]

Nyt yhtälö sievenee muotoon

\[\begin{split}\begin{augmatrix}{rr} -1 & 1 \\ 1 & -1 \end{augmatrix} \begin{augmatrix}{c} v_1 \\ v_2 \end{augmatrix} = \begin{augmatrix}{c} 0 \\ 0 \end{augmatrix}.\end{split}\]

Päädytään siis ratkaisemaan yhtälöryhmä

\[\begin{split}\left\{ \begin{aligned} -v_1+v_2 &= 0 \\ v_1-v_2& =0 \\ \end{aligned}\right.\end{split}\]

Muutetaan yhtälöryhmän matriisi porrasmuotoon:

\[\begin{split}\begin{augmatrix}{rr|c} -1 & 1 & 0 \\ 1 & -1 & 0 \end{augmatrix} \overset{R_2+R_1}{\longrightarrow} \begin{augmatrix}{rr|c} -1 & 1 & 0\\ 0 & 0 & 0 \end{augmatrix} \overset{(-1)\cdot R_1}{\longrightarrow} \begin{augmatrix}{rr|c} 1 & -1 & 0\\ 0 & 0 & 0 \end{augmatrix}.\end{split}\]

Merkitään \(v_2=t\). Tällöin \(v_1=v_2=t\). Siten yhtälön ratkaisu on

\[\begin{split}\left\{ \begin{aligned} v_1 &= t \\ v_2& = t, \\ \end{aligned}\quad \text{missä } t \in \R. \right.\end{split}\]

Ominaisvektorit ovat siis muotoa \((t,t)\), missä \(t\in\R\). Siten ominaisarvoa \(4\) vastaava ominaisavaruus on

\[\{(t,t) \mid t\in\R.\}\]

Ominaisavaruus on mahdollista kirjoittaa myös muodossa

\[\{t(1,1) \mid t\in\R\}=\vir\{(1,1)\}.\]

Tästä nähdään, että kyseessä vektorin \((1,1)\) virittämä aliavaruus eli origon kautta kulkeva suora.

Ominaisarvon määritelmästä seuraa, että kun ominaisavaruudessa olevia vektoreita kertoo matriisilla \(A\), ne skaalautuvat nelinkertaisiksi.

Jos matriisille \(A\) löytyy yksikin ominaisvektori, sillä on välttämättä äärettömän monta ominaisvektoria. Jokainen ominaisvektorin \(\bv\) skalaarimonikerta nollavektoria lukuunottamatta on nimittäin myös ominaisvektori, sillä \(A(c\bv)=c(A\bv)=c(\lambda\bv)=\lambda(c\bv)\) kaikilla \(c\in\R\).

Ominaisarvoa vastaavien ominaisvektorien ei kuitenkaan tarvitse kaikkien olla toistensa skalaarimonikertoja kuten seuraava esimerkki osoittaa.

Esimerkki 6.4.7

Tutkitaan matriisia

\[\begin{split}A=\begin{augmatrix}{rrr} 7 & 8 & -2 \\ -3 & -3 & 1 \\ 9 & 12 & -2 \end{augmatrix}.\end{split}\]

Tällä matriisilla on ominaisarvo \(1\), jota vastaa ominaisvektori \((1,0,3)\), sillä

\[\begin{split}\begin{augmatrix}{rrr} 7 & 8 & -2 \\ -3 & -3 & 1 \\ 9 & 12 & -2 \end{augmatrix} \begin{augmatrix}{c} 1 \\ 0 \\ 3 \end{augmatrix} = \begin{augmatrix}{c} 1 \\ 0 \\ 3 \end{augmatrix} = 1\begin{augmatrix}{c} 1 \\ 0 \\ 3 \end{augmatrix}.\end{split}\]

Toisaalta

\[\begin{split}\begin{augmatrix}{rrr} 7 & 8 & -2 \\ -3 & -3 & 1 \\ 9 & 12 & -2 \end{augmatrix} \begin{augmatrix}{r} -4 \\ 3 \\ 0 \end{augmatrix} = \begin{augmatrix}{r} -4 \\ 3 \\ 0 \end{augmatrix} = 1\begin{augmatrix}{r} -4 \\ 3 \\ 0 \end{augmatrix}.\end{split}\]

joten myös \((-4,3,0)\) on ominaisarvoa \(1\) vastaava ominaisvektori. Vektorit \((1,0,3)\) ja \((-4,3,0)\) eivät kuitenkaan ole toistensa skalaarimonikertoja. Samaa ominaisarvoa vastaavien ominaisvektorien ei siis tarvitse olla yhdensuuntaisia.

Tutkitaan vielä tarkemmin, miltä ominaisarvoa \(1\) vastaava ominaisavaruus näyttää. Laskemalla samaan tapaan kuin esimerkissä 6.4.6 saadaan ominaisvektoria \(1\) vastaavaksi ominaisavaruudeksi

\[\{(s-4t, \ 3t,\ 3s), \mid s,t \in \R\}.\]

Tämä joukko voidaan kirjoittaa muodossa

\[\begin{split}\begin{aligned} \{(s-4t, \ 3t, \ 3s) \mid s,t\in\R\}&=\{(s,0,3s)+(-4t,3t,0) \mid s,t\in\R\} \\ &=\{s(1,0,3)+t(-4,3,0) \mid s,t \in \R\} \\ &=\vir\{(1,0,3),(-4,3,0)\}. \end{aligned}\end{split}\]

Ominaisvektorit muodostavat siis tason, joka kulkee origon kautta.

Kun ominaisavaruudessa olevia vektoreita kertoo matriisilla \(A\) ne tulevat kerrotuiksi skalaarilla \(1\). Vektoreille ei siis tapahdu mitään.

Tiivistelmä

previous | next

Kun matriisilla kertoo ominaisvektoria, vektori tulee kerrotuksi skalaarilla. Tätä skalaaria kutsutaan ominaisarvoksi.
Matriisin ominaisvektorit pysyvät virittämällään suoralla, kun niitä kerrotaan matriisilla.