\[\newcommand{\N}{\mathbb N} \newcommand{\Z}{\mathbb Z} \newcommand{\Q}{\mathbb Q} \newcommand{\R}{\mathbb R} \newcommand{\C}{\mathbb C} \newcommand{\ba}{\mathbf{a}} \newcommand{\bb}{\mathbf{b}} \newcommand{\bc}{\mathbf{c}} \newcommand{\bd}{\mathbf{d}} \newcommand{\be}{\mathbf{e}} \newcommand{\bff}{\mathbf{f}} \newcommand{\bh}{\mathbf{h}} \newcommand{\bi}{\mathbf{i}} \newcommand{\bj}{\mathbf{j}} \newcommand{\bk}{\mathbf{k}} \newcommand{\bN}{\mathbf{N}} \newcommand{\bn}{\mathbf{n}} \newcommand{\bo}{\mathbf{0}} \newcommand{\bp}{\mathbf{p}} \newcommand{\bq}{\mathbf{q}} \newcommand{\br}{\mathbf{r}} \newcommand{\bs}{\mathbf{s}} \newcommand{\bT}{\mathbf{T}} \newcommand{\bu}{\mathbf{u}} \newcommand{\bv}{\mathbf{v}} \newcommand{\bw}{\mathbf{w}} \newcommand{\bx}{\mathbf{x}} \newcommand{\by}{\mathbf{y}} \newcommand{\bz}{\mathbf{z}} \newcommand{\bzero}{\mathbf{0}} \newcommand{\nv}{\mathbf{0}} \newcommand{\cA}{\mathcal{A}} \newcommand{\cB}{\mathcal{B}} \newcommand{\cC}{\mathcal{C}} \newcommand{\cD}{\mathcal{D}} \newcommand{\cE}{\mathcal{E}} \newcommand{\cF}{\mathcal{F}} \newcommand{\cG}{\mathcal{G}} \newcommand{\cH}{\mathcal{H}} \newcommand{\cI}{\mathcal{I}} \newcommand{\cJ}{\mathcal{J}} \newcommand{\cK}{\mathcal{K}} \newcommand{\cL}{\mathcal{L}} \newcommand{\cM}{\mathcal{M}} \newcommand{\cN}{\mathcal{N}} \newcommand{\cO}{\mathcal{O}} \newcommand{\cP}{\mathcal{P}} \newcommand{\cQ}{\mathcal{Q}} \newcommand{\cR}{\mathcal{R}} \newcommand{\cS}{\mathcal{S}} \newcommand{\cT}{\mathcal{T}} \newcommand{\cU}{\mathcal{U}} \newcommand{\cV}{\mathcal{V}} \newcommand{\cW}{\mathcal{W}} \newcommand{\cX}{\mathcal{X}} \newcommand{\cY}{\mathcal{Y}} \newcommand{\cZ}{\mathcal{Z}} \newcommand{\pv}{\overline} \newcommand{\iu}{\mathrm{i}} \newcommand{\ju}{\mathrm{j}} \newcommand{\re}{\operatorname{Re}} \newcommand{\im}{\operatorname{Im}} \newcommand{\arsinh}{\operatorname{ar\,sinh}} \newcommand{\arcosh}{\operatorname{ar\,cosh}} \newcommand{\artanh}{\operatorname{ar\,tanh}} \newcommand{\sgn}{\operatorname{sgn}} \newcommand{\diag}{\operatorname{diag}} \newcommand{\proj}{\operatorname{proj}} \newcommand{\rref}{\operatorname{rref}} \newcommand{\rank}{\operatorname{rank}} \newcommand{\Span}{\operatorname{span}} \newcommand{\vir}{\operatorname{span}} \renewcommand{\dim}{\operatorname{dim}} \newcommand{\alg}{\operatorname{alg}} \newcommand{\geom}{\operatorname{geom}} \newcommand{\id}{\operatorname{id}} \newcommand{\norm}[1]{\lVert #1 \rVert} \newcommand{\tp}[1]{#1^{\top}} \renewcommand{\d}{\mathrm{d}} \newcommand{\sij}[2]{\bigg/_{\mspace{-15mu}#1}^{\,#2}} \newcommand{\abs}[1]{\lvert#1\rvert} \newcommand{\pysty}[1]{\left[\begin{array}{@{}r@{}}#1\end{array}\right]} \newcommand{\piste}{\cdot} \newcommand{\qedhere}{} \newcommand{\taumatrix}[1]{\left[\!\!#1\!\!\right]} \newenvironment{augmatrix}[1]{\left[\begin{array}{#1}}{\end{array}\right]} \newenvironment{vaugmatrix}[1]{\left|\begin{array}{#1}}{\end{array}\right|}\]

Ominaisarvojen löytäminen¶

Ominaisarvojen ja ominaisvektoreiden löytäminen perustuu yhtälön

(1)¶\[A\bv-\lambda\bv=\nv\]

ratkaisemiseen. Ominaisvektoria \(\bv\) ei kuitenkaan voida ratkaista ennen kuin tunnetaan ominaisarvo \(\lambda\). Sen löytämiseksi muutetaan yhtälö hieman toiseen muotoon samaan tapaan kuin esimerkissä 6.4.6. Ensinnäkin huomataan, että \(\lambda\bv=\lambda I\bv\), missä \(I\) on yksikkömatriisi. Näin ollen

\[A\bv-\lambda\bv=A\bv-\lambda I\bv=(A-\lambda I)\bv.\]

Nyt yhtälö (1) tulee muotoon

(2)¶\[(A-\lambda I)\bv=\nv.\]

Yhtälöä (2) vastaa homogeeninen yhtälöryhmä, joten sillä on aina triviaaliratkaisu \(\bv=\nv\). Tämä ei kuitenkaan kelpaa ominaisvektoriksi, joten tavoitteena on löytää jokin epätriviaali ratkaisu. Lauseen 4.6.6 nojalla yhtälöllä on epätriviaaleja ratkaisuja täsmälleen silloin, kun kerroinmatriisi \(A-\lambda I\) ei ole kääntyvä. Toisaalta lauseen 6.3.1 mukaan neliömatriisi ei ole kääntyvä täsmälleen silloin, kun sen determinantti on \(0\). Näin saadaan seuraava lause.

Lause 6.5.1

Reaaliluku \(\lambda\) on neliömatriisin \(A\) ominaisarvo, jos ja vain jos

\[\det(A-\lambda I)=0.\]

Lauseke \(\det(A-\lambda I)\) on eräs muuttujan \(\lambda\) polynomi. Sitä nimitetään matriisin \(A\) karakteristiseksi polynomiksi. Edellinen lause voidaan siis muotoilla myös niin, että matriisin \(A\) ominaisarvot ovat sen karakteristisen polynomin nollakohdat.

Esimerkki 6.5.2

Määritetään matriisin

\[\begin{split}A=\begin{augmatrix}{cc} 1 & 2 \\ 3 & 2 \end{augmatrix}\end{split}\]

ominaisarvot ja niitä vastaavat ominaisavaruudet. Lähdetään liikkeelle laskemalla lauseessa 6.5.1 mainittu determinantti:

\[\begin{split}\begin{aligned} \det(A-\lambda I)= \begin{vaugmatrix}{cc} 1-\lambda & 2 \\ 3 & 2-\lambda \end{vaugmatrix} &=(1-\lambda)(2-\lambda)-6\\ &=2-\lambda-2\lambda+\lambda^2-6=\lambda^2-3\lambda-4. \end{aligned}\end{split}\]

Matriisin \(A\) ominaisarvot ovat lauseen 6.5.1 nojalla yhtälön \(\lambda^2-3\lambda-4=0\) ratkaisut. Toisen asteen yhtälön ratkaisukaavan mukaan tarkasteltava yhtälö toteutuu, jos ja vain jos \(\lambda=4\) tai \(\lambda = -1\). Siten matriisin \(A\) ominaisarvot ovat \(\lambda_1=4\) ja \(\lambda_2=-1\).

Määritetään vielä näihin ominaisarvoihin liittyvät ominaisavaruudet. Kumpaakin ominaisarvoa vastaavat omat ominaisvektorinsa. Tarkastellaan ensin ominaisarvoa \(\lambda_1=4\). Tällöin ratkaistavana on yhtälö \((A-4I)\bv=\nv\). Ratkaistavaksi saadaan siis yhtälöryhmä, jota vastaa matriisi

\[\begin{split}\begin{augmatrix}{rr|c} -3 & 2&0 \\ 3 & -2&0 \end{augmatrix}.\end{split}\]

Ratkaistaan yhtälöryhmä Gaussin-Jordanin eliminointimenetelmällä:

\[\begin{split}\begin{augmatrix}{rr|c} -3 & 2 & 0 \\ 3 & -2 & 0 \end{augmatrix} \overset{-\frac{1}{3}R_1}{\longrightarrow} \begin{augmatrix}{rr|c} 1 & -\frac{2}{3} & 0 \\ 3 & -2 & 0 \end{augmatrix} \overset{-3R_1+R_2}{\longrightarrow} \begin{augmatrix}{rr|c} 1 & -\frac{2}{3} & 0 \\ 0 & 0 & 0 \end{augmatrix}\end{split}\]

Näin nähdään, että yhtälöryhmän ratkaisu on

\[\begin{split}\begin{cases} x_1=(2/3)t \\ x_2=t, \end{cases} \quad \text{missä } t \in \R.\end{split}\]

Ominaisarvoa \(4\) ominaisavaruus on siis

\[\{((2/3)t,t) \mid t\in\R\}.\]

Tarkastellaan sitten ominaisarvoa \(\lambda_2=-1\). Nyt ratkaistavana oleva yhtälö on \((A+I)\bv=\nv\). Sen ratkaisuksi saadaan samaan tapaan kuin edellä

\[\begin{split}\begin{cases} x_1=-t \\ x_2=t, \end{cases} \quad \text{missä } t \in \R.\end{split}\]

Ominaisarvoa \(-1\) vastaavaava ominaisavaruus on siis

\[\{(-t,t) \mid t\in\R\}.\]

Edellisen nojalla matriisin \(A \in \R^{n \times n}\) ominaisarvoa \(\lambda\) vastaava ominaisavaruus voidaan kirjoittaa muodossa

\[\{\bv \in \R^n \mid (A-\lambda I)\bv=\nv\}.\]

Tämä joukko on itse asiassa matriisin \(A-\lambda I\) nolla-avaruus eli \(\cN(A-\lambda I)\).

Kahden ominaisvektorin summa on myös ominaisvektori. Lisäksi kaikki ominaisvektorien skalaarimonikerrat ovat ominaisvektoreita.

Lause 6.5.3

Oletetaan, että \(A\) on \(n \times n\)-matriisi, jolla on ominaisarvo \(\lambda\). Oletetaan lisäksi, että vektorit \(\bv \in \R^n\) ja \(\bw \in \R^n\) ovat ominaisarvoa \(\lambda\) vastaavia ominaisvektoreita ja \(t \in \R\). Tällöin

\(\bv+\bw\) on ominaisarvoa \(\lambda\) vastaava ominaisvektori.
\(t\bv\) on ominaisarvoa \(\lambda\) vastaava ominaisvektori

Piilota/näytä todistus

Lauseen voi todistaa ominaisarvon- ja vektorin määritelmän avulla. Tämä jätetään harjoitustehtäväksi.

Toinen tapa tuloksen todistamiseen on ominaisavaruuden käsitteen käyttäminen. Kuten edellä todettiin ominaisavaruus on nolla-avaruus. Väite seuraa suoraan lauseesta 5.6.2, jonka mukaan nolla-avaruus sisältää kaikkien vektoreidensa summat ja skalaarimonikerrat. Toisin sanoen väite seuraa siitä, että nolla-avaruus on aliavaruus.

Matriisilla voi olla vain äärellisen monta ominaisarvoa.

Lause 6.5.4

Jos \(A\) on \(n \times n\)-matriisi, sillä on korkeintaan \(n\) ominaisarvoa.

Piilota/näytä todistus

Koska \(A\) on \(n \times n\)-matriisi, sen karakteristinen polynomi on korkeintaan astetta \(n\). Karakteristinen polynomi on siis muotoa \(c_0 + c_1\lambda + \dots + c_n\lambda^n\), missä \(c_0, \dots, c_n \in \R\). Voidaan osoittaa, että yhtälöllä

\[c_0 + c_1\lambda + \dots + c_n\lambda^n = 0\]

on enintään \(n\) eri ratkaisua. Näin ollen matriisilla \(A\) on enintään \(n\) eri ominaisarvoa.

Joidenkin matriisien ominaisarvojen löytäminen onnistuu helposti. Jos matriisi \(A\) on kolmiomatriisi eli kaikki sen lävistäjän alapuoliset tai yläpuoliset alkiot ovat nollia, niin myös \(A - \lambda I\) on kolmiomatriisi. Tällöin sen determinantti \(\det(A - \lambda I)\) on lävistäjäalkioiden tulo lauseen 6.3.8 nojalla. Näin ollen kolmiomatriisin \(A\) karakteristinen polynomin nollakohdat saadaan yhtälöstä

\[(a_{11}-\lambda)(a_{22}-\lambda) \dots (a_{nn}-\lambda) = 0.\]

Lauseen 6.5.1 nojalla saadaan tästä seuraava tulos.

Lause 6.5.5

Oletetaan, että neliömatriisi \(A\) on kolmiomatriisi eli että kaikki sen lävistäjän alapuoliset tai yläpuoliset alkiot ovat nollia. Tällöin matriisin \(A\) ominaisarvot ovat sen lävistäjän alkiot.

Esimerkki 6.5.6

Porrasmatriisi

\[\begin{split}A = \begin{augmatrix}{rrrr} 1 & -2 & 0 & 1 \\ 0 & 4 & -2 & -1 \\ 0 & 0 & 1 & 2 \\ 0 & 0 & 0 & -12 \end{augmatrix}\end{split}\]

on kolmiomatriisi, joten sen ominaisarvot ovat lävistäjän alkiot. Siis matriisin \(A\) ominaisarvot ovat \(\lambda_1 = 1\), \(\lambda_2 = 4\) ja \(\lambda_3 = -12\).

Matriisin \(A\) kaikkien ominaisarvojen muodostamaa joukkoa kutsutaan matrisiin spektriksi ja merkitään \(\sigma(A)\). Esimerkiksi edellisen esimerkin matriisin \(A\) spektri on \(\sigma(A)=\{1,4,-12\}\).

Ominaisarvojen avulla voi päätellä, onko matriisi kääntyvä.

Lause 6.5.7

Oletetaan, että \(A \in \R^{n \times n}\). Matriisi \(A\) on kääntyvä, jos ja vain jos \(0\) ei ole sen ominaisarvo.

Piilota/näytä todistus

Oletetaan ensin, että \(A\) on kääntyvä. Tällöin \(\det(A) \neq 0\). Jos \(0\) olisi matriisin \(A\) ominaisarvo, pätisi \(\det(A-0I)=0\). Tästä seuraisi \(\det(A)=0\), mikä on ristiriita. Siten \(0\) ei ole matriisin \(A\) ominaisarvo.

Oletetaan sitten, että \(0\) ei ole matriisin \(A\) ominaisarvo. Nyt \(\det(A-0I) \neq 0\), mistä seuraa, että \(\det(A) \neq 0\). Siten \(A\) on kääntyvä.

Tähän asti olemme käsiteelleet vain reaalisia ominaisarvoja, sillä ominaisarvo on määritelmänsä mukaan reaaliluku. Ominaisarvot löytää ratkaisemalla karakteristisen polynomin nollakohdat. Nämä nollakohdat voivat olla myös kompleksilukuja. Ominaisarvon käsitettä voikin laajentaa niin, että se käsittää myös kompleksiset ominaisarvot. Näihin tutustutaan seuraavassa esimerkissä.

Esimerkki 6.5.8

Matriisi

\[\begin{split}A=\begin{bmatrix} 0 & -1 \\ 1 & 0 \end{bmatrix}\end{split}\]

kiertää tason vektoreita neljänneskierroksen myötäpäivään. Kyseisessä kierrossa mikään nollasta poikkeava vektori ei tule kerrotuksi skalaarilla. Tästä voidaan päätellä, että matriisilla ei ole reaalisia ominaisarvoja. Matriisilla on kuitenkin kompleksisia ominaisarvoja. Tutkitaan asiaa karakteristisen polynomin avulla.

Selvitetään matriisin \(A\) ominaisarvot. Ne saadaan karakteristisen polynomin nollakohdista. Karakteristinen polynomi on

\[\begin{split}\det(A-\lambda I)= \begin{vmatrix} -\lambda & -1 \\ 1 & \lambda \end{vmatrix} =\lambda^2+1.\end{split}\]

Tällä polynomilla ei ole reaalisia juuria. Sillä on kuitenkin kaksi kompleksista juurta, \(i\) ja \(-i\). Matriisilla ei siis ole reaalisia ominaisarvoja, mutta sillä on kaksi kompleksista ominaisarvoa, \(i\) ja \(-i\).

Tiivistelmä

previous | next

Matriisin ominaisarvot on mahdollista löytää determinantin avulla.