\[\newcommand{\N}{\mathbb N} \newcommand{\Z}{\mathbb Z} \newcommand{\Q}{\mathbb Q} \newcommand{\R}{\mathbb R} \newcommand{\C}{\mathbb C} \newcommand{\ba}{\mathbf{a}} \newcommand{\bb}{\mathbf{b}} \newcommand{\bc}{\mathbf{c}} \newcommand{\bd}{\mathbf{d}} \newcommand{\be}{\mathbf{e}} \newcommand{\bff}{\mathbf{f}} \newcommand{\bh}{\mathbf{h}} \newcommand{\bi}{\mathbf{i}} \newcommand{\bj}{\mathbf{j}} \newcommand{\bk}{\mathbf{k}} \newcommand{\bN}{\mathbf{N}} \newcommand{\bn}{\mathbf{n}} \newcommand{\bo}{\mathbf{0}} \newcommand{\bp}{\mathbf{p}} \newcommand{\bq}{\mathbf{q}} \newcommand{\br}{\mathbf{r}} \newcommand{\bs}{\mathbf{s}} \newcommand{\bT}{\mathbf{T}} \newcommand{\bu}{\mathbf{u}} \newcommand{\bv}{\mathbf{v}} \newcommand{\bw}{\mathbf{w}} \newcommand{\bx}{\mathbf{x}} \newcommand{\by}{\mathbf{y}} \newcommand{\bz}{\mathbf{z}} \newcommand{\bzero}{\mathbf{0}} \newcommand{\nv}{\mathbf{0}} \newcommand{\cA}{\mathcal{A}} \newcommand{\cB}{\mathcal{B}} \newcommand{\cC}{\mathcal{C}} \newcommand{\cD}{\mathcal{D}} \newcommand{\cE}{\mathcal{E}} \newcommand{\cF}{\mathcal{F}} \newcommand{\cG}{\mathcal{G}} \newcommand{\cH}{\mathcal{H}} \newcommand{\cI}{\mathcal{I}} \newcommand{\cJ}{\mathcal{J}} \newcommand{\cK}{\mathcal{K}} \newcommand{\cL}{\mathcal{L}} \newcommand{\cM}{\mathcal{M}} \newcommand{\cN}{\mathcal{N}} \newcommand{\cO}{\mathcal{O}} \newcommand{\cP}{\mathcal{P}} \newcommand{\cQ}{\mathcal{Q}} \newcommand{\cR}{\mathcal{R}} \newcommand{\cS}{\mathcal{S}} \newcommand{\cT}{\mathcal{T}} \newcommand{\cU}{\mathcal{U}} \newcommand{\cV}{\mathcal{V}} \newcommand{\cW}{\mathcal{W}} \newcommand{\cX}{\mathcal{X}} \newcommand{\cY}{\mathcal{Y}} \newcommand{\cZ}{\mathcal{Z}} \newcommand{\pv}{\overline} \newcommand{\re}{\operatorname{Re}} \newcommand{\im}{\operatorname{Im}} \newcommand{\arsinh}{\operatorname{ar\,sinh}} \newcommand{\arcosh}{\operatorname{ar\,cosh}} \newcommand{\artanh}{\operatorname{ar\,tanh}} \newcommand{\diag}{\operatorname{diag}} \newcommand{\proj}{\operatorname{proj}} \newcommand{\rref}{\operatorname{rref}} \newcommand{\rank}{\operatorname{rank}} \newcommand{\Span}{\operatorname{span}} \newcommand{\vir}{\operatorname{span}} \renewcommand{\dim}{\operatorname{dim}} \newcommand{\alg}{\operatorname{alg}} \newcommand{\geom}{\operatorname{geom}} \newcommand{\id}{\operatorname{id}} \newcommand{\norm}[1]{\lVert #1 \rVert} \newcommand{\tp}[1]{#1^{\top}} \renewcommand{\d}{\mathrm{d}} \newcommand{\sij}[2]{\bigg/_{\mspace{-15mu}#1}^{\,#2}} \newcommand{\qedhere}{} \newcommand{\taumatrix}[1]{\left[\!\!#1\!\!\right]} \newenvironment{augmatrix}[1]{\left[\begin{array}{#1}}{\end{array}\right]} \newenvironment{vaugmatrix}[1]{\left|\begin{array}{#1}}{\end{array}\right|} \newcommand{\iu}{\mathrm{i}} \newcommand{\ju}{\mathrm{j}}\]

Ominaisarvojen löytäminen

Ominaisarvojen ja ominaisvektoreiden löytäminen perustuu yhtälön

(1)\[A\bv-\lambda\bv=\nv\]

ratkaisemiseen. Ominaisvektoria \(\bv\) ei kuitenkaan voida ratkaista ennen kuin tunnetaan ominaisarvo \(\lambda\). Sen löytämiseksi muutetaan yhtälö hieman toiseen muotoon samaan tapaan kuin esimerkissä 6.4.6. Ensinnäkin huomataan, että \(\lambda\bv=\lambda I\bv\), missä \(I\) on yksikkömatriisi. Näin ollen

\[A\bv-\lambda\bv=A\bv-\lambda I\bv=(A-\lambda I)\bv.\]

Nyt yhtälö (1) tulee muotoon

(2)\[(A-\lambda I)\bv=\nv.\]

Yhtälöä (2) vastaa homogeeninen yhtälöryhmä, joten sillä on aina triviaaliratkaisu \(\bv=\nv\). Tämä ei kuitenkaan kelpaa ominaisvektoriksi, joten tavoitteena on löytää jokin epätriviaali ratkaisu. Lauseen 4.6.6 nojalla yhtälöllä on epätriviaaleja ratkaisuja täsmälleen silloin, kun kerroinmatriisi \(A-\lambda I\) ei ole kääntyvä. Toisaalta lauseen 6.3.1 mukaan neliömatriisi ei ole kääntyvä täsmälleen silloin, kun sen determinantti on \(0\). Näin saadaan seuraava lause.

Lause 6.5.1

Reaaliluku \(\lambda\) on neliömatriisin \(A\) ominaisarvo, jos ja vain jos

\[\det(A-\lambda I)=0.\]

Lauseke \(\det(A-\lambda I)\) on eräs muuttujan \(\lambda\) polynomi. Sitä nimitetään matriisin \(A\) karakteristiseksi polynomiksi. Edellinen lause voidaan siis muotoilla myös niin, että matriisin \(A\) ominaisarvot ovat sen karakteristisen polynomin nollakohdat.

Esimerkki 6.5.2

Määritetään matriisin

\[\begin{split}A=\begin{augmatrix}{cc} 1 & 2 \\ 3 & 2 \end{augmatrix}\end{split}\]

ominaisarvot ja niitä vastaavat ominaisavaruudet. Lähdetään liikkeelle laskemalla lauseessa 6.5.1 mainittu determinantti:

\[\begin{split}\begin{aligned} \det(A-\lambda I)= \begin{vaugmatrix}{cc} 1-\lambda & 2 \\ 3 & 2-\lambda \end{vaugmatrix} &=(1-\lambda)(2-\lambda)-6\\ &=2-\lambda-2\lambda+\lambda^2-6=\lambda^2-3\lambda-4. \end{aligned}\end{split}\]

Matriisin \(A\) ominaisarvot ovat lauseen 6.5.1 nojalla yhtälön \(\lambda^2-3\lambda-4=0\) ratkaisut. Toisen asteen yhtälön ratkaisukaavan mukaan tarkasteltava yhtälö toteutuu, jos ja vain jos \(\lambda=4\) tai \(\lambda = -1\). Siten matriisin \(A\) ominaisarvot ovat \(\lambda_1=4\) ja \(\lambda_2=-1\).

Määritetään vielä näihin ominaisarvoihin liittyvät ominaisavaruudet. Kumpaakin ominaisarvoa vastaavat omat ominaisvektorinsa. Tarkastellaan ensin ominaisarvoa \(\lambda_1=4\). Tällöin ratkaistavana on yhtälö \((A-4I)\bv=\nv\). Ratkaistavaksi saadaan siis yhtälöryhmä, jota vastaa matriisi

\[\begin{split}\begin{augmatrix}{rr|c} -3 & 2&0 \\ 3 & -2&0 \end{augmatrix}.\end{split}\]

Kun yhtälöryhmä ratkaistaan Gaussin-Jordanin eliminointimenetelmällä, ratkaisun nähdään olevan

\[\begin{split}\begin{cases} x_1=(2/3)t \\ x_2=t, \end{cases} \quad \text{missä } t \in \R.\end{split}\]

Ominaisarvoa \(4\) ominaisavaruus on siis

\[\{((2/3)t,t) \mid t\in\R\}.\]

Tarkastellaan sitten ominaisarvoa \(\lambda_2=-1\). Nyt ratkaistavana oleva yhtälö on \((A+I)\bv=\nv\). Sen ratkaisuksi saadaan

\[\begin{split}\begin{cases} x_1=-t \\ x_2=t, \end{cases} \quad \text{missä } t \in \R.\end{split}\]

Ominaisarvoa \(-1\) vastaavaava ominaisavaruus on siis

\[\{(-t,t) \mid t\in\R\}.\]

Edellisen nojalla matriisin \(A \in \R^{n \times n}\) ominaisarvoa \(\lambda\) vastaava ominaisavaruus voidaan kirjoittaa muodossa

\[\{\bv \in \R^n \mid (A-\lambda I)\bv=\nv\}.\]

Tämä joukko on itse asiassa matriisin \(A-\lambda I\) nolla-avaruus eli \(\cN(A-\lambda I)\). Näin ollen lauseen 5.6.2 nojalla ominaisavaruus on aliavaruus eli se sisältää kaikkien vektoreidensa summat ja skalaarimonikerrat.

Matriisilla voi olla vain äärellisen monta ominaisarvoa.

Lause 6.5.3

Jos \(A\) on \(n \times n\)-matriisi, sillä on korkeintaan \(n\) ominaisarvoa.

Näytä/piilota todistus

Koska \(A\) on \(n \times n\)-matriisi, sen karakteristinen polynomi on korkeintaan astetta \(n\). Karakteristinen polynomi on siis muotoa \(c_0 + c_1\lambda + \dots + c_n\lambda^n\), missä \(c_0, \dots, c_n \in \R\). Voidaan osoittaa, että yhtälöllä

\[c_0 + c_1\lambda + \dots + c_n\lambda^n = 0\]

on enintään \(n\) eri ratkaisua. Näin ollen matriisilla \(A\) on enintään \(n\) eri ominaisarvoa.

Joidenkin matriisien ominaisarvojen löytäminen onnistuu helposti. Jos matriisi \(A\) on kolmiomatriisi eli kaikki sen lävistäjän alapuoliset tai yläpuoliset alkiot ovat nollia, niin myös \(A - \lambda I\) on kolmiomatriisi. Tällöin sen determinantti \(\det(A - \lambda I)\) on lävistäjäalkioiden tulo lauseen 6.3.8 nojalla. Näin ollen kolmiomatriisin \(A\) karakteristinen polynomin nollakohdat saadaan yhtälöstä

\[(a_{11}-\lambda)(a_{22}-\lambda) \dots (a_{nn}-\lambda) = 0.\]

Lauseen 6.5.1 nojalla saadaan tästä seuraava tulos.

Lause 6.5.4

Oletetaan, että neliömatriisi \(A\) on kolmiomatriisi eli että kaikki sen lävistäjän alapuoliset tai yläpuoliset alkiot ovat nollia. Tällöin matriisin \(A\) ominaisarvot ovat sen lävistäjän alkiot.

Esimerkki 6.5.5

Porrasmatriisi

\[\begin{split}A = \begin{augmatrix}{rrrr} 1 & -2 & 0 & 1 \\ 0 & 4 & -2 & -1 \\ 0 & 0 & 1 & 2 \\ 0 & 0 & 0 & -12 \end{augmatrix}\end{split}\]

on kolmiomatriisi, joten sen ominaisarvot ovat lävistäjän alkiot. Siis matriisin \(A\) ominaisarvot ovat \(\lambda_1 = 1\), \(\lambda_2 = 4\) ja \(\lambda_3 = -12\).

Matriisin \(A\) kaikkien ominaisarvojen muodostamaa joukkoa kutsutaan matrisiin spektriksi ja merkitään \(\sigma(A)\). Esimerkiksi edellisen esimerkin matriisin \(A\) spektri on \(\sigma(A)=\{1,4,-12\}\).

Ominaisarvojen avulla voi päätellä, onko matriisi kääntyvä.

Lause 6.5.6

Oletetaan, että \(A \in \R^{n \times n}\). Matriisi \(A\) on kääntyvä, jos ja vain jos \(0\) ei ole sen ominaisarvo.

Näytä/piilota todistus

Oletetaan ensin, että \(A\) on kääntyvä. Tällöin \(\det(A) \neq 0\). Jos \(0\) olisi matriisin \(A\) ominaisarvo, pätisi \(\det(A-0I)=0\). Tästä seuraisi \(\det(A)=0\), mikä on ristiriita. Siten \(0\) ei ole matriisin \(A\) ominaisarvo.

Oletetaan sitten, että \(0\) ei ole matriisin \(A\) ominaisarvo. Nyt \(\det(A-0I) \neq 0\), mistä seuraa, että \(\det(A) \neq 0\). Siten \(A\) on kääntyvä.

Tähän asti olemme käsiteelleet vain reaalisia ominaisarvoja, sillä ominaisarvo on määritelmänsä mukaan reaaliluku. Ominaisarvot löytää ratkaisemalla karakteristisen polynomin nollakohdat. Nämä nollakohdat voivat olla myös kompleksilukuja. Ominaisarvon käsitettä voikin laajentaa niin, että se käsittää myös kompleksiset ominaisarvot. Näihin tutustutaan seuraavassa esimerkissä.

Esimerkki 6.5.7

Matriisi

\[\begin{split}A=\begin{bmatrix} 0 & -1 \\ 1 & 0 \end{bmatrix}\end{split}\]

kiertää tason vektoreita neljänneskierroksen myötäpäivään. Kyseisessä kierrossa mikään nollasta poikkeava vektori ei tule kerrotuksi skalaarilla. Tästä voidaan päätellä, että matriisilla ei ole reaalisia ominaisarvoja. Matriisilla on kuitenkin kompleksisia ominaisarvoja. Tutkitaan asiaa karakteristisen polynomin avulla.

Selvitetään matriisin \(A\) ominaisarvot. Ne saadaan karakteristisen polynomin nollakohdista. Karakteristinen polynomi on

\[\begin{split}\det(A-\lambda I)= \begin{vmatrix} -\lambda & -1 \\ 1 & \lambda \end{vmatrix} =\lambda^2+1.\end{split}\]

Tällä polynomilla ei ole reaalisia juuria. Sillä on kuitenkin kaksi kompleksista juurta, \(i\) ja \(-i\). Matriisilla ei siis ole reaalisia ominaisarvoja, mutta sillä on kaksi kompleksista ominaisarvoa, \(i\) ja \(-i\).

  • Matriisin ominaisarvot on mahdollista löytää determinantin avulla.
Matriisin \(A\) ominaisarvot ovat
Palautusta lähetetään...