Loading [MathJax]/jax/output/CommonHTML/jax.js

Diagonalisointi

Lävistäjämatriisit eli diagonaalimatriisit ovat hyvin yksinkertaisia matriiseja. Niitä on helppo kertoa keskenään, niiden determinantti on lävistäjäalkioiden tulo ja niiden ominaisarvot näkyvät suoraan matriisissa. Tässä osiossa tutustutaan menetelmään, jonka avulla tietynlaiset neliömatriisit saadaan muutettua lävistäjämatriiseksi. Näin saadulla lävistäjämatriisilla on samat ominaisarvot kuin alkuperäisillä matriiseilla ja paljon muitakin yhteisiä ominaisuuksia aluperäisen matriisin kanssa. Matriiseja, joilla tämä menetelmä toimii, kutsutaan diagonalisoituviksi ja menetelmää diagonalisoinniksi. Diagonalisoinnin avulla saadaan siis muutettua matriisi yksinkertaisempaan ja helpommin käsiteltävään muotoon.

Määritelmä 6.6.1

Neliömatriisi ARn×n on diagonalisoituva, jos on olemassa kääntyvä matriisi PRn×n ja lävistäjämatriisi DRn×n, joille pätee

P1AP=D.

Esimerkki 6.6.2

Esimerkin 6.4.4 matriisi

A=[3113]

on diagonalisoituva. Valitsemalla

P=[1111]

ja etsimällä esimerkiksi lauseen 4.6.6 avulla sen käänteismatriisi

P1=12[1111]

saadaan

P1AP=12[1111][3113][1111]=12[4422][1111]=12[8004]=[4002].

Näin siis matriisi

A=[3113]

diagonalisoitiin lävistäjämatriisiksi

D=[4002].

Esimerkissä 6.6.2 matriisi P vain tupsahti jostakin. Vertaamalla esimerkkiin 6.4.4 huomataan kuitenkin, että matriisin D lävistäjäalkiot ovat matriisin A ominaisarvot, ja matriisin P sarakkeet ovat jotkin niitä vastaavat ominaisvektorit. Seuraava lause osoittaa, että näin on aina, jos matriisi on diagonalisoituva.

Lause 6.6.3

Neliömatriisi ARn×n on diagonalisoituva, jos ja vain jos sillä on n lineaarisesti riippumatonta ominaisvektoria. Tällöin

P1AP=[λ1000λ2000λn],

missä matriisin PRn×n sarakkeet ovat matriisin A lineaarisesti riippumattomia ominaisvektoreita ja λ1,λn ovat niitä vastaavat ominaisarvot samassa järjestyksessä.

Piilota/näytä todistus

”: Oletetaan, että P1AP=D, missä PRn×n on jokin kääntyvä matriisi ja DRn×n lävistäjämatriisi. Nyt AP=PD. Olkoot matriisin P sarakkeet p1,,pn ja matriisin D lävistäjäalkiot λ1,,λn. Nyt siis

P=[p1pn]jaD=[λ10000λ20000λn10000λn].

Matriisituloa laskettaessa tulon AP jokainen sarake saadaan kertomalla matriisilla A vastaava sarake matriisista P:

AP=A[p1pn]=[Ap1Apn].

Toisaalta lävistäjämatriisia D kerrottaessa tullaan kertoneeksi matriisin P jokainen sarake vastaavalla lävistäjäalkiolla:

PD=[λ1p1λnpn].

Koska AP=PD, nähdään nyt, että Api=λipi kaikilla i{1,,n}. Siis jokainen λi on ominaisarvo ja pi sitä vastaava ominaisvektori.

On vielä osoitettava, että ominaisvektorit p1,,pn ovat lineaarisesti riippumattomia. Koska P on kääntyvä, yhtälöllä Px=0 on lauseen 4.7.1 mukaan täsmälleen yksi ratkaisu x=0. Yhtälö Px=0 voidaan kirjoittaa myös muotoon

x1p1+x2p2++xnpn=0.

Tämän yhtälön ainoa ratkaisu on siis x1=0,,xn=0. Näin ollen matriisin A ominaisvektorit p1,,pn ovat lineaarisesti riippumattomia.

”: Oletetaan, että p1,,pn ovat jotkin matriisin A lineaarisesti riippumattomat ominaisvektorit. Olkoot niitä vastaavat ominaisarvot λ1,,λn. Nyt Api=λipi kaikilla i{1,,n}. Olkoon P matriisi, jonka sarakkeet ovat ominaisvektorit: P=[p1pn]. Olkoon D puolestaan lävistäjämatriisi, jonka lävistäjäalkiot ovat λ1,,λn. Tällöin nähdään samaan tapaan kuin edellä, että AP=PD.

Koska matriisin P sarakkeet ovat lineaarisesti riippumattomat, on yhtälöllä Px=0 täsmälleen yksi ratkaisu x=0. (Tämä nähdään samalla tavalla kuin todistuksen ensimmäisessä osassa.) Lauseen 4.8.6 nojalla matriisi P on nyt kääntyvä. Yhtälö AP=PD saadaan siis muotoon

P1AP=D.

Olkoon λ matriisin A ominaisarvo. Ominaisarvon λ algebralliseksi kertaluvuksi alg(λ) kutsutaan sen kertalukua karakteristisen polynomin juurena. Ominaisarvon λ geometriseksi kertaluvuksi geom(λ) kutsutaan sitä vastaavan ominaisavaruuden Eλ dimensiota. Toisin sanoen geom(λ)=dim(Eλ). Nyt edellinen lause voidaan esittää kertalukujen avulla: matriisi on diagonalisoituva, jos sen jokaisen ominaisarvon algebrallinen ja geometrinen kertaluku ovat samat.

Esimerkki 6.6.4

Tutkitaan, onko esimerkin 6.5.2 matriisi

A=[1232]

diagonalisoituva. Esimerkissä 6.5.2 todettiin, että matriisin ominaisarvot ovat 4 ja 1. Eräät näitä ominaisarvoja vastaavat ominaisvektorit ovat (2,3) ja (1,1). Nämä ominaisvektorit ovat lineaarisesti riippumattomat, joten lauseen 6.6.3 perusteella A on diagonalisoituva. Muodostetaan ominaisvektoreista matriisi

P=[2131]

ja ominaisarvoista matriisi

D=[4001]

Nyt lauseen 6.6.3 nojalla pätee P1AP=D. Tämän voi vielä tarkistaa laskemalla.

Tutkitaan vielä toisellakin tavalla, onko matriisi A diagonalisoituva. Esimerkin 6.5.2 perusteella matriisin A ominaisarvot ovat 4 ja 1. Ominaisarvo 4 on karakteristisen polynomin yksinkertainen juuri, joten sen algebrallinen kertaluku on yksi. Toisaalta ominaisarvoa 4 vastaa yksiulotteinen ominaisavaruus, joten sen geometrinen kertaluku on yksi. Siten ominaisarvon 4 algebralliset ja geometriset kertaluvut ovat samat. Samalla tavalla voidaan perustella, että ominaisarvon 1 algebralliset ja geometriset kertaluvut ovat molemmat yksi. Siten ominaisarvon 1 algebrallinen ja geometrinen kertaluku on sama. Koska jokaisella ominaisarvolla geometrinen ja algebrallinen kertaluku on sama, on matriisi A diagonalisoituva.

Esimerkki 6.6.5

Diagonalisoidaan matriisi

B=[2102],

jos mahdollista. Selvitetään aluksi matriisin ominaisarvot. Koska matriisi A on kolmiomatriisi, sen ominaisarvot ovat sen lävistäjän alkiot. Näin matriisin A ainoa ominaisarvo on 2. Ominaisarvoa vastaavat ominaisvektorit saadaan yhtälöstä Bx=2x. Kun yhtälö ratkaistaan, nähdään sen ratkaisujen olevan muotoa x=(t,0), missä tR{0}. Matriisilla B ei siis ole kahta lineaarisesti riippumatonta ominaisvektoria, joten B ei ole diagonalisoituva.

Tutkitaan vielä toisellakin tavalla, onko matriisi B diagonalisoituva. Voidaan laskea, että matriisin B karakteristinen polynomi on (λ2)2. Tämän polynomin ainoa juuri on λ=2 ja se on kaksinkertainen juuri. Siten ainoa ominaisarvo on 2 ja sen algebrallinen kertaluku on kaksi. Ominaisarvoa 2 vastaava ominaisavaruus on

{(t,0)tR}=span{(1,0)}.

Tämän avaruuden dimensio on yksi, joten ominaisarvon 2 geometrinen kertaluku on yksi. Koska algebrallinen ja geometrinen kertaluku eivät ole samat, ei matriisi ole diagonalisoituva.

Oletetaan, että ARn×n ja BRn×n. Jos löytyy kääntyvä matriisi P, jolle pätee P1AP=B, sanotaan, että A ja B ovat similaarisia. Diagonalisoituva matriisi A on siis similaarinen diagonaalimatriisin D kanssa. Similaarisilla matriiseilla on paljon yhteisiä omainaisuuksia. Voidaan osoittaa, että niillä on esimerkiksi samat ominaisarvot, sama determinantti ja sama aste.

Diagonalisoituva matriisi voidaan hajottaa tuloksi matriiseista, jotka koostuvat ominaisvektoreista ja ominaisarvoista. Jos nimittäin diagonalisoituvalle matriisille A pätee P1AP=D, voidaan yhtälöä kertoa vasemmalta matriisilla P ja oikealta matriisilla P1. Näin saadaan A=PDP1. Tuloa kutsutaan matriisin A ominaisarvohajotelmaksi. Ominaisarvohajotelmaa hyödynnetään seuraavassa esimerkissä, jossa esitellään eräs diagonalisoinnin sovellus.

Esimerkki 6.6.6 (Diagonalisoituvan matriisin potenssit)

Lasketaan esimerkissä 6.6.2 esiintyneen matriisin

A=[3113]

seitsemäs potenssi. Suora matriisikertolasku olisi työläs suorittaa, mutta koska matriisi A on diagonalisoituva, voidaan käyttää hyväksi sen ominaisarvoja. Tällöin laskut ovat helpompia.

Esimerkissä 6.6.2 todettiin, että P1AP=D, missä

P=[1111]jaD=[4002].

Jos kerrotaan yhtälöä P1AP=D vasemmalta matriisilla P ja oikealta matriisilla P1, saadaan A=PDP1. Nyt voidaan laskea

A7=(PDP1)7=(PDP1)(PDP1)(PDP1)(PDP1)7 kpl=PD(P1P)D(P1P)DP1=PDD7 kplP1=PD7P1.

Matriisin A potenssin määritäminen on siis muuttunut matriisin D potenssin määrittämiseksi. Se osoittautuu helposksi. Huomataan nimittäin, että

D7=[470027]=[1638400128].

Lävistäjämatriisin potenssi saadaan itse asiassa aina selville laskemalla pelkät lävistäjäalkioiden potenssit.

Nyt

A7=(PDP1)7=PD7P1=[1111][1638400128](12[1111])=12[1638412816384128][1111]=12[16512162561625616512]=[8256812881288256].

Matriisipotenssin laskeminen saatiin siis muutettua pariksi matriisikertolaskuksi sekä tavallisten kokonaislukujen potenssiksi. Samalla vaivalla voitaisiin laskea paljon suurempiakin potensseja. Tämä temppu onnistuu kuitenkin vain, jos alkuperäinen matriisi on diagonalisoituva.

Palataan vielä tutkimaan matriisin ominaisvektoreita. Seuraava lause osoittaa, että eri ominaisarvoja vastaavat ominaisvektorit ovat lineaarisesti riippumattomia. Tästä tuloksesta on toisinaan hyötyä, kun tutkitaan, onko matriisi diagonalisoituva.

Lause 6.6.7

Oletetaan, että A on n×n-matriisi. Oletetaan, että λ1,,λm ovat matriisin A eri ominaisarvoja ja v1,,vmRn jotkin niitä vastaavat ominaisvektorit. Tällöin vektorit v1,,vm ovat lineaarisesti riippumatttomia.

Piilota/näytä todistus

Oletetaan vastoin väitettä, että vektorit v1,,vm ovat lineaarisesti riippuvia. Nyt lauseen 5.4.9 nojalla jokin vektoreista on muiden lineaarikombinaatio. Tästä seuraa, että jokin vektoreista on sitä edeltävien vektoreiden lineaarikombinaatio. Olkoon vk+1 ensimmäinen vektori, joka on sitä edeltävien vektoreiden lineaarikombinaatio. Tällöin on olemassa reaaliluvut c1,,ck, joille pätee

(1)c1v1++ckvk=vk+1.

Lisäksi vektorit v1,,vk ovat lineaarisesti riippumattomia. Jos ne nimittäin olisivat lineaarisesti riippuvia, vk+1 ei olisikaan ensimmäinen vektori, joka on sitä edeltävien vektoreiden lineaarikombinaatio.

Kertomalla yhtälön (1) molemmat puolet vasemmalta matriisilla A saadaan yhtälö

A(c1v1++ckvk)=Avk+1.

Matriisien laskusääntöjen avulla yhtälö saa muodon c1Av1++ckAvk=Avk+1. Kun vielä muistetaan, että vektorit v1,,vk ovat matriisin A ominaisvektoreita, saadaan lopulta yhtälö

(2)c1λ1v1++ckλkvk=λk+1vk+1.

Toisaalta voidaan kertoa yhtälön (1) molemmat puolet luvulla λk+1 päätyen yhtälöön

(3)c1λk+1v1++ckλk+1vk=λk+1vk+1.

Vähennetään yhtälöstä (2) puolittain yhtälö (3), jolloin saadaan

c1(λ1λk+1)v1++ck(λkλk+1)vk=0.

Vektorit v1,,vk ovat lineaarisesti riippumattomia, joten kaikkien yhtälössä olevien kertoimien on oltava nollia:

c1(λ1λk+1)=0, c2(λ2λk+1)=0,, ck(λkλk+1)=0.

Koska λ1,,λm ovat kaikki eri ominaisarvoja, niin tiedetään, että (λiλk+1)0 kaikilla i{1,,k}. Tulon nollasäännön nojalla

c1=0, c2=0, , ck=0.

Näin ollen

vk+1=c1v1++ckvk=0v1++0vk=0.

Toisaalta oletuksen mukaan vk+1 on matriisin A ominaisvektori, joten vk+10. Koska päädyttiin ristiriitaan, vastaoletus ei voi olla tosi. Siis alkuperäinen väite pätee, eli vektorit v1,,vm ovat lineaarisesti riippumatttomia.

Edellisestä lauseesta seuraa, että toisinaan matriisin diagonalisoituvuus on helppo todeta.

Seuraus 6.6.8

Oletetaan, että n×n-matriisilla on n eri ominaisarvoa. Tällöin A on diagonalisoituva.

Piilota/näytä todistus
Olkoot v1,,vn jotkin eri ominaisarvoihin liittyvät ominaisvektorit. Ne ovat lineaarisesti riippumattomia lauseen 6.6.7 nojalla. Koska matriisilla A on n lineaarisesti riippumatonta ominaisvektoria, on A diagonalisoituva lauseen 6.6.3 nojalla.

Huomaa, että diagonalisoituvan n×n-matriisin ominaisarvojen lukumäärän ei tarvitse olla n. Esimerkiksi lävistäjämatriisi

A=[3003]

on diagonalisoituva, sillä I1AI=A. Lävistäjämatriisi on kolmiomatriisi, joten sen ominaisarvot voidaan lukea suoraan lävistäjältä. Havaitaan, että matriisilla A on vain yksi ominaisarvo, 3.

  • Jotkin matriisit on mahdollista muuttaa matriisikertolaskun avulla lävistäjä- eli diagonaalimatriiseiksi.
  • Tällaisia matriiseja kutsutaan diagonalisoituviksi ja prosessia kutsutaan diagonalisoinniksi.
  • Koska lävistäjämatriiseja on helppo käsitellä, voidaan diagonalisoinnin avulla helpottaa laskuja kuten potenssiin korotusta.
Tehtävää ladataan...
Palautusta lähetetään...