Similaariset matriisit ja diagonalisointi¶
Matriisin ominaisarvojen tunteminen kertoo paljon sen ominaisuuksista. Niiden kautta saadaan myös tarkasteltua erisuuria, mutta samankaltaisia matriiseja. Ajatuksena on, että suuri osa tällaisten matriisien ominaisuuksista on samoja, mutta toinen niistä on laskennallisesti helpommin käsiteltävissä. Esimerkkejä mukavista matriiseista ovat ainakin ylä- ja alakolmiomatriisit, sekä niiden yhdistelmänä diagonaalimatriisit.
Matriisien similaarisuus käyttäytyy tietyiltä osin kuten yhtäsuuruuskin.
Lause.
Olkoot \(A\), \(B\) ja \(C\) samankokoisia neliömatriiseja. Tällöin seuraavat väitteet ovat voimassa.
- \(A \sim A\).
- Jos \(A \sim B\), niin \(B \sim A\).
- Jos \(A \sim B\) ja \(B \sim C\), niin \(A \sim C\).
Todistetaan jokainen kohta erikseen.
- Yksikkömatriisi \(I_n\) on kääntyvä ja se täyttää ehdon \(I_n^{-1}AI_n=A\). Täten \(A \sim A\).
- Jos \(A \sim B\), löydetään kääntyvä matriisi \(P\), jolle \(P^{-1}AP = B\). Kerrotaan tätä oikealta matriisilla \(P^{-1}\) ja vasemmalta matriisilla \(P\), jolloin \(PBP^{-1} = A\). Toisaalta myös \(P^{-1}\) on kääntyvä matriisi, jolle \((P^{-1})^{-1} = P\), ja tämän vuoksi \((P^{-1})^{-1}BP^{-1} = A\). Täten \(B \sim A\).
- Jos \(A \sim B\) ja \(B \sim C\), löydetään kääntyvät matriisit \(P\) ja \(S\), joille \(P^{-1}AP = B\) ja \(S^{-1}BS = C\). Sijoittamalla \(B\) nähdään, että \(S^{-1}P^{-1}APS = C\). Tässä \(PS\) on kääntyvä matriisi, jolle \((PS)^{-1} = S^{-1}P^{-1}\), ja tämän vuoksi \((PS)^{-1}A(PS) = C\). Täten \(A \sim C\).
Lauseessa mainittujen väittämien toteutuminen tarkoittaa, että matriisien similaarisuus on ekvivalenssirelaatio. \(\square\)
Lause.
Olkoot \(A\) ja \(B\) samankokoisia neliömatriiseja, sekä \(A \sim B\). Tällöin
- \(\det(A) = \det(B)\),
- \(A\) on kääntyvä täsmälleen silloin, kun \(B\) on kääntyvä,
- \(\operatorname{rank}(A) = \operatorname{rank}(B)\),
- matriiseilla \(A\) ja \(B\) on samat ominaisarvot.
Koska \(A \sim B\), löydetään kääntyvä matriisi \(P\), jolle \(P^{-1}AP = B\). Todistetaan jokainen kohta erikseen.
\(\det(B) = \det(P^{-1}AP) = \det(P)^{-1}\det(A)\det(P) = \det(A)\).
Edellisen kohdan nojalla \(\det(A) \not= 0\) täsmälleen silloin, kun \(\det(B) \not= 0\). Siis matriisi \(A\) on kääntyvä täsmälleen silloin, kun matriisi \(B\) on kääntyvä.
Olkoon \(E\) alkeismatriisi. Koska matriisit \(A\) ja \(EA\) ovat keskenään riviekvivalentit, niillä on sama redusoitu riviporrasmuoto ja näin myös \(\operatorname{rank}(EA) = \operatorname{rank}(A)\). Matriisin \(E\) transpoosi \(E^T\) on sekin alkeismatriisi. Voidaan osoittaa, että matriisilla ja sen transpoosilla on sama aste, ja tämän vuoksi
\[\operatorname{rank}(AE) = \operatorname{rank}(E^TA^T) = \operatorname{rank}(A^T) = \operatorname{rank}(A).\]Nyt muunnosmatriisi \(P\) on kääntyvänä matriisina alkeismatriisien tulo, jolloin matriisi \(B = P^{-1}AP\) saadaan kertomalla matriisia \(A\) molemmin puolin joillakin alkeismatriiseilla. Siis \(\operatorname{rank}(B) = \operatorname{rank}(P^{-1}AP) = \operatorname{rank}(A)\).
Kirjoitetaan \(P^{-1}P = I_n\), jolloin osittelulakien nojalla
\[B - \lambda I_n = P^{-1}AP - \lambda P^{-1}P = P^{-1}(A - \lambda I_n)P,\]eli \(A - \lambda I_n \sim B - \lambda I_n\). Tämän vuoksi \(\det(A - \lambda I_n) = \det(B - \lambda I_n)\), eli matriiseilla \(A\) ja \(B\) on samat karakteristiset polynomit. Täten niiden ominaisarvotkin ovat samat.
\(\square\)
Erityisen mukavia ovat matriisit, jotka ovat similaarisia diagonaalimatriisin kanssa. Tämä on niin tärkeä ominaisuus, että sille annetaan oma nimitys.
Ominaisarvojen avulla matriisin diagonalisoituvuus on helposti tarkistettavissa.
Lause.
\(n \times n\)-neliömatriisi \(A\) on diagonalisoituva täsmälleen silloin, kun sillä on \(n\) lineaarisesti riippumatonta ominaisvektoria. Tällöin
missä \(\mathbf{v}_1, \mathbf{v}_2, \ldots, \mathbf{v}_n\) ovat matriisin \(A\) lineaarisesti riippumattomat ominaisvektorit ja diagonaalialkiot \(\lambda_1, \lambda_2, \ldots, \lambda_n\) niihin liittyvät ominaisarvot.
Todistetaan väite kahdessa osassa.
Oletetaan, että matriisi \(A\) on diagonalisoituva, eli löydetään \(n \times n\)-diagonaalimatriisi \(D = \operatorname{diag}(d_1, d_2, \ldots, d_n)\) ja kääntyvä matriisi
\[P = \begin{bmatrix} \mathbf{p}_1 & \mathbf{p}_2 & \cdots & \mathbf{p}_n \end{bmatrix},\]joille \(P^{-1}AP = D\). Tällöin
\[\begin{split}\begin{aligned} \begin{bmatrix} A\mathbf{p}_1 & A\mathbf{p}_2 & \cdots & A\mathbf{p}_n \end{bmatrix} &= AP = PD = \begin{bmatrix} \mathbf{p}_1 & \mathbf{p}_2 & \cdots & \mathbf{p}_n \end{bmatrix} \begin{bmatrix} d_1 & & & \\ & d_2 & & \\ & & \ddots & \\ & & & d_n \end{bmatrix} \\ &= \begin{bmatrix} d_1\mathbf{p}_1 & d_2\mathbf{p}_2 & \cdots & d_n\mathbf{p}_n \end{bmatrix}, \end{aligned}\end{split}\]eli on oltava \(A\mathbf{p}_i = d_i\mathbf{p}_i\) jokaista \(i = 1, 2, \ldots, n\) kohti. Täten \(d_1, d_2, \ldots, d_n\) ovat matriisin \(A\) ominaisarvoja ja \(\mathbf{p}_1, \mathbf{p}_2, \ldots, \mathbf{p}_n\) niihin liittyviä ominaisvektoreita. Koska ominaisvektorit muodostavat kääntyvän matriisin sarakkeet, niiden on oltava lineaarisesti riippumattomia.
Oletetaan, että \(\mathbf{v}_1, \mathbf{v}_2, \ldots, \mathbf{v}_n\) ovat matriisin \(A\) lineaarisesti riippumattomat ominaisvektorit ja \(\lambda_1, \lambda_2, \ldots, \lambda_n\) niihin liittyvät ominaisarvot. Tällöin
\[\begin{split}\begin{aligned} A \begin{bmatrix} \mathbf{v}_1 & \mathbf{v}_2 & \cdots & \mathbf{v}_n \end{bmatrix} &= \begin{bmatrix} A\mathbf{v}_1 & A\mathbf{v}_2 & \cdots & A\mathbf{v}_n \end{bmatrix} = \begin{bmatrix} \lambda_1\mathbf{v}_1 & \lambda_2\mathbf{v}_2 & \cdots & \lambda_n\mathbf{v}_n \end{bmatrix} \\ &= \begin{bmatrix} \mathbf{v}_1 & \mathbf{v}_2 & \cdots & \mathbf{v}_n \end{bmatrix} \begin{bmatrix} \lambda_1 & & & \\ & \lambda_2 & & \\ & & \ddots & \\ & & & \lambda_n \end{bmatrix}, \end{aligned}\end{split}\]eli
\[\begin{split}A = \begin{bmatrix} \mathbf{v}_1 & \mathbf{v}_2 & \cdots & \mathbf{v}_n \end{bmatrix} \begin{bmatrix} \lambda_1 & & & \\ & \lambda_2 & & \\ & & \ddots & \\ & & & \lambda_n \end{bmatrix} \begin{bmatrix} \mathbf{v}_1 & \mathbf{v}_2 & \cdots & \mathbf{v}_n \end{bmatrix}^{-1}.\end{split}\]On osoitettu, että diagonaalimatriisi on similaarinen matriisin \(A\) kanssa, joten matriisi \(A\) on diagonalisoituva.
\(\square\)
Diagonalisoituvalle matriisille \(A\) siis muunnosmatriisi \(P\) muodostuu lineaarisesti riippumattomista ominaisvektoreista ja itse diagonaalimatriisi \(D\) vastaavuusjärjestykseen asetetuista ominaisarvoista. Tällaista similaarisuusmuunnosta kutsutaan matriisin \(A\) ominaisarvohajotelmaksi
missä \(V = P\) ja \(\Lambda = D\).
Esimerkki.
Diagonalisoi matriisi \(A=\begin{bmatrix} -1 & 0 & 1\\ 3 & 0 & -3\\ 1 & 0 & -1 \end{bmatrix}\).
Matriisin \(A\) ominaisarvot ovat \(\lambda = 0\) (kaksinkertainen) ja \(\lambda=-2\). Vastaavien ominaisavaruuksien kannoiksi saadaan
ja
aiempien esimerkkien tapaan. Matriisilla \(A\) on siis kolme lineaarisesti riippumatonta ominaisvektoria, ja tällöin voidaan valita esimerkiksi
ja
Tarkista diagonalisoinnin toimivuus Matlab
illa.
Diagonalisoinnin avulla voidaan laskea helposti matriisin korkeita potensseja.
Lause.
Jos matriisi \(P\) diagonalisoi matriisin \(A\) diagonaalimatriisiksi \(D\), niin
ja
aina, kun \(k\) on positiivinen kokonaisluku.
Suoralla laskulla saadaan
Diagonaalimatriisin potenssi saadaan korottamalla sen alkiot samaan potenssiin, ja tämän todistaminen jätetään harjoitustehtäväksi. \(\square\)
Huomautus.
Edellä esitelty matriisin diagonalisoiminen onnistuu ainoastaan tilanteessa, jossa lineaarisesti riippumattomia ominaisvektoreita on yhtä monta kuin matriisissa \(A\) sarakkeita. Yleensä vastaan tuleva matriisi ei ole diagonalisoituva (ainakaan reaalisena). Jokainen neliömatriisi on kuitenkin mahdollista muuntaa Jordanin kanoniseen muotoon, joka imitoi mahdollisimman läheisesti ominaisarvohajotelmaa.