Similaariset matriisit ja diagonalisointi¶

Matriisin ominaisarvojen tunteminen kertoo paljon sen ominaisuuksista. Niiden kautta saadaan myös tarkasteltua erisuuria, mutta samankaltaisia matriiseja. Ajatuksena on, että suuri osa tällaisten matriisien ominaisuuksista on samoja, mutta toinen niistä on laskennallisesti helpommin käsiteltävissä. Esimerkkejä mukavista matriiseista ovat ainakin ylä- ja alakolmiomatriisit, sekä niiden yhdistelmänä diagonaalimatriisit.

Määritelmä.

Olkoot \(A\) ja \(B\) samankokoisia neliömatriiseja. Matriisit \(A\) ja \(B\) ovat similaarisia, jos löytyy kääntyvä matriisi \(P\), jolle \(P^{-1}AP=B\). Jos \(A\) ja \(B\) ovat similaarisia, niin merkitään \(A \sim B\). Matriisia \(B\) kutsutaan joskus matriisin \(A\) similaarisuusmuunnokseksi ja matriisia \(P\) muunnosmatriisiksi.

Matriisien similaarisuus käyttäytyy tietyiltä osin kuten yhtäsuuruuskin.

Lause.

Olkoot \(A\), \(B\) ja \(C\) samankokoisia neliömatriiseja. Tällöin seuraavat väitteet ovat voimassa.

\(A \sim A\).
Jos \(A \sim B\), niin \(B \sim A\).
Jos \(A \sim B\) ja \(B \sim C\), niin \(A \sim C\).

Todistus.

Todistetaan jokainen kohta erikseen.

Yksikkömatriisi \(I_n\) on kääntyvä ja se täyttää ehdon \(I_n^{-1}AI_n=A\). Täten \(A \sim A\).
Jos \(A \sim B\), löydetään kääntyvä matriisi \(P\), jolle \(P^{-1}AP = B\). Kerrotaan tätä oikealta matriisilla \(P^{-1}\) ja vasemmalta matriisilla \(P\), jolloin \(PBP^{-1} = A\). Toisaalta myös \(P^{-1}\) on kääntyvä matriisi, jolle \((P^{-1})^{-1} = P\), ja tämän vuoksi \((P^{-1})^{-1}BP^{-1} = A\). Täten \(B \sim A\).
Jos \(A \sim B\) ja \(B \sim C\), löydetään kääntyvät matriisit \(P\) ja \(S\), joille \(P^{-1}AP = B\) ja \(S^{-1}BS = C\). Sijoittamalla \(B\) nähdään, että \(S^{-1}P^{-1}APS = C\). Tässä \(PS\) on kääntyvä matriisi, jolle \((PS)^{-1} = S^{-1}P^{-1}\), ja tämän vuoksi \((PS)^{-1}A(PS) = C\). Täten \(A \sim C\).

Lauseessa mainittujen väittämien toteutuminen tarkoittaa, että matriisien similaarisuus on ekvivalenssirelaatio. \(\square\)

Lause.

Olkoot \(A\) ja \(B\) samankokoisia neliömatriiseja, sekä \(A \sim B\). Tällöin

\(\det(A) = \det(B)\),
\(A\) on kääntyvä täsmälleen silloin, kun \(B\) on kääntyvä,
\(\operatorname{rank}(A) = \operatorname{rank}(B)\),
matriiseilla \(A\) ja \(B\) on samat ominaisarvot.

Todistus.

Koska \(A \sim B\), löydetään kääntyvä matriisi \(P\), jolle \(P^{-1}AP = B\). Todistetaan jokainen kohta erikseen.

\(\det(B) = \det(P^{-1}AP) = \det(P)^{-1}\det(A)\det(P) = \det(A)\).
Edellisen kohdan nojalla \(\det(A) \not= 0\) täsmälleen silloin, kun \(\det(B) \not= 0\). Siis matriisi \(A\) on kääntyvä täsmälleen silloin, kun matriisi \(B\) on kääntyvä.
Olkoon \(E\) alkeismatriisi. Koska matriisit \(A\) ja \(EA\) ovat keskenään riviekvivalentit, niillä on sama redusoitu riviporrasmuoto ja näin myös \(\operatorname{rank}(EA) = \operatorname{rank}(A)\). Matriisin \(E\) transpoosi \(E^T\) on sekin alkeismatriisi. Voidaan osoittaa, että matriisilla ja sen transpoosilla on sama aste, ja tämän vuoksi

\[\operatorname{rank}(AE) = \operatorname{rank}(E^TA^T) = \operatorname{rank}(A^T) = \operatorname{rank}(A).\]

Nyt muunnosmatriisi \(P\) on kääntyvänä matriisina alkeismatriisien tulo, jolloin matriisi \(B = P^{-1}AP\) saadaan kertomalla matriisia \(A\) molemmin puolin joillakin alkeismatriiseilla. Siis \(\operatorname{rank}(B) = \operatorname{rank}(P^{-1}AP) = \operatorname{rank}(A)\).
Kirjoitetaan \(P^{-1}P = I_n\), jolloin osittelulakien nojalla

\[B - \lambda I_n = P^{-1}AP - \lambda P^{-1}P = P^{-1}(A - \lambda I_n)P,\]

eli \(A - \lambda I_n \sim B - \lambda I_n\). Tämän vuoksi \(\det(A - \lambda I_n) = \det(B - \lambda I_n)\), eli matriiseilla \(A\) ja \(B\) on samat karakteristiset polynomit. Täten niiden ominaisarvotkin ovat samat.

\(\square\)

Erityisen mukavia ovat matriisit, jotka ovat similaarisia diagonaalimatriisin kanssa. Tämä on niin tärkeä ominaisuus, että sille annetaan oma nimitys.

Määritelmä.

Neliömatriisia \(A\) kutsutaan diagonalisoituvaksi, jos se on similaarinen diagonaalimatriisin kanssa.

Ominaisarvojen avulla matriisin diagonalisoituvuus on helposti tarkistettavissa.

Lause.

\(n \times n\)-neliömatriisi \(A\) on diagonalisoituva täsmälleen silloin, kun sillä on \(n\) lineaarisesti riippumatonta ominaisvektoria. Tällöin

\[\begin{split}A = \begin{bmatrix} \mathbf{v}_1 & \mathbf{v}_2 & \cdots & \mathbf{v}_n \end{bmatrix} \begin{bmatrix} \lambda_1 & & & \\ & \lambda_2 & & \\ & & \ddots & \\ & & & \lambda_n \end{bmatrix} \begin{bmatrix} \mathbf{v}_1 & \mathbf{v}_2 & \cdots & \mathbf{v}_n \end{bmatrix}^{-1},\end{split}\]

missä \(\mathbf{v}_1, \mathbf{v}_2, \ldots, \mathbf{v}_n\) ovat matriisin \(A\) lineaarisesti riippumattomat ominaisvektorit ja diagonaalialkiot \(\lambda_1, \lambda_2, \ldots, \lambda_n\) niihin liittyvät ominaisarvot.

Todistus.

Todistetaan väite kahdessa osassa.

Oletetaan, että matriisi \(A\) on diagonalisoituva, eli löydetään \(n \times n\)-diagonaalimatriisi \(D = \operatorname{diag}(d_1, d_2, \ldots, d_n)\) ja kääntyvä matriisi

\[P = \begin{bmatrix} \mathbf{p}_1 & \mathbf{p}_2 & \cdots & \mathbf{p}_n \end{bmatrix},\]

joille \(P^{-1}AP = D\). Tällöin

\[\begin{split}\begin{aligned} \begin{bmatrix} A\mathbf{p}_1 & A\mathbf{p}_2 & \cdots & A\mathbf{p}_n \end{bmatrix} &= AP = PD = \begin{bmatrix} \mathbf{p}_1 & \mathbf{p}_2 & \cdots & \mathbf{p}_n \end{bmatrix} \begin{bmatrix} d_1 & & & \\ & d_2 & & \\ & & \ddots & \\ & & & d_n \end{bmatrix} \\ &= \begin{bmatrix} d_1\mathbf{p}_1 & d_2\mathbf{p}_2 & \cdots & d_n\mathbf{p}_n \end{bmatrix}, \end{aligned}\end{split}\]

eli on oltava \(A\mathbf{p}_i = d_i\mathbf{p}_i\) jokaista \(i = 1, 2, \ldots, n\) kohti. Täten \(d_1, d_2, \ldots, d_n\) ovat matriisin \(A\) ominaisarvoja ja \(\mathbf{p}_1, \mathbf{p}_2, \ldots, \mathbf{p}_n\) niihin liittyviä ominaisvektoreita. Koska ominaisvektorit muodostavat kääntyvän matriisin sarakkeet, niiden on oltava lineaarisesti riippumattomia.
Oletetaan, että \(\mathbf{v}_1, \mathbf{v}_2, \ldots, \mathbf{v}_n\) ovat matriisin \(A\) lineaarisesti riippumattomat ominaisvektorit ja \(\lambda_1, \lambda_2, \ldots, \lambda_n\) niihin liittyvät ominaisarvot. Tällöin

\[\begin{split}\begin{aligned} A \begin{bmatrix} \mathbf{v}_1 & \mathbf{v}_2 & \cdots & \mathbf{v}_n \end{bmatrix} &= \begin{bmatrix} A\mathbf{v}_1 & A\mathbf{v}_2 & \cdots & A\mathbf{v}_n \end{bmatrix} = \begin{bmatrix} \lambda_1\mathbf{v}_1 & \lambda_2\mathbf{v}_2 & \cdots & \lambda_n\mathbf{v}_n \end{bmatrix} \\ &= \begin{bmatrix} \mathbf{v}_1 & \mathbf{v}_2 & \cdots & \mathbf{v}_n \end{bmatrix} \begin{bmatrix} \lambda_1 & & & \\ & \lambda_2 & & \\ & & \ddots & \\ & & & \lambda_n \end{bmatrix}, \end{aligned}\end{split}\]

eli

\[\begin{split}A = \begin{bmatrix} \mathbf{v}_1 & \mathbf{v}_2 & \cdots & \mathbf{v}_n \end{bmatrix} \begin{bmatrix} \lambda_1 & & & \\ & \lambda_2 & & \\ & & \ddots & \\ & & & \lambda_n \end{bmatrix} \begin{bmatrix} \mathbf{v}_1 & \mathbf{v}_2 & \cdots & \mathbf{v}_n \end{bmatrix}^{-1}.\end{split}\]

On osoitettu, että diagonaalimatriisi on similaarinen matriisin \(A\) kanssa, joten matriisi \(A\) on diagonalisoituva.

\(\square\)

Diagonalisoituvalle matriisille \(A\) siis muunnosmatriisi \(P\) muodostuu lineaarisesti riippumattomista ominaisvektoreista ja itse diagonaalimatriisi \(D\) vastaavuusjärjestykseen asetetuista ominaisarvoista. Tällaista similaarisuusmuunnosta kutsutaan matriisin \(A\) ominaisarvohajotelmaksi

\[A = V\Lambda V^{-1},\]

missä \(V = P\) ja \(\Lambda = D\).

Esimerkki.

Diagonalisoi matriisi \(A=\begin{bmatrix} -1 & 0 & 1\\ 3 & 0 & -3\\ 1 & 0 & -1 \end{bmatrix}\).

Ratkaisu.

Matriisin \(A\) ominaisarvot ovat \(\lambda = 0\) (kaksinkertainen) ja \(\lambda=-2\). Vastaavien ominaisavaruuksien kannoiksi saadaan

\[\begin{split}E_0=\operatorname{span}\left\{\begin{bmatrix}0 \\1\\ 0\end{bmatrix},\begin{bmatrix}1 \\0\\ 1\end{bmatrix}\right\}\end{split}\]

\[\begin{split}E_{-2}=\operatorname{span}\left\{\begin{bmatrix}-1 \\3\\ 1\end{bmatrix}\right\}\end{split}\]

aiempien esimerkkien tapaan. Matriisilla \(A\) on siis kolme lineaarisesti riippumatonta ominaisvektoria, ja tällöin voidaan valita esimerkiksi

\[\begin{split}P=\begin{bmatrix}0 & 1 & -1\\ 1 & 0 & 3\\ 0 & 1 & 1 \end{bmatrix}\end{split}\]

\[\begin{split}D=\begin{bmatrix}0 & 0 & 0\\ 0 & 0 & 0\\ 0 & 0 & -2 \end{bmatrix}.\end{split}\]

Tarkista diagonalisoinnin toimivuus Matlabilla.

Diagonalisoinnin avulla voidaan laskea helposti matriisin korkeita potensseja.

Lause.

Jos matriisi \(P\) diagonalisoi matriisin \(A\) diagonaalimatriisiksi \(D\), niin

\[A^k=PD^kP^{-1}\]

\[\begin{split}D^k=\begin{bmatrix} \lambda_1^k & & &\\ & \lambda_2^k & &\\ & & \ddots & \\ & & & \lambda_n^k \end{bmatrix}\end{split}\]

aina, kun \(k\) on positiivinen kokonaisluku.

Todistus.

Suoralla laskulla saadaan

\[\begin{split}\begin{aligned} A^k &= AA \cdots A = (PDP^{-1})(PDP^{-1})\cdots(PDP^{-1}) \\ &= PD(P^{-1}P)D(P^{-1}\cdots P)DP^{-1} = PDD\cdots DP^{-1} = PD^kP^{-1}.\end{aligned}\end{split}\]

Diagonaalimatriisin potenssi saadaan korottamalla sen alkiot samaan potenssiin, ja tämän todistaminen jätetään harjoitustehtäväksi. \(\square\)

Huomautus.

Edellä esitelty matriisin diagonalisoiminen onnistuu ainoastaan tilanteessa, jossa lineaarisesti riippumattomia ominaisvektoreita on yhtä monta kuin matriisissa \(A\) sarakkeita. Yleensä vastaan tuleva matriisi ei ole diagonalisoituva (ainakaan reaalisena). Jokainen neliömatriisi on kuitenkin mahdollista muuntaa Jordanin kanoniseen muotoon, joka imitoi mahdollisimman läheisesti ominaisarvohajotelmaa.