Käänteismatriisi¶
Lineaarinen yhtälöryhmä voidaan kirjoittaa kerroinmatriisin \(A\) ja vakiotermivektorin \(\mathbf{b}\) avulla muodossa \(A\mathbf{x}= \mathbf{b}\). Jos kerroinmatriisi sattuisi olemaan neliömatriisi ja \(A = I_n\), niin ryhmän ratkaisu olisi yksinkertaisesti \(\mathbf{x}= I_n\mathbf{x}= \mathbf{b}\). Muussa tapauksessa voidaan kysyä, löydetäänkö sellainen matriisi \(B\), että tulo \(BA = I_n\). Tällöin yhtälön ratkaisuksi kävisi
Tässä päättelyssä on olennaista, että \(A\) on \(n \times n\)-neliömatriisi.
Huomautus.
Kaikki neliömatriisit eivät ole kääntyviä ja vain neliömatriisit voivat olla kääntyviä annetun määritelmän mukaan. Matriisin kääntyvyyden riittävät ja välttämättömät ehdot voidaan esitellä vasta myöhemmin.
Lause.
Kääntyvän matriisin \(A\) käänteismatriisi \(A^{-1}\) on yksikäsitteinen.
Oletetaan, että matriisilla \(A\) on käänteismatriisit \(B_1\) ja \(B_2\), eli \(B_1A=I_n=AB_1\) ja \(B_2A=I_n=AB_2\). Tällöin
Siis \(B_1=B_2\), joten käänteismatriisi on yksikäsitteinen. \(\square\)
Lause.
Olkoot \(A\) ja \(B\) kääntyviä samankokoisia neliömatriiseja, sekä \(r \not= 0\) reaaliluku. Tällöin
- \(A^{-1}\) on kääntyvä ja \((A^{-1})^{-1} = A\),
- \(rA\) on kääntyvä ja \((rA)^{-1} = \frac{1}{r}A^{-1}\),
- \(AB\) on kääntyvä ja \((AB)^{-1} = B^{-1}A^{-1}\),
- \(A^T\) on kääntyvä ja \((A^T)^{-1} = (A^{-1})^T = A^{-T}\),
- \(A^n\), missä \(n \geq 0\) on kokonaisluku, on kääntyvä ja \((A^n)^{-1} = (A^{-1})^n = A^{-n}\).
Osoitetaan esimerkkinä kohdat 3 ja 5. Kohdan 3 todistamiseksi riittää osoittaa, että matriisi \(B^{-1}A^{-1}\) (kooltaan \(n \times n\)) toteuttaa käänteismatriisin ehdot, eli
Siis matriisi \(AB\) on kääntyvä ja \((AB)^{-1} = B^{-1}A^{-1}\).
Todistetaan kohta 5 induktiolla hyödyntäen kohtaa 3.
Alkuaskel. Kun \(n = 0\), väitetään matriisin \(A^0 = I_n\) olevan kääntyvä ja että käänteismatriisi \(I_n^{-1} = (A^{-1})^0 = I_n\). Koska \(I_nI_n = I_n\), niin \(I_n^{-1} = I_n\) ja väite on tosi.
Induktioaskel. Tehdään induktio-oletus, jonka mukaan matriisi \(A^k\) on kääntyvä ja \((A^k)^{-1} = (A^{-1})^k\), kun \(k \geq 0\) on kokonaisluku. Pyritään osoittamaan, että matriisi \(A^{k + 1}\) on kääntyvä ja että \((A^{k + 1})^{-1} = (A^{-1})^{k + 1}\). Induktio-oletuksen ja kohdan 3 nojalla matriisi \(A^kA = A^{k + 1}\) on kääntyvä ja
\[(A^{k + 1})^{-1} = (A^kA)^{-1} = A^{-1}(A^k)^{-1} \stackrel{\text{io}}{=} A^{-1}(A^{-1})^k = (A^{-1})^{k + 1},\]eli induktioväite on tosi.
Induktioperiaatteen nojalla siis matriisi \(A^n\) on kääntyvä ja \((A^n)^{-1} = (A^{-1})^n\) aina, kun \(n \geq 0\) on kokonaisluku. Loput jätetään harjoitustehtäväksi. \(\square\)
Edellisen lauseen viimeinen kohta motivoi laajentamaan matriisin potenssin määritelmää myös negatiivisille kokonaisluvuille. Jos \(A\) on kääntyvä matriisi ja \(k\) on positiivinen kokonaisluku, niin asetetaan
Vastaavanlaista merkintää käytetään joskus transpoosin käänteismatriisille
Esimerkki.
Ratkaise \(X\), kun
- \(AXA^2=A^{-1}\),
- \(AXB=(BA)^2\),
ja kaikki matriisit ovat kääntyviä \(n \times n\)-matriiseja.
Koska matriisitulo ei ole vaihdannainen, tulee mainita kerrotaanko yhtälöä oikealta vai vasemmalta puolelta.
Kerrotaan yhtälöä puolittain vasemmalta matriisilla \(A^{-1}\), jolloin
\[AXA^2 = A^{-1} \Leftrightarrow A^{-1}AXA^2 = A^{-1}A^{-1} \Leftrightarrow XA^2 = A^{-2}.\]Kerrotaan sitten yhtälöä puolittain oikealta matriisilla \(A^{-2}\), jolloin
\[XA^2 = A^{-2} \Leftrightarrow XA^2A^{-2} = A^{-2}A^{-2} \Leftrightarrow X = A^{-4}.\]Siis matriisi \(X = A^{-4}\).
Kerrotaan yhtälöä puolittain vasemmalta matriisilla \(A^{-1}\) ja oikealta matriisilla \(B^{-1}\), jolloin
\[AXB = (BA)^2 \Leftrightarrow A^{-1}AXBB^{-1} = A^{-1}(BA)^2B^{-1} \Leftrightarrow X = A^{-1}(BA)^2B^{-1}.\]Koska matriisitulo ei ole vaihdannainen, ratkaisu ei etene pidemmälle.
Yhtälöryhmän ratkaisu saadaan käänteismatriisin avulla seuraavasti.
Lause.
Jos \(A\) on kääntyvä \(n \times n\)-matriisi, niin lineaarisella yhtälöryhmällä \(A\mathbf{x}=\mathbf{b}\), missä \(\mathbf{b}\) on avaruuden \(\mathbb R^n\) vektori, on yksikäsitteinen ratkaisu \(\mathbf{x}=A^{-1}\mathbf{b}\) avaruudessa \(\mathbb R^n\).
Oletetaan, että \(A\) on kääntyvä, jolloin käänteismatriisi \(A^{-1}\) on olemassa. Vektori \(\mathbf{x}=A^{-1}\mathbf{b}\) on tällöin yhtälöryhmän \(A\mathbf{x}=\mathbf{b}\) ratkaisu, sillä
Ratkaisu on myös yksikäsitteinen, sillä jos \(\mathbf{y}\) on toinen ratkaisu, niin
eli ratkaisut ovat samat. \(\square\)
\(2\times 2\)-matriisin käänteismatriisille saadaan seuraava helpohko, jopa ulkoa muistettavissa oleva sääntö.
Lause.
Jos matriisille
on voimassa \(ad - bc \not= 0\), niin \(A\) on kääntyvä ja
Suoralla laskulla voitaisiin osoittaa, että kyseessä on todella käänteismatriisi. Tutkitaan asiaa kuitenkin hieman konstruktiivisemmin. Oletetaan, että matriisi
toteuttaa käänteismatriisin määritelmän \(AB = I_n = BA\). Tällöin siis
Matriisit ovat samat silloin, kun niiden sarakkeet ovat samat, eli kun
Saadaan siis kaksi yhtälöryhmää, joiden kokonaismatriisit ovat
ja joiden on toteuduttava yhtä aikaa. Jaetaan tarkastelu kahteen osaan sen mukaan, onko kerroin \(a = 0\) vai ei.
\(a \not= 0\). Viedään ensimmäistä kokonaismatriisia kohti redusoitua riviporrasmuotoa.
\[\begin{split}\begin{aligned} \begin{bmatrix} a & b & 1 \\ c & d & 0 \end{bmatrix} \xrightarrow{\frac{1}{a}R_1} \begin{bmatrix} 1 & \frac{b}{a} & \frac{1}{a} \\ c & d & 0 \end{bmatrix} \xrightarrow{R_2 - cR_1} \begin{bmatrix} 1 & \frac{b}{a} & \frac{1}{a} \\ 0 & d - \frac{bc}{a} & -\frac{c}{a} \end{bmatrix} \end{aligned}\end{split}\]Jos tässä \(d - \frac{bc}{a} = \frac{ad - bc}{a} = 0\), niin yhtälöryhmällä ei ole ratkaisua. Oletetaan siis, että \(ad - bc \not= 0\), jolloin
\[\begin{split}\begin{aligned} \begin{bmatrix} 1 & \frac{b}{a} & \frac{1}{a} \\ 0 & d - \frac{bc}{a} & -\frac{c}{a} \end{bmatrix} \xrightarrow{\frac{a}{ad - bc}R_2} \begin{bmatrix} 1 & \frac{b}{a} & \frac{1}{a} \\ 0 & 1 & -\frac{c}{ad - bc} \end{bmatrix} \xrightarrow{R_1 - \frac{b}{a}R_2} \begin{bmatrix} 1 & 0 & \frac{d}{ad - bc} \\ 0 & 1 & -\frac{c}{ad - bc} \end{bmatrix}. \end{aligned}\end{split}\]Samalla prosessilla ja oletuksilla saadaan jälkimmäiselle kokonaismatriisille
\[\begin{split}\operatorname{rref} \begin{bmatrix} a & b & 0 \\ c & d & 1 \end{bmatrix} = \begin{bmatrix} 1 & 0 & -\frac{b}{ad - bc} \\ 0 & 1 & \frac{a}{ad - bc} \end{bmatrix}.\end{split}\]\(a = 0\). Jos nyt olisi lisäksi \(c = 0\), niin pitäisi toteutua
\[\begin{split}\begin{bmatrix} by \\ dy \end{bmatrix} = \begin{bmatrix} 1 \\ 0 \end{bmatrix} \qquad\text{ja}\qquad \begin{bmatrix} bz \\ dz \end{bmatrix} = \begin{bmatrix} 0 \\ 1 \end{bmatrix}.\end{split}\]Ensimmäisen yhtälön ensimmäisestä komponentista päätellään, että \(b \not= 0\), jolloin yhtälö \(bz = 0\) tarkoittaa, että \(z = 0\). Mutta tällöin \(dz = 0 = 1\), mikä on ristiriita. On siis oltava \(c \not= 0\). Myös \(b \not= 0\), sillä muussa tapauksessa olisi oltava
\[\begin{split}\begin{bmatrix} 0 \\ cw + dy \end{bmatrix} = \begin{bmatrix} 1 \\ 0 \end{bmatrix}.\end{split}\]Viedään ensimmäinen kokonaismatriisi redusoituun riviporrasmuotoon.
\[\begin{split}\begin{aligned} \begin{bmatrix} 0 & b & 1 \\ c & d & 0 \end{bmatrix} &\xrightarrow{R_1 \leftrightarrow R_2} \begin{bmatrix} c & d & 0 \\ 0 & b & 1 \end{bmatrix} \xrightarrow{\frac{1}{c}R_1} \begin{bmatrix} 1 & \frac{d}{c} & 0 \\ 0 & b & 1 \end{bmatrix} \xrightarrow{\frac{1}{b}R_2} \begin{bmatrix} 1 & \frac{d}{c} & 0 \\ 0 & 1 & \frac{1}{b} \end{bmatrix} \\ &\xrightarrow{R_1 - \frac{d}{c}R_2} \begin{bmatrix} 1 & 0 & -\frac{d}{bc} \\ 0 & 1 & \frac{1}{b} \end{bmatrix} \end{aligned}\end{split}\]Tässä oletukset \(b \not= 0\) ja \(c \not= 0\) voidaan korvata oletuksella \(ad - bc = -bc \not= 0\). Samalla prosessilla ja oletuksilla saadaan jälkimmäiselle kokonaismatriisille
\[\begin{split}\operatorname{rref} \begin{bmatrix} 0 & b & 0 \\ c & d & 1 \end{bmatrix} = \begin{bmatrix} 1 & 0 & \frac{1}{c} \\ 0 & 1 & 0 \end{bmatrix}.\end{split}\]
Molemmissa tapauksissa siis oletus \(ad - bc \not= 0\) riittää yksikäsitteisten ratkaisujen olemassaoloon. Jälkimmäisen tapauksen ratkaisussa voidaan lisäksi luonnollisesti kirjoittaa
jotta se saadaan yhdenmukaiseksi ensimmäisen tapauksen ratkaisun kanssa. Tämän esityksen mukainen ratkaisu luvuille \(w\), \(y\), \(x\) ja \(z\) on siis aina olemassa, kun \(ad - bc \not= 0\), ja tällöin matriisi
on matriisin \(A\) käänteismatriisi. \(\square\)
Esimerkki.
- Olkoon :math:`A = begin{bmatrix}
2 & 4 \ 1 & 3 end{bmatrix}` ja \(\mathbf{b}= \begin{bmatrix} -1 \\ 2 \end{bmatrix}\). Etsi \(A^{-1}\) ja ratkaise yhtälö
\(A\mathbf{x}= \mathbf{b}\).
Ratkaise yhtälöryhmä \(\begin{cases} 2x_1 + x_2 = 2 \\ x_1 - x_2 = 1\end{cases}\) käänteismatriisin avulla.
Koska \(2 \cdot 3 - 4 \cdot 1 = 2 \not= 0\), matriisi \(A\) on kääntyvä ja
\[\begin{split}A^{-1} = \frac{1}{2} \begin{bmatrix} 3 & -4 \\ -1 & 2 \end{bmatrix} = \begin{bmatrix} \frac{3}{2} & -2 \\ -\frac{1}{2} & 1 \end{bmatrix}.\end{split}\]Koska matriisi \(A\) on kääntyvä, yhtälöllä \(A\mathbf{x}= \mathbf{b}\) on yksikäsitteinen ratkaisu
\[\begin{split}\mathbf{x}= A^{-1}\mathbf{b}= \frac{1}{2} \begin{bmatrix} 3 & -4 \\ -1 & 2 \end{bmatrix} \begin{bmatrix} -1 \\ 2 \end{bmatrix} = \begin{bmatrix} -\frac{11}{2} \\ \frac{5}{2} \end{bmatrix}.\end{split}\]Yhtälöryhmä voidaan kirjoittaa matriisiyhtälönä
\[\begin{split}\begin{bmatrix} 2 & 1 \\ 1 & -1 \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \end{bmatrix} = \begin{bmatrix} 2 \\ 1 \end{bmatrix}.\end{split}\]Koska \(2 \cdot (-1) - 1 \cdot 1 = -3 \not= 0\), kerroinmatriisi on kääntyvä ja yhtälöryhmällä on yksikäsitteinen ratkaisu
\[\begin{split}\begin{bmatrix} x_1 \\ x_2 \end{bmatrix} = -\frac{1}{3} \begin{bmatrix} -1 & -1 \\ -1 & 2 \end{bmatrix} \begin{bmatrix} 2 \\ 1 \end{bmatrix} = \begin{bmatrix} 1 \\ 0 \end{bmatrix}.\end{split}\]
Alkeismatriisit¶
Yhtälöryhmää \(A\mathbf{x}=\mathbf{b}\) ratkaistaessa viedään kokonaismatriisi \([A\mid\mathbf{b}]\) redusoituun riviporrasmuotoon rivimuunnosten (rivien vaihto ja skaalaus, sekä lisääminen vakiolla kerrottuna) avulla. Tähän prosessiin liittyvä teoria voidaan esittää myös alkeismatriisien ja matriisitulon avulla.
Esimerkki.
Eräitä \(3\times 3\)-alkeismatriiseja ovat
Seuraavan varsin ilmeisen tuloksen todistus on merkinnöiltään tekninen, ja siksi sivuutetaan.
Lause.
Olkoon \(E\) rivimuunnokseen \(Q\) liittyvä \(n \times n\)-alkeismatriisi. Tällöin
aina, kun \(A\) on \(n \times r\)-matriisi.
Matriisiin \(A\) saadaan siis sovellettua rivimuunnos \(Q\) kertomalla se vasemmalta sopivalla alkeismatriisilla \(E\). Koska rivimuunnokset ovat kääntyviä, saadaan seuraava tulos.
Lause.
Olkoon \(E\) rivimuunnokseen \(Q\) liittyvä \(n \times n\)-alkeismatriisi. Tällöin \(E\) on kääntyvä ja \(E^{-1}\) on rivimuunnokseen \(Q^{-1}\) liittyvä alkeismatriisi.
Oletetaan, että rivimuunnokseen \(Q^{-1}\) liittyy alkeismatriisi \(F\) ja sovelletaan muunnoksia \(Q\) ja \(Q^{-1}\) yksikkömatriisiin \(I_n\).
Toisaalta tuloksen on oltava alkuperäinen matriisi, joten \(FE = I_n\). Vastaavasti soveltamalla muunnoksia käänteisessä järjestyksessä päätellään, että \(EF = I_n\), joten matriisi \(E\) on kääntyvä ja \(F = E^{-1}\).
Varsinainen lause on jo todistettu, mutta kirjoitetaan vielä ylös eri rivimuunnoksiin liittyvien alkeismatriisien käänteismatriisit.
Perustelut jätetään harjoitustehtäväksi. \(\square\)
Alkeismatriisien avulla voidaan myös ilmaista riittäviä ja välttämättömiä ehtoja neliömatriisin kääntyvyydelle. Seuraavan kääntyvien matriisien peruslauseen tärkeyttä on vaikea korostaa liikaa.
Lause.
Olkoon \(A\) \(n \times n\)-neliömatriisi. Tällöin seuraavat väitteet ovat yhtäpitäviä.
- \(A\) on kääntyvä.
- Yhtälöllä \(A\mathbf{x}= \mathbf{b}\) on yksikäsitteinen ratkaisu aina, kun \(\mathbf{b}\) on avaruuden \(\mathbb R^n\) vektori.
- Yhtälöllä \(A\mathbf{x}= \mathbf{0}\) on ainoastaan triviaaliratkaisu.
- Matriisin \(A\) redusoitu riviporrasmuoto on \(I_n\).
- \(A\) on alkeismatriisien tulo.
Tämän muotoisen lauseen todistamiseksi riittää osoittaa, että kohdasta 1 seuraa kohta 2, kohdasta 2 kohta 3, ja niin edelleen. Lopuksi todistetaan, että viimeisestä kohdasta seuraa ensimmäinen. Seuraavassa numerointi viittaa osatodistuksen oletuksena olevaan väitteeseen.
Aiempi lause käsittelee tämän kohdan.
Oletetaan, että yhtälöllä \(A\mathbf{x}= \mathbf{b}\) on yksikäsitteinen ratkaisu aina, kun \(\mathbf{b}\) on avaruuden \(\mathbb R^n\) vektori. Tällöin myös yhtälöllä \(A\mathbf{x}= \mathbf{0}\) on yksikäsitteinen ratkaisu. Mutta triviaaliratkaisu \(\mathbf{x}= \mathbf{0}\) on aina homogeenisen lineaarisen yhtälöryhmän ratkaisu, joten nyt se on ainoa ratkaisu.
Oletetaan, että yhtälöllä \(A\mathbf{x}= \mathbf{0}\) on vain triviaaliratkaisu. Yksikäsitteinen ratkaisu syntyy vain silloin, kun yhtälöryhmässä ei ole vapaita muuttujia, ja tällöin matriisin \(\operatorname{rref}[A\mid\mathbf{0}]\) jokaisessa sarakkeessa on johtava ykkönen. On siis oltava \(\operatorname{rref}(A) = I_n\).
Oletetaan, että \(\operatorname{rref}(A) = I_n\). Tällöin on löydyttävä rivimuunnokset \(Q_1, Q_2, \ldots, Q_k\) ja niitä vastaavat alkeismatriisit \(E_1, E_2, \ldots, E_k\), joille
\[A \xrightarrow{Q_1, Q_2, \ldots, Q_k} E_k \cdots E_2E_1A = \operatorname{rref}(A) = I_n.\]Alkeismatriisit ovat kääntyviä ja niiden käänteismatriisit ovat alkeismatriiseja, joten
\[A = (E_k \cdots E_2E_1)^{-1}I_n = E_1^{-1}E_2^{-1} \cdots E_k^{-1},\]alkeismatriisien tulo.
Oletetaan, että \(A = E_1E_2 \cdots E_l\), missä \(E_1, E_2, \ldots, E_l\) ovat alkeismatriiseja. Tällöin \(A\) on kääntyvien matriisien tulona kääntyvä.
\(\square\)
Kääntyvien matriisien peruslauseen todistuksen välitön sovellus on neliömatriisin \(A\) kääntyvyyden tutkiminen ja käänteismatriisin selvittäminen Gaussin eliminoinnilla.
Seuraus.
Olkoon \(A\) \(n \times n\)-neliömatriisi. Jos
niin matriisi \(A\) on kääntyvä ja
Oletuksista seuraa, että \(\operatorname{rref}(A) = I_n\), joten kääntyvien matriisien peruslauseen nojalla \(A\) on kääntyvä. Jos rivimuunnoksia \(Q_1, Q_2, \ldots, Q_k\) vastaavat alkeismatriisit ovat \(E_1, E_2, \ldots, E_k\), niin \((E_k \cdots E_2E_1)A = I_n\), eli
ja väite on todistettu. \(\square\)
Huomautus.
Neliömatriisi on siis kääntyvä täsmälleen silloin, kun se voidaan muuntaa Gaussin eliminoinnilla yksikkömatriisiksi.
Jos siis \(A\) on \(n \times n\)-neliömatriisi, sen kääntyvyyttä voidaan tutkia seuraavasti Gaussin eliminoinnilla.
- Kirjoita kokonaismatriisi \([A\mid I_n]\).
- Sovella Gaussin eliminointia matriisiin \([A\mid I_n]\) viedäksesi matriisin \(A\) redusoituun riviporrasmuotoon.
- Jos \(\operatorname{rref}(A) = I_n\), niin kokonaismatriisi on muodossa \([I_n\mid A^{-1}]\). Muuten käänteismatriisia ei ole.
Huomautus.
Vertaa edellä esitettyä kokonaismatriisimenetelmää tapaan, jolla etsittiin \(2 \times 2\)-matriisin käänteismatriisi.
Esimerkki.
Etsi matriisin \(A=\begin{bmatrix} 2 & 0 &1\\ 0 & 1 &0\\ 1 & 0 & 2 \end{bmatrix}\) käänteismatriisi.
Sovelletaan Gaussin eliminointia kokonaismatriisiin \([A\mid I_3]\).
Koska \(\operatorname{rref}(A) = I_3\), käänteismatriisi \(A^{-1}=\begin{bmatrix} \frac{2}{3} & 0 & -\frac{1}{3}\\ 0 & 1 & 0\\ -\frac{1}{3} & 0 & \frac{2}{3} \end{bmatrix}\) on olemassa.
Esimerkki.
Tutki matriisien \(A = \begin{bmatrix} 2 & -2 & 4 \\ 2 & 3 & -1 \\ 3 & 1 & 2 \end{bmatrix}\) ja \(B = \begin{bmatrix} 1 & -2 & -1 \\ 2 & 3 & 0 \\ 4 & 0 & -2 \end{bmatrix}\) kääntyvyyttä.
Sovelletaan Gaussin eliminointia kokonaismatriisiin \([A\mid I_3]\).
Koska matriisin \(A\) puolelle syntyi nollarivi, matriisi \(A\) ei voi olla riviekvivalentti yksikkömatriisin \(I_3\) kanssa. Tämän vuoksi \(A\) on singulaarinen. Sovelletaan sitten Gaussin eliminointia kokonaismatriisiin \([B\mid I_3]\).
Koska matriisin \(B\) paikalle syntyy yksikkömatriisi \(I_3\), niin käänteismatriisi on olemassa ja
Esimerkki.
Osoita, että jos kääntyvän matriisin \(A\) käänteismatriisi \(A^{-1}\) on symmetrinen, niin myös \(A\) on symmetrinen.
Oletetaan, että \(A\) on kääntyvä \(n \times n\)-neliömatriisi ja että \(A^{-1} = (A^{-1})^T\), eli käänteismatriisi on symmetrinen. Tällöin käänteismatriisin ominaisuuksien nojalla
eli myös matriisi \(A\) on symmetrinen. \(\square\)