"

Matriisialgebraa

Ryhdytään sitten tarkastelemaan edellä määriteltyjen matriisien summan, skalaarilla kertomisen, tulon ja transpoosin omainaisuuksia.

Lause.

Olkoot \(A\), \(B\) ja \(C\) samankokoisia matriiseja, sekä \(r\) ja \(s\) reaalilukuja. Tällöin

  1. \(rA+sA=(r+s)A\) (osittelulaki matriisille)
  2. \(rA+rB=r(A+B)\) (osittelulaki skalaarille)
  3. \(r(sA)=(rs)A\) (skalaarin siirto)
  4. \(A+B=B+A\), (summan vaihdannaisuus)
  5. \((A+B)+C=A+(B+C)\) (summan liitännäisyys)
  6. \(A+O=A\) (summan neutraalialkio)
  7. \(A+(-A)=O\) (summan vasta-alkio)
  8. \(1A=A\) (skalaarilla kertomisen neutraalialkio)
  9. \(0A=O\) (nollalla kertominen).
Todistus.
Kaikki kohdat seuraavat suoraan määritelmistä. Vertaa vektorien summan ja skalaarilla kertomisen vastaaviin ominaisuuksiin. \(\square\)

Lause.

Olkoot \(A\), \(B\) ja \(C\) matriiseja, joiden koot sallivat seuraavat operaatiot, sekä \(r\) reaaliluku. Tällöin

  1. \(A(BC)=(AB)C\) (matriisitulon liitännäisyys)
  2. \(A(B+C)=AB+AC\) (osittelulaki summan suhteen)
  3. \((A+B)C=AC+BC\) (osittelulaki summan suhteen)
  4. \(r(AB)=(rA)B=A(rB)\) (skalaarin siirto)
  5. \(I_mA=A=AI_n\), jos \(A\) on \(m \times n\)-matriisi (matriisitulon neutraalialkio)
  6. \(OA = O = AO\) (nollalla kertominen).
Todistus.

Todistetaan esimerkiksi kohta 3. Olkoot

\[\begin{split}A = \begin{bmatrix} \mathbf{a}_1^T \\ \mathbf{a}_2^T \\ \vdots \\ \mathbf{a}_m^T \end{bmatrix}\qquad\text{ja}\qquad B = \begin{bmatrix} \mathbf{b}_1^T \\ \mathbf{b}_2^T \\ \vdots \\ \mathbf{b}_m^T \end{bmatrix}\end{split}\]

\(m \times n\)-matriiseja, sekä

\[C = \begin{bmatrix} \mathbf{c}_1 & \mathbf{c}_2 & \cdots & \mathbf{c}_r \end{bmatrix}\]

\(n \times r\) matriisi. Matriisitulon määritelmästä saadaan, että

\[\begin{split}\begin{aligned} (A + B)C &= \begin{bmatrix} (A + B)\mathbf{c}_1 & (A + B)\mathbf{c}_2 & \cdots & (A + B)\mathbf{c}_r \end{bmatrix} \\ &= \begin{bmatrix} (\mathbf{a}_1 + \mathbf{b}_1) \cdot \mathbf{c}_1 & (\mathbf{a}_1 + \mathbf{b}_1) \cdot \mathbf{c}_2 & \cdots & (\mathbf{a}_1 + \mathbf{b}_1) \cdot \mathbf{c}_r \\ (\mathbf{a}_2 + \mathbf{b}_2) \cdot \mathbf{c}_1 & (\mathbf{a}_2 + \mathbf{b}_2) \cdot \mathbf{c}_2 & \cdots & (\mathbf{a}_2 + \mathbf{b}_2) \cdot \mathbf{c}_r \\ \vdots & \vdots & \ddots & \vdots \\ (\mathbf{a}_m + \mathbf{b}_m) \cdot \mathbf{c}_1 & (\mathbf{a}_m + \mathbf{b}_m) \cdot \mathbf{c}_2 & \cdots & (\mathbf{a}_m + \mathbf{b}_m) \cdot \mathbf{c}_r \end{bmatrix}.\end{aligned}\end{split}\]

Nyt vektorien pistetulon osittelulain nojalla

\[\begin{split}\begin{aligned} (A + B)C &= \begin{bmatrix} \mathbf{a}_1 \cdot \mathbf{c}_1 & \mathbf{a}_1 \cdot \mathbf{c}_2 & \cdots & \mathbf{a}_1 \cdot \mathbf{c}_r \\ \mathbf{a}_2 \cdot \mathbf{c}_1 & \mathbf{a}_2 \cdot \mathbf{c}_2 & \cdots & \mathbf{a}_2 \cdot \mathbf{c}_r \\ \vdots & \vdots & \ddots & \vdots \\ \mathbf{a}_m \cdot \mathbf{c}_1 & \mathbf{a}_m \cdot \mathbf{c}_2 & \cdots & \mathbf{a}_m \cdot \mathbf{c}_r \end{bmatrix} + \begin{bmatrix} \mathbf{b}_1 \cdot \mathbf{c}_1 & \mathbf{b}_1 \cdot \mathbf{c}_2 & \cdots & \mathbf{b}_1 \cdot \mathbf{c}_r \\ \mathbf{b}_2 \cdot \mathbf{c}_1 & \mathbf{b}_2 \cdot \mathbf{c}_2 & \cdots & \mathbf{b}_2 \cdot \mathbf{c}_r \\ \vdots & \vdots & \ddots & \vdots \\ \mathbf{b}_m \cdot \mathbf{c}_1 & \mathbf{b}_m \cdot \mathbf{c}_2 & \cdots & \mathbf{b}_m \cdot \mathbf{c}_r \end{bmatrix} \\ &= AC + BC.\end{aligned}\end{split}\]

Loput jätetään harjoitustehtäväksi. Kaikki kohdat seuraavat kyllä suoraan määritelmistä ja aiemmin esitellyistä laskusäännöistä, vaikka todistukset saattavatkin näyttää monimutkaisilta. \(\square\)

Huomautus.

Matriisien algebralliset ominaisuudet motivoivat lineaarikuvauksen määritelmän. Funktio \(L\), joka ottaa syötteenään avaruuden \(\mathbb R^n\) vektorin ja tuottaa avaruuden \(\mathbb R^m\) vektorin on lineaarikuvaus, jos

\[L(\alpha\mathbf{x}+\beta\mathbf{y})=\alpha L(\mathbf{x})+\beta L(\mathbf{y})\]

aina, kun \(\mathbf{x}\) ja \(\mathbf{y}\) ovat avaruuden \(\mathbb R^n\) vektoreita, sekä \(\alpha\) ja \(\beta\) reaalilukuja. Matriisin \(A\) avulla määritelty kuvaus \(L(\mathbf{x})=A\mathbf{x}\) on lineaarikuvaus edellä esiteltyjen laskusääntöjen nojalla. Lisäksi voidaan osoittaa, että jokaiselle tietyt ehdot toteuttavalle lineaarikuvaukselle on tämän kaltainen matriisiesitys.

Hieman monimutkaisempi esimerkki avaruuden \(\mathbb R^3\) lineaarikuvauksesta on ristitulo vakiovektorin \(\mathbf{a}= (a_1, a_2, a_3)\) kanssa, jolle saadaan matriisiesitys

\[\begin{split}L_{\mathbf{a}}(\mathbf{x}) = \mathbf{x}\times \mathbf{a}= \begin{bmatrix} 0 & a_3 & -a_2 \\ -a_3 & 0 & a_1 \\ a_2 & -a_1 & 0 \end{bmatrix}\mathbf{x}.\end{split}\]

Esimerkki vektoreille toimivasta funktiosta, joka ei ole lineaarikuvaus, on \(L(\mathbf{x}) = \|\mathbf{x}\|\).

Toisin kuin reaaliluvuilta ja monilta muilta matemaattisilta olioilta, matriiseilta puuttuu tulon vaihdannaisuuden ominaisuus. Tämän vuoksi samankokoisten neliömatriisien \(A\) ja \(B\) tulon algebrallisten ominaisuuksien tutkimisessa käytetään joskus kommutaattoria

\[[A, B] = AB - BA.\]

Jos matriisien \(A\) ja \(B\) tulo sattuu toteuttamaan vaihdannaisuusehdon \(AB = BA\), kommutaattorin arvoksi tulee nollamatriisi \(O\). Muuten \([A, B] \not= O\). Kommutaattorilla on tärkeitä sovelluksia ainakin geometriassa ja kvanttimekaniikassa.

Lause.

Olkoot \(A\), \(B\) ja \(C\) samankokoisia neliömatriiseja, sekä \(a\), \(b\) ja \(c\) reaalilukuja. Tällöin

  1. \([aA + bB, C] = a[A, C] + b[B, C]\) ja \([A, bB + cC] = b[A, B] + c[A, C]\),
  2. \([A, B] = -[B, A]\) (vinosymmetrisyys),
  3. \([[A, B], C] + [[C, A], B] + [[B, C], A] = O\) (Jacobin identiteetti).
Todistus.
Jätetään harjoitustehtäväksi. Kaikki kohdat seuraavat määritelmästä. \(\square\)

Lause.

Olkoot \(A\) ja \(B\) matriiseja, joiden koot sallivat seuraavat operaatiot ja \(\alpha\in\mathbb{R}\). Tällöin

  1. \((A^T)^T=A\),
  2. \((A+B)^T=A^T+B^T\),
  3. \((\alpha A)^T=\alpha(A^T)\),
  4. \((AB)^T=B^TA^T\),
  5. \((A^k)^T=(A^T)^k\), kun \(k\) on ei-negatiivinen kokonaisluku.
Todistus.

Todistetaan esimerkkeinä kohdat 1 ja 4. Ensimmäistä varten todetaan yksinkertaisesti, että matriisin \((A^T)^T\) jokainen sarake \(j\) on matriisin \(A^T\) rivi \(j\), eli matriisin \(A\) sarake \(j\). Kohtaa 4 varten merkitään

\[\begin{split}A = \begin{bmatrix} \mathbf{a}_1^T \\ \mathbf{a}_2^T \\ \vdots \\ \mathbf{a}_m^T \end{bmatrix}\qquad\text{ja}\qquad B = \begin{bmatrix} \mathbf{b}_1 & \mathbf{b}_2 & \cdots & \mathbf{b}_r \end{bmatrix},\end{split}\]

missä matriisin \(A\) koko on \(m \times n\) ja matriisin \(B\) koko \(n \times r\). Tällöin

\[\begin{split}(AB)^T = \begin{bmatrix} \mathbf{a}_1^T\mathbf{b}_1 & \mathbf{a}_1^T\mathbf{b}_2 & \cdots & \mathbf{a}_1^T\mathbf{b}_r \\ \mathbf{a}_2^T\mathbf{b}_1 & \mathbf{a}_2^T\mathbf{b}_2 & \cdots & \mathbf{a}_2^T\mathbf{b}_r \\ \vdots & \vdots & \ddots & \vdots \\ \mathbf{a}_m^T\mathbf{b}_1 & \mathbf{a}_m^T\mathbf{b}_2 & \cdots & \mathbf{a}_m^T\mathbf{b}_r \end{bmatrix}^T = \begin{bmatrix} \mathbf{a}_1^T\mathbf{b}_1 & \mathbf{a}_2^T\mathbf{b}_1 & \cdots & \mathbf{a}_m^T\mathbf{b}_1 \\ \mathbf{a}_1^T\mathbf{b}_2 & \mathbf{a}_2^T\mathbf{b}_2 & \cdots & \mathbf{a}_m^T\mathbf{b}_2 \\ \vdots & \vdots & \ddots & \vdots \\ \mathbf{a}_1^T\mathbf{b}_r & \mathbf{a}_2^T\mathbf{b}_r & \cdots & \mathbf{a}_m^T\mathbf{b}_r \end{bmatrix}.\end{split}\]

Aiemmin huomautettiin, että \(\mathbf{x}^T\mathbf{y}= \mathbf{y}^T\mathbf{x}\) kaikille avaruuden \(\mathbb R^n\) vektoreille \(\mathbf{x}\) ja \(\mathbf{y}\), joten

\[\begin{split}(AB)^T = \begin{bmatrix} \mathbf{b}_1^T\mathbf{a}_1 & \mathbf{b}_1^T\mathbf{a}_2 & \cdots & \mathbf{b}_1^T\mathbf{a}_m \\ \mathbf{b}_2^T\mathbf{a}_1 & \mathbf{b}_2^T\mathbf{a}_2 & \cdots & \mathbf{b}_2^T\mathbf{a}_m \\ \vdots & \vdots & \ddots & \vdots \\ \mathbf{b}_r^T\mathbf{a}_1 & \mathbf{b}_r^T\mathbf{a}_2 & \cdots & \mathbf{b}_r^T\mathbf{a}_m \end{bmatrix} = \begin{bmatrix} \mathbf{b}_1^T \\ \mathbf{b}_2^T \\ \vdots \\ \mathbf{b}_r^T \end{bmatrix} \begin{bmatrix} \mathbf{a}_1 & \mathbf{a}_2 & \cdots & \mathbf{a}_m \end{bmatrix} = B^TA^T.\end{split}\]

Tässä matriisien \(B^T\) ja \(A^T\) koot ovat \(r \times n\) ja \(n \times m\). Loput jätetään harjoitustehtäväksi. Kohdat 3 ja 5 voidaan muotoilla kohdan 4 seurauksina. \(\square\)

Lause.

Neliömatriisi \(A\) voidaan esittää symmetrisen matriisin \(S = \frac{1}{2}(A + A^T)\) ja vinosymmetrisen matriisin \(N = \frac{1}{2}(A - A^T)\) summana

\[A=S+N.\]
Todistus.

Oletetaan, että \(A\) on neliömatriisi. On osoitettava, että yllä määritelty matriisi \(S\) on symmetrinen ja \(N\) vinosymmetrinen, sekä että \(A\) on näiden summa. Tutkitaan määritelmän mukaisesti matriisien \(S\) ja \(N\) transpooseja.

\[\begin{split}\begin{aligned} S^T &= \left(\frac{1}{2}(A + A^T)\right)^T = \frac{1}{2}(A^T + (A^T)^T) = \frac{1}{2}(A^T + A) = \frac{1}{2}(A + A^T) = S \\ N^T &= \left(\frac{1}{2}(A - A^T)\right)^T = \frac{1}{2}(A^T - (A^T)^T) = \frac{1}{2}(A^T - A) = -\frac{1}{2}(A - A^T) = -N\end{aligned}\end{split}\]

Siis matriisi \(S\) on symmetrinen ja matriisi \(N\) vinosymmetrinen. Niiden summa on

\[S + N = \frac{1}{2}(A + A^T) + \frac{1}{2}(A - A^T) = \frac{1}{2}(A + A) + \frac{1}{2}(A^T - A^T) = A,\]

eli todistus on valmis. \(\square\)

Transpoosi liittyy kauniisti myös vektorien pistetuloon.

Lause.

Olkoon \(A\) \(m \times n\)-matriisi. Ehto

\[(A\mathbf{x})\cdot\mathbf{y}=\mathbf{x}\cdot(B\mathbf{y})\]

toteutuu kaikille avaruuksien \(\mathbb R^n\) ja \(\mathbb R^m\) vektoreille \(\mathbf{x}\) ja \(\mathbf{y}\) jos ja vain jos \(B=A^T\).

Todistus.

On siis osoitettava, että annettu ehto on voimassa vektorien \(\mathbf{x}\) ja \(\mathbf{y}\) valinnasta riippumatta jos ja vain jos \(B = A^T\). Osoitetaan väite kahdessa osassa.

  1. Jos \(B = A^T\), niin ehto toteutuu. Käytetään pistetulon tulkintaa matriisitulona, jolloin transpoosin laskusääntöjen nojalla

    \[(A\mathbf{x}) \cdot \mathbf{y}= (A\mathbf{x})^T\mathbf{y}= (\mathbf{x}^TA^T)\mathbf{y}= \mathbf{x}^T(A^T\mathbf{y}) = \mathbf{x}\cdot (A^T\mathbf{y}).\]

    Tässä vektorit \(\mathbf{x}\) ja \(\mathbf{y}\) ovat mielivaltaisia omissa avaruuksissaan.

  2. Jos ehto toteutuu, niin \(B = A^T\). Nyt siis \((A\mathbf{x}) \cdot \mathbf{y}= \mathbf{x}\cdot (B\mathbf{y})\), ja edellisen kohdan nojalla \((A\mathbf{x}) \cdot \mathbf{y}= \mathbf{x}\cdot (A^T\mathbf{y})\). Vähennetään nämä yhtälöt toisistaan ja tulkitaan pistetulo matriisitulona, jolloin

    \[0 = \mathbf{x}\cdot (B\mathbf{y}) - \mathbf{x}\cdot (A^T\mathbf{y}) = \mathbf{x}\cdot (B - A^T)\mathbf{y}= \mathbf{x}^T(B - A^T)\mathbf{y}.\]

    Tämä yhtälö toteutuu kaikilla sopivilla vektoreilla \(\mathbf{x}\) ja \(\mathbf{y}\), jolloin matriisin ja vektorin tuloa koskevan lemman nojalla on oltava

    \[\mathbf{x}^T(B - A^T) = \mathbf{0}^T.\]

    Transponoimalla puolittain ja soveltamalla samaa lemmaa uudelleen mielivaltaisella avaruuden \(\mathbb R^n\) vektorilla \(\mathbf{x}\) toteutuvaan yhtälöön

    \[(B^T - A)\mathbf{x}= \mathbf{0}\]

    päätellään, että \(B^T - A = O\). Täten \(B^T = A\), eli \(B = A^T\).

\(\square\)

Edellinen lause on esimerkki tuloksesta, joka on ekvivalentti, eli yhtäpitävä määritelmän kanssa. Matriisin \(A\) transpoosi voitaisiin yhtä hyvin määritellä sellaisena yksikäsitteisenä matriisina \(B\), joka toteuttaa tämän lauseen ehdon. Kyseessä olisi erilaisesta määritelmästä huolimatta täsmälleen sama transpoosi \(A^T\), kuin edellä määriteltiin.

Esimerkki.

Olkoot \(A\) ja \(B\) symmetrisiä \(n\times n\)-neliömatriiseja. Osoita, että \(AB=BA\) täsmälleen silloin, kun matriisi \(AB\) on symmetrinen.

Todistus.

Osoitetaan väite jälleen kahdessa osassa.

  1. Jos \(AB = BA\), niin \(AB\) on symmetrinen. Matriisit \(A\) ja \(B\) ovat symmetrisiä, eli \(A^T = A\) ja \(B^T = B\). Tällöin oletuksen nojalla matriisin \(AB\) transpoosi

    \[(AB)^T = B^TA^T = BA = AB,\]

    eli \(AB\) on symmetrinen.

  2. Jos \(AB\) on symmetrinen, niin \(AB = BA\). Koska \(AB\), \(A\) ja \(B\) ovat symmetrisiä,

    \[AB = (AB)^T = B^TA^T = BA.\]

    Siis \(AB = BA\).

\(\square\)