"

Lineaarinen yhtälöryhmä ja kokonaismatriisi

Määritelmä.

Muuttujien \(x_1, x_2, \ldots, x_n\) lineaarinen yhtälö on muotoa

\[a_1x_1+a_2x_2+\cdots + a_nx_n=b,\]

missä kertoimet \(a_1, \ldots, a_n\) ja termi \(b\) ovat vakioita.

Lineaarisen yhtälön \(a_1x_1+a_2x_2+ \cdots + a_nx_n=b\) ratkaisulla tarkoitetaan kokoelmaa reaalilukuja \(s_1,s_2,\ldots,s_n\), joille

\[a_1s_1 + a_2s_2 + \cdots + a_ns_n = b.\]

Tässä on tehty sijoitus \(x_1 = s_1, x_2 = s_2, \ldots, x_n = s_n\), joka merkitään usein myös monikkojen avulla muodossa

\[(x_1, x_2, \ldots, x_n) = (s_1, s_2, \ldots, s_n).\]

Lineaarinen yhtälöryhmä on äärellinen kokoelma samojen muuttujien lineaarisia yhtälöitä. Yleisesti tällainen on muotoa

\[\begin{split}\begin{cases} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n = b_1\\ a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n = b_2\\ \phantom{a_{31}x_1 + a_{32}x_2 +}\vdots \\ a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n = b_m. \end{cases}\end{split}\]

Lineaarisen yhtälöryhmän ratkaisulla tarkoitetaan sellaisia lukuja \(s_1, s_2, \ldots, s_n\), jotka toteuttavat sijoituksella

\[(x_1, x_2, \ldots, x_n) = (s_1, s_2, \ldots, s_n)\]

jokaisen ryhmän yhtälöistä. Ratkaisuja voi hyvin olla useampia, jolloin kaikkien ratkaisujen muodostamaa joukkoa kutsutaan ratkaisujoukoksi.

Reaalikertoimisella lineaarisella yhtälöryhmällä on joko

  1. yksikäsitteinen ratkaisu,
  2. ääretön määrä ratkaisuja,
  3. ei yhtään ratkaisua.

Kahdessa ensimmäisessä tapauksessa yhtälöryhmää sanotaan ratkeavaksi ja viimeisessä ristiriitaiseksi. Tämän väitteen täsmällinen todistaminen onnistuu vasta, kun käytössä on riittävä määrä työkaluja.

Esimerkki.

Lineaarisen yhtälön \(2x + y = 1\) ratkaisuja ovat muun muassa \((x, y) = (0, 1)\) ja \((x, y) = (4, -7)\). Yhtälön yleinen ratkaisu löydetään parametrisoinnin avulla. Olkoon \(x = t\), jolloin sitä vastaava yhtälön toteuttava muuttujan \(y\) arvo on \(1 - 2t\). Toisin sanoen \((x, y) = (t, 1 - 2t)\) on yhtälön ratkaisu aina, kun \(t\) on reaaliluku. Tutki, millä parametrin \(t\) arvoilla päädyttäisiin edellä esitettyihin ratkaisuihin.

Yhtälöryhmän (yhtälöparin)

\[\begin{split}\begin{cases} 2x + y = 1 \\ x - 3y = 3 \end{cases}\end{split}\]

yksittäisten yhtälöiden yleiset ratkaisut ovat \((x, y) = (t, 1 - 2t)\) ja \((x, y) = \left(s, \frac{1}{3}s - 1\right)\), missä \(s\) ja \(t\) ovat reaalilukuja. Jotta nyt molemmat yhtälöt toteutuisivat samanaikaisesti, on oltava \(t = s\) ja \(1 - 2t = \frac{1}{3}s - 1\). Sijoittamalla ensimmäinen jälkimmäiseen saadaan

\[1 - 2s = \frac{1}{3}s - 1 \Leftrightarrow \frac{7}{3}s = 2,\]

eli \(s = \frac{6}{7} = t\). Tällöin molempien yhtälöiden ratkaisuksi tulee \((x, y) = \left(\frac{6}{7}, -\frac{5}{7}\right)\), eli se on koko yhtälöryhmän ratkaisu. Muita ratkaisuja ei ole. Pohdi, montako ratkaisua yhtälöryhmillä

\[\begin{split}\begin{cases} 2x + y = 1 \\ 4x + 2y = 2 \end{cases} \qquad\text{ja}\qquad \begin{cases} 2x + y = 1 \\ 2x + y = 2 \end{cases}\end{split}\]

on ja perustele miksi.

Kahta lineaarista yhtälöryhmää kutsutaan ekvivalenteiksi, jos niillä on sama ratkaisujoukko. Lineaarisen yhtälöryhmän ratkaisua etsittäessä voidaan yhtälöryhmälle tehdä seuraavia operaatioita.

  1. Kahden yhtälön paikat vaihdetaan.
  2. Yksi yhtälö kerrotaan puolittain nollasta poikkeavalla vakiolla.
  3. Yhteen yhtälöön lisätään vakiolla kerrottu toinen yhtälö.

Näitä toimenpiteitä kutsutaan myös rivimuunnoksiksi.

Lause.

Rivimuunnokset eivät muuta yhtälöryhmän ratkaisua.

Todistus.

Kaksi ensimmäistä ovat varsin selviä, sillä järjestystä vaihtaessa yhtälöiden kokoelma pysyy samana, ja yksittäisen yhtälön ratkaisut säilyvät vakiolla kerrottaessa. Tutkitaan kohtaa 3 tarkemmin. Oletetaan, että \(s_1, s_2, \ldots, s_n\) on yhtälöryhmän ratkaisu, jolloin se on myös yksi yhtälöiden

\[\begin{split}\begin{aligned} a_{11}x_1+a_{12}x_2+ \cdots + a_{1n}x_n&=b_1\\ a_{21}x_1+a_{22}x_2+ \cdots + a_{2n}x_n&=b_2\end{aligned}\end{split}\]

yhteisistä ratkaisuista. Kerrotaan ylempää yhtälöä vakiolla \(c \not= 0\) ja lisätään alempaan.

\[\begin{aligned} (a_{21}x_1+a_{22}x_2+ \cdots + a_{2n}x_n)+c(a_{11}x_1+a_{12}x_2+ \cdots + a_{1n}x_n)&=b_2+cb_1\end{aligned}\]

Mutta koska \(s_1, s_2, \ldots, s_n\) on alkuperäisten yhtälöiden ratkaisu, niin sijoituksen jälkeen sulkulausekkeiden arvoiksi täytyy tulla \(b_2\) ja \(b_1\). Näin \(s_1, s_2, \ldots, s_n\) toteuttavat myös tämän yhtälön, ja yhtälöryhmän ratkaisujoukko ei ole muuttunut. \(\square\)

Esimerkki.

Ratkaistaan edellisen esimerkin yhtälöryhmät rivimuunnosten avulla. Ideana on siis muuntaa yhtälöryhmä toiseksi, ekvivalentiksi systeemiksi, josta ratkaisu on helpommin luettavissa. Ensimmäiselle ryhmälle voidaan kirjoittaa esimerkiksi

\[\begin{split}\begin{cases} 2x + y = 1 \\ x - 3y = 3 \end{cases} \xrightarrow{R_1 - 2R_2} \begin{cases} 7y = -5 \\ x - 3y = 3 \end{cases} \xrightarrow{\frac{1}{7}R_1} \begin{cases} y = -\frac{5}{7} \\ x - 3y = 3 \end{cases} \xrightarrow{R_2 + 3R_1} \begin{cases} y = -\frac{5}{7} \\ x = \frac{6}{7}, \end{cases}\end{split}\]

mistä yksikäsitteinen ratkaisu on helppo nähdä. Toiselle yhtälöryhmälle voidaan kirjoittaa

\[\begin{split}\begin{cases} 2x + y = 1 \\ 4x + 2y = 2 \end{cases} \xrightarrow{R_2 - 2R_1} \begin{cases} 2x + y = 1 \\ 0 = 0, \end{cases}\end{split}\]

missä yhtälö \(0 = 0\) toteutuu millä tahansa tuntemattomien \(x\) ja \(y\) arvoilla. Tämä yhtälö ei siis rajoita ryhmän ratkaisua millään tavalla, ja yhtälöryhmän ratkaisu on ensimmäisen yhtälön yleinen ratkaisu \((x, y) = (t, 1 - 2t)\), missä \(t\) on reaalilukuparametri. Koska parametri \(t\) voidaan valita äärettömän monella tavalla, myös ratkaisuja on äärettömän monta. Viimeiselle yhtälöryhmälle on voimassa

\[\begin{split}\begin{cases} 2x + y = 1 \\ 2x + y = 2 \end{cases} \xrightarrow{R_2 - R_1} \begin{cases} 2x + y = 1 \\ 0 = 1, \end{cases}\end{split}\]

missä yhtälö \(0 = 1\) ei toteudu koskaan. Yhtälöryhmällä ei siis ole ratkaisuja.

Tarkastellaan lineaarista yhtälöryhmää, jossa on \(n\) tuntematonta ja \(m\) yhtälöä.

\[\begin{split}\begin{cases} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n = b_1\\ a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n = b_2\\ \phantom{a_{31}x_1 + a_{32}x_2 +}\vdots \\ a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n = b_m. \end{cases}\end{split}\]

Kaikki oleellinen informaatio yhtälöryhmästä sisältyy vakioihin \(a_{ij}\) ja \(b_j\), ja tämän vuoksi yksinkertaistetaan edellä olevaa suhteellisen raskasta merkintää seuraavasti. Tuntemattomien \(x_i\) kertoimet \(a_{ij}\) kerätään kerroinmatriisiksi \(A\), tuntemattomat muuttujavektoriksi \(\mathbf{x}\) ja yhtälöiden oikealla puolella olevat vakiot \(b_j\) vakiotermivektoriksi \(\mathbf{b}\).

\[\begin{split}A = \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{bmatrix}, \qquad \mathbf{x}= \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix}, \qquad \mathbf{b}= \begin{bmatrix} b_1 \\ b_2 \\ \vdots \\ b_m \end{bmatrix}\end{split}\]

Tässä matriisin käsite on vielä määrittelemättä, joten korjataan asia.

Määritelmä.

Matriisi on suorakaiteen muotoinen taulukko \(A\), jonka rivin \(i\) ja sarakkeen \(j\) alkiota merkitään \(a_{ij}\). Matriisi \(A\) kirjoitetaan

\[\begin{split}A = \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{bmatrix},\end{split}\]

kun siinä on \(m\) riviä ja \(n\) saraketta. Tällaisen matriisin koko on \(m \times n\), ja kaikki tämän kokoiset reaalialkioiset matriisit muodostavat avaruuden \(\mathbb R^{m \times n}\).

Matriisi voidaan esittää alkioittain myös kirjoittamalla \(A = [a_{ij}]_{m \times n}\) tai \(A = [a_{ij}]\). Toinen kätevä tapa on tulkita matriisi vierekkäin asetetuiksi pystyvektoreiksi \(\mathbf{a}_1, \mathbf{a}_2, \ldots, \mathbf{a}_n\) avaruudesta \(\mathbb R^m\), jolloin

\[A=\begin{bmatrix}\mathbf{a}_1 & \mathbf{a}_2 & \cdots & \mathbf{a}_n\end{bmatrix}.\]

Vain yhden pystyvektorin tapauksessa samastetaan matriisi \([\mathbf{a}_1]\) ja vektori \(\mathbf{a}_1\), eli jokainen avaruuden \(\mathbb R^n\) vektori on \(n \times 1\)-matriisi. Vastaavasti avaruuden \(\mathbb R^1\) vektori \([a]\) samastetaan sekä \(1 \times 1\)-matriisin \([a]\), että reaaliluvun \(a\) kanssa.

Yhdistämällä \(n\) tuntemattoman ja \(m\) yhtälön ryhmän kerroinmatriisi \(A\) ja vakiotermivektori \(\mathbf{b}\) saadaan koko yhtälöryhmää kuvaava kokonaismatriisi

\[\begin{split}[A\mid\mathbf{b}] = \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} & b_1 \\ a_{21} & a_{22} & \cdots & a_{2n} & b_2 \\ \vdots & \vdots & \ddots & \vdots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} & b_m \end{bmatrix}.\end{split}\]

Kyseessä on siis \(m \times (n + 1)\)-matriisi, ja se tarjoaa tehokkaan tavan merkitä yhtälöryhmää. Kokonaismatriisin symbolissa \([A \mid \mathbf{b}]\) käytetään pystyviivaa muistuttamaan siitä, että se koostuu kahdesta erillisestä osasta. Joskus sama viiva piirretään myös ennen alkioittain kirjoitetun kokonaismatriisin viimeistä saraketta.

Myös muunlaisille matriiseille annetaan erityisnimityksiä. Neliömatriisi on nimensä mukaisesti neliön muotoinen, eli sen koko on \(n \times n\) jollakin positiivisella kokonaisluvulla \(n\). Diagonaalimatriisi on neliömatriisi \(D\), jonka diagonaalin ulkopuoliset alkiot ovat nollia.

\[\begin{split}D = \begin{bmatrix} d_1 & 0 & \cdots & 0 \\ 0 & d_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & d_n \end{bmatrix} = \begin{bmatrix} d_1 &&& \\ & d_2 && \\ && \ddots & \\ &&& d_n \end{bmatrix} = \operatorname{diag}(d_1, d_2, \ldots, d_n)\end{split}\]

Matriisin \(A = [a_{ij}]\) diagonaali muodostuu diagonaalialkioista \(a_{ii}\), jotka ovat yhtä kaukana ensimmäisestä rivistä ja sarakkeesta. Mukavuussyistä matriisin nolla-alkiot jätetään usein kirjoittamatta silloin, kun niitä esiintyy paljon lähekkäin.

Yksikkömatriisi eli identiteettimatriisi \(I_n\) on \(n \times n\)-diagonaalimatriisin erikoistapaus, jossa kaikki diagonaalialkiot ovat ykkösiä. Yksikkömatriisia merkitään

\[\begin{split}I_n = \begin{bmatrix} 1 & & & \\ & 1 & & \\ & & \ddots & \\ & & & 1 \end{bmatrix} = \begin{bmatrix} \mathbf{e}_1 & \mathbf{e}_2 & \cdots & \mathbf{e}_n \end{bmatrix} = [\delta_{ij}]_n,\end{split}\]

missä \(\mathbf{e}_1, \mathbf{e}_2, \ldots, \mathbf{e}_n\) ovat luonnollisen kannan vektorit ja \(\delta_{ij}\) on Kroneckerin delta. Nollamatriisi on matriisi \(O = [0]_{m \times n}\), eli minkä tahansa kokoinen matriisi, jonka kaikki alkiot ovat nollia.