\[\newcommand{\N}{\mathbb N} \newcommand{\Z}{\mathbb Z} \newcommand{\Q}{\mathbb Q} \newcommand{\R}{\mathbb R} \newcommand{\C}{\mathbb C} \newcommand{\ba}{\mathbf{a}} \newcommand{\bb}{\mathbf{b}} \newcommand{\bc}{\mathbf{c}} \newcommand{\bd}{\mathbf{d}} \newcommand{\be}{\mathbf{e}} \newcommand{\bff}{\mathbf{f}} \newcommand{\bh}{\mathbf{h}} \newcommand{\bi}{\mathbf{i}} \newcommand{\bj}{\mathbf{j}} \newcommand{\bk}{\mathbf{k}} \newcommand{\bN}{\mathbf{N}} \newcommand{\bn}{\mathbf{n}} \newcommand{\bo}{\mathbf{0}} \newcommand{\bp}{\mathbf{p}} \newcommand{\bq}{\mathbf{q}} \newcommand{\br}{\mathbf{r}} \newcommand{\bs}{\mathbf{s}} \newcommand{\bT}{\mathbf{T}} \newcommand{\bu}{\mathbf{u}} \newcommand{\bv}{\mathbf{v}} \newcommand{\bw}{\mathbf{w}} \newcommand{\bx}{\mathbf{x}} \newcommand{\by}{\mathbf{y}} \newcommand{\bz}{\mathbf{z}} \newcommand{\bzero}{\mathbf{0}} \newcommand{\nv}{\mathbf{0}} \newcommand{\cA}{\mathcal{A}} \newcommand{\cB}{\mathcal{B}} \newcommand{\cC}{\mathcal{C}} \newcommand{\cD}{\mathcal{D}} \newcommand{\cE}{\mathcal{E}} \newcommand{\cF}{\mathcal{F}} \newcommand{\cG}{\mathcal{G}} \newcommand{\cH}{\mathcal{H}} \newcommand{\cI}{\mathcal{I}} \newcommand{\cJ}{\mathcal{J}} \newcommand{\cK}{\mathcal{K}} \newcommand{\cL}{\mathcal{L}} \newcommand{\cM}{\mathcal{M}} \newcommand{\cN}{\mathcal{N}} \newcommand{\cO}{\mathcal{O}} \newcommand{\cP}{\mathcal{P}} \newcommand{\cQ}{\mathcal{Q}} \newcommand{\cR}{\mathcal{R}} \newcommand{\cS}{\mathcal{S}} \newcommand{\cT}{\mathcal{T}} \newcommand{\cU}{\mathcal{U}} \newcommand{\cV}{\mathcal{V}} \newcommand{\cW}{\mathcal{W}} \newcommand{\cX}{\mathcal{X}} \newcommand{\cY}{\mathcal{Y}} \newcommand{\cZ}{\mathcal{Z}} \newcommand{\rA}{\mathrm{A}} \newcommand{\rB}{\mathrm{B}} \newcommand{\rC}{\mathrm{C}} \newcommand{\rD}{\mathrm{D}} \newcommand{\rE}{\mathrm{E}} \newcommand{\rF}{\mathrm{F}} \newcommand{\rG}{\mathrm{G}} \newcommand{\rH}{\mathrm{H}} \newcommand{\rI}{\mathrm{I}} \newcommand{\rJ}{\mathrm{J}} \newcommand{\rK}{\mathrm{K}} \newcommand{\rL}{\mathrm{L}} \newcommand{\rM}{\mathrm{M}} \newcommand{\rN}{\mathrm{N}} \newcommand{\rO}{\mathrm{O}} \newcommand{\rP}{\mathrm{P}} \newcommand{\rQ}{\mathrm{Q}} \newcommand{\rR}{\mathrm{R}} \newcommand{\rS}{\mathrm{S}} \newcommand{\rT}{\mathrm{T}} \newcommand{\rU}{\mathrm{U}} \newcommand{\rV}{\mathrm{V}} \newcommand{\rW}{\mathrm{W}} \newcommand{\rX}{\mathrm{X}} \newcommand{\rY}{\mathrm{Y}} \newcommand{\rZ}{\mathrm{Z}} \newcommand{\pv}{\overline} \newcommand{\iu}{\mathrm{i}} \newcommand{\ju}{\mathrm{j}} \newcommand{\im}{\mathrm{i}} \newcommand{\e}{\mathrm{e}} \newcommand{\real}{\operatorname{Re}} \newcommand{\imag}{\operatorname{Im}} \newcommand{\Arg}{\operatorname{Arg}} \newcommand{\Ln}{\operatorname{Ln}} \DeclareMathOperator*{\res}{res} \newcommand{\re}{\operatorname{Re}} \newcommand{\im}{\operatorname{Im}} \newcommand{\arsinh}{\operatorname{ar\,sinh}} \newcommand{\arcosh}{\operatorname{ar\,cosh}} \newcommand{\artanh}{\operatorname{ar\,tanh}} \newcommand{\sgn}{\operatorname{sgn}} \newcommand{\diag}{\operatorname{diag}} \newcommand{\proj}{\operatorname{proj}} \newcommand{\rref}{\operatorname{rref}} \newcommand{\rank}{\operatorname{rank}} \newcommand{\Span}{\operatorname{span}} \newcommand{\vir}{\operatorname{span}} \renewcommand{\dim}{\operatorname{dim}} \newcommand{\alg}{\operatorname{alg}} \newcommand{\geom}{\operatorname{geom}} \newcommand{\id}{\operatorname{id}} \newcommand{\norm}[1]{\lVert #1 \rVert} \newcommand{\tp}[1]{#1^{\top}} \renewcommand{\d}{\mathrm{d}} \newcommand{\sij}[2]{\bigg/_{\mspace{-15mu}#1}^{\,#2}} \newcommand{\abs}[1]{\lvert#1\rvert} \newcommand{\pysty}[1]{\left[\begin{array}{@{}r@{}}#1\end{array}\right]} \newcommand{\piste}{\cdot} \newcommand{\qedhere}{} \newcommand{\taumatrix}[1]{\left[\!\!#1\!\!\right]} \newenvironment{augmatrix}[1]{\left[\begin{array}{#1}}{\end{array}\right]} \newenvironment{vaugmatrix}[1]{\left|\begin{array}{#1}}{\end{array}\right|} \newcommand{\trans}{\mathrm{T}} \newcommand{\EUR}{\text{\unicode{0x20AC}}} \newcommand{\SI}[3][]{#2\,\mathrm{#3}} \newcommand{\si}[2][]{\mathrm{#2}} \newcommand{\num}[2][]{#2} \newcommand{\ang}[2][]{#2^{\circ}} \newcommand{\meter}{m} \newcommand{\metre}{\meter} \newcommand{\kilo}{k} \newcommand{\kilogram}{kg} \newcommand{\gram}{g} \newcommand{\squared}{^2} \newcommand{\cubed}{^3} \newcommand{\minute}{min} \newcommand{\hour}{h} \newcommand{\second}{s} \newcommand{\degreeCelsius}{^{\circ}C} \newcommand{\per}{/} \newcommand{\centi}{c} \newcommand{\milli}{m} \newcommand{\deci}{d} \newcommand{\percent}{\%} \newcommand{\Var}{\operatorname{Var}} \newcommand{\Cov}{\operatorname{Cov}} \newcommand{\Corr}{\operatorname{Corr}} \newcommand{\Tasd}{\operatorname{Tasd}} \newcommand{\Ber}{\operatorname{Ber}} \newcommand{\Bin}{\operatorname{Bin}} \newcommand{\Geom}{\operatorname{Geom}} \newcommand{\Poi}{\operatorname{Poi}} \newcommand{\Hyperg}{\operatorname{Hyperg}} \newcommand{\Tas}{\operatorname{Tas}} \newcommand{\Exp}{\operatorname{Exp}} \newcommand{\tdist}{\operatorname{t}} \newcommand{\rd}{\mathrm{d}}\]

Lineaarisen yhtälöryhmän määritelmä

Muuttujien \(x_1, x_2, \ldots, x_n\) lineaarinen yhtälö on muotoa

\[a_1x_1+a_2x_2+\cdots + a_nx_n=b,\]

missä kertoimet \(a_1, \ldots, a_n\) ja termi \(b\) ovat vakioita. Lineaarisessa yhtälössä tuntemattomia ei siis ole esimerkiksi korotettu potessiin tai kerrottu keskenään.

Lineaarinen yhtälöryhmä on yhtälöryhmä, joka on muotoa

\[\begin{split}\left\{ \begin{array}{rcrcccrcr} a_{11}x_1&+&a_{12}x_2&+&\cdots&+&a_{1n}x_n&=&b_1 \\ a_{21}x_1&+&a_{22}x_2&+&\cdots&+&a_{2n}x_n&=&b_2 \\ &&&&&&&\vdots & \\ a_{m1}x_1&+&a_{m2}x_2&+&\cdots&+&a_{mn}x_n&=&b_m, \\ \end{array} \right.\end{split}\]

missä \(a_{11},\dots,a_{mn},b_1,\dots,b_m \in \R\). Symbolit \(x_1,x_2,\dots,x_n\) ovat yhtälöiden tuntemattomia. Lukuja \(a_{11},\dots,a_{mn}\) nimitetään yhtälöryhmän kertoimiksi ja lukuja \(b_1,b_2,\dots,b_m\) vakioiksi. Jos tuntemattomia on vähän, niitä voidaan merkitä myös vaikkapa symboleilla \(x,y,z\) ja niin edelleen. Lineaariset yhtälöryhmät on tapana järjestää niin, että kaikki tuntemattomat ovat yhtälösuuruusmerkin vasemmalla puolella ja kaikki vakiot yhtäsuuruusmerkin oikealla puolella.

Lineaarisen yhtälöryhmän ratkaiseminen merkitsee sitä, että löydetään kaikki ne luvut, jotka tuntemattomien \(x_1,\dots,x_n\) paikalle sijoitettuina toteuttavat yhtä aikaa kaikki yhtälöt.

Tarkastellaan yhtälöryhmää

\[\begin{split}\left\{ \begin{aligned} 3x+2y+z & =1 \\ -x+2y\hphantom{{}+x} & =-1 \\ 2x+4y+z & = 0 \end{aligned}\right.\end{split}\]

Kysymyksessä on lineaarinen yhtälöryhmä, koska yhtälöt ovat kaikki ensimmäisen asteen yhtälöitä. Yritetään ratkaista yhtälöryhmä eli löytää sellaiset luvut \(x\), \(y\) ja \(z\), että kaikki ryhmän yhtälöt toteutuvat yhtä aikaa.

Aloitetaan ratkaisemalla toisesta yhtälöstä \(x\):

\[-x+2y=-1 \iff x=2y+1.\]

Sijoitetaan sitten saatu \(x\) ensimmäiseen yhtälöön, ja ratkaistaan \(z\):

\[3(2y+1)+2y+z=1 \iff 6y+3+2y+z=1 \iff z=-8y-2.\]

Sijoitetaan sitten sekä \(x\) että \(z\) kolmanteen yhtälöön, jotta voitaisiin ratkaista \(y\):

\[2(2y+1)+4y-8y-2=0 \iff 4y+2+4y-8y-2=0 \iff 0=0.\]

Päädyttiin tulokseen \(0=0\). Miten tämä pitäisi tulkita? Onko ratkaisuja yksi vai useampia? Päteekö yhtälö ehkä kaikilla luvuilla? Selvästihän \(x\) ja \(z\) kuitenkin riippuvat \(y\):stä, koska ne ratkaistiin yllä \(y\):n lausekkeina. Mutta samalla tavoinhan \(y\):n voitaisiin ajatella riippuvan \(x\):stä ja \(z\):sta. Vai olisiko sijoitus pitänyt tehdä jossain toisessa järjestyksessä?

Esimerkki osoittaa, että yhtälöryhmien monimutkaistuessa tarvitaan jokin järjestelmällinen menetelmä, jota käyttämällä saadaan aina varmasti jokin vastaus ja pystytään tulkitsemaan vastauksen merkitys. Tässä luvussa esiteltävä Gaussin–Jordanin eliminointimenetelmä redusoi minkä tahansa lineaarisen yhtälöryhmän sellaiseen muotoon, että vastaus löytyy helposti.

Lineaarisen yhtälöryhmän ratkaisemisen kannalta oleellista ovat vain kertoimien ja vakioiden arvot, esimerkiksi tuntemattomien nimityksellä ei ole merkitystä. Kaikki tieto yhtälöryhmästä voidaankin tiivistää lukutaulukkoon eli matriisiin, jossa luetellaan kaikki kertoimet sekä vakiot. Kun käsitellään yhtälöryhmien sijasta matriiseja, päästään helpommalla, sillä tuntemattomia ei tarvitse kirjata ylös.

Esimerkiksi yhtälöryhmän

\[\begin{split}\left\{ \begin{array}{rcrcrcr} -4x_1&+&\sqrt{3}x_2&+&2x_3&=&4 \\ x_1&&&+&\frac{6}{8}x_3&=&0 \\ 5x_1&+&\sqrt{2}x_2&+&11x_3&=&-3 \\ &&-6x_2&-&32x_3&=&4 \\ \end{array} \right.\end{split}\]

matriisi on

\[\begin{split}\begin{augmatrix}{rrr|r} -4&\sqrt{3}&2&4 \\ 1&0&\frac{6}{8}&0 \\ 5&\sqrt{2}&11&-3 \\ 0&-6&-32&4 \end{augmatrix}.\end{split}\]

Selkeyden vuoksi kertoimet on tapana erottaa vakioista pystyviivalla. Viivalla ei kuitenkaan ole matemaattista merkitystä. Huomaa, että matriisiin on kirjoitettava nolla niiden termien kohdalle, jotka puuttuvat yhtälöryhmästä. Kyseisten termien kertoimena on nimittäin nolla.

Edellä kuvattua matriisia kutsutaan lineaarisen yhtälöryhmän kokonaismatriisiksi tai täydennetyksi matriisiksi. Pystyrivien eli sarakkeiden vasemmasta puolesta koostuvaa matriisia kutsutaan kerroinmatriisiksi ja oikealla olevaa pystyriviä eli saraketta vakiotermivektoriksi. Luvussa ?? käsitellään matriisien teoriaa yleisemmin. Tässä luvussa käsittelemme vain yhtälöryhmistä saatuja matriiseja.

Geometrinen tulkinta

Ennen kuin ryhdytään ratkomaan lineaarisia yhtälöryhmiä algoritmin avulla, tutkitaan, miten niitä voi hahmottaa visuaalisesti. Kun yhtälöryhmässä on kaksi tai kolme tuntematonta, tilannetta voi havainnollistaa analyyttisen geometrian avulla. Tutkitaan yhtälöparia

\[\begin{split}\left\{ \begin{aligned} x-y&=-1 \\ x+2y&=0. \end{aligned} \right.\end{split}\]

Näitä kahta yhtälöä voidaan kumpaakin ajatella suorina. Kun yhtälöt kirjoitetaan hiukan toiseen muotoon, on suorista helpompi piirtää kuva:

\[\begin{split}\left\{ \begin{aligned} y&=x+1 \\ y&=-(1/2)x . \end{aligned} \right.\end{split}\]

Yhtälöitä vastaavat suorat on esitetty kuvassa 1.

../_images/suoratRisteavat.svg

Fig. 1: Jos yhtälöitä vastaavat suorat risteävät yhdessä pisteessä, yhtälöryhmällä on täsmälleen yksi ratkaisu. Se vastaa suorien leikkauspistettä.

Yhtälön \(y=x+1\) ratkaisuja voidaan ajatella tason pisteinä. Esimerkiksi eräs ratkaisu on \(x=0\), \(y=1\). Tätä ratkaisua vastaa tason piste \((0,1)\). Kaikki yhtälön ratkaisut muodostavat muodostavat suoran \(y=x+1\). Samoin toisen yhtälön ratkaisut muodostavat suoran \(y=-(1/2)x\). Yhtälöparin ratkaisut toteuttavat molemmat yhtälöt, joten ratkaisut ovat pisteitä, jotka ovat sekä suoralla \(y=x+1\) että suoralla \(y=-(1/2)x\). Kuvassa yhtälöryhmän ratkaisut näkyvät siis suorien leikkauskohdassa. Kuvan 1 perusteella leikkauspiste voisi olla suunnilleen \((-2/3,1/3)\). Kun yhtälöihin sijoittaa \(x=-2/3\) ja \(y=1/3\), näkee, että kyseessä on molempien yhtälöiden ratkaisu. Siten \(x=-2/3\), \(y=1/3\) on tosiaan yhtälöparin ratkaisu.

Tutkitaan sitten yhtälöparia

\[\begin{split}\left\{ \begin{aligned} x-y&=-1 \\ x-y&=1. \end{aligned} \right.\end{split}\]

Sen yhtälöitä vastaavat suorat ovat yhdensuuntaisia (ks. kuva 2). Näillä suorilla ei ole yhtään leikkauspistettä. Siten yhtälöparilla ei kuvan perusteella ei ole ratkaisuja.

../_images/suoratYhdensuuntaiset.svg

Fig. 2: Jos yhtälöitä vastaavat suorat eivät leikkaa toisiaan, ei yhtälöryhmällä ole ratkaisuja.

Yhtälöparin

\[\begin{split}\left\{ \begin{aligned} x-y&=-1 \\ 2x-2y&=-2 \end{aligned} \right.\end{split}\]

molempia yhtälöitä vastaa puolestaan sama suora (ks. kuva 3). Näin ollen yhtälöitä vastaavat suorat leikkaavat joka ikisessä pisteessään, joten leikkauspisteitä on äärettömän monta. Yhtälöparilla on siis äärettömä monta ratkaisua.

../_images/suoratSamat.svg

Fig. 3: Jos yhtälöitä vastaavat suorat ovat sama suora, on niillä äärettömän monta leikkauspistettä. Yhtälöryhmällä on silloin äärettömän monta ratkaisua.

Edellisissä tapauksissa yhtälöparilla oli joko täsmälleen yksi, nolla tai äärettömän monta ratkaisua. Tulemme näkemään, minkä tahansa lineaarisen yhtälöryhmän kohdalla vain nämä kolme vaihtoehtoa ovat mahdollisia. Kun yhtälöryhmän muuttujia on kolme, yhtälöt kuvaavat tasoja. Myös tällöin ratkaisuja voi havainnollistaa kuvan avulla tutkimalla tasojen leikkauksia.

  • Lineaarinen yhtälöryhmä koostuu ensimmäisen asteen yhtälöistä
  • Yhtälöryhmässä oleva informaatio voidaan kerätä matriisiin, jossa ovat yhtälöryhmän kertoimet ja vakiot.
  • Kun tuntemattomia on kaksi, voi yhtälöryhmän yhtälöitä havainnollistaa suorina. Tällöin yhtälöryhmän ratkaisut ovat pisteet, joissa kaikki suorat leikkaavat.

Kolmen muuttujan lineaarista yhtälöä \(ax + by + cz = d\) vastaa avaruuden \(\R^3\) taso. Kun ratkaistaan kolmen tällaisen yhtälön yhtälöryhmää

\[\begin{split}\begin{cases} a_1x + b_1y + c_1z = d_1 \\ a_2x + b_2y + c_2z = d_2 \\ a_3x + b_3y + c_3z = d_3, \end{cases}\end{split}\]

ollaan siis ratkaisemassa kolmen tason leikkauspisteitä. Jos ratkaisuja löytyy, on olemassa kolme vaihtoehtoa ratkaisuvektorin \((x, y, z)\) yleiselle muodolle:

\[\begin{split}\begin{bmatrix} x \\ y \\ z \end{bmatrix} = \begin{bmatrix} p_1 \\ p_2 \\ p_3 \end{bmatrix} + t\begin{bmatrix} q_1 \\ q_2 \\ q_3 \end{bmatrix} + s\begin{bmatrix} r_1 \\ r_2 \\ r_3 \end{bmatrix}, \text{ missä } t, s \in \R, \qquad \begin{bmatrix} x \\ y \\ z \end{bmatrix} = \begin{bmatrix} p_1 \\ p_2 \\ p_3 \end{bmatrix} + t\begin{bmatrix} q_1 \\ q_2 \\ q_3 \end{bmatrix}, \text{ missä } t \in \R, \qquad\text{tai}\qquad \begin{bmatrix} x \\ y \\ z \end{bmatrix} = \begin{bmatrix} p_1 \\ p_2 \\ p_3 \end{bmatrix}.\end{split}\]

Liitä toisiinsa edellä annetut ratkaisun yleiset muodot ja seuraavan kuvan tilanteet A, B ja C. Anna vastauksenasi merkit A, B ja C ratkaisujen muotojen järjestyksessä vasemmalta oikealle. Jos esimerkiksi uskot tilanteiden A, B ja C olevan jo valmiiksi ratkaisuihin verrattuna oikeassa järjestyksessä, niin vastaa ABC.

../_images/tasot.svg
Kirjoita vastauksesi tähän kenttään.
Palautusta lähetetään...