\[\newcommand{\N}{\mathbb N}
\newcommand{\Z}{\mathbb Z}
\newcommand{\Q}{\mathbb Q}
\newcommand{\R}{\mathbb R}
\newcommand{\C}{\mathbb C}
\newcommand{\ba}{\mathbf{a}}
\newcommand{\bb}{\mathbf{b}}
\newcommand{\bc}{\mathbf{c}}
\newcommand{\bd}{\mathbf{d}}
\newcommand{\be}{\mathbf{e}}
\newcommand{\bff}{\mathbf{f}}
\newcommand{\bh}{\mathbf{h}}
\newcommand{\bi}{\mathbf{i}}
\newcommand{\bj}{\mathbf{j}}
\newcommand{\bk}{\mathbf{k}}
\newcommand{\bN}{\mathbf{N}}
\newcommand{\bn}{\mathbf{n}}
\newcommand{\bo}{\mathbf{0}}
\newcommand{\bp}{\mathbf{p}}
\newcommand{\bq}{\mathbf{q}}
\newcommand{\br}{\mathbf{r}}
\newcommand{\bs}{\mathbf{s}}
\newcommand{\bT}{\mathbf{T}}
\newcommand{\bu}{\mathbf{u}}
\newcommand{\bv}{\mathbf{v}}
\newcommand{\bw}{\mathbf{w}}
\newcommand{\bx}{\mathbf{x}}
\newcommand{\by}{\mathbf{y}}
\newcommand{\bz}{\mathbf{z}}
\newcommand{\bzero}{\mathbf{0}}
\newcommand{\nv}{\mathbf{0}}
\newcommand{\cA}{\mathcal{A}}
\newcommand{\cB}{\mathcal{B}}
\newcommand{\cC}{\mathcal{C}}
\newcommand{\cD}{\mathcal{D}}
\newcommand{\cE}{\mathcal{E}}
\newcommand{\cF}{\mathcal{F}}
\newcommand{\cG}{\mathcal{G}}
\newcommand{\cH}{\mathcal{H}}
\newcommand{\cI}{\mathcal{I}}
\newcommand{\cJ}{\mathcal{J}}
\newcommand{\cK}{\mathcal{K}}
\newcommand{\cL}{\mathcal{L}}
\newcommand{\cM}{\mathcal{M}}
\newcommand{\cN}{\mathcal{N}}
\newcommand{\cO}{\mathcal{O}}
\newcommand{\cP}{\mathcal{P}}
\newcommand{\cQ}{\mathcal{Q}}
\newcommand{\cR}{\mathcal{R}}
\newcommand{\cS}{\mathcal{S}}
\newcommand{\cT}{\mathcal{T}}
\newcommand{\cU}{\mathcal{U}}
\newcommand{\cV}{\mathcal{V}}
\newcommand{\cW}{\mathcal{W}}
\newcommand{\cX}{\mathcal{X}}
\newcommand{\cY}{\mathcal{Y}}
\newcommand{\cZ}{\mathcal{Z}}
\newcommand{\rA}{\mathrm{A}}
\newcommand{\rB}{\mathrm{B}}
\newcommand{\rC}{\mathrm{C}}
\newcommand{\rD}{\mathrm{D}}
\newcommand{\rE}{\mathrm{E}}
\newcommand{\rF}{\mathrm{F}}
\newcommand{\rG}{\mathrm{G}}
\newcommand{\rH}{\mathrm{H}}
\newcommand{\rI}{\mathrm{I}}
\newcommand{\rJ}{\mathrm{J}}
\newcommand{\rK}{\mathrm{K}}
\newcommand{\rL}{\mathrm{L}}
\newcommand{\rM}{\mathrm{M}}
\newcommand{\rN}{\mathrm{N}}
\newcommand{\rO}{\mathrm{O}}
\newcommand{\rP}{\mathrm{P}}
\newcommand{\rQ}{\mathrm{Q}}
\newcommand{\rR}{\mathrm{R}}
\newcommand{\rS}{\mathrm{S}}
\newcommand{\rT}{\mathrm{T}}
\newcommand{\rU}{\mathrm{U}}
\newcommand{\rV}{\mathrm{V}}
\newcommand{\rW}{\mathrm{W}}
\newcommand{\rX}{\mathrm{X}}
\newcommand{\rY}{\mathrm{Y}}
\newcommand{\rZ}{\mathrm{Z}}
\newcommand{\pv}{\overline}
\newcommand{\iu}{\mathrm{i}}
\newcommand{\ju}{\mathrm{j}}
\newcommand{\im}{\mathrm{i}}
\newcommand{\e}{\mathrm{e}}
\newcommand{\real}{\operatorname{Re}}
\newcommand{\imag}{\operatorname{Im}}
\newcommand{\Arg}{\operatorname{Arg}}
\newcommand{\Ln}{\operatorname{Ln}}
\DeclareMathOperator*{\res}{res}
\newcommand{\re}{\operatorname{Re}}
\newcommand{\im}{\operatorname{Im}}
\newcommand{\arsinh}{\operatorname{ar\,sinh}}
\newcommand{\arcosh}{\operatorname{ar\,cosh}}
\newcommand{\artanh}{\operatorname{ar\,tanh}}
\newcommand{\sgn}{\operatorname{sgn}}
\newcommand{\diag}{\operatorname{diag}}
\newcommand{\proj}{\operatorname{proj}}
\newcommand{\rref}{\operatorname{rref}}
\newcommand{\rank}{\operatorname{rank}}
\newcommand{\Span}{\operatorname{span}}
\newcommand{\vir}{\operatorname{span}}
\renewcommand{\dim}{\operatorname{dim}}
\newcommand{\alg}{\operatorname{alg}}
\newcommand{\geom}{\operatorname{geom}}
\newcommand{\id}{\operatorname{id}}
\newcommand{\norm}[1]{\lVert #1 \rVert}
\newcommand{\tp}[1]{#1^{\top}}
\renewcommand{\d}{\mathrm{d}}
\newcommand{\sij}[2]{\bigg/_{\mspace{-15mu}#1}^{\,#2}}
\newcommand{\abs}[1]{\lvert#1\rvert}
\newcommand{\pysty}[1]{\left[\begin{array}{@{}r@{}}#1\end{array}\right]}
\newcommand{\piste}{\cdot}
\newcommand{\qedhere}{}
\newcommand{\taumatrix}[1]{\left[\!\!#1\!\!\right]}
\newenvironment{augmatrix}[1]{\left[\begin{array}{#1}}{\end{array}\right]}
\newenvironment{vaugmatrix}[1]{\left|\begin{array}{#1}}{\end{array}\right|}
\newcommand{\trans}{\mathrm{T}}
\newcommand{\EUR}{\text{\unicode{0x20AC}}}
\newcommand{\SI}[3][]{#2\,\mathrm{#3}}
\newcommand{\si}[2][]{\mathrm{#2}}
\newcommand{\num}[2][]{#2}
\newcommand{\ang}[2][]{#2^{\circ}}
\newcommand{\meter}{m}
\newcommand{\metre}{\meter}
\newcommand{\kilo}{k}
\newcommand{\kilogram}{kg}
\newcommand{\gram}{g}
\newcommand{\squared}{^2}
\newcommand{\cubed}{^3}
\newcommand{\minute}{min}
\newcommand{\hour}{h}
\newcommand{\second}{s}
\newcommand{\degreeCelsius}{^{\circ}C}
\newcommand{\per}{/}
\newcommand{\centi}{c}
\newcommand{\milli}{m}
\newcommand{\deci}{d}
\newcommand{\percent}{\%}
\newcommand{\Var}{\operatorname{Var}}
\newcommand{\Cov}{\operatorname{Cov}}
\newcommand{\Corr}{\operatorname{Corr}}
\newcommand{\Tasd}{\operatorname{Tasd}}
\newcommand{\Ber}{\operatorname{Ber}}
\newcommand{\Bin}{\operatorname{Bin}}
\newcommand{\Geom}{\operatorname{Geom}}
\newcommand{\Poi}{\operatorname{Poi}}
\newcommand{\Hyperg}{\operatorname{Hyperg}}
\newcommand{\Tas}{\operatorname{Tas}}
\newcommand{\Exp}{\operatorname{Exp}}
\newcommand{\tdist}{\operatorname{t}}
\newcommand{\rd}{\mathrm{d}}\]
Yhtälöryhmästä matriisiyhtälöksi
Aloita katsomalla seuraava video:
Tässä luvussa esitellään uusi tapa kirjoittaa lineaarinen yhtälöryhmä matriisien avulla käyttäen hyväksi matriisikertolaskua sekä vektoreita. Tällöin yhtälöryhmien ratkaisussa voidaan käyttää avuksi matriisien ominaisuuksia.
Tutkitaan yhtälöryhmää
\[\begin{split}\left\{
\begin{array}{cccc}
2x_1+3x_2+4x_3+5x_4 & = & 6 \\
11x_1+12x_2+13x_3+14x_4 & = & 15 \\
-7x_1-8x_2-9x_3-10x_4 & = & -11
\end{array}\right.\end{split}\]
Yhtälön vasemmalla puolella näkyy jotain samanlaista kuin saadaan tulokseksi matriisien kertolaskusta.
Kirjoitetaan yhtälöryhmän kertoimet yhdeksi matriisiksi
\[\begin{split}A=
\begin{augmatrix}{rrrr}
2 & 3 & 4 & 5\\
11 & 12 & 13 & 14 \\
-7 & -8 & -9 & -10
\end{augmatrix},\end{split}\]
tuntemattomat toiseksi matriisksi
\[\begin{split}\bx=
\begin{augmatrix}{c}
x_1 \\
x_2 \\
x_3\\
x_4
\end{augmatrix}\end{split}\]
ja vakiot kolmanneksi
\[\begin{split}\bb=
\begin{augmatrix}{r}
6 \\
15 \\
-11\\
\end{augmatrix}.\end{split}\]
Nyt
\[\begin{split}A\bx=\begin{augmatrix}{c}
2x_1+3x_2+4x_3+5x_4 \\
11x_1+12x_2+13x_3+14x_4 \\
-7x_1-8x_2-9x_3-10x_4
\end{augmatrix}\end{split}\]
eli tulo \(A\bx\) vastaa yhtälöryhmän vasenta puolta.
Siten yhtälöryhmä voidaan kirjoittaa muodossa \(A\bx=\bb\) eli
\[\begin{split}\begin{augmatrix}{rrrr}
2 & 3 & 4 & 5\\
11 & 12 & 13 & 14 \\
-7 & -8 & -9 & -10
\end{augmatrix}
\begin{augmatrix}{c}
x_1 \\
x_2 \\
x_3\\
x_4
\end{augmatrix}
=\begin{augmatrix}{r}
6 \\
15 \\
-11
\end{augmatrix}.\end{split}\]
Yleisesti yhtälöryhmä
\[\begin{split}\left\{
\begin{array}{ccc}
a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n & = & b_1 \\
a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n & = & b_2 \\
\vdots & & \vdots \\
a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n & = & b_m
\end{array}\right.\end{split}\]
voidaan kirjoittaa muodossa \(A\bx=\bb\), missä
\[\begin{split}A=
\begin{augmatrix}{cccc}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn} \\
\end{augmatrix}, \qquad
\bx=
\begin{augmatrix}{c}
x_1 \\
x_2 \\
\vdots \\
x_n \\
\end{augmatrix} \qquad \text{ja} \qquad
\bb=
\begin{augmatrix}{c}
b_1 \\
b_2 \\
\vdots \\
b_m \\
\end{augmatrix}.\end{split}\]
Matriisia \(A\) kutsutaan yhtälöryhmän
kerroinmatriisiksi
Jos nyt kerroinmatriisi on neliömatriisi, sen kääntyvyys vaikuttaa merkittävästi yhtälöryhmän ratkaisuihin.
Lause 4.7.1
Jos matriisi \(A\in\R^{n\times n}\) on kääntyvä ja \(\bb\in\R^n\), yhtälöllä \(A\bx=\bb\) on täsmälleen
yksi ratkaisu, ja se on \(\bx=A^{-1}\bb\).
Piilota/näytä todistus
Oletetaan, että matriisi \(A\) on kääntyvä. Todistuksessa on kaksi osaa. On osoitettava, että \(A^{-1}\bb\) on yhtälön ratkaisu ja että muita ratkaisuja ei ole.
Osoitetaan ensin, että \(A^{-1}\bb\) on yhtälön ratkaisu sijoittamalla se yhtälön vasemmalle puolelle vektorin \(\bx\) paikalle:
\[A(A^{-1}\bb)=(AA^{-1})\bb=I\bb=\bb.\]
Koska tuloksena oli yhtälön oikea puoli, esitetty ratkaisu toteuttaa yhtälön.
Osoitetaan sitten, ettei muita ratkaisuja ole. Oletetaan, että \(\by\) on jokin (toinen) ratkaisu. Tällöin \(A\by=\bb\). Kerrotaan yhtälön molemmat puolet vasemmalta matriisilla \(A^{-1}\), jolloin saadaan
\[A^{-1}A\by=A^{-1}\bb.\]
Koska \(A^{-1}A=I\), edellinen yhtälö sievenee muotoon \(\by=A^{-1}\bb\). Kysymyksessä on siis sama ratkaisu kuin edellä.
Siten ratkaisuja on vain yksi ja se on \(A^{-1}\bb\).
Huomaa, että todistuksessa tarvittiin käänteismatriisin kumpaakin ominaisuutta: \(AA^{-1}=I\) ja \(A^{-1}A=I\).
- Lineaariset yhtälöryhmät voidaan kirjoittaa matriisiyhtälönä muodossa \(A\bx=\bb\).
- Matriisiyhtälöllä \(A\bx=\bb\) on täsmälleen yksi ratkaisu, jos ja vain jos \(A\) on kääntyvä.