- MAT-04601
- 6. Lineaarialgebra ja matriisit
- 6.6 Ortogonaaliset kannat ja matriisit
Ortogonaaliset kannat ja matriisit¶
Palautetaan mieleen kahden vektorin \(\mathbf{u}\) ja \(\mathbf{v}\) ortogonaalisuuden, eli kohtisuoruuden ehto
Avaruuden \(\mathbb R^n\) vektoreita \(\mathbf{v}_1, \mathbf{v}_2, \ldots, \mathbf{v}_k\) sanotaan ortogonaalisiksi, jos ne kaikki ovat pareittain ortogonaalisia, eli
aina, kun \(i \not= j\). Jos lisäksi \(\|\mathbf{v}_i\| = 1\) jokaisella \(i = 1, 2, \ldots, k\), niin vektoreita \(\mathbf{v}_1, \mathbf{v}_2, \ldots, \mathbf{v}_k\) sanotaan ortonormaaleiksi. Mitkä tahansa ortogonaaliset vektorit ovat lineaarisesti riippumattomia.
Lause.
Olkoot \(\mathbf{v}_1, \mathbf{v}_2, \ldots, \mathbf{v}_k\) ortogonaalisia nollasta poikkeavia vektoreita. Tällöin vektorit \(\mathbf{v}_1, \mathbf{v}_2, \ldots, \mathbf{v}_k\) ovat lineaarisesti riippumattomat.
Oletetaan, että \(c_1\mathbf{v}_1 + c_2\mathbf{v}_2 + \cdots + c_k\mathbf{v}_k = \mathbf{0}\). Otetaan yhtälöstä puolittain pistetulo vektorin \(\mathbf{v}_i\) kanssa, jolloin ortogonaalisuusoletuksen nojalla
jokaista \(i = 1, 2, \ldots, k\) kohti. Koska kaikki vektorit eroavat nollasta, näiden ehtojen toteutumiseksi on oltava \(c_1 = c_2 = \cdots = c_k = 0\), eli vektorit \(\mathbf{v}_1, \mathbf{v}_2, \ldots, \mathbf{v}_k\) ovat lineaarisesti riippumattomat. \(\square\)
Huomautus.
Luonnollisen kannan vektorit \(\mathbf{e}_1, \mathbf{e}_2, \ldots, \mathbf{e}_n\) ovat keskenään ortonormaaleja, sillä \(\mathbf{e}_i \cdot \mathbf{e}_j = \delta_{ij}\). Yleisemminkin vektorit \(\mathbf{v}_1, \mathbf{v}_2, \ldots, \mathbf{v}_k\) ovat ortonormaaleja jos ja vain jos
Aliavaruuden \(S\) kantaa sanotaan ortogonaaliseksi tai ortonormaaliksi, jos siihen kuuluvat vektorit ovat ortogonaaliset tai ortonormaalit. Ortogonaalisella ja ortonormaalilla kannalla on seuraavat miellyttävät ominaisuudet.
Lause.
Olkoon \(\{\mathbf{v}_1, \mathbf{v}_2, \ldots, \mathbf{v}_k\}\) aliavaruuden \(S\) ortogonaalinen kanta, sekä \(\mathbf{x}\) aliavaruuden \(S\) vektori. Tällöin
Jos kanta on lisäksi ortonormaali, niin
Ortonormaalissa kannassa normille ja pistetulolle saadaan tutut esitykset.
Lause.
Olkoon \(\{\mathbf{v}_1, \mathbf{v}_2, \ldots, \mathbf{v}_k\}\) aliavaruuden \(S\) ortonormaali kanta. Jos
niin
ja
Merkitään
jolloin \(\mathbf{x}= V\mathbf{a}\) ja \(\mathbf{y}= V\mathbf{b}\). Tulkitaan pistetulo matriisitulona, jolloin
Koska \(\{\mathbf{v}_1, \mathbf{v}_2, \ldots, \mathbf{v}_k\}\) on ortonormaali kanta,
ja täten
Tätä tulosta voidaan hyödyntää normin kaavan osoittamiseen. Nyt
kuten haluttiinkin. Viimeinen osa väitteestä seuraa edellisen lauseen esityksestä vektorille ortonormaalissa kannassa. \(\square\)
Jokaiselle aliavaruudelle voidaan löytää ortogonaalinen kanta. Tehokkain keino sen löytämiseksi on ortogonalisoida jo valmiiksi tunnettu kanta projektioiden avulla. Tämä menetelmä tunnetaan Gram-Schmidtin ortogonalisointiprosessina, ja sen todistus sivuutetaan. Algoritmin vaiheet ovat kuitenkin varsin intuitiiviset.
Lause.
Olkoon \(\{\mathbf{x}_1, \mathbf{x}_2, \ldots, \mathbf{x}_k\}\) aliavaruuden \(S\) kanta. Tällöin \(\{\mathbf{v}_1, \mathbf{v}_2, \ldots, \mathbf{v}_k\}\), missä \(\mathbf{v}_1 = \mathbf{x}_1\) ja
jokaiselle \(i = 2, 3, \ldots, k\), on aliavaruuden \(S\) ortogonaalinen kanta.
Ortonormaali kanta \(\{\mathbf{w}_1, \mathbf{w}_2, \ldots, \mathbf{w}_k\}\) on helppo muodostaa ortogonaalisesta kannasta normeeraamalla jokaisen kantavektorin yksikön pituiseksi.
Monesti numeeriset laskut on tehokkainta suorittaa ortonormaalissa kannassa.
Esimerkki.
Tiedetään, että
Etsi alkuperäisen matriisin sarakeavaruudelle ortonormaali kanta.
Redusoidusta riviporrasmuodosta nähdään, että eräs sarakeavaruuden kanta on
Valitaan ortogonaalista kantaa varten \(\mathbf{v}_1 = (1, 1, 2)\), jolloin Gram-Schmidtin prosessi tuottaa lopuiksi kantavektoreiksi
ja
Laskemalla pistetulot pareittain nähdään, että kantavektorit \(\mathbf{v}_1\), \(\mathbf{v}_2\) ja \(\mathbf{v}_3\) todella ovat ortogonaalisia. Normeerataan jokainen niistä yksikkövektoriksi, jotta saadaan ortonormaali sarakeavaruuden kanta
Aiemman lauseen todistuksessa törmättiin ortonormaaleista sarakkeista koostuvaan matriisiin \(V\), jolle \(V^TV = I_k\). Neliömatriisien tapauksessa tämä ominaisuus määrittelee mielenkiintoisen matriisien luokan.
Määritelmä.
\(n \times n\)-neliömatriisi \(Q\) on ortogonaalinen, jos \(Q^TQ = I_n = QQ^T\).
Merkitään
jolloin ehto \(Q^TQ = I_n\) (tai \(QQ^T = I_n\)) tarkoittaa sitä, että
Toisin sanoen ortogonaalisen matriisin sarakkeet ovat ortonormaalit. Ortonormaalit vektorit ovat lineaarisesti riippumattomia, joten \(\operatorname{rref}(Q) = I_n\), ja täten ortogonaalinen matriisi \(Q\) on kääntyvä. Tämä tulos on määritelmän perusteella odotettu, ja käänteismatriisi on sen valossa \(Q^{-1} = Q^T\).
Pistetulon ja normin esityksestä ortonormaalissa kannassa seuraa, että ortogonaalinen matriisi ei vaikuta pistetulon tai normin arvoon.
Seuraus.
Jos \(n \times n\)-matriisi \(Q\) on ortogonaalinen, niin \(Q\mathbf{x}\cdot Q\mathbf{y}= \mathbf{x}\cdot \mathbf{y}\) ja \(\|Q\mathbf{x}\| = \|\mathbf{x}\|\) aina, kun \(\mathbf{x}\) ja \(\mathbf{y}\) ovat avaruuden \(\mathbb R^n\) vektoreita.