- MAT-04601
- 10. Derivaatta
- 10.8 Pienimmän neliösumman menetelmä
Pienimmän neliösumman menetelmä¶
Palataan hetkeksi ratkaisemaan yhtälöryhmää Ax=b, missä A on matriisi ja b tunnettu vektori. Insinöörien elämässä tulee usein vastaan ongelmia, missä tällä yhtälöryhmällä ei yksinkertaisesti ole ratkaisua. Yksi yleinen syy on se, että reaalimaailman mittaukset eivät ole virheettömiä ja tämän vuoksi tuottavat ristiriitoja käytössä olevaan malliin. Tällöin yhtälöryhmälle Ax=b voidaan tarkan ratkaisun sijaan etsiä ”paras mahdollinen” ratkaisu, jota kutsutaan pienimmän neliösumman ratkaisuksi.
Määritelmä.
Olkoon A jokin m×n-matriisi ja b avaruuden Rm vektori. Tällöin yhtälöryhmän Ax=b pienimmän neliösumman ratkaisu (least squares solution) on avaruuden Rn vektori ¯x, joka toteuttaa epäyhtälön
aina, kun x∈Rn.
Jos yhtälöryhmällä Ax=b ei ole ratkaisua, niin b∉R(A). Pienimmän neliösumman ratkaisu on sellainen vektori ¯x, että vektori A¯x∈R(A) on ikään kuin lähimpänä vektoria b. Nyt kun periaate on selvä, tarvitsee enää tietää, miten ¯x lasketaan.
Merkitään virhevektoria, eli residuaalia e=b−Ax, jolloin komponenteittain
Pienimmän neliösumman ratkaisun ajatuksena on minimoida normi ‖e‖. Samanaikaisesti minimoidaan myös normin neliö
sillä normi on ei-negatiivinen reaaliluku. Tässä summassa jokainen termi on ei-negatiivinen, ja siksi se saavuttaa minimiarvonsa täsmälleen silloin, kun jokainen yhteenlaskettavista termeistä e2i, i=1,2,…,m minimoituu.
Pidetään summaa ‖e‖2=e21+e22+⋯+e2m vuorotellen muuttujavektorin x komponenttien xj, j=1,2,…,n funktiona. Nähdään, että
jolloin ketjusäännön nojalla
Matriisitulon avulla kirjoitettuna
missä aj on matriisin A sarake j. Kun kaikki tällaiset derivaatat kerätään pystyvektoriin, saadaan
Asiaa sen tarkemmin todistamatta väitetään, että virhevektorin normin neliö ‖e‖2 minimoituu silloin, kun kaikki derivaatat ovat yhtä aikaa nollia, eli kun −2AT(b−Ax)=0. Tämä ehto on yhtäpitävä yhtälön
kanssa.
Määritelmä.
Yhtälöryhmän Ax=b normaaliryhmä on ATAx=ATb.
Pienimmän neliösumman menetelmää voidaan lähestyä myös teoreettisemmin seuraavasta näkökulmasta. Jos matriisiyhtälössä Ax=b matriisi A ei ole kääntyvä, voidaan silti yrittää löytää mahdollisimman hyvin käänteismatriisin käyttäytymistä imitoiva matriisi. Tällaista matriisia kutsutaan pseudoinverssiksi. Seuraava tulos otetaan käyttöön todistamatta.
Lause.
Jos A on m×n-matriisi, niin on olemassa yksikäsitteinen n×m-matriisi A+, joka toteuttaa ehdot
- AA+A=A,
- A+AA+=A+,
- (AA+)T=AA+
- (A+A)T=A+A.
Matriisia A+ sanotaan matriisin A Moore-Penrosen pseudoinverssiksi.
Lemma.
Jos A on m×n-matriisi, niin R(ATA)=R(AT).
Oletetaan, että y∈R(ATA). Tällöin y=ATAx jollekin avaruuden Rn vektorille x ja Ax=z on avaruuden Rm vektori. Täten y=ATz jollekin avaruuden Rm vektorille z, eli y∈R(AT).
Oletetaan sitten, että y∈R(AT), eli y=ATx jollekin avaruuden Rm vektorille x. Sijoitetaan matriisin A paikalle Moore-Penrosen pseudoinverssin A+ sisältävä matriisitulo edellisen lauseen ensimmäisen ehdon mukaisesti ja sovelletaan muitakin pseudoinverssin ominaisuuksia.
Tässä A+x=z on avaruuden Rn vektori, jolle y=ATAz, ja täten y∈R(ATA).
Edellä olevista päättelyistä seuraa, että R(ATA)⊆R(AT) ja R(AT)⊆R(ATA), joten R(ATA)=R(AT). ◻
Nyt voidaan lopulta osoittaa, että yhtälöryhmän Ax=b normaaliryhmällä ATAx=ATb on aina vähintään yksi ratkaisu.
Lause.
Olkoon A m×n-matriisi ja b∈Rm. Tällöin yhtälöryhmän Ax=b normaaliryhmällä on ratkaisu x=¯x, ja tämä on yhtälöryhmän Ax=b pienimmän neliösumman ratkaisu.
Vektori ATb kuuluu luonnollisesti matriisin AT sarakeavaruuteen R(AT). Edellisen lemman nojalla siis ATb∈R(ATA), ja täten normaaliryhmällä ATAx=ATb on ratkaisu ¯x. Osion alussa johdetun mukaisesti sijoituksella x=¯x minimoidaan virhevektorin b−Ax normi, joten
aina, kun x∈Rn. ◻
Pienimmän neliösumman ratkaisu on siis aina olemassa, ja edellinen lause tarjoaa keinon löytää sen.
Huomautus.
Pienimmän neliösumman ratkaisun olemassaolo ei tarkoita sitä, että se olisi yksikäsitteinen. On hyvinkin mahdollista, että matriisi normaaliryhmän kerroinmatriisi ATA ei ole kääntyvä, ja tällöin normaaliryhmällä on ääretön määrä ratkaisuja.
Varmistetaan vielä, että pienimmän neliösumman ratkaisu toimii kuten yhtälön Ax=b tarkkakin ratkaisu ainakin seuraavan lauseen mielessä.
Lause.
Olkoon ¯x yhtälöryhmän Ax=b pienimmän neliösumman ratkaisu. Jos yhtälöryhmällä Ax=b on ratkaisuja, niin tällöin myös ¯x on sen ratkaisu.
Normaaliryhmä ATAx=ATb voidaan ratkaista Gaussin eliminoinnilla, kuten mikä tahansa muukin yhtälöryhmä. Erityisen kiintoisa tapaus syntyy silloin, kun ratkaisu on yksikäsitteinen, eli kerroinmatriisi ATA on kääntyvä. Tällöin pienimmän neliösumman ratkaisuksi tulee
Moore-Penrosen pseudoinverssi sattuu tässä tapauksessa olemaan täsmälleen se matriisi, joka ”kääntää” matriisin A: jos ATA on kääntyvä, niin A+=(ATA)−1AT ja pienimmän neliösumman ratkaisu on ¯x=A+b.
Lause.
Olkoon A m×n-matriisi. Tällöin seuraavat väitteet ovat voimassa.
- Jos ATA on kääntyvä, niin A+A=In.
- Jos A on kääntyvä, niin A+=A−1.
Käänteismatriisia (ATA)−1 kutsutaan yhtälöryhmän Ax=b normalisoivaksi kertoimeksi, ja sen olemassaololle löydetään riittävä ja välttämätön ehto.
Lause.
Normalisoiva kerroin (ATA)−1 on olemassa täsmälleen silloin, kun matriisin A sarakkeet ovat lineaarisesti riippumattomat.
Tiedetään, että m×n-matriisin A sarakkeet ovat lineaarisesti riippumattomat täsmälleen silloin, kun rank(A)=n. Vastaavasti n×n-matriisi ATA on kääntyvä jos ja vain jos rank(ATA)=n. Mutta aikaisemman lemman nojalla R(ATA)=R(AT), joten
ja väite on todistettu. ◻
Esimerkki.
Tutki yhtälöryhmän
ratkaisujen olemassaoloa. Jos ratkaisuja ei ole, etsi residuaalin normin minimoiva approksimaatio ryhmän ratkaisulle. Jos tämä arvio on yksikäsitteinen, etsi yhtälöryhmän kerroinmatriisille Moore-Penrosen pseudoinverssi.
Viedään yhtälöryhmän kokonaismatriisi redusoituun riviporrasmuotoon.
Tästä nähdään, että yhtälöryhmällä ei ole tarkkaa ratkaisua, joten etsitään pienimmän neliösumman ratkaisu. Normaaliryhmän kerroinmatriisi ja vakiovektori
Matriisi ATA on selvästi kääntyvä, sillä se on kolmiomatriisi, jolla ei ole nolla-alkiota diagonaalillaan. Täten normaaliryhmällä ATAx=ATb on yksikäsitteinen pienimmän neliösumman ratkaisu
Kerroinmatriisin A pseudoinverssiksi saadaan tällöin