- MAT-01530
- 4. Odotusarvo
- 4.4 Kovarianssi, korrelaatio ja summan varianssi
Kovarianssi, korrelaatio ja summan varianssi¶
Olkoot X ja Y sitten kaksi samaan satunnaiskokeeseen liittyvää satunnaismuuttujaa ja jatketaan niiden riippumattomuuden tutkimista. Jos muuttujat riippuvat toisistaan, niin sovelluksen kannalta on tärkeää tietää minkälainen ja kuinka voimakas riippuvuus on kyseessä. Seuraavassa rajoitutaan vain lineaarisen riippuvuuden tarkastelemiseen. Oletetaan, että satunnaismuuttujilla on odotusarvot
Muuttujien X ja Y välistä lineaarista riippuvuutta kuvataan tulon (X-\mu_X)(Y-\mu_Y) odotusarvon avulla.
Määritelmä 4.4.1
Satunnaismuuttujien X ja Y kovarianssi (covariance)
Määritelmästä nähdään välittömästi, että \Cov(X,X)=\rE((X-\mu_X)^2)=\Var(X), eli kovarianssi ikään kuin laajentaa varianssin käsitteen kahdelle satunnaismuuttujalle.
Lause 4.4.2
Satunnaismuuttujien X ja Y kovarianssi
Väite seuraa kovarianssin määritelmästä ja odotusarvon lineaarisuudesta:
missä \mu_X = \rE(X) ja \mu_Y = \rE(Y).
Lause 4.4.3
Jos satunnaismuuttujat X ja Y ovat riippumattomia, niin \Cov(X,Y)=0.
Kuten aikaisemminkin, tätä lausetta ei voi yleisesti kääntää: ehdon \Cov(X,Y)=0 toteutuminen ei takaa satunnaismuuttujien X ja Y riippumattomuutta.
On tärkeää muistaa, että kovarianssin avulla voidaan ilmaista vain lineaarista riippuvuutta. Jos muuttujien X ja Y kovarianssi \Cov(X,Y)>0, poikkeamien (X-\mu_X) ja (Y-\mu_Y) voidaan tulkita olevan tyypillisesti samanmerkkisiä. Tällöin siis satunnaismuuttujille X ja Y realisoituvat arvot yleisesti ottaen kasvavat tai vähenevät samanaikaisesti. Lisäksi tällöin satunnaisvektorin (X, Y) havaintoarvoja (x, y) esiintyy yleensä eniten xy-tason siinä osassa, jossa (X-\mu_X)(Y-\mu_Y)>0.
Kovarianssin suuruus riippuu osittain satunnaismuuttujien X ja Y keskihajonnoista \sqrt{\mathrm{Var}(X)}=\sigma_X ja \sqrt{\mathrm{Var}(Y)}=\sigma_Y, minkä vuoksi \Cov(X,Y) ei kelpaa eri muuttujaparien välisten lineaaristen riippuvuuksien voimakkuuden vertailemiseen. Ongelma saadaan korjattua siirtymällä tutkimaan keskihajonnan suhteen normeerattujen satunnaismuuttujien \hat{X} = \frac{1}{\sigma_X}X ja \hat{Y} = \frac{1}{\sigma_Y}Y kovarianssia
Määritelmä 4.4.4
Satunnaismuuttujien X ja Y välinen (lineaarinen) korrelaatio ((linear) correlation)
Esimerkki 4.4.5
Aikaisemman esimerkin 4.3.2 satunnaisvektorin (X,Y) tiheysfunktio on f(x,y)=8xy, kun 0<x<y<1. Laske komponenttien X ja Y kovarianssi ja korrelaatio.
Esimerkissä 4.3.2 laskettiin, että \rE(XY)=\frac{4}{9}, ja lisäksi
Täten
Seuraavaksi lasketaan tulosten \rE(X^2) = \frac{1}{3} ja \rE(Y^2) = \frac{2}{3} (tarkista!) avulla, että
jolloin
Lause 4.4.6
Satunnaismuuttujien X ja Y korrelaatio toteuttaa seuraavat väitteet.
- -1 \leq \Corr(X,Y) \leq 1.
- \left|\Corr(X, Y)\right| = 1 jos ja vain jos P(Y = aX + b) = 1 joillakin vakioilla a \not= 0 ja b. Tässä a > 0 jos \Corr(X, Y) = 1, ja a < 0 jos \Corr(X, Y) = -1.
Mitä suurempi \left|\Corr(X,Y)\right| on, sen voimakkaammasta lineaarisesta riippuvuudesta on kyse, eli sitä tiiviimmin satunnaisvektorin (X, Y) havaintoarvot (x, y) osuvat suoran kuvaajalle. Korrelaation arvot \Corr(X,Y)=\pm1 kuvaavat täydellistä lineaarista riippuvuutta. Arvosta \Corr(X,Y)=0 voidaan päätellä vain, että muuttujien X ja Y välillä ei ole lineaarista riippuvuutta. Sen sijaan muun luonteista riippuvuutta voi olla. Korrelaatiokertoimen arvosta voidaan tehdä esimerkiksi seuraavanlaisia sanallisia tulkintoja. Muuttujien X ja Y välinen lineaarinen riippuvuus on
- voimakas, jos |\rho_{XY}| \geq 0{,}8,
- huomattava, jos 0{,}6\leq |\rho_{XY}| < 0{,}8,
- kohtalainen, jos 0{,}3\leq |\rho_{XY}| < 0{,}6,
- merkityksetön, jos |\rho_{XY}| < 0{,}3.
Kun korrelaatiota mitataan satunnaismuuttujiin X ja Y liittyvästä empiirisestä aineistosta, on aina suotavaa muodostaa ensin havaintoaineiston pisteparvi, eli sirontakuvio (scatter plot), jossa havaintoarvoparit (x,y) piirretään xy-koordinaatistoon. Sirontakuvion avulla voidaan arvioida, onko lineaarisen riippuvuuden mittaaminen edes järkevää, sekä havaita mahdolliset poikkeavat tulokset, joille korrelaatio on herkkä. Alla on kuvattu joitakin sirontakuvioita ja korrelaatiokertoimia.
Regressioanalyysissa (regression analysis) tutkitaan tarkemmin havaintoaineiston muuttujien lineaarisia riippuvuuksia, mutta siihen palataan vasta myöhemmällä opintojaksolla.
Lause 4.4.7
Satunnaismuuttujien X ja Y lineaarisen lausekkeen varianssi
Erityisesti, jos X ja Y ovat riippumattomia, niin
Tuloksen \Var(X)=\rE(X^2)-(\rE(x))^2 ja odotusarvon lineaarisuuden, lause 4.3.4 nojalla
kuten väitettiinkin. Jos muuttujat X ja Y ovat riippumattomia, niin \Cov(X, Y) = 0, ja varianssi sievenee toisen väitteen muotoon.
Tämä tulos yleistyy induktiolla useamman kuin kahden satunnaismuuttujan lineaarisille lausekkeille.
Lause 4.4.8
Jos satunnaismuuttujat X_1,X_2,\ldots,X_n ovat riippumattomia ja a_1, a_2, \ldots, a_n vakioita, niin
Esimerkki 4.4.9
Jos muuttujien X ja Y varianssit ovat \sigma_X^2=2 ja \sigma_Y^2=4, sekä niiden kovarianssi \sigma_{XY}=-2, niin satunnaismuuttujan U=3X-4Y+8 varianssi