Processing math: 100%
Tämä kurssi on jo päättynyt.

Kovarianssi, korrelaatio ja summan varianssi

Olkoot X ja Y sitten kaksi samaan satunnaiskokeeseen liittyvää satunnaismuuttujaa ja jatketaan niiden riippumattomuuden tutkimista. Jos muuttujat riippuvat toisistaan, niin sovelluksen kannalta on tärkeää tietää minkälainen ja kuinka voimakas riippuvuus on kyseessä. Seuraavassa rajoitutaan vain lineaarisen riippuvuuden tarkastelemiseen. Oletetaan, että satunnaismuuttujilla on odotusarvot

E(X)=μXjaE(Y)=μY.

Muuttujien X ja Y välistä lineaarista riippuvuutta kuvataan tulon (XμX)(YμY) odotusarvon avulla.

Määritelmä 3.4.1

Satunnaismuuttujien X ja Y kovarianssi (covariance)

Cov(X,Y)=σXY=E((XμX)(YμY)).

Määritelmästä nähdään välittömästi, että Cov(X,X)=E((XμX)2)=Var(X), eli kovarianssi ikään kuin laajentaa varianssin käsitteen kahdelle satunnaismuuttujalle.

Lause 3.4.2

Satunnaismuuttujien X ja Y kovarianssi

Cov(X,Y)=E(XY)E(X)E(Y).
Näytä/piilota todistus

Väite seuraa kovarianssin määritelmästä ja odotusarvon lineaarisuudesta:

Cov(X,Y)=E((XμX)(YμY))=E(XYXμYμXY+μXμY)=E(XY)E(X)μYμXE(Y)+μXμY=E(XY)μXμY,

missä μX=E(X) ja μY=E(Y).

Satunnaisvektori (X,Y) saa arvoja (1,0), (0,1), (1,0) ja (0,1). Jokaisen arvon todennäköisyys on 1/4. Mikä on kovarianssin Cov(X,Y) merkki?
Ovatko satunnaismuuttujat X ja Y riippumattomia?

Lause 3.4.3

Jos satunnaismuuttujat X ja Y ovat riippumattomia, niin Cov(X,Y)=0.

Näytä/piilota todistus
Lauseessa 3.3.5 osoitettiin, että riippumattomille muuttujille X ja Y on voimassa E(XY)=E(X)E(Y), joten väite seuraa suoraan edellisestä lauseesta.

Kuten aikaisemminkin, tätä lausetta ei voi yleisesti kääntää: ehdon Cov(X,Y)=0 toteutuminen ei takaa satunnaismuuttujien X ja Y riippumattomuutta.

Jos satunnaismuuttujat X ja Y ovat riippumattomia, niin Cov(X,Y)=0.
Jos satunnaismuuttujille X ja Y on voimassa E(XY)E(X)E(Y)=0, niin ne ovat riippumattomia.

On tärkeää muistaa, että kovarianssin avulla voidaan ilmaista vain lineaarista riippuvuutta. Jos muuttujien X ja Y kovarianssi Cov(X,Y)>0, poikkeamien (XμX) ja (YμY) voidaan tulkita olevan tyypillisesti samanmerkkisiä. Tällöin siis satunnaismuuttujille X ja Y realisoituvat arvot yleisesti ottaen kasvavat tai vähenevät samanaikaisesti. Lisäksi tällöin satunnaisvektorin (X,Y) havaintoarvoja (x,y) esiintyy yleensä eniten xy-tason siinä osassa, jossa (XμX)(YμY)>0.

Kovarianssin suuruus riippuu myös muuttujien X ja Y keskihajonnoista Var(X)=σX ja Var(Y)=σY, minkä vuoksi Cov(X,Y) ei kelpaa eri muuttujaparien välisten lineaaristen riippuvuuksien voimakkuuden vertailemiseen. Ongelma saadaan korjattua siirtymällä tutkimaan keskihajonnan suhteen normeerattujen satunnaismuuttujien ˆX=1σXX ja ˆY=1σYY kovarianssia

Cov(ˆX,ˆY)=E(ˆXˆY)E(ˆX)E(ˆY)=E(XY)E(X)E(Y)σXσY=Cov(X,Y)σXσY.

Määritelmä 3.4.4

Satunnaismuuttujien X ja Y välinen (lineaarinen) korrelaatio ((linear) correlation)

Corr(X,Y)=ρXY=Cov(X,Y)Var(X)Var(Y).

Esimerkki 3.4.5

Esimerkin 3.3.2 satunnaisvektorin (X,Y) tiheysfunktio on f(x,y)=8xy otosavaruudessa 0<x<y<1. Laske komponenttien X ja Y kovarianssi ja korrelaatio.

Näytä/piilota ratkaisu

Esimerkissä 3.3.2 laskettiin, että E(XY)=49, ja lisäksi

E(X)=10y0x8xydxdy=10(/y083x3y)dy=1083y4dy=/10815y5=815E(Y)=10y0y8xydxdy=10(/y04x2y2)dy=104y4dy=/1045y5=45.

Täten

Cov(X,Y)=E(XY)E(X)E(Y)=4981545=4225.

Seuraavaksi lasketaan tulosten E(X2)=13 ja E(Y2)=23 (tarkista!) avulla, että

Var(X)=E(X2)E(X)2=13(815)2=11225Var(Y)=E(Y2)E(Y)2=23(1215)2=6225,

jolloin

Corr(X,Y)=Cov(X,Y)Var(X)Var(Y)=4225112256225=4660,4924.

Lause 3.4.6

Satunnaismuuttujien X ja Y korrelaatio toteuttaa seuraavat väitteet.

  1. 1Corr(X,Y)1.
  2. |Corr(X,Y)|=1 jos ja vain jos P(Y=aX+b)=1 joillakin vakioilla a0 ja b. Tässä a>0 jos Corr(X,Y)=1, ja a<0 jos Corr(X,Y)=1.

Mitä suurempi |Corr(X,Y)| on, sen voimakkaammasta lineaarisesta riippuvuudesta on kyse, eli sitä tiiviimmin satunnaisvektorin (X,Y) havaintoarvot (x,y) osuvat suoran kuvaajalle. Korrelaation arvot Corr(X,Y)=±1 kuvaavat täydellistä lineaarista riippuvuutta. Arvosta Corr(X,Y)=0 voidaan päätellä vain, että muuttujien X ja Y välillä ei ole lineaarista riippuvuutta. Sen sijaan muun luonteista riippuvuutta voi olla.

Korrelaatiokertoimen arvosta voidaan tehdä esimerkiksi seuraavanlaisia sanallisia tulkintoja. Muuttujien X ja Y välinen lineaarinen riippuvuus on

  • voimakas, jos |ρXY|0,8,
  • huomattava, jos 0,6|ρXY|<0,8,
  • kohtalainen, jos 0,3|ρXY|<0,6,
  • merkityksetön, jos |ρXY|<0,3.

Kun korrelaatiota mitataan satunnaismuuttujiin X ja Y liittyvästä empiirisestä aineistosta, on aina suotavaa muodostaa ensin havaintoaineiston pisteparvi, eli sirontakuvio (scatter plot), jossa havaintoarvoparit (x,y) piirretään xy-koordinaatistoon. Sirontakuvion avulla voidaan arvioida, onko lineaarisen riippuvuuden mittaaminen edes järkevää, sekä havaita mahdolliset poikkeavat tulokset, joille korrelaatio on herkkä. Alla on kuvattu joitakin sirontakuvioita ja korrelaatiokertoimia.

../_images/kuva39korr.svg

Regressioanalyysissa (regression analysis) tutkitaan tarkemmin havaintoaineiston muuttujien lineaarisia riippuvuuksia, mutta siihen palataan vasta myöhemmällä opintojaksolla.

Lause 3.4.7

Satunnaismuuttujien X ja Y lineaarisen lausekkeen varianssi

Var(aX+bY)=a2Var(X)+b2Var(Y)+2abCov(X,Y).

Erityisesti, jos X ja Y ovat riippumattomia, niin

Var(aX+bY)=a2Var(X)+b2Var(Y).
Näytä/piilota todistus

Tuloksen Var(X)=E(X2)(E(x))2 ja odotusarvon lineaarisuuden, lause 3.3.4 nojalla

Var(aX+bY)=E((aX+bY)2)E(aX+bY)2=E(a2X2+2abXY+b2E(Y2))(aE(X)+bE(Y))2=a2(E(X2)E(X)2)+b2(E(Y2)E(Y)2)+2ab(E(XY)E(X)E(Y))=a2Var(X)+b2Var(Y)+2abCov(X,Y),

kuten väitettiinkin. Jos muuttujat X ja Y ovat riippumattomia, niin Cov(X,Y)=0, ja varianssi sievenee toisen väitteen muotoon.

Tämä tulos yleistyy induktiolla useamman kuin kahden satunnaismuuttujan lineaarisille lausekkeille.

Lause 3.4.8

Jos satunnaismuuttujat X1,X2,,Xn ovat riippumattomia ja a1,a2,,an vakioita, niin

Var(a1X1+a2X2++anXn)=a21Var(X1)+a22Var(X2)++a2nVar(Xn).

Esimerkki 3.4.9

Jos muuttujien X ja Y varianssit ovat σ2X=2 ja σ2Y=4, sekä niiden kovarianssi σXY=2, niin satunnaismuuttujan U=3X4Y+8 varianssi

σ2U=Var(3X4Y+8)=Var(3X4Y)=32σ2X+(4)2σ2Y+23(4)σXY=130.
Palautusta lähetetään...