- MATH.APP.210
- 2. Satunnaismuuttuja
- 2.4 Satunnaisvektorin jakauma
Satunnaisvektorin jakauma¶
Sovelluksissa satunnaiskokeen tuloksena saadaan usein havaintoarvot satunnaismuuttujille \(X_1, X_2, \ldots, X_p\), jotka voidaan myös kerätä yhteen satunnaisvektoriin \((X_1, X_2, \ldots, X_p)\). Koetta kuvaavan matemaattisen mallin rakentaminen edellyttää, että yksittäisten komponenttien jakaumien lisäksi selvitetään myös niiden yhteisjakauma, eli satunnaisvektorin jakauma. Yhteisjakauman määrittäminen ja sen avulla todennäköisyyksien laskeminen voi erityisesti jatkuvien satunnaismuuttujien kohdalla johtaa vaativiin laskuihin tasointegraaleina. Yhteisjakaumaa kuitenkin tarvitaan, jos halutaan tutkia satunnaismuuttujien \(X\) ja \(Y\) tapahtumien todennäköisyyksiä tai niiden välistä riippumattomuutta. Siksi yhteisjakauman käsite esitellään ja sitä käytetään reunajakaumien, riippumattomuuden ja riippuvuutta kuvaavien otossuureiden kovarianssin ja korrelaation määrittelemisessä.
Kuten yksiulotteisessa tapauksessa, myös satunnaisvektorin tapahtumien todennäköisyydet annetaan tavallisesti tiheysfunktion avulla. Seuraavassa tarkastellaan lähinnä kaksiulotteisia satunnaisvektoreita \((X, Y)\), sillä yleistys \(p\)-ulotteiseen tapaukseen on monesti suoraviivainen.
Diskreetti satunnaisvektori¶
Satunnaisvektori \((X, Y)\) on diskreetti (discrete), jos sen molemmat komponentit ovat diskreettejä satunnaismuuttujia. Diskreetin satunnaisvektorin otosavaruus on tason äärellinen tai ääretön diskreetti (numeroituva) osajoukko \(\Omega=\{(x_1, y_1), (x_2, y_2), \ldots, (x_n, y_n), \ldots\}\).
Diskreetin satunnaisvektorin \((X, Y)\) tiheysfunktio (density function) \(f(x, y)\) määritellään jokaisessa tason pisteessä \((x, y)\) asettamalla
jos \((x, y) \in \Omega\), ja \(f(x, y)=0\) muulloin. Arvot \(f(x, y)\), missä \((x, y) \in \Omega\), ovat pistetodennäköisyyksiä. Niiden koko otosavaruuden \(\Omega\) yli lasketun summan on oltava
Tapahtuman \(A\subseteq\Omega\) todennäköisyys on summa
Diskreetin satunnaisvektorin todennäköisyydet saadaan samalla tavoin kuin yhden muuttujan tapauksessa laskemalla yhteen pistetodennäköisyyksiä. Ero on vain se, että otosavaruuden alkeistapaukset ovat lukupareja \((x,y)\).
Esimerkki 2.4.1
Kahden nopan heitto tai kaksi kertaa yhden nopan heitto tuottaa satunnaisvektorin \((X,Y)\), missä \(X\) tarkoittaa 1. nopan silmälukua ja \(Y\) toisen nopan silmälukua. Otosavaruus on kaikkien \(6\cdot 6 = 36\) heittoparin joukko
ja nopanheiton luonteen mukaisesti jokainen heittopari on yhtä todennäköinen, joten tiheysfunktio
Tämän kaksiulotteisen diskreetin tasajakauman tapahtumien todennäköisyydet saadaan määrittämällä tapahtumaan kuuluvat alkeistapaukset. Esimerkiksi todennäköisyys, että toisella heitolla saadaan suurempi luku kuin ensimmäisellä on tapahtuma \(X<Y\). Tapahtumaan kuuluu alkeistapaukset
joita on 15. Todennäköisyys \(P(X<Y)=15/36=0.417\)
Esimerkki 2.4.2
Satunnaisvektorin \((X,Y)\) otosavaruus on \(\Omega=\{(0,1),(0,2),(1,0),(1,1),(2,0)\}\), ja tiheysfunktio
Määritä vakion \(c\) arvo, sekä laske todennäköisyydet \(P(X > Y)\) ja \(P(X = 1)\).
Kaikkien pistetodennäköisyyksien summan on oltava \(1\), joten
Tästä ratkaistaan \(c = \frac{1}{12}\). Sijoittamalla tämä tiheysfunktion lausekkeeseen saadaan kysyttyjen tapahtumien todennäköisyyksiksi
Jatkuva satunnaisvektori¶
Satunnaisvektori \((X, Y)\) on jatkuva (continuous), jos sen molemmat komponentit ovat jatkuvia satunnaismuuttujia. Jatkuvan satunnaisvektorin otosavaruus \(\Omega\) on tason \(\R^2 = \{(x, y) : x \in \R, y \in \R\}\) osajoukko.
Jatkuvan satunnaisvektorin \((X, Y)\) tiheysfunktio (density function) on koko tasossa määritelty ei-negatiivinen funktio \(f(x, y)\), jolle \(f(x, y) = 0\) aina, kun \((x, y) \not\in \Omega\), ja jonka avulla tapahtuman \(A \subseteq \Omega\) todennäköisyys voidaan esittää tasointegraalina
Tapahtuman \(A\) todennäköisyys on geometrisesti tulkittuna pinnan \(z = f(x, y)\) ja \(xy\)-tasoon sijoitetun joukon \(A\) rajaaman suoran sylinterikappaleen tilavuus.
Tiheysfunktiota \(f(x, y)\) kutsutaan satunnaismuuttujien \(X\) ja \(Y\) yhteisjakauman tiheysfunktioksi (density function of the joint distribution).
Satunnaisvektorin \((X,Y)\) kertymäfunktio (cumulative distribution function) määritellään jokaisessa tason pisteessä \((x, y)\) asettamalla
missä \(f(x,y)\) on vektorin \((X,Y)\) tiheysfunktio.
Jatkuvien satunnaisvektorien todennäköisyyksien laskeminen edellyttää tasointegraalien käyttöä. Ne lasketaan yleensä kahtena sisäkkäisenä integraalina ja integroimisrajat täytyy määrittää otosavaruuden ja tapahtuman perusteella. Seuraavassa esitetään yksi esimerkki yhteisjakauman käytöstä todennäköisyyksien laskemisessa.
Esimerkki 2.4.3
Satunnaisvektorin \((X,Y)\) tiheysfunktio on
Lasketaan todennäköisyys \(P(X + Y < 1)\). Otosavaruus \(\Omega\) on tason kolmiojoukko, jonka kärkipisteet ovat \((0,0),(0,1),(1,1)\). Tapahtuma \(X + Y < 1\) rajaa tästä otosavaruudesta joukon \(A\), kuva alla. Nyt todennäköisyys \(P(X + Y < 1)\) saadaan laskettua tiheysfunktion tasointegraalina, kun integroimisjoukko on
Seuraavat kuvat havainnollistavat otosavaruutta ja tapahtumaa otosavaruudessa. Nämä tapahtuman rajat ovat tasointegraalin rajoja
Suoritetaan integrointi ensin muuttujan \(y\) suhteen, ja tällöin