- MATH.APP.210
- 2. Satunnaismuuttuja
- 2.4 Satunnaisvektorin jakauma
Satunnaisvektorin jakauma¶
Sovelluksissa satunnaiskokeen tuloksena saadaan usein havaintoarvot satunnaismuuttujille X_1, X_2, \ldots, X_p, jotka voidaan myös kerätä yhteen satunnaisvektoriin (X_1, X_2, \ldots, X_p). Koetta kuvaavan matemaattisen mallin rakentaminen edellyttää, että yksittäisten komponenttien jakaumien lisäksi selvitetään myös niiden yhteisjakauma, eli satunnaisvektorin jakauma. Tällöin tehtävänä on mallintaa (havaintoarvojen pohjalta) satunnaisvektorin eri tapahtumien todennäköisyydet siten, että Kolmogorovin aksioomat toteutuvat. Kuten yksiulotteisessa tapauksessa, myös satunnaisvektorin tapahtumien todennäköisyydet annetaan tavallisesti tiheysfunktion avulla. Seuraavassa tarkastellaan lähinnä kaksiulotteisia satunnaisvektoreita (X, Y), sillä yleistys p-ulotteiseen tapaukseen on monesti suoraviivainen.
Diskreetti satunnaisvektori¶
Satunnaisvektori (X, Y) on diskreetti (discrete), jos sen molemmat komponentit ovat diskreettejä satunnaismuuttujia. Diskreetin satunnaisvektorin otosavaruus on tason äärellinen tai ääretön diskreetti (numeroituva) osajoukko \Omega=\{(x_1, y_1), (x_2, y_2), \ldots, (x_n, y_n), \ldots\}.
Diskreetin satunnaisvektorin (X, Y) tiheysfunktio (density function) f(x, y) määritellään jokaisessa tason pisteessä (x, y) asettamalla
jos (x, y) \in \Omega, ja f(x, y)=0 muulloin. Arvot f(x, y), missä (x, y) \in \Omega, ovat pistetodennäköisyyksiä. Niiden koko otosavaruuden \Omega yli lasketun summan on oltava
Tapahtuman A\subseteq\Omega todennäköisyys on summa
Satunnaisvektorin (X,Y) kertymäfunktio (cumulative distribution function) F määritellään jokaisessa tason pisteessä (x, y) asettamalla
Esimerkki 2.4.1
Satunnaisvektorin (X,Y) otosavaruus on \Omega=\{(0,1),(0,2),(1,0),(1,1),(2,0)\}, ja tiheysfunktio
Määritä vakion c arvo, sekä laske todennäköisyydet P(X > Y) ja P(X = 1).
Kaikkien pistetodennäköisyyksien summan on oltava 1, joten
Tästä ratkaistaan c = \frac{1}{12}. Sijoittamalla tämä tiheysfunktion lausekkeeseen saadaan kysyttyjen tapahtumien todennäköisyyksiksi
Jatkuva satunnaisvektori¶
Satunnaisvektori (X, Y) on jatkuva (continuous), jos sen molemmat komponentit ovat jatkuvia satunnaismuuttujia. Jatkuvan satunnaisvektorin otosavaruus \Omega on karteesisen tason \R^2 = \{(x, y) : x \in \R, y \in \R\} osajoukko.
Jatkuvan satunnaisvektorin (X, Y) tiheysfunktio (density function) on koko tasossa määritelty ei-negatiivinen funktio f(x, y), jolle f(x, y) = 0 aina, kun (x, y) \not\in \Omega, ja jonka avulla tapahtuman A \subseteq \Omega todennäköisyys voidaan esittää tasointegraalina
Tapahtuman A todennäköisyys on geometrisesti tulkittuna pinnan z = f(x, y) ja xy-tasoon sijoitetun joukon A rajaaman suoran sylinterikappaleen tilavuus.
Tiheysfunktiota f(x, y) kutsutaan (diskreetissäkin tapauksessa) myös satunnaismuuttujien X ja Y yhteisjakauman tiheysfunktioksi (density function of the joint distribution). Jotta jatkuvalle satunnaisvektorille olisi P(\Omega)=1, tiheysfunktion f(x, y) on toteutettava ehto
Tasointegraali koko tason \R^2 yli tarkoittaa epäoleellista integraalia
missä sisempi integraali määritetään ensin.
Satunnaisvektorin (X,Y) kertymäfunktio (cumulative distribution function) määritellään jokaisessa tason pisteessä (x, y) asettamalla
missä f(x,y) on vektorin (X,Y) tiheysfunktio. Pisteissä (x, y), joissa tiheysfunktio on jatkuva, on voimassa
missä \frac{\partial}{\partial z} tarkoittaa osittaisderivointia muuttujan z suhteen.
Esimerkki 2.4.2
Satunnaisvektorin (X,Y) tiheysfunktio
Määritä vakion c arvo, sekä laske todennäköisyys P(X + Y < 1).
Otosavaruus \Omega on sellaisenaan esitettynä y-projisoituva, eli muuttujan x rajat voidaan ilmoittaa muuttujan y avulla. Tällöin tasointegraali otosavaruuden \Omega yli on sisäkkäinen integraali
Tästä ratkaistaan c = 8. Nyt todennäköisyys P(X + Y < 1) saadaan laskettua tiheysfunktion tasointegraalina joukon
yli. Seuraavat kuvat havainnollistavat otosavaruutta ja tapahtumaa otosavaruudessa. Nämä tapahtuman rajat ovat tasointegraalin rajoja
Kyseessä on x-projisoituva joukko, joten integrointi voidaan suorittaa ensin muuttujan y suhteen, ja tällöin