- MATH.APP.210
- 7. Liitteet
- 7.1 Todennäköisyysjakaumia
Todennäköisyysjakaumia¶
Seuraavassa tiivistetään kurssilla esillä olleet diskreetit ja jatkuvat todennäköisyysjakaumat. Jokaisesta esitellään hyödyllisin osin otosavaruus, tiheysfunktio, odotusarvo, varianssi, momentit generoiva funktio, esimerkkikuvaajia ja lisätietoja.
Diskreetti tasajakauma, Tasd(a,b)¶
Otosavaruus: Ω=[a,b]∩Z={i∈Z:a≤i≤b}
Tiheysfunktio: P(X=x)=f(x)=1b−a+1
Odotusarvo: E(X)=a+b2
Varianssi: Var(X)=(b−a+1)2−112
Momentit generoiva funktio: M(t)={1,kun t=01b−a+1eta−et(b+1)1−et,kun t≠0
Lisätietoja:
- Englanniksi discrete uniform distribution, Unifd(a,b).
- Jos otosavaruuden alkeistapahtumat ovat symmetriset (klassinen todennäköisyys), niin niistä muodostuva satunnaismuuttuja noudattaa diskreettiä tasajakaumaa.
- Esimerkiksi nopan- tai kolikonheiton tulosten todennäköisyydet saadaan diskreetistä tasajakaumasta.
- Tasd(0,1)=Ber(0,5).
Bernoullin jakauma, Ber(p)¶
Otosavaruus: Ω={0,1}
Tiheysfunktio: P(X=x)=f(x)=px(1−p)1−x
Odotusarvo: E(X)=p
Varianssi: Var(X)=p(1−p)
Momentit generoiva funktio: M(t)=pet+1−p
Lisätietoja:
- Englanniksi Bernoulli distribution.
- Bernoullin jakaumaa noudattava satunnaismuuttuja X saa toisen kahdesta arvosta, jotka on koodattu luvuiksi 0 ja 1. Tapauksen X=1 (onnistuminen) todennäköisyys on p ja tapauksen X=0 (epäonnistuminen) 1−p.
- Esimerkiksi syntyvän lapsen sukupuoli tai tentissä onnistuminen voidaan esittää Bernoullin jakaumaa noudattavalla satunnaismuuttujalla.
- Bernoullin kokeella tarkoitetaan Bernoullin jakaumaa noudattavan satunnaismuuttujan koetta.
- Ber(0,5)=Tasd(0,1) ja Ber(p)=Bin(1,p).
Binomijakauma, Bin(n,p)¶
Otosavaruus: Ω={0,1,2,…,n}
Tiheysfunktio: P(X=x)=f(x)=(nx)px(1−p)n−x
Odotusarvo: E(X)=np
Varianssi: Var(X)=np(1−p)
Momentit generoiva funktio: M(t)=(pet+1−p)n
Lisätietoja:
- Englanniksi binomial distribution.
- f(x) kuvaa yhteensä x onnistumisen todennäköisyyttä n riippumattomassa jakaumaa Ber(p) noudattavassa Bernoullin kokeessa.
- Esimerkiksi viiden klaavan saaminen 10 kolikonheiton sarjassa.
- Jos X1∼Bin(n,p) ja X2∼Bin(m,p) ovat riippumattomia, niin niiden summa X1+X2∼Bin(n+m,p).
- Bin(1,p)=Ber(p).
- Bin(n,p)≈Poi(np), kun n on suuri, p pieni ja np≪n.
- Bin(n,p)≈N(np,np(1−p)), kun np≥5 ja n(1−p)≥5.
Poissonin jakauma, Poi(λ)¶
Otosavaruus: Ω=N∪{0}={0,1,2,…}
Tiheysfunktio: P(X=x)=f(x)=λxx!e−λ
Odotusarvo: E(X)=λ
Varianssi: Var(X)=λ
Momentit generoiva funktio: M(t)=e−λeλet
Lisätietoja:
- Englanniksi Poisson distribution.
- Harvinaisten, riippumattomien ja keskimäärin vakiotahdilla esiintyvien tapahtumien todennäköisyysjakauma.
- Jos suoritetaan suuri määrä n jakaumaa Ber(p) noudattavia Bernoullin kokeita ja p on pieni, niin onnistumisien lukumäärä noudattaa likimain Poissonin jakaumaa ja λ≈np.
- Esimerkiksi tuotantovirheiden esiintyminen tai fotonien osuminen sensorille.
- Poi(np)≈Bin(n,p), kun n on suuri, p on pieni ja np≪n.
- Jos X1∼Poi(λ1) ja X2∼Poi(λ2) ovat riippumattomia, niin X1+X2∼Poi(λ1+λ2).
Geometrinen jakauma, Geom(p)¶
Otosavaruus: Ω=Z+={1,2,3,…}
Tiheysfunktio: P(X=x)=f(x)=p(1−p)x−1
Odotusarvo: E(X)=1p
Varianssi: Var(X)=1−pp2
Momentit generoiva funktio: M(t)=pet1−(1−p)et
Lisätietoja:
- Englanniksi geometric distribution.
- f(x) kuvaa todennäköisyyttä, että ensimmäinen onnistuminen osuu x:lle yrittämälle jonossa riippumattomia jakaumaa Ber(p) noudattavia Bernoullin kokeita.
- Esimerkiksi ensimmäisen klaavan saaminen seitsemännellä yrittämällä kolikonheittojen sarjassa.
Hypergeometrinen jakauma, Hyperg(N,m,n)¶
Otosavaruus: Ω={x∈Z:max{0,n−(N−m)}≤x≤min{n,m}}
Tiheysfunktio: P(X=x)=f(x)=(mx)(N−mn−x)(Nn)
Odotusarvo: E(X)=nmN
Varianssi: Var(X)=nm(N−m)(N−n)N3−N
Lisätietoja:
- Englanniksi hypergeometric distribution.
- Lähtötilanteessa joukossa on N alkiota, joista m ovat halutunlaisia ja loput eivät. Kokeessa poimitaan palauttamatta n alkion otos. f(x) kuvaa todennäköisyyttä, jolla otokseen valikoituu x kappaletta halutunlaisia alkioita.
- Esimerkiksi eri väristen pallojen poimiminen laatikosta.
- Jos N≫n, niin palauttamatta tehty otanta on likimain sama kuin palauttaen tehty otanta.
- Hyperg(N,m,n)≈Bin(n,mN), kun n≤N10.
Jatkuva tasajakauma, Tas(a,b)¶
Otosavaruus: Ω=[a,b]
Tiheysfunktio: f(x)=1b−a
Odotusarvo: E(X)=a+b2
Varianssi: Var(X)=(b−a)212
Momentit generoiva funktio: M(t)={1,kun t=0ebt−eatt(b−a),kun t≠0
Lisätietoja:
- Englanniksi (continuous) uniform distribution, Unif(a,b).
- Monissa tietokoneohjelmissa satunnaisluvulla (random number) tarkoitetaan satunnaismuuttujan X∼Tas(a,b) realisoitunutta arvoa. Muiden jatkuvien satunnaislukugeneraattoreiden toteutukset nojaavat jatkuvaan tasajakaumaan.
Eksponenttijakauma, Exp(λ)¶
Otosavaruus: Ω=[0,∞)
Tiheysfunktio: f(x)=λe−λx
Odotusarvo: E(X)=1λ
Varianssi: Var(X)=1λ2
Momentit generoiva funktio: M(t)=λλ−t, kun 0≤t<λ
Lisätietoja:
Englanniksi exponential distribution.
Geometrisen jakauman jatkuva vastine.
Unohtuvaisuusominaisuus (memorylessness): jos X∼Exp(λ), niin
P(X>x1+x2∣X>x1)=P(X>x2).Esimerkiksi elektronisen komponentin ikä.
Normaalijakauma, N(μ,σ2)¶
Otosavaruus: Ω=R
Tiheysfunktio: f(x)=1σ√2πe−12(x−μσ)2
Odotusarvo: E(X)=μ
Varianssi: Var(X)=σ2
Momentit generoiva funktio: M(t)=eμt+12t2σ2
Lisätietoja:
Englanniksi normal distribution tai Gaussian distribution.
Jos X∼N(μ,σ2), niin aX+b∼N(aμ+b,a2σ2).
Jos X1∼N(μ1,σ21) ja X2∼N(μ2,σ22) ovat riippumattomia, niin
X1+X2∼N(μ1+μ2,σ21+σ22).Keskeisen raja-arvolauseen perusteella usean satunnaismuuttujan summa (ja täten myös otoskeskiarvo) on likimain normaalisti jakautunut riippumatta niiden alkuperäisistä jakaumista.
N(np,np(1−p))≈Bin(n,p), kun np≥5 ja n(1−p)≥5.
Jos Zi∼N(0,1), i=1,2,…,n ovat riippumattomia, niin n∑i=1Z2i∼χ2(n).
χ2-jakauma, χ2(n)¶
Otosavaruus: Ω=[0,∞)
Tiheysfunktio: f(x)=12n2Γ(n2)xn2−1e−x2, missä Γ on Eulerin gammafunktio
Odotusarvo: E(X)=n
Varianssi: Var(X)=2n
Momentit generoiva funktio: M(t)=(1−2t)−n2, kun t<12
Lisätietoja:
Englanniksi chi-squared distribution.
Jos X∼χ2(n), niin satunnaismuuttuja X on χ2-jakautunut vapausastein n (degrees of freedom, df).
Jos Zi∼N(0,1), i=1,2,…,n ovat riippumattomia, niin n∑i=1Z2i∼χ2(n).
Jos Xi∼N(μ,σ2), i=1,2,…,n ovat riippumattomia, niin
(n−1)S2σ2∼χ2(n−1).
Studentin t-jakauma, t(n)¶
Otosavaruus: Ω=R
Tiheysfunktio: f(x)=1√nπΓ(n+12)Γ(n2)(1+x2n)−n+12, missä Γ on Eulerin gammafunktio
Odotusarvo: E(X)=0, kun n>1
Varianssi: Var(X)=nn−2, kun n>2
Lisätietoja:
Englanniksi Student’s t-distribution.
Jos X∼t(n), niin satunnaismuuttuja X on t-jakautunut vapausastein n (degrees of freedom, df).
t-jakauma lähestyy standardinormaalijakaumaa N(0,1), kun n kasvaa rajatta.
Jos X1,X2,…,Xn on otos muuttujasta X∼N(μ,σ2), niin
¯X−μs/√n∼t(n−1).
F-jakauma, F(n1,n2)¶
Otosavaruus: Ω=[0,∞)
Tiheysfunktio: f(x)=Γ(n1+n22)Γ(n12)Γ(n22)(n1n2)n12xn1−22(1+n1n2x)−n1+n22, missä Γ on Eulerin gammafunktio
Odotusarvo: E(X)=n2n2−2, kun n2>2
Varianssi: Var(X)=2n22(n1+n2−2)n1(n2−2)2(n2−4), kun n2>4
Lisätietoja:
Englanniksi F-distribution. Myös Fisherin jakauma tai Snedecorin jakauma.
Jos X∼F(n1,n2), niin satunnaismuuttuja X on F-jakautunut vapausastein n1 ja n2 (degrees of freedom, df).
Jos X1∼χ2(n1) ja X2∼χ2(n2), niin
F=X1/n1X2/n2∼F(n1,n2)ja1F∼F(n2,n1).