- MATH.APP.210
- 4. Todennäköisyysjakaumia
- 4.2 Binomijakauma
Binomijakauma¶
Palataan sitten tutkimaan tärkeimpiä diskreettejä ja jatkuvia todennäköisyysjakaumia. Niistä ensimmäinen muodostuu seuraavan Bernoullin kokeen toistona. Oletetaan, että satunnaiskokeen tulosvaihtoehdot (koodattuna) ovat 0 ja 1, eli tarkastelun kohteena oleva tapahtuma joko ei realisoidu tai realisoituu. Ensimmäistä vaihtoehtoa kutsutaan myös epäonnistumiseksi ja jälkimmäistä onnistumiseksi. Kiinnitetään onnistumisen todennäköisyydeksi p, jolloin epäonnistumisen todennäköisyys on 1−p.
Määritelmä 4.2.1
Diskreetti satunnaismuuttuja X noudattaa Bernoullin jakaumaa (Bernoulli distribution) parametrilla p, X∼Ber(p), jos sen otosavaruus Ω={0,1} ja tiheysfunktio
Bernoullin jakauman kuvaama satunnaiskoe voidaan yleistää toistamalla sitä n kertaa siten, että jokainen toisto on toisista riippumaton. Onnistumisien lukumäärä tässä n-toistokokeessa on uusi diskreetti satunnaismuuttuja X, jonka mahdolliset arvot ovat kokonaislukuja 0,1,…,n. Siihen liittyvät alkeistapaukset ovat nollista ja ykkösistä koostuvia jonoja, joissa on x kappaletta onnistumisia ja n−x kappaletta epäonnistumisia jossakin järjestyksessä. Koska onnistumisen todennäköisyys on p ja toistot ovat riippumattomia toisistaan, yksittäinen alkeistapaus realisoituu todennäköisyydellä px(1−p)n−x. Vaihtoehtoja alkeistapahtumiksi, joihin liittyy x onnistumista, on (nx) erilaista, joten
Määritelmä 4.2.2
Diskreetti satunnaismuuttuja X noudattaa binomijakaumaa (binomial distribution) parametrein n ja p, X∼Bin(n,p), jos sen otosavaruus
ja tiheysfunktio
Binomijakauman tiheysfunktion f arvoja f(x)=b(x;n,p) otosavaruuden pisteissä sanotaan binomitodennäköisyyksiksi.
Lause 4.2.3
Jos satunnaismuuttuja X∼Bin(n,p), niin sen odotusarvo ja varianssi ovat
Olkoon Xi∼Ber(p), i∈{1,2,3,…n} riippumattomia Bernoullijakautuneita satunnaismuuttujia. Niiden otosavaruus Ω={0,1} ja tiheysfunktio
Nyt odotusarvon määritelmän mukaan
Varianssia varten lasketaan ensin
ja
Kun nämä riippumattomat satunnaismuuttujat lasketaan yhteen saadaan
ja satunnaismuuttujien summan odotusarvon tuloksen mukaan
ja riippumattomien satunnaismuuttujien summan varianssin tuloksen mukaan
Esimerkki 4.2.4
Isossa määrässä arpoja joka 5. arpa voittaa. Millä todennäköisyydellä 10 arpaa ostava saa vähintään 2 voittoarpaa?
Arpojen ostaminen on esimerkki otannasta palauttamatta. Koska arpoja on rajallinen määrä, jokaisen oston jälkeen voittoarvan saamisen todennäköisyys muuttuu. Tässä tilanteessa, jossa arpojen kokonaismäärää ei tiedetä, ei ole kuitenkaan mahdollisuutta arvoida todennäköisyyden muutosta. Kun sanotaan, että arpoja on paljon, todennäköisyyden muutos on niin pieni, että tilannetta voi arvioida binomijakaumalla käyttäen kiinteää todennäköisyyttä p=0.2.
Voittoarpojen lukumäärä 10 ostetun arvan joukossa on satunnaismuuttuja
X∼Bin(10,0.2) tiheysfunktiona
Nyt E(X)=np=10⋅0.2=2. Keskimäärin 10 arvan joukossa on 2 voittoarpaa. Todennäköisyys saada vähintään 2 voittoarpaa on
Matlabin komennot binopdf
ja binocdf
laskevat binomijakauman tiheys- ja kertymäfunktioiden arvoja. Vastauksen voi laskea Matlabilla
pistetodennäköisyyksien summana
1- sum(binopdf([0 1], 10, 0.2))
tai kertymäfunktion avulla. Huomaa, että kertymäfunktiota käytettäessä pisteen X=2 todennäköisyys sisältyy kertymäfunktion arvoon F(2) ja siksi lasketaankin
1−P(X<2)=1−P(X≤1)=1−F(1)
1- binocdf(1, 10, 0.2)
R:n vastaavat komennot tiheys- ja kertymäfunktioille ovat dbinom
ja pbinom
ja ratkaisu saadaan
1 - dbinom(0, 10, 0.2) - dbinom(1, 10, 0.2) 1 - pbinom(1, 10, 0.2)
Esimerkki 4.2.5
Erään tuottajan transistoreista 5 % on viallisia. Asiakas ostaa 6 transistoria ja kuvaa viallisten laitteiden lukumäärää otoksessaan satunnaismuuttujalla X. Laske todennäköisyys sille, että asiakas saa
a) yksi tai kaksi viallista transistoria
b) vähintään yhden viallisen transistorin.
Kyseessä on 6-toistokoe, jossa onnistumisen, eli viallisen transistorin saamisen todennäköisyys yksittäisellä toistolla on 0.05. Täten satunnaismuuttuja X∼Bin(6,0.05) tiheysfunktionaan
Satunnaismuuttujan odotusarvo on E(X)=np=6⋅0.05=0.3 ja varianssi
Var(X)=np(1−p)=6⋅0.05⋅0.95=0.285.
a) Todennäköisyys sille, että asiakas saa yhden tai kaksi viallista transistoria on
Matlabilla edellinen tulos voitaisiin laskea pistetodennäköisyyksien summana
sum(binopdf([1 2], 6, 0.05))
tai kertymäfunktion avulla. Kertymäfunktiota käytettäessä pisteen X=1 todennäköisyys sisältyy kertymäfunktion arvoon F(1) ja siksi käytetään muotoa
P(1≤X≤2)=P(0<X≤2)
binocdf(2, 6, 0.05) - binocdf(0, 6, 0.05)
R:n vastaavat komennot olisivat
dbinom(1, 6, 0.05) + dbinom(2, 6, 0.05) pbinom(2, 6, 0.05) - pbinom(0, 6, 0.05)
b) Todennäköisyys sille, että asiakas saa vähintään yhden viallisen transistorin on
Matlab- ja R-komennot ovat
1 - binopdf(0, 6, 0.05) % Matlab 1 - dbinom(0, 6, 0.05) # R