Processing math: 100%

Kokonaistodennäköisyys ja Bayesin kaava

Oletetaan, että tapahtumat B1,B2,,BnΩ muodostavat otosavaruuden Ω osituksen (partition), eli että tapahtumat Bi, 1in ovat pareittain erillisiä ja että

Ω=ni=1Bi=B1B2Bn.

Tällöin jokainen alkeistapaus otosavaruudessa kuuluu täsmälleen yhteen tapahtumaan Bi.

Nyt mikä tahansa tapahtuma AΩ voidaan esittää pareittain erillisten tapahtumien ABi, 1in yhdisteenä

A=AΩ=Ani=1Bi=ni=1(ABi)=(AB1)(AB2)(ABn).
../_images/kuva15ositus.svg

Erillisten tapahtumien yhdisteenä tapahtuman A todennäköisyys on siis

P(A)=ni=1P(ABi),

mikä voidaan edelleen tulkita kertolaskusäännön avulla seuraavasti.

Lause 1.5.1

Kokonaistodennäköisyyden kaava. Jos tapahtumat B1,B2,,BnΩ muodostavat otosavaruuden Ω osituksen ja todennäköisyys P(Bi)>0 kaikille i=1,2,,n, niin

P(A)=ni=1P(Bi)P(ABi).

Tällä voidaan laskea todennäköisyys P(A), kun tunnetaan ositteiden Bi todennäköisyydet ja tapahtuman A todennäköisyydet ositteissa Bi. Tämän tärkeänä seurauksena voidaan laskea ehdollinen todennäköisyys

P(BkA)=P(BkA)P(A)

käyttämällä ehdollisia todennäköisyyksiä P(ABi).

Lause 1.5.2 (Bayesin kaava)

Jos tapahtumat B1,B2,,BnΩ muodostavat otosavaruuden Ω osituksen ja todennäköisyys P(Bi)>0 kaikille i=1,2,,n, sekä P(A)>0, niin

P(BkA)=P(Bk)P(ABk)ni=1P(Bi)P(ABi).

Kirjoittamalla Bayesin kaava tapahtumien B ja ¯B muodostamalle ositukselle saadaan käyttökelpoinen erikoistapaus.

Seuraus 1.5.3

Jos 0<P(B)<1 ja P(A)>0, niin

P(BA)=P(B)P(AB)P(B)P(AB)+P(¯B)P(A¯B).

Tutkitaan aiemman tehtävän tapaan 52-korttista korttipakkaa, jonka jäsenet ovat järjestettyjä pareja (a,b), missä a{,,,} ja b{2,,14}. Tehdään korttipakan ositus kahteen eri tapaan: maiden , , ja , ja sitten numeroiden 214 mukaan. Näin muodostuvat esim. osajoukot

Ma={(a,2),,(a,14)}jaNb={(,b),(,b),(,b),(,b)}.

Mikä seuraavista tapahtumajoukoista on pareittain erillinen?

Esimerkki 1.5.4

Tehtaan tuotannosta 1 % on viallisia (tapahtuma B1), 5 % huonoja (tapahtuma B2) ja 94 % hyviä (tapahtuma B3). Kehitettiin testauslaite, joka hylkää viallisen tuotteen todennäköisyydellä 0.90 ja huonon tuotteen todennäköisyydellä 0.70. Todennäköisyydellä 0.10 testi saattaa virheellisesti hylätä tuotteen, vaikka tuote olisi hyvä. Oletetaan, että on valittu satunnainen tuote ja että testilaite on hylännyt sen. Mikä on todennäköisyys, että tämä tuote on todella viallinen?

Piilota/näytä ratkaisu

Annettujen tietojen perusteella P(B1)=0.01, P(B2)=0.05 ja P(B3)=0.94. Olkoon A tapahtuma “tuote hylätään”. Tällöin P(AB1)=0.90, P(AB2)=0.70 ja P(AB3)=0.10, joten todennäköisyys hylätylle tuotteelle olla viallinen on Bayesin kaavan mukaisesti

P(B1A)=P(B1)P(AB1)P(B1)P(AB1)+P(B2)P(AB2)+P(B3)P(AB3)=0.010.900.010.90+0.050.70+0.940.100.065.

Näin päätellään (frekvenssitulkinnassa), että hylätyistä tuotteista vain noin 6.5 % on viallisia! Toinen tapa lähestyä ongelmaa olisi laskea hylkäämisen todennäköisyys

P(A)=P(B1)P(AB1)+P(B2)P(AB2)+P(B3)P(AB3)=0.010.90+0.050.70+0.940.100.138

kokonaistodennäköisyyden kaavalla, ja sen jälkeen soveltaa ehdollisen todennäköisyyden määritelmää ja kertolaskusääntöä kysytyn todennäköisyyden laskemiseksi.

Esimerkki 1.5.5

Testissä saadaan selville 95 % dopingia käyttäneistä. 2 % urheilijoista saa niinsanotun väärän positiivisen tuloksen, eli heille testi on positiivinen, vaikka he ovatkin puhtaita. Oletetaan, että 1 % urheilijoista käyttää dopingia. Jos satunnaisesti valitun urheilijan testitulos on positiivinen, millä todennäköisyydellä hän on käyttänyt dopingia?

Piilota/näytä ratkaisu

Olkoot D ja T tapahtumat “käyttää dopingia” ja “tulos on positiivinen” tässä järjestyksessä. Tietojen perusteella P(D)=0.01, P(¯D)=0.99, P(TD)=0.95 ja P(T¯D)=0.02. Soveltamalla Bayesin kaavaa nähdään, että kysytty todennäköisyys

P(DT)=P(D)P(TD)P(D)P(TD)+P(¯D)P(T¯D)=0.010.950.010.95+0.990.020.32.
Palautusta lähetetään...