- MATH.APP.210
- 1. Todennäköisyys
- 1.5 Kokonaistodennäköisyys ja Bayesin kaava
Kokonaistodennäköisyys ja Bayesin kaava¶
Oletetaan, että tapahtumat B1,B2,…,Bn⊆Ω muodostavat otosavaruuden Ω osituksen (partition), eli että tapahtumat Bi, 1≤i≤n ovat pareittain erillisiä ja että
Tällöin jokainen alkeistapaus otosavaruudessa kuuluu täsmälleen yhteen tapahtumaan Bi.
Nyt mikä tahansa tapahtuma A⊆Ω voidaan esittää pareittain erillisten tapahtumien A∩Bi, 1≤i≤n yhdisteenä
Erillisten tapahtumien yhdisteenä tapahtuman A todennäköisyys on siis
mikä voidaan edelleen tulkita kertolaskusäännön avulla seuraavasti.
Lause 1.5.1
Kokonaistodennäköisyyden kaava. Jos tapahtumat B1,B2,…,Bn⊆Ω muodostavat otosavaruuden Ω osituksen ja todennäköisyys P(Bi)>0 kaikille i=1,2,…,n, niin
Tällä voidaan laskea todennäköisyys P(A), kun tunnetaan ositteiden Bi todennäköisyydet ja tapahtuman A todennäköisyydet ositteissa Bi. Tämän tärkeänä seurauksena voidaan laskea ehdollinen todennäköisyys
käyttämällä ehdollisia todennäköisyyksiä P(A∣Bi).
Lause 1.5.2 (Bayesin kaava)
Jos tapahtumat B1,B2,…,Bn⊆Ω muodostavat otosavaruuden Ω osituksen ja todennäköisyys P(Bi)>0 kaikille i=1,2,…,n, sekä P(A)>0, niin
Kirjoittamalla Bayesin kaava tapahtumien B ja ¯B muodostamalle ositukselle saadaan käyttökelpoinen erikoistapaus.
Seuraus 1.5.3
Jos 0<P(B)<1 ja P(A)>0, niin
Esimerkki 1.5.4
Tehtaan tuotannosta 1 % on viallisia (tapahtuma B1), 5 % huonoja (tapahtuma B2) ja 94 % hyviä (tapahtuma B3). Kehitettiin testauslaite, joka hylkää viallisen tuotteen todennäköisyydellä 0.90 ja huonon tuotteen todennäköisyydellä 0.70. Todennäköisyydellä 0.10 testi saattaa virheellisesti hylätä tuotteen, vaikka tuote olisi hyvä. Oletetaan, että on valittu satunnainen tuote ja että testilaite on hylännyt sen. Mikä on todennäköisyys, että tämä tuote on todella viallinen?
Annettujen tietojen perusteella P(B1)=0.01, P(B2)=0.05 ja P(B3)=0.94. Olkoon A tapahtuma “tuote hylätään”. Tällöin P(A∣B1)=0.90, P(A∣B2)=0.70 ja P(A∣B3)=0.10, joten todennäköisyys hylätylle tuotteelle olla viallinen on Bayesin kaavan mukaisesti
Näin päätellään (frekvenssitulkinnassa), että hylätyistä tuotteista vain noin 6.5 % on viallisia! Toinen tapa lähestyä ongelmaa olisi laskea hylkäämisen todennäköisyys
kokonaistodennäköisyyden kaavalla, ja sen jälkeen soveltaa ehdollisen todennäköisyyden määritelmää ja kertolaskusääntöä kysytyn todennäköisyyden laskemiseksi.
Esimerkki 1.5.5
Testissä saadaan selville 95 % dopingia käyttäneistä. 2 % urheilijoista saa niinsanotun väärän positiivisen tuloksen, eli heille testi on positiivinen, vaikka he ovatkin puhtaita. Oletetaan, että 1 % urheilijoista käyttää dopingia. Jos satunnaisesti valitun urheilijan testitulos on positiivinen, millä todennäköisyydellä hän on käyttänyt dopingia?
Olkoot D ja T tapahtumat “käyttää dopingia” ja “tulos on positiivinen” tässä järjestyksessä. Tietojen perusteella P(D)=0.01, P(¯D)=0.99, P(T∣D)=0.95 ja P(T∣¯D)=0.02. Soveltamalla Bayesin kaavaa nähdään, että kysytty todennäköisyys