- MATH.APP.210
- 1. Todennäköisyys
- 1.5 Kokonaistodennäköisyys ja Bayesin kaava
Kokonaistodennäköisyys ja Bayesin kaava¶
Oletetaan sitten, että tapahtumat B_1, B_2, \ldots, B_n \subseteq \Omega muodostavat otosavaruuden \Omega osituksen (partition), eli että tapahtumat B_i, 1 \leq i \leq n ovat pareittain erillisiä ja että
Tällöin mikä tahansa tapahtuma A \subseteq \Omega voidaan esittää pareittain erillisten tapahtumien A \cap B_i, 1 \leq i \leq n yhdisteenä
Erillisten tapahtumien yhdisteenä tapahtuman A todennäköisyys on siis
mikä voidaan edelleen tulkita kertolaskusäännön avulla seuraavasti.
Lause 1.5.1
Jos tapahtumat B_1, B_2, \ldots, B_n \subseteq \Omega muodostavat otosavaruuden \Omega osituksen ja todennäköisyys P(B_i) > 0 kaikille i = 1, 2, \ldots, n, niin
Tällä kokonaistodennäköisyyden kaavalla voidaan laskea todennäköisyys P(A), kun tunnetaan ositteiden B_i todennäköisyydet ja tapahtuman A todennäköisyydet ositteissa B_i. Tämän tärkeänä seurauksena voidaan laskea ehdollinen todennäköisyys
käyttämällä ehdollisia todennäköisyyksiä P(A \mid B_i).
Lause 1.5.2 (Bayesin kaava)
Jos tapahtumat B_1, B_2, \ldots, B_n \subseteq \Omega muodostavat otosavaruuden \Omega osituksen ja todennäköisyys P(B_i)>0 kaikille i=1,2,\ldots,n, sekä P(A)>0, niin
Kirjoittamalla Bayesin kaava tapahtumien B ja \overline{B} muodostamalle ositukselle saadaan käyttökelpoinen erikoistapaus.
Seuraus 1.5.3
Jos 0 < P(B) < 1 ja P(A) > 0, niin
Esimerkki 1.5.4
Tehtaan tuotannosta 1~\% on viallisia (tapahtuma B_1), 5~\% huonoja (tapahtuma B_2) ja 94~\% hyviä (tapahtuma B_3). Kehitettiin testauslaite, joka hylkää viallisen tuotteen todennäköisyydellä 0{,}90 ja huonon tuotteen todennäköisyydellä 0{,}70. Todennäköisyydellä 0{,}10 testi saattaa virheellisesti hylätä tuotteen, vaikka tuote olisi hyvä. Oletetaan, että on valittu satunnainen tuote ja että testilaite on hylännyt sen. Mikä on todennäköisyys, että tämä tuote on todella viallinen?
Annettujen tietojen perusteella P(B_1)=0{,}01, P(B_2)=0{,}05 ja P(B_3)=0{,}94. Olkoon A tapahtuma “tuote hylätään”. Tällöin P(A\mid B_1)=0{,}90, P(A\mid B_2)=0{,}70 ja P(A\mid B_3)=0{,}10, joten todennäköisyys hylätylle tuotteelle olla viallinen on Bayesin kaavan mukaisesti
Näin päätellään (frekvenssitulkinnassa), että hylätyistä tuotteista vain noin 6{,}5~\% on viallisia! Toinen tapa lähestyä ongelmaa olisi laskea hylkäämisen todennäköisyys
kokonaistodennäköisyyden kaavalla, ja sen jälkeen soveltaa ehdollisen todennäköisyyden määritelmää ja kertolaskusääntöä kysytyn todennäköisyyden laskemiseksi.
Esimerkki 1.5.5
Testissä saadaan selville 95~\% dopingia käyttäneistä. 2~\% urheilijoista saa niinsanotun väärän positiivisen tuloksen, eli heille testi on positiivinen, vaikka he ovatkin puhtaita. Oletetaan, että 1~\% urheilijoista käyttää dopingia. Jos satunnaisesti valitun urheilijan testitulos on positiivinen, millä todennäköisyydellä hän on käyttänyt dopingia?
Olkoot D ja T tapahtumat “käyttää dopingia” ja “tulos on positiivinen” tässä järjestyksessä. Tietojen perusteella P(D) = 0{,}01, P(\overline{D}) = 0{,}99, P(T \mid D) = 0{,}95 ja P(T \mid \overline{D}) = 0{,}02. Soveltamalla Bayesin kaavaa nähdään, että kysytty todennäköisyys