\newcommand{\N}{\mathbb N}
\newcommand{\Z}{\mathbb Z}
\newcommand{\Q}{\mathbb Q}
\newcommand{\R}{\mathbb R}
\newcommand{\C}{\mathbb C}
\newcommand{\ba}{\mathbf{a}}
\newcommand{\bb}{\mathbf{b}}
\newcommand{\bc}{\mathbf{c}}
\newcommand{\bd}{\mathbf{d}}
\newcommand{\be}{\mathbf{e}}
\newcommand{\bff}{\mathbf{f}}
\newcommand{\bh}{\mathbf{h}}
\newcommand{\bi}{\mathbf{i}}
\newcommand{\bj}{\mathbf{j}}
\newcommand{\bk}{\mathbf{k}}
\newcommand{\bN}{\mathbf{N}}
\newcommand{\bn}{\mathbf{n}}
\newcommand{\bo}{\mathbf{0}}
\newcommand{\bp}{\mathbf{p}}
\newcommand{\bq}{\mathbf{q}}
\newcommand{\br}{\mathbf{r}}
\newcommand{\bs}{\mathbf{s}}
\newcommand{\bT}{\mathbf{T}}
\newcommand{\bu}{\mathbf{u}}
\newcommand{\bv}{\mathbf{v}}
\newcommand{\bw}{\mathbf{w}}
\newcommand{\bx}{\mathbf{x}}
\newcommand{\by}{\mathbf{y}}
\newcommand{\bz}{\mathbf{z}}
\newcommand{\bzero}{\mathbf{0}}
\newcommand{\nv}{\mathbf{0}}
\newcommand{\cA}{\mathcal{A}}
\newcommand{\cB}{\mathcal{B}}
\newcommand{\cC}{\mathcal{C}}
\newcommand{\cD}{\mathcal{D}}
\newcommand{\cE}{\mathcal{E}}
\newcommand{\cF}{\mathcal{F}}
\newcommand{\cG}{\mathcal{G}}
\newcommand{\cH}{\mathcal{H}}
\newcommand{\cI}{\mathcal{I}}
\newcommand{\cJ}{\mathcal{J}}
\newcommand{\cK}{\mathcal{K}}
\newcommand{\cL}{\mathcal{L}}
\newcommand{\cM}{\mathcal{M}}
\newcommand{\cN}{\mathcal{N}}
\newcommand{\cO}{\mathcal{O}}
\newcommand{\cP}{\mathcal{P}}
\newcommand{\cQ}{\mathcal{Q}}
\newcommand{\cR}{\mathcal{R}}
\newcommand{\cS}{\mathcal{S}}
\newcommand{\cT}{\mathcal{T}}
\newcommand{\cU}{\mathcal{U}}
\newcommand{\cV}{\mathcal{V}}
\newcommand{\cW}{\mathcal{W}}
\newcommand{\cX}{\mathcal{X}}
\newcommand{\cY}{\mathcal{Y}}
\newcommand{\cZ}{\mathcal{Z}}
\newcommand{\rA}{\mathrm{A}}
\newcommand{\rB}{\mathrm{B}}
\newcommand{\rC}{\mathrm{C}}
\newcommand{\rD}{\mathrm{D}}
\newcommand{\rE}{\mathrm{E}}
\newcommand{\rF}{\mathrm{F}}
\newcommand{\rG}{\mathrm{G}}
\newcommand{\rH}{\mathrm{H}}
\newcommand{\rI}{\mathrm{I}}
\newcommand{\rJ}{\mathrm{J}}
\newcommand{\rK}{\mathrm{K}}
\newcommand{\rL}{\mathrm{L}}
\newcommand{\rM}{\mathrm{M}}
\newcommand{\rN}{\mathrm{N}}
\newcommand{\rO}{\mathrm{O}}
\newcommand{\rP}{\mathrm{P}}
\newcommand{\rQ}{\mathrm{Q}}
\newcommand{\rR}{\mathrm{R}}
\newcommand{\rS}{\mathrm{S}}
\newcommand{\rT}{\mathrm{T}}
\newcommand{\rU}{\mathrm{U}}
\newcommand{\rV}{\mathrm{V}}
\newcommand{\rW}{\mathrm{W}}
\newcommand{\rX}{\mathrm{X}}
\newcommand{\rY}{\mathrm{Y}}
\newcommand{\rZ}{\mathrm{Z}}
\newcommand{\pv}{\overline}
\newcommand{\iu}{\mathrm{i}}
\newcommand{\ju}{\mathrm{j}}
\newcommand{\im}{\mathrm{i}}
\newcommand{\e}{\mathrm{e}}
\newcommand{\real}{\operatorname{Re}}
\newcommand{\imag}{\operatorname{Im}}
\newcommand{\Arg}{\operatorname{Arg}}
\newcommand{\Ln}{\operatorname{Ln}}
\DeclareMathOperator*{\res}{res}
\newcommand{\re}{\operatorname{Re}}
\newcommand{\im}{\operatorname{Im}}
\newcommand{\arsinh}{\operatorname{ar\,sinh}}
\newcommand{\arcosh}{\operatorname{ar\,cosh}}
\newcommand{\artanh}{\operatorname{ar\,tanh}}
\newcommand{\sgn}{\operatorname{sgn}}
\newcommand{\diag}{\operatorname{diag}}
\newcommand{\proj}{\operatorname{proj}}
\newcommand{\rref}{\operatorname{rref}}
\newcommand{\rank}{\operatorname{rank}}
\newcommand{\Span}{\operatorname{span}}
\newcommand{\vir}{\operatorname{span}}
\renewcommand{\dim}{\operatorname{dim}}
\newcommand{\alg}{\operatorname{alg}}
\newcommand{\geom}{\operatorname{geom}}
\newcommand{\id}{\operatorname{id}}
\newcommand{\norm}[1]{\lVert #1 \rVert}
\newcommand{\tp}[1]{#1^{\top}}
\renewcommand{\d}{\mathrm{d}}
\newcommand{\sij}[2]{\bigg/_{\mspace{-15mu}#1}^{\,#2}}
\newcommand{\abs}[1]{\lvert#1\rvert}
\newcommand{\pysty}[1]{\left[\begin{array}{@{}r@{}}#1\end{array}\right]}
\newcommand{\piste}{\cdot}
\newcommand{\qedhere}{}
\newcommand{\taumatrix}[1]{\left[\!\!#1\!\!\right]}
\newenvironment{augmatrix}[1]{\left[\begin{array}{#1}}{\end{array}\right]}
\newenvironment{vaugmatrix}[1]{\left|\begin{array}{#1}}{\end{array}\right|}
\newcommand{\trans}{\mathrm{T}}
\newcommand{\EUR}{\text{\unicode{0x20AC}}}
\newcommand{\SI}[3][]{#2\,\mathrm{#3}}
\newcommand{\si}[2][]{\mathrm{#2}}
\newcommand{\num}[2][]{#2}
\newcommand{\ang}[2][]{#2^{\circ}}
\newcommand{\meter}{m}
\newcommand{\metre}{\meter}
\newcommand{\kilo}{k}
\newcommand{\kilogram}{kg}
\newcommand{\gram}{g}
\newcommand{\squared}{^2}
\newcommand{\cubed}{^3}
\newcommand{\minute}{min}
\newcommand{\hour}{h}
\newcommand{\second}{s}
\newcommand{\degreeCelsius}{^{\circ}C}
\newcommand{\per}{/}
\newcommand{\centi}{c}
\newcommand{\milli}{m}
\newcommand{\deci}{d}
\newcommand{\percent}{\%}
\newcommand{\Var}{\operatorname{Var}}
\newcommand{\Cov}{\operatorname{Cov}}
\newcommand{\Corr}{\operatorname{Corr}}
\newcommand{\Tasd}{\operatorname{Tasd}}
\newcommand{\Ber}{\operatorname{Ber}}
\newcommand{\Bin}{\operatorname{Bin}}
\newcommand{\Geom}{\operatorname{Geom}}
\newcommand{\Poi}{\operatorname{Poi}}
\newcommand{\Hyperg}{\operatorname{Hyperg}}
\newcommand{\Tas}{\operatorname{Tas}}
\newcommand{\Exp}{\operatorname{Exp}}
\newcommand{\tdist}{\operatorname{t}}
\newcommand{\rd}{\mathrm{d}}
Todennäköisyyslaskennan aksioomat
Klassisella ja frekvenssitulkintaan perustuvalla todennäköisyydellä on omat rajoituksensa. Klassinen todennäköisyys edellyttää äärellisen määrän yhtä mahdollisia alkeistapauksia. Jos klassista todennäköisyyttä käytetään mallina, joudutaan satunnaiskokeelle olettamaan alkeistapaukset yhtä mahdollisiksi. Kuinka hyvin malli toimii, riippuu siitä, miten hyvin oletus sopii yhteen todellisuuden kanssa.
Frekvenssitulkinnassa puolestaan käytetään suhteellisen frekvenssin raja-arvoa. Tällaista raja-arvoa ei voida tarkalleen saavuttaa, koska äärettömiä koesarjoja ei voida toteuttaa. Frekvenssitulkintaa käytettäessä muodostetut todennäköisyydet ovat vain likiarvoja todellisille todennäköisyyksille.
Kuten muukin matematiikka, todennäköisyyslaskenta on aksiomatisoitu. Tällä on pyritty antamaan todennäköisyyslaskennalle matemaattisesti pitävä perusta. Oletetaan, että on määritelty jokin otosavaruus \Omega ja sen kaikkien osajoukkojen, eli tapahtumien joukko \mathcal{F}. Todennäköisyyskäsite liitetään näihin määrittelemällä joukkofunktio P : \cF\rightarrow\R, joka liittää jokaiseen tapahtumaan reaaliluvun väliltä [0,1].
Nämä aksioomat esitti venäläinen matemaatikko Andrei Kolmogorov vuonna 1933. Jos otosavaruus on äärellinen, voidaan todennäköisyysmitan määrittelyjoukoksi \cF ottaa otosavaruuden \Omega kaikkien osajoukkojen joukko \cP(\Omega). Ajan, pituuden ja muiden jatkuvasti muuttuvien suureiden yhteydessä otosavaruus on useimmiten ääretön. Tällöin määrittelyjoukkoon \cF voidaan hyväksyä vain tietyn “\sigma-algebran” ehdot toteuttavat riittävän “säännölliset” tapahtumat. Soveltajaa tämä ei haittaa, sillä reaalimaailmassa satunnaiskokeiden tapahtumat ovat “säännöllisiä” ja muodostavat “\sigma-algebran”.
Todennäköisyysmitta P on siis funktio, joka liittää jokaiseen tapahtumaan A \subseteq \Omega luvun väliltä [0, 1]. Todennäköisyysmitan arvo P(A) on tapahtuman A todennäköisyys (probability). Kolmikkoa (\Omega, \cF, P) sanotaan todennäköisyyskentäksi tai todennäköisyysavaruudeksi. Stokastiset ilmiöt tapahtuvat tällaisissa avaruuksissa. Huomaa, että todennäköisyyden määrittelevästä todennäköisyysmitasta P ei sanota yhtään enempää. Tämä määritelmä ei siis ota kantaa yksittäisen tapahtuman todennäköisyyden laskemiseen tai mallin todenmukaisuuteen. Kyseessä on pikemminkin matemaattinen kehys, jonka perusteella voidaan johtaa erilaisia todennäköisyyden laskusääntöjä.
Todennäköisyyden ominaisuuksia
Olkoon P otosavaruuden \Omega todennäköisyysmitta. Aksioomiin nojautuen johdetaan todennäköisyyksille eräitä hyödyllisiä laskusääntöjä.
Lause 1.3.2
Jos A_1, A_2, \ldots, A_n on kokoelma pareittain erillisiä tapahtumia, niin
P\left(\bigcup_{i = 1}^n A_i\right) = P(A_1\cup A_2\cup\cdots\cup A_n)=P(A_1)+P(A_2)+\cdots+P(A_n) = \sum_{i = 1}^{n}P(A_i).
Piilota/näytä todistus
Laajennetaan kokoelma pareittain erillisten tapahtumien äärettömäksi jonoksi asettamalla A_i = \varnothing, kun i > n. Nyt
\sum_{i = 1}^{n}P(A_i) = \sum_{i = 1}^{n}P(A_i) + \sum_{i = n + 1}^{\infty}0 = \sum_{i = 1}^{\infty}P(A_i) = P\left(\bigcup_{i = 1}^{\infty}A_i\right) = P\left(\bigcup_{i = 1}^{n}A_i\right).\qedhere
Seuraus 1.3.3
Jos A\cap B=\varnothing, niin P(A\cup B)=P(A)+P(B).
Lause 1.3.4 (Vastatapahtuman todennäköisyys)
Jos A \subseteq \Omega ja \overline{A} on sen komplementtitapahtuma, niin P(A)=1-P(\overline{A}).
Piilota/näytä todistus
Koska A\cap\overline{A}=\varnothing, edellisen seurauksen nojalla P(A)+P(\overline{A})=P(A \cup \overline{A}). Toisaalta A \cup \overline{A} = \Omega, joten P(A \cup \overline{A}) = P(\Omega) = 1. Väite seuraa yhdistämällä nämä yhtälöt ja vähentämällä puolittain todennäköisyys P(\overline{A}).
Esimerkki 1.3.5
Pelaaja heittää kahta noppaa. Hän suorittaa 24 pelikierrosta ja voittaa, jos saa ainakin kerran kuutosparin. Olkoon A tapahtuma “kuutospari esiintyy ainakin kerran”, jolloin \overline{A} on tapahtuma “ei kertaakaan kuutosparia”. Koska tuloperiaatteen mukaan P(\overline{A})=\left(\frac{35}{36}\right)^{24}, niin voittotodennäköisyys on
P(A)=1-P(\overline{A})=1-\left(\frac{35}{36}\right)^{24} \approx 0.4914.
Lause 1.3.6 (Yhteenlaskusääntö)
Jos A \subseteq \Omega ja B \subseteq \Omega, niin P(A\cup B)=P(A)+P(B)-P(A\cap B).
Piilota/näytä todistus
Kirjoitetaan A ja A\cup B erillisten
tapahtumien yhdisteinä:
A = (A \cap B) \cup (A \setminus B) = (A \cap B) \cup (A \cap \overline{B}) \qquad\text{ja}\qquad A \cup B = B \cup (A \setminus B) = B \cup (A \cap \overline{B}).
Seurauksen nojalla nyt
P(A) = P(A \cap B) + P(A \cap \overline{B}) \qquad\text{ja}\qquad P(A \cup B) = P(B) + P(A \cap \overline{B}),
ja väite seuraa vähentämällä nämä yhtälöt toisistaan.
Edellisen lauseen avulla voidaan todistaa, että tapahtumien A_1, A_2 ja A_3 yhdisteen todennäköisyys
\begin{split}\begin{aligned}
P(A_1\cup A_2\cup A_3)&=P(A_1)+P(A_2)+P(A_3)\\
&\qquad-P(A_1\cap A_2)-P(A_1\cap A_3)-P(A_2\cap A_3)\\
&\qquad+P(A_1\cap A_2 \cap A_3).
\end{aligned}\end{split}
Induktiolla yhteenlaskusääntö voidaan yleistää seuraavaan muotoon.
Lause 1.3.7
Jos A_1, A_2, \ldots, A_n \subseteq \Omega, niin
\begin{split}\begin{aligned}
P\left(\bigcup_{i=1}^{n}A_i\right)&=\sum_{i=1}^{n}P(A_i)-\sum_{i<j}P(A_i\cap A_j)\\
&\qquad+\sum_{i<j<k}P(A_i\cap A_j\cap A_k)-\cdots+(-1)^{n+1}P\left(\bigcap_{i=1}^{n}A_i\right)
\end{aligned}\end{split}
Huomautus 1.3.8
Koska Venn-diagrammiin piirrettyjen joukkojen pinta-alat suhteutettuna otosavaruuden pinta-alaan toteuttavat myös Kolmogorovin aksioomat, voidaan niiden avulla muistaa ja hahmotella todennäköisyyslaskennan laskusääntöjä.
Esimerkki 1.3.9
Pakasta vedetään yksi kortti. Millä todennäköisyydellä se on
- pata tai ässä,
- musta kortti, pata tai ässä?
Olkoot A, B ja C tapahtumat “kortti on pata”, “kortti on ässä” ja “kortti on musta” tässä järjestyksessä.
Koska alkeistapaukset ovat symmetriset, klassisen todennäköisyyden mukaisesti lasketaan, että P(A) = \frac{13}{52}, P(B) = \frac{4}{52} ja P(A \cap B) = \frac{1}{52} (patakortteja on 13, ässiä 4 ja pataässiä 1). Siis
P(A \cup B) = P(A) + P(B) - P(A \cap B) = \frac{13 + 4 - 1}{52} = \frac{16}{52} = \frac{4}{13}.
Edellisen tapaan P(C) = \frac{26}{52}, P(A \cap C) = \frac{13}{52}, P(B \cap C) = \frac{2}{52} ja P(A \cap B \cap C) = \frac{1}{52}. Siis
\begin{split}\begin{aligned}
P(A \cup B \cup C) &= P(A) + P(B) + P(C) \\
&\qquad- P(A \cap B) - P(A \cap C) - P(B \cap C)\\
&\qquad+ P(A \cap B \cap C) \\
&= \frac{13 + 4 + 26 - 1 - 13 - 2 + 1}{52} = \frac{28}{52} = \frac{7}{13}.
\end{aligned}\end{split}