$\newcommand{\N}{\mathbb N} \newcommand{\Z}{\mathbb Z} \newcommand{\Q}{\mathbb Q} \newcommand{\R}{\mathbb R} \newcommand{\C}{\mathbb C} \newcommand{\ba}{\mathbf{a}} \newcommand{\bb}{\mathbf{b}} \newcommand{\bc}{\mathbf{c}} \newcommand{\bd}{\mathbf{d}} \newcommand{\be}{\mathbf{e}} \newcommand{\bff}{\mathbf{f}} \newcommand{\bh}{\mathbf{h}} \newcommand{\bi}{\mathbf{i}} \newcommand{\bj}{\mathbf{j}} \newcommand{\bk}{\mathbf{k}} \newcommand{\bN}{\mathbf{N}} \newcommand{\bn}{\mathbf{n}} \newcommand{\bo}{\mathbf{0}} \newcommand{\bp}{\mathbf{p}} \newcommand{\bq}{\mathbf{q}} \newcommand{\br}{\mathbf{r}} \newcommand{\bs}{\mathbf{s}} \newcommand{\bT}{\mathbf{T}} \newcommand{\bu}{\mathbf{u}} \newcommand{\bv}{\mathbf{v}} \newcommand{\bw}{\mathbf{w}} \newcommand{\bx}{\mathbf{x}} \newcommand{\by}{\mathbf{y}} \newcommand{\bz}{\mathbf{z}} \newcommand{\bzero}{\mathbf{0}} \newcommand{\nv}{\mathbf{0}} \newcommand{\cA}{\mathcal{A}} \newcommand{\cB}{\mathcal{B}} \newcommand{\cC}{\mathcal{C}} \newcommand{\cD}{\mathcal{D}} \newcommand{\cE}{\mathcal{E}} \newcommand{\cF}{\mathcal{F}} \newcommand{\cG}{\mathcal{G}} \newcommand{\cH}{\mathcal{H}} \newcommand{\cI}{\mathcal{I}} \newcommand{\cJ}{\mathcal{J}} \newcommand{\cK}{\mathcal{K}} \newcommand{\cL}{\mathcal{L}} \newcommand{\cM}{\mathcal{M}} \newcommand{\cN}{\mathcal{N}} \newcommand{\cO}{\mathcal{O}} \newcommand{\cP}{\mathcal{P}} \newcommand{\cQ}{\mathcal{Q}} \newcommand{\cR}{\mathcal{R}} \newcommand{\cS}{\mathcal{S}} \newcommand{\cT}{\mathcal{T}} \newcommand{\cU}{\mathcal{U}} \newcommand{\cV}{\mathcal{V}} \newcommand{\cW}{\mathcal{W}} \newcommand{\cX}{\mathcal{X}} \newcommand{\cY}{\mathcal{Y}} \newcommand{\cZ}{\mathcal{Z}} \newcommand{\rA}{\mathrm{A}} \newcommand{\rB}{\mathrm{B}} \newcommand{\rC}{\mathrm{C}} \newcommand{\rD}{\mathrm{D}} \newcommand{\rE}{\mathrm{E}} \newcommand{\rF}{\mathrm{F}} \newcommand{\rG}{\mathrm{G}} \newcommand{\rH}{\mathrm{H}} \newcommand{\rI}{\mathrm{I}} \newcommand{\rJ}{\mathrm{J}} \newcommand{\rK}{\mathrm{K}} \newcommand{\rL}{\mathrm{L}} \newcommand{\rM}{\mathrm{M}} \newcommand{\rN}{\mathrm{N}} \newcommand{\rO}{\mathrm{O}} \newcommand{\rP}{\mathrm{P}} \newcommand{\rQ}{\mathrm{Q}} \newcommand{\rR}{\mathrm{R}} \newcommand{\rS}{\mathrm{S}} \newcommand{\rT}{\mathrm{T}} \newcommand{\rU}{\mathrm{U}} \newcommand{\rV}{\mathrm{V}} \newcommand{\rW}{\mathrm{W}} \newcommand{\rX}{\mathrm{X}} \newcommand{\rY}{\mathrm{Y}} \newcommand{\rZ}{\mathrm{Z}} \newcommand{\pv}{\overline} \newcommand{\iu}{\mathrm{i}} \newcommand{\ju}{\mathrm{j}} \newcommand{\im}{\mathrm{i}} \newcommand{\e}{\mathrm{e}} \newcommand{\real}{\operatorname{Re}} \newcommand{\imag}{\operatorname{Im}} \newcommand{\Arg}{\operatorname{Arg}} \newcommand{\Ln}{\operatorname{Ln}} \DeclareMathOperator*{\res}{res} \newcommand{\re}{\operatorname{Re}} \newcommand{\im}{\operatorname{Im}} \newcommand{\arsinh}{\operatorname{ar\,sinh}} \newcommand{\arcosh}{\operatorname{ar\,cosh}} \newcommand{\artanh}{\operatorname{ar\,tanh}} \newcommand{\sgn}{\operatorname{sgn}} \newcommand{\diag}{\operatorname{diag}} \newcommand{\proj}{\operatorname{proj}} \newcommand{\rref}{\operatorname{rref}} \newcommand{\rank}{\operatorname{rank}} \newcommand{\Span}{\operatorname{span}} \newcommand{\vir}{\operatorname{span}} \renewcommand{\dim}{\operatorname{dim}} \newcommand{\alg}{\operatorname{alg}} \newcommand{\geom}{\operatorname{geom}} \newcommand{\id}{\operatorname{id}} \newcommand{\norm}[1]{\lVert #1 \rVert} \newcommand{\tp}[1]{#1^{\top}} \renewcommand{\d}{\mathrm{d}} \newcommand{\sij}[2]{\bigg/_{\mspace{-15mu}#1}^{\,#2}} \newcommand{\abs}[1]{\lvert#1\rvert} \newcommand{\pysty}[1]{\left[\begin{array}{@{}r@{}}#1\end{array}\right]} \newcommand{\piste}{\cdot} \newcommand{\qedhere}{} \newcommand{\taumatrix}[1]{\left[\!\!#1\!\!\right]} \newenvironment{augmatrix}[1]{\left[\begin{array}{#1}}{\end{array}\right]} \newenvironment{vaugmatrix}[1]{\left|\begin{array}{#1}}{\end{array}\right|} \newcommand{\trans}{\mathrm{T}} \newcommand{\EUR}{\text{\unicode{0x20AC}}} \newcommand{\SI}[3][]{#2\,\mathrm{#3}} \newcommand{\si}[2][]{\mathrm{#2}} \newcommand{\num}[2][]{#2} \newcommand{\ang}[2][]{#2^{\circ}} \newcommand{\meter}{m} \newcommand{\metre}{\meter} \newcommand{\kilo}{k} \newcommand{\kilogram}{kg} \newcommand{\gram}{g} \newcommand{\squared}{^2} \newcommand{\cubed}{^3} \newcommand{\minute}{min} \newcommand{\hour}{h} \newcommand{\second}{s} \newcommand{\degreeCelsius}{^{\circ}C} \newcommand{\per}{/} \newcommand{\centi}{c} \newcommand{\milli}{m} \newcommand{\deci}{d} \newcommand{\percent}{\%} \newcommand{\Var}{\operatorname{Var}} \newcommand{\Cov}{\operatorname{Cov}} \newcommand{\Corr}{\operatorname{Corr}} \newcommand{\Tasd}{\operatorname{Tasd}} \newcommand{\Ber}{\operatorname{Ber}} \newcommand{\Bin}{\operatorname{Bin}} \newcommand{\Geom}{\operatorname{Geom}} \newcommand{\Poi}{\operatorname{Poi}} \newcommand{\Hyperg}{\operatorname{Hyperg}} \newcommand{\Tas}{\operatorname{Tas}} \newcommand{\Exp}{\operatorname{Exp}} \newcommand{\tdist}{\operatorname{t}} \newcommand{\rd}{\mathrm{d}}$

Todennäköisyyslaskennan aksioomat¶

Klassisella ja frekvenssitulkintaan perustuvalla todennäköisyydellä on omat rajoituksensa. Klassinen todennäköisyys edellyttää äärellisen määrän yhtä mahdollisia alkeistapauksia. Jos klassista todennäköisyyttä käytetään mallina, joudutaan satunnaiskokeelle olettamaan alkeistapaukset yhtä mahdollisiksi. Kuinka hyvin malli toimii, riippuu siitä, miten hyvin oletus sopii yhteen todellisuuden kanssa.

Frekvenssitulkinnassa puolestaan käytetään suhteellisen frekvenssin raja-arvoa. Tällaista raja-arvoa ei voida tarkalleen saavuttaa, koska äärettömiä koesarjoja ei voida toteuttaa. Frekvenssitulkintaa käytettäessä muodostetut todennäköisyydet ovat vain likiarvoja todellisille todennäköisyyksille.

Kuten muukin matematiikka, todennäköisyyslaskenta on aksiomatisoitu. Tällä on pyritty antamaan todennäköisyyslaskennalle matemaattisesti pitävä perusta. Oletetaan, että on määritelty jokin otosavaruus $\Omega$ ja sen kaikkien osajoukkojen, eli tapahtumien joukko $\mathcal{F}$ . Todennäköisyyskäsite liitetään näihin määrittelemällä joukkofunktio $P : \cF\rightarrow\R$ , joka liittää jokaiseen tapahtumaan reaaliluvun väliltä $[0,1]$ .

Määritelmä 1.3.1

Todennäköisyysmitta $P$ on otosavaruuden $\Omega$ osajoukkojen muodostamassa joukossa $\cF$ määritelty reaaliarvoinen joukkofunktio $P : \cF\rightarrow\R$ , joka toteuttaa seuraavat todennäköisyysaksioomat, eli Kolmogorovin aksioomat.

$0 \leq P(A) \leq 1$ aina, kun $A \in \cF$ .
Jos $A_1, A_2, \ldots, A_n, \ldots$ on ääretön jono pareittain erillisiä (pairwise disjoint) joukon $\cF$ tapahtumia, eli $A_i \cap A_j = \varnothing$ aina, kun $i \neq j$ , niin

$P\left(\bigcup_{i = 1}^{\infty}A_i\right) = P(A_1) + P(A_2) + \cdots + P(A_n) + \cdots = \sum_{i = 1}^{\infty}P(A_i).$
$P(\Omega) = 1$ ja $P(\varnothing) = 0$ .

Nämä aksioomat esitti venäläinen matemaatikko Andrei Kolmogorov vuonna 1933. Jos otosavaruus on äärellinen, voidaan todennäköisyysmitan määrittelyjoukoksi $\cF$ ottaa otosavaruuden $\Omega$ kaikkien osajoukkojen joukko $\cP(\Omega)$ . Ajan, pituuden ja muiden jatkuvasti muuttuvien suureiden yhteydessä otosavaruus on useimmiten ääretön. Tällöin määrittelyjoukkoon $\cF$ voidaan hyväksyä vain tietyn “ $\sigma$ -algebran” ehdot toteuttavat riittävän “säännölliset” tapahtumat. Soveltajaa tämä ei haittaa, sillä reaalimaailmassa satunnaiskokeiden tapahtumat ovat “säännöllisiä” ja muodostavat “ $\sigma$ -algebran”.

Todennäköisyysmitta $P$ on siis funktio, joka liittää jokaiseen tapahtumaan $A \subseteq \Omega$ luvun väliltä $[0, 1]$ . Todennäköisyysmitan arvo $P(A)$ on tapahtuman $A$ todennäköisyys (probability). Kolmikkoa $(\Omega, \cF, P)$ sanotaan todennäköisyyskentäksi tai todennäköisyysavaruudeksi. Stokastiset ilmiöt tapahtuvat tällaisissa avaruuksissa. Huomaa, että todennäköisyyden määrittelevästä todennäköisyysmitasta $P$ ei sanota yhtään enempää. Tämä määritelmä ei siis ota kantaa yksittäisen tapahtuman todennäköisyyden laskemiseen tai mallin todenmukaisuuteen. Kyseessä on pikemminkin matemaattinen kehys, jonka perusteella voidaan johtaa erilaisia todennäköisyyden laskusääntöjä.

Todennäköisyyden ominaisuuksia¶

Olkoon $P$ otosavaruuden $\Omega$ todennäköisyysmitta. Aksioomiin nojautuen johdetaan todennäköisyyksille eräitä hyödyllisiä laskusääntöjä.

Lause 1.3.2

Jos $A_1, A_2, \ldots, A_n$ on kokoelma pareittain erillisiä tapahtumia, niin

$P\left(\bigcup_{i = 1}^n A_i\right) = P(A_1\cup A_2\cup\cdots\cup A_n)=P(A_1)+P(A_2)+\cdots+P(A_n) = \sum_{i = 1}^{n}P(A_i).$

Piilota/näytä todistus

Laajennetaan kokoelma pareittain erillisten tapahtumien äärettömäksi jonoksi asettamalla $A_i = \varnothing$ , kun $i > n$ . Nyt

$\sum_{i = 1}^{n}P(A_i) = \sum_{i = 1}^{n}P(A_i) + \sum_{i = n + 1}^{\infty}0 = \sum_{i = 1}^{\infty}P(A_i) = P\left(\bigcup_{i = 1}^{\infty}A_i\right) = P\left(\bigcup_{i = 1}^{n}A_i\right).\qedhere$

Seuraus 1.3.3

Jos $A\cap B=\varnothing$ , niin $P(A\cup B)=P(A)+P(B)$ .

Lause 1.3.4 (Vastatapahtuman todennäköisyys)

Jos $A \subseteq \Omega$ ja $\overline{A}$ on sen komplementtitapahtuma, niin $P(A)=1-P(\overline{A})$ .

Piilota/näytä todistus

Koska

$A\cap\overline{A}=\varnothing$ , edellisen seurauksen nojalla

$P(A)+P(\overline{A})=P(A \cup \overline{A})$ . Toisaalta

$A \cup \overline{A} = \Omega$ , joten

$P(A \cup \overline{A}) = P(\Omega) = 1$ . Väite seuraa yhdistämällä nämä yhtälöt ja vähentämällä puolittain todennäköisyys

$P(\overline{A})$ .

Esimerkki 1.3.5

Pelaaja heittää kahta noppaa. Hän suorittaa $24$ pelikierrosta ja voittaa, jos saa ainakin kerran kuutosparin. Olkoon $A$ tapahtuma “kuutospari esiintyy ainakin kerran”, jolloin $\overline{A}$ on tapahtuma “ei kertaakaan kuutosparia”. Koska tuloperiaatteen mukaan $P(\overline{A})=\left(\frac{35}{36}\right)^{24}$ , niin voittotodennäköisyys on

$P(A)=1-P(\overline{A})=1-\left(\frac{35}{36}\right)^{24} \approx 0.4914.$

Lause 1.3.6 (Yhteenlaskusääntö)

Jos $A \subseteq \Omega$ ja $B \subseteq \Omega$ , niin $P(A\cup B)=P(A)+P(B)-P(A\cap B)$ .

Piilota/näytä todistus

Kirjoitetaan $A$ ja $A\cup B$ erillisten tapahtumien yhdisteinä:

$A = (A \cap B) \cup (A \setminus B) = (A \cap B) \cup (A \cap \overline{B}) \qquad\text{ja}\qquad A \cup B = B \cup (A \setminus B) = B \cup (A \cap \overline{B}).$

Seurauksen nojalla nyt

$P(A) = P(A \cap B) + P(A \cap \overline{B}) \qquad\text{ja}\qquad P(A \cup B) = P(B) + P(A \cap \overline{B}),$

ja väite seuraa vähentämällä nämä yhtälöt toisistaan.

Edellisen lauseen avulla voidaan todistaa, että tapahtumien $A_1$ , $A_2$ ja $A_3$ yhdisteen todennäköisyys

$\begin{split}\begin{aligned} P(A_1\cup A_2\cup A_3)&=P(A_1)+P(A_2)+P(A_3)\\ &\qquad-P(A_1\cap A_2)-P(A_1\cap A_3)-P(A_2\cap A_3)\\ &\qquad+P(A_1\cap A_2 \cap A_3). \end{aligned}\end{split}$

Induktiolla yhteenlaskusääntö voidaan yleistää seuraavaan muotoon.

Lause 1.3.7

Jos $A_1, A_2, \ldots, A_n \subseteq \Omega$ , niin

$\begin{split}\begin{aligned} P\left(\bigcup_{i=1}^{n}A_i\right)&=\sum_{i=1}^{n}P(A_i)-\sum_{i<j}P(A_i\cap A_j)\\ &\qquad+\sum_{i<j<k}P(A_i\cap A_j\cap A_k)-\cdots+(-1)^{n+1}P\left(\bigcap_{i=1}^{n}A_i\right) \end{aligned}\end{split}$

Huomautus 1.3.8

Koska Venn-diagrammiin piirrettyjen joukkojen pinta-alat suhteutettuna otosavaruuden pinta-alaan toteuttavat myös Kolmogorovin aksioomat, voidaan niiden avulla muistaa ja hahmotella todennäköisyyslaskennan laskusääntöjä.

Esimerkki 1.3.9

Pakasta vedetään yksi kortti. Millä todennäköisyydellä se on

pata tai ässä,
musta kortti, pata tai ässä?

Olkoot $A$ , $B$ ja $C$ tapahtumat “kortti on pata”, “kortti on ässä” ja “kortti on musta” tässä järjestyksessä.

Koska alkeistapaukset ovat symmetriset, klassisen todennäköisyyden mukaisesti lasketaan, että $P(A) = \frac{13}{52}$ , $P(B) = \frac{4}{52}$ ja $P(A \cap B) = \frac{1}{52}$ (patakortteja on $13$ , ässiä $4$ ja pataässiä $1$ ). Siis

$P(A \cup B) = P(A) + P(B) - P(A \cap B) = \frac{13 + 4 - 1}{52} = \frac{16}{52} = \frac{4}{13}.$
Edellisen tapaan $P(C) = \frac{26}{52}$ , $P(A \cap C) = \frac{13}{52}$ , $P(B \cap C) = \frac{2}{52}$ ja $P(A \cap B \cap C) = \frac{1}{52}$ . Siis

$\begin{split}\begin{aligned} P(A \cup B \cup C) &= P(A) + P(B) + P(C) \\ &\qquad- P(A \cap B) - P(A \cap C) - P(B \cap C)\\ &\qquad+ P(A \cap B \cap C) \\ &= \frac{13 + 4 + 26 - 1 - 13 - 2 + 1}{52} = \frac{28}{52} = \frac{7}{13}. \end{aligned}\end{split}$