\[\newcommand{\N}{\mathbb N} \newcommand{\Z}{\mathbb Z} \newcommand{\Q}{\mathbb Q} \newcommand{\R}{\mathbb R} \newcommand{\C}{\mathbb C} \newcommand{\ba}{\mathbf{a}} \newcommand{\bb}{\mathbf{b}} \newcommand{\bc}{\mathbf{c}} \newcommand{\bd}{\mathbf{d}} \newcommand{\be}{\mathbf{e}} \newcommand{\bff}{\mathbf{f}} \newcommand{\bh}{\mathbf{h}} \newcommand{\bi}{\mathbf{i}} \newcommand{\bj}{\mathbf{j}} \newcommand{\bk}{\mathbf{k}} \newcommand{\bN}{\mathbf{N}} \newcommand{\bn}{\mathbf{n}} \newcommand{\bo}{\mathbf{0}} \newcommand{\bp}{\mathbf{p}} \newcommand{\bq}{\mathbf{q}} \newcommand{\br}{\mathbf{r}} \newcommand{\bs}{\mathbf{s}} \newcommand{\bT}{\mathbf{T}} \newcommand{\bu}{\mathbf{u}} \newcommand{\bv}{\mathbf{v}} \newcommand{\bw}{\mathbf{w}} \newcommand{\bx}{\mathbf{x}} \newcommand{\by}{\mathbf{y}} \newcommand{\bz}{\mathbf{z}} \newcommand{\bzero}{\mathbf{0}} \newcommand{\nv}{\mathbf{0}} \newcommand{\cA}{\mathcal{A}} \newcommand{\cB}{\mathcal{B}} \newcommand{\cC}{\mathcal{C}} \newcommand{\cD}{\mathcal{D}} \newcommand{\cE}{\mathcal{E}} \newcommand{\cF}{\mathcal{F}} \newcommand{\cG}{\mathcal{G}} \newcommand{\cH}{\mathcal{H}} \newcommand{\cI}{\mathcal{I}} \newcommand{\cJ}{\mathcal{J}} \newcommand{\cK}{\mathcal{K}} \newcommand{\cL}{\mathcal{L}} \newcommand{\cM}{\mathcal{M}} \newcommand{\cN}{\mathcal{N}} \newcommand{\cO}{\mathcal{O}} \newcommand{\cP}{\mathcal{P}} \newcommand{\cQ}{\mathcal{Q}} \newcommand{\cR}{\mathcal{R}} \newcommand{\cS}{\mathcal{S}} \newcommand{\cT}{\mathcal{T}} \newcommand{\cU}{\mathcal{U}} \newcommand{\cV}{\mathcal{V}} \newcommand{\cW}{\mathcal{W}} \newcommand{\cX}{\mathcal{X}} \newcommand{\cY}{\mathcal{Y}} \newcommand{\cZ}{\mathcal{Z}} \newcommand{\rA}{\mathrm{A}} \newcommand{\rB}{\mathrm{B}} \newcommand{\rC}{\mathrm{C}} \newcommand{\rD}{\mathrm{D}} \newcommand{\rE}{\mathrm{E}} \newcommand{\rF}{\mathrm{F}} \newcommand{\rG}{\mathrm{G}} \newcommand{\rH}{\mathrm{H}} \newcommand{\rI}{\mathrm{I}} \newcommand{\rJ}{\mathrm{J}} \newcommand{\rK}{\mathrm{K}} \newcommand{\rL}{\mathrm{L}} \newcommand{\rM}{\mathrm{M}} \newcommand{\rN}{\mathrm{N}} \newcommand{\rO}{\mathrm{O}} \newcommand{\rP}{\mathrm{P}} \newcommand{\rQ}{\mathrm{Q}} \newcommand{\rR}{\mathrm{R}} \newcommand{\rS}{\mathrm{S}} \newcommand{\rT}{\mathrm{T}} \newcommand{\rU}{\mathrm{U}} \newcommand{\rV}{\mathrm{V}} \newcommand{\rW}{\mathrm{W}} \newcommand{\rX}{\mathrm{X}} \newcommand{\rY}{\mathrm{Y}} \newcommand{\rZ}{\mathrm{Z}} \newcommand{\pv}{\overline} \newcommand{\iu}{\mathrm{i}} \newcommand{\ju}{\mathrm{j}} \newcommand{\im}{\mathrm{i}} \newcommand{\e}{\mathrm{e}} \newcommand{\real}{\operatorname{Re}} \newcommand{\imag}{\operatorname{Im}} \newcommand{\Arg}{\operatorname{Arg}} \newcommand{\Ln}{\operatorname{Ln}} \DeclareMathOperator*{\res}{res} \newcommand{\re}{\operatorname{Re}} \newcommand{\im}{\operatorname{Im}} \newcommand{\arsinh}{\operatorname{ar\,sinh}} \newcommand{\arcosh}{\operatorname{ar\,cosh}} \newcommand{\artanh}{\operatorname{ar\,tanh}} \newcommand{\sgn}{\operatorname{sgn}} \newcommand{\diag}{\operatorname{diag}} \newcommand{\proj}{\operatorname{proj}} \newcommand{\rref}{\operatorname{rref}} \newcommand{\rank}{\operatorname{rank}} \newcommand{\Span}{\operatorname{span}} \newcommand{\vir}{\operatorname{span}} \renewcommand{\dim}{\operatorname{dim}} \newcommand{\alg}{\operatorname{alg}} \newcommand{\geom}{\operatorname{geom}} \newcommand{\id}{\operatorname{id}} \newcommand{\norm}[1]{\lVert #1 \rVert} \newcommand{\tp}[1]{#1^{\top}} \renewcommand{\d}{\mathrm{d}} \newcommand{\sij}[2]{\bigg/_{\mspace{-15mu}#1}^{\,#2}} \newcommand{\abs}[1]{\lvert#1\rvert} \newcommand{\pysty}[1]{\left[\begin{array}{@{}r@{}}#1\end{array}\right]} \newcommand{\piste}{\cdot} \newcommand{\qedhere}{} \newcommand{\taumatrix}[1]{\left[\!\!#1\!\!\right]} \newenvironment{augmatrix}[1]{\left[\begin{array}{#1}}{\end{array}\right]} \newenvironment{vaugmatrix}[1]{\left|\begin{array}{#1}}{\end{array}\right|} \newcommand{\trans}{\mathrm{T}} \newcommand{\EUR}{\text{\unicode{0x20AC}}} \newcommand{\SI}[3][]{#2\,\mathrm{#3}} \newcommand{\si}[2][]{\mathrm{#2}} \newcommand{\num}[2][]{#2} \newcommand{\ang}[2][]{#2^{\circ}} \newcommand{\meter}{m} \newcommand{\metre}{\meter} \newcommand{\kilo}{k} \newcommand{\kilogram}{kg} \newcommand{\gram}{g} \newcommand{\squared}{^2} \newcommand{\cubed}{^3} \newcommand{\minute}{min} \newcommand{\hour}{h} \newcommand{\second}{s} \newcommand{\degreeCelsius}{^{\circ}C} \newcommand{\per}{/} \newcommand{\centi}{c} \newcommand{\milli}{m} \newcommand{\deci}{d} \newcommand{\percent}{\%} \newcommand{\Var}{\operatorname{Var}} \newcommand{\Cov}{\operatorname{Cov}} \newcommand{\Corr}{\operatorname{Corr}} \newcommand{\Tasd}{\operatorname{Tasd}} \newcommand{\Ber}{\operatorname{Ber}} \newcommand{\Bin}{\operatorname{Bin}} \newcommand{\Geom}{\operatorname{Geom}} \newcommand{\Poi}{\operatorname{Poi}} \newcommand{\Hyperg}{\operatorname{Hyperg}} \newcommand{\Tas}{\operatorname{Tas}} \newcommand{\Exp}{\operatorname{Exp}} \newcommand{\tdist}{\operatorname{t}} \newcommand{\rd}{\mathrm{d}}\]

Tilastollinen ja klassinen todennäköisyys¶

Tapahtuman todennäköisyyden käsitteelle on monia eri tulkintoja. Sen tavoite on mitata tapahtuman realisoitumisen uskottavuutta tai mahdollisuutta reaaliluvulla väliltä \([0, 1]\). Reaaliluku \(0\) valitaan kuvaamaan mahdotonta tapahtumaa \(\varnothing\) ja reaaliluku \(1\) täysin varmaa tapahtumaa, eli koko otosavaruutta \(\Omega\). Varsinainen ongelma on pohtia, miten muiden tapahtumien todennäköisyyttä tulisi mitata.

Subjektiivinen todennäköisyys on soveltajan näkemys vallitsevasta tilanteesta. Kyse voi olla esimerkiksi tulevaisuuden ainutkertaisen tapahtuman ennustamisesta väittämällä “ensi vuonna ostan uuden auton \(70~\%\):n todennäköisyydellä”. Tiedon taustalla on jonkinlaisia subjektiivisia tietoja ja olettamuksia, jotka puetaan yhdeksi luvuksi kuvaamaan vastaajan uskomuksen varmuutta. Tämä on tavallinen, arkikielen mukainen todennäköisyyden tulkinta, mutta se ei kelpaa matematiikan käsitykseksi todennäköisyydestä.

Tilastollinen todennäköisyys¶

Ensimmäinen mielekäs todennäköisyyden tulkinta kumpuaa satunnaiskokeiden suorittamisesta. Kun sama koe suoritetaan \(n\) kertaa samoissa olosuhteissa, puhutaan \(n\)-toistokokeesta. Jos \(f_n(A)\) merkitsee tapahtuman \(A\) realisoitumisen frekvenssiä \(n\)-toistokokeessa, niin sen suhteellinen frekvenssi (relative frequency)

\[p_n(A)=\frac{f_n(A)}{n}\]

edustaa tapahtuman \(A\) esiintymistiheyttä suhteessa kaikkiin tapahtumiin. Tällaisessa frekvenssitulkinnassa määritellään tapahtuman \(A\) tilastollinen todennäköisyys (statistical probability) suhteellisen frekvenssin “raja-arvona”, kun koetoistojen lukumäärä \(n\) kasvaa rajatta:

\[P(A) = \text{''}\lim_{n\rightarrow\infty}\text{''}\ p_n(A).\]

Koska äärettömän pitkiä toistokokeita ei voida suorittaa, käytännössä tilastollista todennäköisyyttä pystytään vain arvioimaan.

Frekvenssitulkinta on erityisen käyttökelpoinen sovelluksissa. Reaalimaailmassa on runsaasti kokeita tai havaintoja, joissa tarkasteltavan tapahtuman suhteellinen frekvenssi tuntuu suppenevan siinä mielessä, että suhteelliset frekvenssit \(p_n(A), p_{n + 1}(A), \ldots, p_{n + k}(A)\) tapahtumalle \(A\) poikkeavat toisistaan hyvin vähän, kun \(n\) on riittävän suuri. Soveltajan tehtävänä on arvioida suhteellisen frekvenssin “raja-arvolle” mahdollisimman tarkka arvo.

Monet käytännön elämän tapahtumien todennäköisyydet ovat juuri tilastollisia todennäköisyyksiä, sillä ne perustuvat havainnoista tehtyihin tilastoaineistoihin. Esimerkiksi väite, jonka mukaan laite rikkoutuu takuuaikanaan todennäköisyydellä \(0{,}01\), perustuu tavallisesti pitkäaikaiseen seurantaan, jossa keskimäärin yksi sadasta laitteesta on rikkoontunut takuuaikanaan. Havaintojen pohjalta oletetaan, että rikkoutumisen noudattaa jatkossakin tätä säännönmukaisuutta.

Frekvenssitulkinnan käyttö todennäköisyysmitalle herättää monia kysymyksiä eikä ole matemaattisesti tyydyttävä. Miten määritellään esimerkiksi äärettömän pitkä koetoistojen sarja tai suhteellisten frekvenssien muodostaman jonon suppeneminen? Miten äärellisen toistokokeen perusteella voidaan olettaa, että ilmiö käyttäytyy jatkossakin samalla tavalla?

Klassinen todennäköisyys¶

Oletetaan, että kokeen otosavaruudessa on äärellinen määrä \(N\) alkeistapauksia, jotka ovat kaikki yhtä mahdollisia. Tällöin tapahtuman \(A\subseteq\Omega\) klassinen todennäköisyys on

\[P(A)=\frac{|A|}{N},\]

missä \(|A|\) tarkoittaa joukon \(A\) alkioiden lukumäärää (cardinality), eli tapahtumalle \(A\) suotuisien (favourable) alkeistapausten lukumäärää. Tapahtuman \(A\) klassinen todennäköisyys on siis sen suotuisten alkeistapausten lukumäärän suhde kaikkien alkeistapausten lukumäärään.

Jotta klassista todennäköisyyttä voidaan soveltaa, alkeistapausten määrän \(|\Omega| = N\) on oltava äärellinen ja niiden tulee olla yhtä mahdollisia, eli symmetrisiä (symmetric). Havaitaan, että jokaisen alkeistapauksen \(a \in \Omega\) todennäköisyys on tällöin

\[P(a)=\frac{1}{N}.\]

Sovelluksissa satunnaiskokeiden alkeistapaukset eivät yleensä ole symmetrisiä, eikä tällöin voida käyttää klassista määritelmää.

Huomautus 1.2.1

Tarkkaan ottaen yllä esitetty “määritelmä” ei ole määritelmä: mitä ilmaus “yhtä mahdollisia” oikein tarkoittaa, kun todennäköisyyttä vasta ollaan määrittelemässä? Klassinen todennäköisyys nojaakin yleiseen intuitioon symmetrisyydestä. Tasapainoisen nopan eri tulosvaihtoehtojen oletetaan olevan yhtä mahdollisia. Samoin jokainen seitsemän numeron lottorivi on yhtä mahdollinen. Yleisestikin yhden alkion satunnainen arvonta äärellisestä perusjoukosta vastaa käsitystä klassisesta todennäköisyydestä.

Klassisessa todennäköisyydessä suotuisten ja kaikkien alkeistapausten lukumäärien laskeminen saattaa olla vaikea kombinatorinen tehtävä. Seuraavassa annetaan lyhyt tiivistelmä käyttökelpoisia kombinatorisia käsitteitä.

Lause 1.2.2 (Tuloperiaate)

Jos koe voidaan suorittaa \(p\) eri vaiheessa ja vaiheessa \(i\) eri tulosmahdollisuuksia on \(N_i\), niin koko kokeessa eri tulosmahdollisuuksia on

\[N=N_1N_2 \cdots N_p = \prod_{i=1}^p N_i.\]

Esimerkki 1.2.3

Kun henkilöllä on \(3\) hattua, \(5\) takkia, \(2\) housut ja \(3\) kengät, hän voi valita \(3\cdot 5\cdot 2 \cdot 3 = 90\) erilaista asukokokonaisuutta.

Noppaa heitetään neljästi. Jokaisessa vaiheessa on \(6\) tulosvaihtoehtoa, joten erilaisia tulosnelikkoja \((n_1,n_2,n_3,n_4)\), missä \(n_i\in\{1,2,3,4,5,6\}\), on \(6\cdot 6\cdot 6 \cdot 6 = 6^4=1296\).

Yhteensä \(6\) henkilöä voidaan asettaa jonoon \(720\) tavalla. Nimittäin jonossa ensimmäiselle paikalle on \(6\) vaihtoehtoa ja toiselle \(5\), koska samaa henkilöä ei valita kahdesti. Jatkamalla samaan tapaan nähdään, että erilaisia jonoja on \(6\cdot 5\cdot 4 \cdot 3\cdot 2\cdot 1 = 6! = 720\).

Yleisesti jonon, eli järjestetyn joukon \((a_1, a_2, \ldots, a_n)\) alkioiden asettamista eri järjestykseen sanotaan permutoinniksi. Jokainen näin saatu uusi jono on permutaatio (permutation). \(n\)-alkioisella jonolla on tuloperiaatteen perusteella luvun \(n\) kertoman

\[n!=1\cdot 2 \cdot \cdots \cdot n\]

verran erilaisia permutaatioita. Kertoman määritelmässä sovitaan, että \(0! = 1\).

Olkoon joukossa \(n\) alkiota ja \(k \leq n\). Kyseisen joukon \(k\)-permutaatio on mikä tahansa joukon alkioista palauttamatta muodostettu \(k\)-alkioinen jono. Tapoja valita ensimmäinen alkio on \(n\), toinen \(n-1\) ja kolmas \(n-2\) kappaletta. Lopulta viimeinen alkio voidaan valita \((n-(k-1))\):llä tavalla, joten tuloperiaatteen nojalla \(n\)-alkioisella joukolla on erilaisia \(k\)-permutaatioita

\[n(n-1)(n-2)\cdots(n-(k-1))=\frac{n!}{(n-k)!}\]

kappaletta.

Esimerkki 1.2.4

Jääkiekon MM-kisoissa pelaa \(16\) maata. Erilaisia 16 maan järjestyksiä on \(16!=20\, 922\, 789\, 888\, 000\)

Erilaista mitalikolmikoita on \(16\cdot 15 \cdot 14 = 3360\). Klassisen todennäköisyyden vastaisesti kaikki nämä mitalikolmikot eivät kuitenkaan ole yhtä todennäköisiä, mutta käytetyn sarjajärjestelmän vuoksi jokainen kolmikko on kuitenkin mahdollinen.

Edellä olevissa esimerkeissä oli kyse jonoista, joissa alkioiden järjestyksellä on merkitystä. Esimerkiksi \((1,2,3)\ne(1,3,2)\) ovat kaksi eri jonoa. Jos alkioiden järjestysellä ei ole merkitystä, kyse on otosavaruuden osajoukoista, missä esimerkiksi \(\{1,2,3\}=\{1,3,2\}\).

Annetun \(n\)-alkioisen joukon \(k\)-kombinaatio (combination) on joukon \(k\)-alkioinen osajoukko. Erilaisten osajoukkojen lukumäärä saadaan, kun poistetaan jonojen joukosta saman jonon eri permutaatiot.

Lause 1.2.5

\(n\)-alkioisen joukon \(k\)-kombinaatioiden lukumäärä on binomikerroin

\[\binom{n}{k} =\frac{n!}{k!(n-k)!},\]

missä \(1 \leq k \leq n\).

Piilota/näytä todistus

Olkoon \(k\)-kombinaatioiden lukumäärä \(x\). Koska jokaisella \(k\)-kombinaatiolla (osajoukolla) on \(k!\) erilaista \(k\)-permutaatioita, niin alkuperäisen joukon \(k\)-permutaatioiden lukumäärä on

\[xk!=\frac{n!}{(n-k)!}.\]

Tulos seuraa jakamalla tämä yhtälö puolittain luvulla \(k!\).

Esimerkki 1.2.6

Tutkitaan erilaisia merkkijonoja, jotka voidaan muodostaa kirjaimista a–z. Kirjaimia on yhteensä \(26\), ja niistä \(6\) on vokaaleja \(20\) ja konsonantteja.

Erilaisia \(5\) kirjaimen merkkijonoja on tuloperiaatteen mukaan \(26\cdot 26\cdot 26\cdot 26\cdot 26 = 26^5 = 11~881~376\). Tässä siis jokainen kirjain voidaan valita useamman kerran.
Sellaisia merkkijonoja, joissa kirjaimet ovat järjestyksessä konsonantti + vokaali + konsonantti + sama kuin edellinen konsonantti + vokaali (siis esimerkiksi ‘kello’) on tuloperiaatteen mukaan \(20\cdot 6\cdot 20\cdot 1\cdot 6 = 14~400\).
Jos yhden kirjaimen voi valita merkkijonoon vain kerran, on kyse kirjaiten a–z permutaatioista. Nyt erilaisia \(5\) kirjaimen merkkijonoja, joissa voi esiintyä yksi kirjain vain kerran on \(26\cdot 25\cdot 24\cdot 23\cdot 22 = 7~893~600\).
Jos halutaan vaihtaa jonkin merkkijonon kirjaimien järjestystä on kyse anagrammista. Esimerkiksi sanan “aitat” eräs anagrammi on “taiat”. Sanan “aitat” anagrammien lukumäärää laskettaessa tulee ottaa huomioon kirjaimien a ja t esiintyminen kahdesti. Kaikkiaan \(5\) eri kirjainta voidaan järjestää \(5!=120\) eri tavalla. Jokainen permutaatio esiintyy yhteensä \(2! \cdot 2! = 4\) kertaa, sillä a- ja t-kirjaimet voidaan kummatkin järjestää \(2! = 2\) eri tavalla. Siksi sanan “aitat” erilaisia anagrammeja on \(\frac{5!}{2! \cdot 2!} = 30\) kappaletta.
Edellä on ollut kyse merkkijonoista, joissa kirjainten järjestyksellä on merkitystä. Tutkitaan nyt erilaisia kirjainjoukkoja, joissa järjestyksellä ei ole merkitystä. \(26\) kirjaimesta voidaan valita erilaisia \(5\) kirjaimen joukkoja

\[\binom{26}{5}=\frac{26!}{5!21!}= \frac{26\cdot 25\cdot 24\cdot 23\cdot 22}{5!}=65~780\]

kappaletta. Laskun toiseksi viimeisestä muodosta saadaan binomikertoimelle seuraava tulkinta: erilaisten \(5\) alkion osajoukkojen määrä saadaan jakamalla \(5\)-permutaatioiden määrä \(26\cdot 25\cdot 24\cdot 23\cdot 22\) erilaisilla \(5\) alkion järjestyksillä \(5!\).
Sellaisia 5 kirjaimen joukkoja, joissa on kaksi eri vokaalia ja kolme eri konsonanttia on tuloperiaatteen mukaan

\[\binom{6}{2}\cdot \binom{20}{3}=\frac{6!}{2!4!}\cdot\frac{20!}{3!17!}=17~100.\]
Klassisia todennäköisyyksiä laskettaessa tutkitaan suotuisten alkeistapausten ja kaikkien alkeistapausten lukumäärien osamäärää. Kohtien 1 ja 3 perusteella todennäköisyys sille, että \(5\) kirjaimen merkkijonossa on \(5\) eri kirjainta on

\[\frac{7~893~600}{11~881~376} \approx 0{,}6644.\]

Vastaavasti kohtien 5 ja 6 perusteella todennäköisyys sille, että \(5\) kirjaimen joukossa on kaksi eri vokaalia ja kolme eri konsonanttia on

\[\frac{17~100}{65~780} \approx 0{,}2600.\]