\[\newcommand{\N}{\mathbb N} \newcommand{\Z}{\mathbb Z} \newcommand{\Q}{\mathbb Q} \newcommand{\R}{\mathbb R} \newcommand{\C}{\mathbb C} \newcommand{\ba}{\mathbf{a}} \newcommand{\bb}{\mathbf{b}} \newcommand{\bc}{\mathbf{c}} \newcommand{\bd}{\mathbf{d}} \newcommand{\be}{\mathbf{e}} \newcommand{\bff}{\mathbf{f}} \newcommand{\bh}{\mathbf{h}} \newcommand{\bi}{\mathbf{i}} \newcommand{\bj}{\mathbf{j}} \newcommand{\bk}{\mathbf{k}} \newcommand{\bN}{\mathbf{N}} \newcommand{\bn}{\mathbf{n}} \newcommand{\bo}{\mathbf{0}} \newcommand{\bp}{\mathbf{p}} \newcommand{\bq}{\mathbf{q}} \newcommand{\br}{\mathbf{r}} \newcommand{\bs}{\mathbf{s}} \newcommand{\bT}{\mathbf{T}} \newcommand{\bu}{\mathbf{u}} \newcommand{\bv}{\mathbf{v}} \newcommand{\bw}{\mathbf{w}} \newcommand{\bx}{\mathbf{x}} \newcommand{\by}{\mathbf{y}} \newcommand{\bz}{\mathbf{z}} \newcommand{\bzero}{\mathbf{0}} \newcommand{\nv}{\mathbf{0}} \newcommand{\cA}{\mathcal{A}} \newcommand{\cB}{\mathcal{B}} \newcommand{\cC}{\mathcal{C}} \newcommand{\cD}{\mathcal{D}} \newcommand{\cE}{\mathcal{E}} \newcommand{\cF}{\mathcal{F}} \newcommand{\cG}{\mathcal{G}} \newcommand{\cH}{\mathcal{H}} \newcommand{\cI}{\mathcal{I}} \newcommand{\cJ}{\mathcal{J}} \newcommand{\cK}{\mathcal{K}} \newcommand{\cL}{\mathcal{L}} \newcommand{\cM}{\mathcal{M}} \newcommand{\cN}{\mathcal{N}} \newcommand{\cO}{\mathcal{O}} \newcommand{\cP}{\mathcal{P}} \newcommand{\cQ}{\mathcal{Q}} \newcommand{\cR}{\mathcal{R}} \newcommand{\cS}{\mathcal{S}} \newcommand{\cT}{\mathcal{T}} \newcommand{\cU}{\mathcal{U}} \newcommand{\cV}{\mathcal{V}} \newcommand{\cW}{\mathcal{W}} \newcommand{\cX}{\mathcal{X}} \newcommand{\cY}{\mathcal{Y}} \newcommand{\cZ}{\mathcal{Z}} \newcommand{\rA}{\mathrm{A}} \newcommand{\rB}{\mathrm{B}} \newcommand{\rC}{\mathrm{C}} \newcommand{\rD}{\mathrm{D}} \newcommand{\rE}{\mathrm{E}} \newcommand{\rF}{\mathrm{F}} \newcommand{\rG}{\mathrm{G}} \newcommand{\rH}{\mathrm{H}} \newcommand{\rI}{\mathrm{I}} \newcommand{\rJ}{\mathrm{J}} \newcommand{\rK}{\mathrm{K}} \newcommand{\rL}{\mathrm{L}} \newcommand{\rM}{\mathrm{M}} \newcommand{\rN}{\mathrm{N}} \newcommand{\rO}{\mathrm{O}} \newcommand{\rP}{\mathrm{P}} \newcommand{\rQ}{\mathrm{Q}} \newcommand{\rR}{\mathrm{R}} \newcommand{\rS}{\mathrm{S}} \newcommand{\rT}{\mathrm{T}} \newcommand{\rU}{\mathrm{U}} \newcommand{\rV}{\mathrm{V}} \newcommand{\rW}{\mathrm{W}} \newcommand{\rX}{\mathrm{X}} \newcommand{\rY}{\mathrm{Y}} \newcommand{\rZ}{\mathrm{Z}} \newcommand{\pv}{\overline} \newcommand{\iu}{\mathrm{i}} \newcommand{\ju}{\mathrm{j}} \newcommand{\im}{\mathrm{i}} \newcommand{\e}{\mathrm{e}} \newcommand{\real}{\operatorname{Re}} \newcommand{\imag}{\operatorname{Im}} \newcommand{\Arg}{\operatorname{Arg}} \newcommand{\Ln}{\operatorname{Ln}} \DeclareMathOperator*{\res}{res} \newcommand{\re}{\operatorname{Re}} \newcommand{\im}{\operatorname{Im}} \newcommand{\arsinh}{\operatorname{ar\,sinh}} \newcommand{\arcosh}{\operatorname{ar\,cosh}} \newcommand{\artanh}{\operatorname{ar\,tanh}} \newcommand{\sgn}{\operatorname{sgn}} \newcommand{\diag}{\operatorname{diag}} \newcommand{\proj}{\operatorname{proj}} \newcommand{\rref}{\operatorname{rref}} \newcommand{\rank}{\operatorname{rank}} \newcommand{\Span}{\operatorname{span}} \newcommand{\vir}{\operatorname{span}} \renewcommand{\dim}{\operatorname{dim}} \newcommand{\alg}{\operatorname{alg}} \newcommand{\geom}{\operatorname{geom}} \newcommand{\id}{\operatorname{id}} \newcommand{\norm}[1]{\lVert #1 \rVert} \newcommand{\tp}[1]{#1^{\top}} \renewcommand{\d}{\mathrm{d}} \newcommand{\sij}[2]{\bigg/_{\mspace{-15mu}#1}^{\,#2}} \newcommand{\abs}[1]{\lvert#1\rvert} \newcommand{\pysty}[1]{\left[\begin{array}{@{}r@{}}#1\end{array}\right]} \newcommand{\piste}{\cdot} \newcommand{\qedhere}{} \newcommand{\taumatrix}[1]{\left[\!\!#1\!\!\right]} \newenvironment{augmatrix}[1]{\left[\begin{array}{#1}}{\end{array}\right]} \newenvironment{vaugmatrix}[1]{\left|\begin{array}{#1}}{\end{array}\right|} \newcommand{\trans}{\mathrm{T}} \newcommand{\EUR}{\text{\unicode{0x20AC}}} \newcommand{\SI}[3][]{#2\,\mathrm{#3}} \newcommand{\si}[2][]{\mathrm{#2}} \newcommand{\num}[2][]{#2} \newcommand{\ang}[2][]{#2^{\circ}} \newcommand{\meter}{m} \newcommand{\metre}{\meter} \newcommand{\kilo}{k} \newcommand{\kilogram}{kg} \newcommand{\gram}{g} \newcommand{\squared}{^2} \newcommand{\cubed}{^3} \newcommand{\minute}{min} \newcommand{\hour}{h} \newcommand{\second}{s} \newcommand{\degreeCelsius}{^{\circ}C} \newcommand{\per}{/} \newcommand{\centi}{c} \newcommand{\milli}{m} \newcommand{\deci}{d} \newcommand{\percent}{\%} \newcommand{\Var}{\operatorname{Var}} \newcommand{\Cov}{\operatorname{Cov}} \newcommand{\Corr}{\operatorname{Corr}} \newcommand{\Tasd}{\operatorname{Tasd}} \newcommand{\Ber}{\operatorname{Ber}} \newcommand{\Bin}{\operatorname{Bin}} \newcommand{\Geom}{\operatorname{Geom}} \newcommand{\Poi}{\operatorname{Poi}} \newcommand{\Hyperg}{\operatorname{Hyperg}} \newcommand{\Tas}{\operatorname{Tas}} \newcommand{\Exp}{\operatorname{Exp}} \newcommand{\tdist}{\operatorname{t}} \newcommand{\rd}{\mathrm{d}}\]

Diskreetin satunnaismuuttujan jakauma¶

Satunnaiskokeen tulokset eivät aina ole lukuja välimatka- tai suhdeasteikoilla, vaan ne voivat olla myös luokitteluja tai laadullisesti järjestyviä kuvailuja. Jotta tällaisia tuloksia olisi helpompi tulkita ja käsitellä, ne usein koodataan numeerisiksi arvoiksi. Tähän koodaukseen käytetään funktiota \(X : \Omega \rightarrow \R\), ja sitä sanotaan satunnaismuuttujaksi (random variable). Tässä materiaalissa satunnaiskokeiden tulokset ilmoitetaan usein suoraan reaalilukuina, jolloin satunnaismuuttuja samaistetaan suoraan tuloksiin ja funktiotulkintaa ei tarvita. Satunnaismuuttujia merkitään isoilla kirjaimilla \(X, Y, Z, \ldots\) ja niiden saamia arvoja pienillä kirjaimilla \(x, y, z, \ldots\)

Satunnaismuuttujaan liittyvien tapahtumien todennäköisyyksiä edustaa todennäköisyysjakauma, ja satunnaismuuttujia koskevan päätöksenteon pohjana on tuntea sen noudattama jakauma. Seuraavaksi tutustutaan erityyppisiin satunnaismuuttujiin ja niiden todennäköisyysjakaumiin.

Satunnaismuuttujan \(X\) sanotaan olevan diskreetti, jos sen otosavaruudessa \(\Omega\) on äärellinen tai numeroituvasti ääretön määrä alkeistapauksia. Tällöin otosavaruuden alkiot voidaan luetella äärellisenä tai äärettömänä joukkona

\[\Omega=\{x_1,x_2,\ldots,x_n,\ldots\} \subseteq \R.\]

Diskreetin satunnaismuuttujan \(X\) todennäköisyysjakauma tunnetaan, kun tiedetään eri alkioiden \(x_i\) realisoitumisien todennäköisyydet \(P(X = x_i)\), \(i = 1, 2, \ldots, n, \ldots\)

Määritelmä 2.1.1

Funktio \(f : \R \rightarrow [0, 1]\) on otosavaruuden \(\Omega\) diskreetin satunnaismuuttujan \(X\) tiheysfunktio ((probability) density function, pdf), jos

\(f(x)\geq 0\) aina, kun \(x \in \Omega\),
\(\sum\limits_{x\in\Omega}f(x) = 1\),
\(f(x) = P(X = x)\).

Huomautus 2.1.2

Satunnaismuuttujan \(X\) tiheysfunktio \(f(x)\) on siis määritelty kaikilla reaaliluvuilla. Tavallisesti tiheysfunktion muoto kerrotaan vain otosavaruudessa ja jätetään mainitsematta implisiittinen oletus \(f(x)=0\), jos \(x\not\in\Omega\).

Arvoja \(f(x) = P(X = x)\), missä \(x\in\Omega\), kutsutaan pistetodennäköisyyksiksi, ja diskreetin satunnaismuuttujan tiheysfunktiosta käytetään myös nimitystä pistetodennäköisyysfunktio. Mielivaltaisen tapahtuman \(A\subseteq\Omega\) todennäköisyys saadaan laskemalla yhteen sen alkioiden pistetodennäköisyydet, eli

\[P(A) = \sum_{x\in A}f(x).\]

Näin määritelty todennäköisyysmitta \(P\) toteuttaa Kolmogorovin aksioomat.

Esimerkki 2.1.3

Olkoon satunnaismuuttujan \(X\) otosavaruus \(\Omega = \Z_+ = \{1,2,3,\dots\}\), ja olkoot todennäköisyydet \(P(X = x) = \left(\frac{1}{2}\right)^x\), kun \(x\in\Omega\). Tällöin diskreetin muuttujan \(X\) jakauma ilmoitetaan tiheysfunktiolla

\[\begin{split}f(x)= \begin{cases} \left(\frac{1}{2}\right)^x, & \text{kun } x \in \Z_+ \\ 0, & \text{muulloin}, \end{cases}\end{split}\]

tai lyhyemmin \(f(x) = \left(\frac{1}{2}\right)^x\), kun \(x \in \Z_+\). Sen jakaumaa voi havainnollistaa graafisesti janadiagrammilla, jossa arvon \(x\) kohdalle piirretään \(f(x)\)-pituinen pystysuora jana.

Funktio \(f\) on tiheysfunktio, sillä se saa vain ei-negatiivisia arvoja ja sen antamien kaikkien todennäköisyyksien summa on

\[\sum_{x \in \Omega}f(x) = \sum_{k = 1}^{\infty}\left(\frac{1}{2}\right)^k = \frac{\frac{1}{2}}{1 - \frac{1}{2}} = 1.\]

Tiheysfunktiota voidaan käyttää todennäköisyyksien laskemisessa esimerkiksi seuraavasti:

\[\begin{split}\begin{aligned} P(X>2 \mid X<4) &= \frac{P(\{X>2\}\cap\{X<4\})}{P(X<4)} = \frac{P(X = 3)}{P(X < 4)}\\ &= \frac{f(3)}{f(1)+f(2)+f(3)}=\frac{\frac{1}{8}}{\frac{1}{2}+\frac{1}{4}+\frac{1}{8}}=\frac{1}{7}. \end{aligned}\end{split}\]

Määritelmä 2.1.4

Diskreetin satunnaismuuttujan \(X\) kertymäfunktio (cumulative distribution function, cdf) on funktio \(F : \R \rightarrow [0, 1]\),

\[F(x) = P(X\leq x) = \sum_{t\leq x}f(t).\]

Diskreetin satunnaismuuttujan kertymäfunktio on kasvava porrasfunktio (kohdassa \(x=x_i\) on \(f(x_i)\)-pituinen hyppäys), sekä lisäksi

\[\lim_{x\to-\infty}F(x)=0\qquad\text{ja}\qquad\lim_{x\to\infty}F(x)=1.\]

Jos kertymäfunktio tunnetaan, niin voidaan helposti laskea reaalilukuväleinä esitettävien tapahtumien todennäköisyyksiä. Esimerkiksi jos \(a < b\) joillekin otosavaruuden alkioille \(a\) ja \(b\), niin

\[\begin{split}\begin{aligned} P(a<X\leq b) &= P(\{X > a\} \cap \{X \leq b\}) \\ &= P(X > a) + P(X \leq b) - P(\{X > a\} \cup \{X \leq b\}) \\ &= 1 - P(X \leq a) + P(X \leq b) - P(\Omega) \\ &= F(b)-F(a). \end{aligned}\end{split}\]

Vastaavasti voidaan osoittaa, että \(P(a \leq X \leq b) = F(b) - F(a) + f(a)\), eli diskreetin satunnaismuuttujan tapauksessa on tärkeää huomata kuuluvatko rajat \(a\) ja \(b\) mukaan tapahtumaan vai eivät.

Esimerkki 2.1.5

Määritetään edellisen esimerkin satunnaismuuttujan \(X\) kertymäfunktio. Jos \(x\in\Z_+\), niin

\[P(X\leq x)=\sum_{t=1}^{x}\left(\frac{1}{2}\right)^t = \frac{\frac{1}{2}\left(1 - \left(\frac{1}{2}\right)^x\right)}{1 - \frac{1}{2}} = 1-\left(\frac{1}{2}\right)^x,\]

joten kertymäfunktio on

\[\begin{split}F(x)= \begin{cases} 0, & \text{kun } x < 1 \\ 1-\left(\frac{1}{2}\right)^{\lfloor x\rfloor}, &\text{kun } x \geq 1, \end{cases}\end{split}\]

missä \(\lfloor x\rfloor\) on suurin reaalilukua \(x\) pienempi kokonaisluku (lattiafunktio).

Yksinkertainen diskreetti todennäköisyysjakauma muodostuu suoraan klassisen todennäköisyyden kautta symmetristen alkeistapausten otosavaruudessa.

Määritelmä 2.1.6

Diskreetti satunnaismuuttuja \(X\) noudattaa diskreettiä tasajakaumaa (discrete uniform distribution), jos sen otosavaruudessa \(\Omega\) on äärellinen määrä \(n\) yhtä todennäköisiä alkeistapauksia. Tällöin satunnaismuuttujan \(X\) tiheysfunktio on

\[f(x)=\frac{1}{n},\qquad\text{kun }x\in\Omega.\]

Usein alkeistapaukset ovat peräkkäisiä kokonaislukuja arvojen \(a\) ja \(b\) välissä, ja tällöin merkitään \(X \sim \Tasd(a, b)\). Nyt myös \(\Omega=\{a,a+1,a+2, \ldots ,b\} = [a, b] \cap \Z\), otosavaruudessa on \(b-a+1\) alkiota ja tiheysfunktio

\[f(x)=\frac{1}{b-a+1},\qquad\text{kun }x\in\Omega.\]

Esimerkki 2.1.7

Nopanheiton tuloksen \(X\) otosavaruus \(\Omega = \{1,2,3,4,5,6\}\), ja symmetriaoletuksen nojalla \(X \sim \Tasd(1,6)\). Satunnaismuuttujan \(X\) tiheysfunktio on

\[f(x)=\frac{1}{6},\qquad\text{kun }x\in\Omega.\]

Esimerkki 2.1.8

Tiedetään että yhteensä \(N\) kappaleen joukossa on \(m\) kappaletta tuotetta A. Poimitaan yhteensä \(n\) kappaleen satunnaisotos ilman takaisinpanoa. Määritellään satunnaismuuttuja \(X\) kuvaamaan otoksessa olevien tuotteiden A lukumäärää. Mitä on \(P(X=x)\)?

Piilota/näytä ratkaisu

Jos otoksessa on tuotetta A yhteensä \(x\) kappaletta (\(0 \leq x \leq n\)), niin muita kuin tuotetta A on \(n - x\) kappaletta. Tuloperiaatteen nojalla tällaisia erilaisia palauttamatta valittuja otoksia on \(\binom{m}{x}\binom{N-m}{n-x}\) kappaletta. Kaikkiaan \(n\) alkion otoksia voidaan muodostaa \(\binom{N}{n}\) kappaletta, joten klassisen todennäköisyyden mukaisesti

\[P(X = x) = \frac{\binom{m}{x}\binom{N-m}{n-x}}{\binom{N}{n}} = f(x).\qedhere\]

Määritelmä 2.1.9

Jos satunnaismuuttujan \(X\) tiheysfunktio on

\[f(x)=\frac{\binom{m}{x}\binom{N-m}{n-x}}{\binom{N}{n}}\]

sen sanotaan noudattavan hypergeometrista jakaumaa (hypergeometric distribution) parametrein \(N\), \(m\) ja \(n\), \(X \sim \Hyperg(N,m,n)\). Hypergeometrisen jakauman otosavaruus \(\Omega\) on kaikkien ehdon

\[\max\{0,n-(N-m)\}\leq x\leq\min\{n,m\}\]

toteuttavien kokonaislukujen \(x\) joukko.

Esimerkki 2.1.10

Laatikossa on \(m = 5\) valkoista ja \(7\) mustaa palloa, yhteensä siis \(N = 12\) palloa. Näistä valitaan palauttamatta \(n = 6\) palloa. Otokseen valikoituvien valkoisten pallojen lukumäärä \(X \sim \Hyperg(12,5,6)\), ja satunnaismuuttujan \(X\) otosavaruus on \(\Omega=\{0,1,2,3,4,5\}\). Tiheysfunktio on siis

\[f(x)=\frac{\binom{5}{x}\binom{7}{6-x}}{\binom{12}{6}},\qquad\text{kun } x\in\Omega.\]

Nyt todennäköisyys sille, että otoksessa olisi vähintään \(4\) valkoista palloa on

\[P(X=4)+P(X=5)=f(4)+f(5)=\frac{\binom{5}{4}\binom{7}{2}}{\binom{12}{6}}+\frac{\binom{5}{5}\binom{7}{1}}{\binom{12}{6}} = \frac{5\cdot 21}{924}+\frac{1\cdot 7}{924} \approx 0{,}1212.\]

Esimerkki 2.1.11

Kurssilla on \(5\) aihealuetta ja tentissä on \(4\) tehtävää satunnaisesti valituista neljästä aihealueesta, yksi kustakin. Kurssin \(250\) opiskelijaa valmistautuvat tenttiin opiskelemalla vain kaksi itse valitsemaansa aihealuetta täydellisesti. Kurssista pääsee läpi osaamalla puolet tenttitehtävistä. Kuinka moni

pääsee läpi ensimmäisellä tenttikerralla,
ei pääse läpi kolmella ensimmäisellä tenttikerralla?

Piilota/näytä ratkaisu

Viidestä aihealueesta voidaan valita neljä yhteensä \(\binom{5}{4} = 5\) eri tavalla. Jokainen mahdollinen tehtäväpari sisältyy kolmeen näistä kombinaatioista, jolloin todennäköisyys opiskelijalle vastata juuri harjoittelemiensa aihealueiden kysymyksiin on \(\frac{3}{5} = 0{,}6\). Koska opiskelija osaa vastata näiden aihealueiden tehtäviin täydellisesti, hän myös läpäisee tentin todennäköisyydellä \(0{,}6\). Läpi pääsevien opiskelijoiden lukumäärä on siis \(0{,}6\cdot 250 = 150\).
Määritellään satunnaismuuttuja \(X\) kuvaamaan erään opiskelijan läpäisemän tentin järjestysnumeroa, jolloin sen otosavaruus on \(\Omega = \{1, 2, 3, \ldots\} = \Z_+\). Edellisen kohdan nojalla tiedetään, että \(P(X = 1) = 0{,}6\), ja tämä on myös todennäköisyys onnistua missä tahansa annetussa tentissä. Etsitään satunnaismuuttujan \(X\) tiheysfunktio, eli lasketaan \(P(X = x)\), missä \(x \in \Omega\). Jos opiskelija läpäisee tentin \(x\), hän on sitä ennen epäonnistunut yhteensä \(x - 1\) kertaa. Kun oletetaan, että tenttikerroilla onnistuminen on toisistaan riippumatonta, joten

\[P(X = x) = (1 - 0{,}6)^{x - 1} \cdot 0{,}6 = 0{,}6 \cdot 0{,}4^{x - 1} = f(x).\]

Opiskelijalle, joka ei läpäise ensimmäistä kolmea tenttiä on oltava \(X > 3\), ja tämän tilanteen todennäköisyys on

\[\begin{split}\begin{aligned} P(X > 3) &= 1 - P(X \leq 3) \\ &= 1 - (P(X = 1) + P(X = 2) + P(X = 3)) \\ &= 1 - (0{,}6 \cdot 0{,}4^0 + 0{,}6 \cdot 0{,}4^1 + 0{,}6 \cdot 0{,}4^2) \\ &= 0{,}064. \end{aligned}\end{split}\]

Kolme ensimmäistä tenttiä reputtaa siis \(0{,}064 \cdot 250 = 16\) opiskelijaa.

Määritelmä 2.1.12

Jos toistokokeen (koodattuina) tulosvaihtoehtoina on vain \(0\) tai \(1\) ja vaihtoehdon \(1\) muista kokeista riippumaton todennäköisyys on \(p\), niin ensimmäisenä tuloksen \(1\) antaneen toistokerran järjestysnumeroa kuvaava satunnaismuuttuja \(X\) noudattaa geometrista jakaumaa (geometric distribution), \(X \sim \Geom(p)\). Sen tiheysfunktio on

\[f(x) = p(1-p)^{x-1},\qquad\text{kun } x\in\Omega=\{ 1,2,3,\ldots \} = \Z_+.\]

Usein vaihtoehtoa \(1\) kutsutaan onnistumiseksi (success) ja vaihtoehtoa \(0\) epäonnistumiseksi (failure).

Geometrisessa jakaumassa on siis kyse ensimmäisen onnistumisen esiintymisestä toistokokeessa. Tässä esimerkissä \(X \sim \Geom(0.6)\).