$\newcommand{\N}{\mathbb N} \newcommand{\Z}{\mathbb Z} \newcommand{\Q}{\mathbb Q} \newcommand{\R}{\mathbb R} \renewcommand{\C}{\mathbb C} \newcommand{\ba}{\mathbf{a}} \newcommand{\bb}{\mathbf{b}} \newcommand{\bc}{\mathbf{c}} \newcommand{\bd}{\mathbf{d}} \newcommand{\be}{\mathbf{e}} \newcommand{\bbf}{\mathbf{f}} \newcommand{\bh}{\mathbf{h}} \newcommand{\bi}{\mathbf{i}} \newcommand{\bj}{\mathbf{j}} \newcommand{\bk}{\mathbf{k}} \newcommand{\bN}{\mathbf{N}} \newcommand{\bn}{\mathbf{n}} \newcommand{\bo}{\mathbf{0}} \newcommand{\bp}{\mathbf{p}} \newcommand{\bq}{\mathbf{q}} \newcommand{\br}{\mathbf{r}} \newcommand{\bs}{\mathbf{s}} \newcommand{\bT}{\mathbf{T}} \newcommand{\bu}{\mathbf{u}} \newcommand{\bv}{\mathbf{v}} \newcommand{\bw}{\mathbf{w}} \newcommand{\bx}{\mathbf{x}} \newcommand{\by}{\mathbf{y}} \newcommand{\bz}{\mathbf{z}} \newcommand{\bzero}{\mathbf{0}} \newcommand{\cA}{\mathcal{A}} \newcommand{\cB}{\mathcal{B}} \newcommand{\cC}{\mathcal{C}} \newcommand{\cD}{\mathcal{D}} \newcommand{\cE}{\mathcal{E}} \newcommand{\cF}{\mathcal{F}} \newcommand{\cG}{\mathcal{G}} \newcommand{\cH}{\mathcal{H}} \newcommand{\cI}{\mathcal{I}} \newcommand{\cJ}{\mathcal{J}} \newcommand{\cK}{\mathcal{K}} \newcommand{\cL}{\mathcal{L}} \newcommand{\cM}{\mathcal{M}} \newcommand{\cN}{\mathcal{N}} \newcommand{\cO}{\mathcal{O}} \newcommand{\cP}{\mathcal{P}} \newcommand{\cQ}{\mathcal{Q}} \newcommand{\cR}{\mathcal{R}} \newcommand{\cS}{\mathcal{S}} \newcommand{\cT}{\mathcal{T}} \newcommand{\cU}{\mathcal{U}} \newcommand{\cV}{\mathcal{V}} \newcommand{\cW}{\mathcal{W}} \newcommand{\cX}{\mathcal{X}} \newcommand{\cY}{\mathcal{Y}} \newcommand{\cZ}{\mathcal{Z}} \newcommand{\rA}{\mathrm{A}} \newcommand{\rB}{\mathrm{B}} \newcommand{\rC}{\mathrm{C}} \newcommand{\rD}{\mathrm{D}} \newcommand{\rE}{\mathrm{E}} \newcommand{\rF}{\mathrm{F}} \newcommand{\rG}{\mathrm{G}} \newcommand{\rH}{\mathrm{H}} \newcommand{\rI}{\mathrm{I}} \newcommand{\rJ}{\mathrm{J}} \newcommand{\rK}{\mathrm{K}} \newcommand{\rL}{\mathrm{L}} \newcommand{\rM}{\mathrm{M}} \newcommand{\rN}{\mathrm{N}} \newcommand{\rO}{\mathrm{O}} \newcommand{\rP}{\mathrm{P}} \newcommand{\rQ}{\mathrm{Q}} \newcommand{\rR}{\mathrm{R}} \newcommand{\rS}{\mathrm{S}} \newcommand{\rT}{\mathrm{T}} \newcommand{\rU}{\mathrm{U}} \newcommand{\rV}{\mathrm{V}} \newcommand{\rW}{\mathrm{W}} \newcommand{\rX}{\mathrm{X}} \newcommand{\rY}{\mathrm{Y}} \newcommand{\rZ}{\mathrm{Z}} \newcommand{\re}{\operatorname{Re}} \newcommand{\im}{\operatorname{Im}} \newcommand{\arsinh}{\operatorname{ar\,sinh}} \newcommand{\arcosh}{\operatorname{ar\,cosh}} \newcommand{\artanh}{\operatorname{ar\,tanh}} \newcommand{\diag}{\operatorname{diag}} \newcommand{\proj}{\operatorname{proj}} \newcommand{\rref}{\operatorname{rref}} \newcommand{\rank}{\operatorname{rank}} \newcommand{\Span}{\operatorname{span}} \renewcommand{\dim}{\operatorname{dim}} \newcommand{\alg}{\operatorname{alg}} \newcommand{\geom}{\operatorname{geom}} \newcommand{\id}{\operatorname{id}} \newcommand{\Var}{\operatorname{Var}} \newcommand{\Cov}{\operatorname{Cov}} \newcommand{\Corr}{\operatorname{Corr}} \newcommand{\Tasd}{\operatorname{Tasd}} \newcommand{\Ber}{\operatorname{Ber}} \newcommand{\Bin}{\operatorname{Bin}} \newcommand{\Geom}{\operatorname{Geom}} \newcommand{\Poi}{\operatorname{Poi}} \newcommand{\Hyperg}{\operatorname{Hyperg}} \newcommand{\Tas}{\operatorname{Tas}} \newcommand{\Exp}{\operatorname{Exp}} \newcommand{\tdist}{\operatorname{t}} \newcommand{\rd}{\mathrm{d}} \newcommand{\sij}[2]{\bigg/_{\mspace{-10mu}\,#1}^{\,#2}} \newcommand{\qedhere}{}$

Diskreetin satunnaismuuttujan jakauma¶

Satunnaiskokeen tulokset eivät aina ole lukuja välimatka- tai suhdeasteikoilla, vaan ne voivat olla myös luokitteluja tai laadullisesti järjestyviä kuvailuja. Jotta tällaisia tuloksia olisi helpompi tulkita ja käsitellä, ne usein koodataan numeerisiksi arvoiksi. Tähän koodaukseen käytetään funktiota $X : \Omega \rightarrow \R$ , ja sitä sanotaan satunnaismuuttujaksi (random variable). Tässä materiaalissa satunnaiskokeiden tulokset ilmoitetaan usein suoraan reaalilukuina, jolloin satunnaismuuttuja samaistetaan suoraan tuloksiin ja funktiotulkintaa ei tarvita. Satunnaismuuttujia merkitään isoilla kirjaimilla $X, Y, Z, \ldots$ ja niiden saamia arvoja pienillä kirjaimilla $x, y, z, \ldots$

Satunnaismuuttujaan liittyvien tapahtumien todennäköisyyksiä edustaa todennäköisyysjakauma, ja satunnaismuuttujia koskevan päätöksenteon pohjana on tuntea sen noudattama jakauma. Seuraavaksi tutustutaan erityyppisiin satunnaismuuttujiin ja niiden todennäköisyysjakaumiin.

Satunnaismuuttujan $X$ sanotaan olevan diskreetti, jos sen otosavaruudessa $\Omega$ on äärellinen tai numeroituvasti ääretön määrä alkeistapauksia. Tällöin otosavaruuden alkiot voidaan luetella äärellisenä tai äärettömänä joukkona

$\Omega=\{x_1,x_2,\ldots,x_n,\ldots\} \subseteq \R.$

Diskreetin satunnaismuuttujan $X$ todennäköisyysjakauma tunnetaan, kun tiedetään eri alkioiden $x_i$ realisoitumisien todennäköisyydet $P(X = x_i)$ , $i = 1, 2, \ldots, n, \ldots$

Määritelmä 2.1.1

Funktio $f : \R \rightarrow [0, 1]$ on otosavaruuden $\Omega$ diskreetin satunnaismuuttujan $X$ tiheysfunktio ((probability) density function, pdf), jos

$f(x)\geq 0$ aina, kun $x \in \Omega$ ,
$\sum\limits_{x\in\Omega}f(x) = 1$ ,
$f(x) = P(X = x)$ .

Huomautus 2.1.2

Satunnaismuuttujan $X$ tiheysfunktio $f(x)$ on siis määritelty kaikilla reaaliluvuilla. Tavallisesti tiheysfunktion muoto kerrotaan vain otosavaruudessa ja jätetään mainitsematta implisiittinen oletus $f(x)=0$ , jos $x\not\in\Omega$ .

Arvoja $f(x) = P(X = x)$ , missä $x\in\Omega$ , kutsutaan pistetodennäköisyyksiksi, ja diskreetin satunnaismuuttujan tiheysfunktiosta käytetään myös nimitystä pistetodennäköisyysfunktio. Mielivaltaisen tapahtuman $A\subseteq\Omega$ todennäköisyys saadaan laskemalla yhteen sen alkioiden pistetodennäköisyydet, eli

$P(A) = \sum_{x\in A}f(x).$

Näin määritelty todennäköisyysmitta $P$ toteuttaa Kolmogorovin aksioomat.

Esimerkki 2.1.3

Olkoon satunnaismuuttujan $X$ otosavaruus $\Omega = \Z_+ = \{1,2,3,\dots\}$ , ja olkoot todennäköisyydet $P(X = x) = \left(\frac{1}{2}\right)^x$ , kun $x\in\Omega$ . Tällöin diskreetin muuttujan $X$ jakauma ilmoitetaan tiheysfunktiolla

$\begin{split}f(x)= \begin{cases} \left(\frac{1}{2}\right)^x, & \text{kun } x \in \Z_+ \\ 0, & \text{muulloin}, \end{cases}\end{split}$

tai lyhyemmin $f(x) = \left(\frac{1}{2}\right)^x$ , kun $x \in \Z_+$ . Sen jakaumaa voi havainnollistaa graafisesti janadiagrammilla, jossa arvon $x$ kohdalle piirretään $f(x)$ -pituinen pystysuora jana.

Funktio $f$ on tiheysfunktio, sillä se saa vain ei-negatiivisia arvoja ja sen antamien kaikkien todennäköisyyksien summa on

$\sum_{x \in \Omega}f(x) = \sum_{k = 1}^{\infty}\left(\frac{1}{2}\right)^k = \frac{\frac{1}{2}}{1 - \frac{1}{2}} = 1.$

Tiheysfunktiota voidaan käyttää todennäköisyyksien laskemisessa esimerkiksi seuraavasti:

$\begin{split}\begin{aligned} P(X>2 \mid X<4) &= \frac{P(\{X>2\}\cap\{X<4\})}{P(X<4)} = \frac{P(X = 3)}{P(X < 4)}\\ &= \frac{f(3)}{f(1)+f(2)+f(3)}=\frac{\frac{1}{8}}{\frac{1}{2}+\frac{1}{4}+\frac{1}{8}}=\frac{1}{7}. \end{aligned}\end{split}$

Määritelmä 2.1.4

Diskreetin satunnaismuuttujan $X$ kertymäfunktio (cumulative distribution function, cdf) on funktio $F : \R \rightarrow [0, 1]$ ,

$F(x) = P(X\leq x) = \sum_{t\leq x}f(t).$

Diskreetin satunnaismuuttujan kertymäfunktio on kasvava porrasfunktio (kohdassa $x=x_i$ on $f(x_i)$ -pituinen hyppäys), sekä lisäksi

$\lim_{x\to-\infty}F(x)=0\qquad\text{ja}\qquad\lim_{x\to\infty}F(x)=1.$

Jos kertymäfunktio tunnetaan, niin voidaan helposti laskea reaalilukuväleinä esitettävien tapahtumien todennäköisyyksiä. Esimerkiksi jos $a < b$ joillekin otosavaruuden alkioille $a$ ja $b$ , niin

$\begin{split}\begin{aligned} P(a<X\leq b) &= P(\{X > a\} \cap \{X \leq b\}) \\ &= P(X > a) + P(X \leq b) - P(\{X > a\} \cup \{X \leq b\}) \\ &= 1 - P(X \leq a) + P(X \leq b) - P(\Omega) \\ &= F(b)-F(a). \end{aligned}\end{split}$

Vastaavasti voidaan osoittaa, että $P(a \leq X \leq b) = F(b) - F(a) + f(a)$ , eli diskreetin satunnaismuuttujan tapauksessa on tärkeää huomata kuuluvatko rajat $a$ ja $b$ mukaan tapahtumaan vai eivät.

Esimerkki 2.1.5

Määritetään edellisen esimerkin satunnaismuuttujan $X$ kertymäfunktio. Jos $x\in\Z_+$ , niin

$P(X\leq x)=\sum_{t=1}^{x}\left(\frac{1}{2}\right)^t = \frac{\frac{1}{2}\left(1 - \left(\frac{1}{2}\right)^x\right)}{1 - \frac{1}{2}} = 1-\left(\frac{1}{2}\right)^x,$

joten kertymäfunktio on

$\begin{split}F(x)= \begin{cases} 0, & \text{kun } x < 1 \\ 1-\left(\frac{1}{2}\right)^{\lfloor x\rfloor}, &\text{kun } x \geq 1, \end{cases}\end{split}$

missä $\lfloor x\rfloor$ on suurin reaalilukua $x$ pienempi kokonaisluku (lattiafunktio).

Yksinkertainen diskreetti todennäköisyysjakauma muodostuu suoraan klassisen todennäköisyyden kautta symmetristen alkeistapausten otosavaruudessa.

Määritelmä 2.1.6

Diskreetti satunnaismuuttuja $X$ noudattaa diskreettiä tasajakaumaa (discrete uniform distribution), jos sen otosavaruudessa $\Omega$ on äärellinen määrä $n$ yhtä todennäköisiä alkeistapauksia. Tällöin satunnaismuuttujan $X$ tiheysfunktio on

$f(x)=\frac{1}{n},\qquad\text{kun }x\in\Omega.$

Usein alkeistapaukset ovat peräkkäisiä kokonaislukuja arvojen $a$ ja $b$ välissä, ja tällöin merkitään $X \sim \Tasd(a, b)$ . Nyt myös $\Omega=\{a,a+1,a+2, \ldots ,b\} = [a, b] \cap \Z$ , otosavaruudessa on $b-a+1$ alkiota ja tiheysfunktio

$f(x)=\frac{1}{b-a+1},\qquad\text{kun }x\in\Omega.$

Esimerkki 2.1.7

Nopanheiton tuloksen $X$ otosavaruus $\Omega = \{1,2,3,4,5,6\}$ , ja symmetriaoletuksen nojalla $X \sim \Tasd(1,6)$ . Satunnaismuuttujan $X$ tiheysfunktio on

$f(x)=\frac{1}{6},\qquad\text{kun }x\in\Omega.$

Esimerkki 2.1.8

Tiedetään että yhteensä $N$ kappaleen joukossa on $m$ kappaletta tuotetta A. Poimitaan yhteensä $n$ kappaleen satunnaisotos ilman takaisinpanoa. Määritellään satunnaismuuttuja $X$ kuvaamaan otoksessa olevien tuotteiden A lukumäärää. Mitä on $P(X=x)$ ?

Näytä/piilota ratkaisu

Jos otoksessa on tuotetta A yhteensä $x$ kappaletta ( $0 \leq x \leq n$ ), niin muita kuin tuotetta A on $n - x$ kappaletta. Tuloperiaatteen nojalla tällaisia erilaisia palauttamatta valittuja otoksia on $\binom{m}{x}\binom{N-m}{n-x}$ kappaletta. Kaikkiaan $n$ alkion otoksia voidaan muodostaa $\binom{N}{n}$ kappaletta, joten klassisen todennäköisyyden mukaisesti

$P(X = x) = \frac{\binom{m}{x}\binom{N-m}{n-x}}{\binom{N}{n}} = f(x).\qedhere$

Määritelmä 2.1.9

Jos satunnaismuuttujan $X$ tiheysfunktio on

$f(x)=\frac{\binom{m}{x}\binom{N-m}{n-x}}{\binom{N}{n}}$

sen sanotaan noudattavan hypergeometrista jakaumaa (hypergeometric distribution) parametrein $N$ , $m$ ja $n$ , $X \sim \Hyperg(N,m,n)$ . Hypergeometrisen jakauman otosavaruus $\Omega$ on kaikkien ehdon

$\max\{0,n-(N-m)\}\leq x\leq\min\{n,m\}$

toteuttavien kokonaislukujen $x$ joukko.

Esimerkki 2.1.10

Laatikossa on $m = 5$ valkoista ja $7$ mustaa palloa, yhteensä siis $N = 12$ palloa. Näistä valitaan palauttamatta $n = 6$ palloa. Otokseen valikoituvien valkoisten pallojen lukumäärä $X \sim \Hyperg(12,5,6)$ , ja satunnaismuuttujan $X$ otosavaruus on $\Omega=\{0,1,2,3,4,5\}$ . Tiheysfunktio on siis

$f(x)=\frac{\binom{5}{x}\binom{7}{6-x}}{\binom{12}{6}},\qquad\text{kun } x\in\Omega.$

Nyt todennäköisyys sille, että otoksessa olisi vähintään $4$ valkoista palloa on

$P(X=4)+P(X=5)=f(4)+f(5)=\frac{\binom{5}{4}\binom{7}{2}}{\binom{12}{6}}+\frac{\binom{5}{5}\binom{7}{1}}{\binom{12}{6}} = \frac{5\cdot 21}{924}+\frac{1\cdot 7}{924} \approx 0{,}1212.$

Esimerkki 2.1.11

Kurssilla on $5$ aihealuetta ja tentissä on $4$ tehtävää satunnaisesti valituista neljästä aihealueesta, yksi kustakin. Kurssin $250$ opiskelijaa valmistautuvat tenttiin opiskelemalla vain kaksi itse valitsemaansa aihealuetta täydellisesti. Kurssista pääsee läpi osaamalla puolet tenttitehtävistä. Kuinka moni

pääsee läpi ensimmäisellä tenttikerralla,
ei pääse läpi kolmella ensimmäisellä tenttikerralla?

Näytä/piilota ratkaisu

Viidestä aihealueesta voidaan valita neljä yhteensä $\binom{5}{4} = 5$ eri tavalla. Jokainen mahdollinen tehtäväpari sisältyy kolmeen näistä kombinaatioista, jolloin todennäköisyys opiskelijalle vastata juuri harjoittelemiensa aihealueiden kysymyksiin on $\frac{3}{5} = 0{,}6$ . Koska opiskelija osaa vastata näiden aihealueiden tehtäviin täydellisesti, hän myös läpäisee tentin todennäköisyydellä $0{,}6$ . Läpi pääsevien opiskelijoiden lukumäärä on siis $0{,}6\cdot 250 = 150$ .
Määritellään satunnaismuuttuja $X$ kuvaamaan erään opiskelijan läpäisemän tentin järjestysnumeroa, jolloin sen otosavaruus on $\Omega = \{1, 2, 3, \ldots\} = \Z_+$ . Edellisen kohdan nojalla tiedetään, että $P(X = 1) = 0{,}6$ , ja tämä on myös todennäköisyys onnistua missä tahansa annetussa tentissä. Etsitään satunnaismuuttujan $X$ tiheysfunktio, eli lasketaan $P(X = x)$ , missä $x \in \Omega$ . Jos opiskelija läpäisee tentin $x$ , hän on sitä ennen epäonnistunut yhteensä $x - 1$ kertaa. Kun oletetaan, että tenttikerroilla onnistuminen on toisistaan riippumatonta, joten

$P(X = x) = (1 - 0{,}6)^{x - 1} \cdot 0{,}6 = 0{,}6 \cdot 0{,}4^{x - 1} = f(x).$

Opiskelijalle, joka ei läpäise ensimmäistä kolmea tenttiä on oltava $X > 3$ , ja tämän tilanteen todennäköisyys on

$\begin{split}\begin{aligned} P(X > 3) &= 1 - P(X \leq 3) \\ &= 1 - (P(X = 1) + P(X = 2) + P(X = 3)) \\ &= 1 - (0{,}6 \cdot 0{,}4^0 + 0{,}6 \cdot 0{,}4^1 + 0{,}6 \cdot 0{,}4^2) \\ &= 0{,}064. \end{aligned}\end{split}$

Kolme ensimmäistä tenttiä reputtaa siis $0{,}064 \cdot 250 = 16$ opiskelijaa.

Määritelmä 2.1.12

Jos toistokokeen (koodattuina) tulosvaihtoehtoina on vain $0$ tai $1$ ja vaihtoehdon $1$ muista kokeista riippumaton todennäköisyys on $p$ , niin ensimmäisenä tuloksen $1$ antaneen toistokerran järjestysnumeroa kuvaava satunnaismuuttuja $X$ noudattaa geometrista jakaumaa (geometric distribution), $X \sim \Geom(p)$ . Sen tiheysfunktio on

$f(x) = p(1-p)^{x-1},\qquad\text{kun } x\in\Omega=\{ 1,2,3,\ldots \} = \Z_+.$

Usein vaihtoehtoa $1$ kutsutaan onnistumiseksi (success) ja vaihtoehtoa $0$ epäonnistumiseksi (failure).

Geometrisessa jakaumassa on siis kyse ensimmäisen onnistumisen esiintymisestä toistokokeessa. Tässä esimerkissä $X \sim \Geom(0.6)$ .