\[\newcommand{\N}{\mathbb N} \newcommand{\Z}{\mathbb Z} \newcommand{\Q}{\mathbb Q} \newcommand{\R}{\mathbb R} \newcommand{\C}{\mathbb C} \newcommand{\ba}{\mathbf{a}} \newcommand{\bb}{\mathbf{b}} \newcommand{\bc}{\mathbf{c}} \newcommand{\bd}{\mathbf{d}} \newcommand{\be}{\mathbf{e}} \newcommand{\bff}{\mathbf{f}} \newcommand{\bh}{\mathbf{h}} \newcommand{\bi}{\mathbf{i}} \newcommand{\bj}{\mathbf{j}} \newcommand{\bk}{\mathbf{k}} \newcommand{\bN}{\mathbf{N}} \newcommand{\bn}{\mathbf{n}} \newcommand{\bo}{\mathbf{0}} \newcommand{\bp}{\mathbf{p}} \newcommand{\bq}{\mathbf{q}} \newcommand{\br}{\mathbf{r}} \newcommand{\bs}{\mathbf{s}} \newcommand{\bT}{\mathbf{T}} \newcommand{\bu}{\mathbf{u}} \newcommand{\bv}{\mathbf{v}} \newcommand{\bw}{\mathbf{w}} \newcommand{\bx}{\mathbf{x}} \newcommand{\by}{\mathbf{y}} \newcommand{\bz}{\mathbf{z}} \newcommand{\bzero}{\mathbf{0}} \newcommand{\nv}{\mathbf{0}} \newcommand{\cA}{\mathcal{A}} \newcommand{\cB}{\mathcal{B}} \newcommand{\cC}{\mathcal{C}} \newcommand{\cD}{\mathcal{D}} \newcommand{\cE}{\mathcal{E}} \newcommand{\cF}{\mathcal{F}} \newcommand{\cG}{\mathcal{G}} \newcommand{\cH}{\mathcal{H}} \newcommand{\cI}{\mathcal{I}} \newcommand{\cJ}{\mathcal{J}} \newcommand{\cK}{\mathcal{K}} \newcommand{\cL}{\mathcal{L}} \newcommand{\cM}{\mathcal{M}} \newcommand{\cN}{\mathcal{N}} \newcommand{\cO}{\mathcal{O}} \newcommand{\cP}{\mathcal{P}} \newcommand{\cQ}{\mathcal{Q}} \newcommand{\cR}{\mathcal{R}} \newcommand{\cS}{\mathcal{S}} \newcommand{\cT}{\mathcal{T}} \newcommand{\cU}{\mathcal{U}} \newcommand{\cV}{\mathcal{V}} \newcommand{\cW}{\mathcal{W}} \newcommand{\cX}{\mathcal{X}} \newcommand{\cY}{\mathcal{Y}} \newcommand{\cZ}{\mathcal{Z}} \newcommand{\rA}{\mathrm{A}} \newcommand{\rB}{\mathrm{B}} \newcommand{\rC}{\mathrm{C}} \newcommand{\rD}{\mathrm{D}} \newcommand{\rE}{\mathrm{E}} \newcommand{\rF}{\mathrm{F}} \newcommand{\rG}{\mathrm{G}} \newcommand{\rH}{\mathrm{H}} \newcommand{\rI}{\mathrm{I}} \newcommand{\rJ}{\mathrm{J}} \newcommand{\rK}{\mathrm{K}} \newcommand{\rL}{\mathrm{L}} \newcommand{\rM}{\mathrm{M}} \newcommand{\rN}{\mathrm{N}} \newcommand{\rO}{\mathrm{O}} \newcommand{\rP}{\mathrm{P}} \newcommand{\rQ}{\mathrm{Q}} \newcommand{\rR}{\mathrm{R}} \newcommand{\rS}{\mathrm{S}} \newcommand{\rT}{\mathrm{T}} \newcommand{\rU}{\mathrm{U}} \newcommand{\rV}{\mathrm{V}} \newcommand{\rW}{\mathrm{W}} \newcommand{\rX}{\mathrm{X}} \newcommand{\rY}{\mathrm{Y}} \newcommand{\rZ}{\mathrm{Z}} \newcommand{\pv}{\overline} \newcommand{\iu}{\mathrm{i}} \newcommand{\ju}{\mathrm{j}} \newcommand{\im}{\mathrm{i}} \newcommand{\e}{\mathrm{e}} \newcommand{\real}{\operatorname{Re}} \newcommand{\imag}{\operatorname{Im}} \newcommand{\Arg}{\operatorname{Arg}} \newcommand{\Ln}{\operatorname{Ln}} \DeclareMathOperator*{\res}{res} \newcommand{\re}{\operatorname{Re}} \newcommand{\im}{\operatorname{Im}} \newcommand{\arsinh}{\operatorname{ar\,sinh}} \newcommand{\arcosh}{\operatorname{ar\,cosh}} \newcommand{\artanh}{\operatorname{ar\,tanh}} \newcommand{\sgn}{\operatorname{sgn}} \newcommand{\diag}{\operatorname{diag}} \newcommand{\proj}{\operatorname{proj}} \newcommand{\rref}{\operatorname{rref}} \newcommand{\rank}{\operatorname{rank}} \newcommand{\Span}{\operatorname{span}} \newcommand{\vir}{\operatorname{span}} \renewcommand{\dim}{\operatorname{dim}} \newcommand{\alg}{\operatorname{alg}} \newcommand{\geom}{\operatorname{geom}} \newcommand{\id}{\operatorname{id}} \newcommand{\norm}[1]{\lVert #1 \rVert} \newcommand{\tp}[1]{#1^{\top}} \renewcommand{\d}{\mathrm{d}} \newcommand{\sij}[2]{\bigg/_{\mspace{-15mu}#1}^{\,#2}} \newcommand{\abs}[1]{\lvert#1\rvert} \newcommand{\pysty}[1]{\left[\begin{array}{@{}r@{}}#1\end{array}\right]} \newcommand{\piste}{\cdot} \newcommand{\qedhere}{} \newcommand{\taumatrix}[1]{\left[\!\!#1\!\!\right]} \newenvironment{augmatrix}[1]{\left[\begin{array}{#1}}{\end{array}\right]} \newenvironment{vaugmatrix}[1]{\left|\begin{array}{#1}}{\end{array}\right|} \newcommand{\trans}{\mathrm{T}} \newcommand{\EUR}{\text{\unicode{0x20AC}}} \newcommand{\SI}[3][]{#2\,\mathrm{#3}} \newcommand{\si}[2][]{\mathrm{#2}} \newcommand{\num}[2][]{#2} \newcommand{\ang}[2][]{#2^{\circ}} \newcommand{\meter}{m} \newcommand{\metre}{\meter} \newcommand{\kilo}{k} \newcommand{\kilogram}{kg} \newcommand{\gram}{g} \newcommand{\squared}{^2} \newcommand{\cubed}{^3} \newcommand{\minute}{min} \newcommand{\hour}{h} \newcommand{\second}{s} \newcommand{\degreeCelsius}{^{\circ}C} \newcommand{\per}{/} \newcommand{\centi}{c} \newcommand{\milli}{m} \newcommand{\deci}{d} \newcommand{\percent}{\%} \newcommand{\Var}{\operatorname{Var}} \newcommand{\Cov}{\operatorname{Cov}} \newcommand{\Corr}{\operatorname{Corr}} \newcommand{\Tasd}{\operatorname{Tasd}} \newcommand{\Ber}{\operatorname{Ber}} \newcommand{\Bin}{\operatorname{Bin}} \newcommand{\Geom}{\operatorname{Geom}} \newcommand{\Poi}{\operatorname{Poi}} \newcommand{\Hyperg}{\operatorname{Hyperg}} \newcommand{\Tas}{\operatorname{Tas}} \newcommand{\Exp}{\operatorname{Exp}} \newcommand{\tdist}{\operatorname{t}} \newcommand{\rd}{\mathrm{d}}\]

Diskreetin satunnaismuuttujan jakauma

Satunnaiskokeen tulokset eivät aina ole lukuja välimatka- tai suhdeasteikoilla, vaan ne voivat olla myös luokitteluja tai laadullisesti järjestyviä kuvailuja. Jotta tällaisia tuloksia olisi helpompi tulkita ja käsitellä, ne usein koodataan numeerisiksi arvoiksi. Tähän koodaukseen käytetään funktiota \(X : \Omega \rightarrow \R\), ja sitä sanotaan satunnaismuuttujaksi (random variable). Tässä materiaalissa satunnaiskokeiden tulokset ilmoitetaan usein suoraan reaalilukuina, jolloin satunnaismuuttuja samaistetaan suoraan tuloksiin ja funktiotulkintaa ei tarvita. Satunnaismuuttujia merkitään isoilla kirjaimilla \(X, Y, Z, \ldots\) ja niiden saamia arvoja pienillä kirjaimilla \(x, y, z, \ldots\)

Satunnaismuuttujaan liittyvien tapahtumien todennäköisyyksiä edustaa todennäköisyysjakauma, ja satunnaismuuttujia koskevan päätöksenteon pohjana on tuntea sen noudattama jakauma. Seuraavaksi tutustutaan erityyppisiin satunnaismuuttujiin ja niiden todennäköisyysjakaumiin.

Satunnaismuuttujan \(X\) sanotaan olevan diskreetti, jos sen otosavaruudessa \(\Omega\) on äärellinen tai numeroituvasti ääretön määrä alkeistapauksia. Tällöin otosavaruuden alkiot voidaan luetella äärellisenä tai äärettömänä joukkona

\[\Omega=\{x_1,x_2,\ldots,x_n,\ldots\} \subseteq \R.\]

Diskreetin satunnaismuuttujan \(X\) todennäköisyysjakauma tunnetaan, kun tiedetään eri alkioiden \(x_i\) realisoitumisien todennäköisyydet \(P(X = x_i)\), \(i = 1, 2, \ldots, n, \ldots\)

Määritelmä 2.1.1

Funktio \(f : \R \rightarrow [0, 1]\) on otosavaruuden \(\Omega\) diskreetin satunnaismuuttujan \(X\) tiheysfunktio ((probability) density function, pdf), jos

  1. \(f(x)\geq 0\) aina, kun \(x \in \Omega\),
  2. \(\sum\limits_{x\in\Omega}f(x) = 1\),
  3. \(f(x) = P(X = x)\).

Huomautus 2.1.2

Satunnaismuuttujan \(X\) tiheysfunktio \(f(x)\) on siis määritelty kaikilla reaaliluvuilla. Tavallisesti tiheysfunktion muoto kerrotaan vain otosavaruudessa ja jätetään mainitsematta oletus \(f(x)=0\), jos \(x\notin\Omega\).

Arvoja \(f(x) = P(X = x)\), missä \(x\in\Omega\), kutsutaan pistetodennäköisyyksiksi, ja diskreetin satunnaismuuttujan tiheysfunktiosta käytetään myös nimitystä pistetodennäköisyysfunktio. Mielivaltaisen tapahtuman \(A\subseteq\Omega\) todennäköisyys saadaan laskemalla yhteen sen alkioiden pistetodennäköisyydet, eli

\[P(A) = \sum_{x\in A}f(x).\]

Näin määritelty todennäköisyysmitta \(P\) toteuttaa Kolmogorovin aksioomat.

Esimerkki 2.1.3

4 punaista, 5 sinistä, 2 vihreää ja 3 valkoista palloa sekoitetaan ja valitaan satunnaisesti yksi. Olkoon satunnaiskokeen tulos valitun pallon väri. Nyt otosavaruus \(\Omega=\{\textrm{punainen, sininen, vihreä, valkoinen}\}\). Koodataan otosavaruuden alkeistapaukset numeroiksi

\[\textrm{punainen}=1, \ \textrm{sininen}=2,\ \textrm{vihreä}=3, \ \textrm{valkoinen}=4\]

Täsmällisesti tämä muunnos on satunnaismuuttuja. Usein kuitenkin satunnaismuuttuja samaistetaan suoraan tämän funktion arvoihin , jolloin pallon väri on satunnaismuuttuja \(X\), jonka otosavaruus on \(\Omega=\{1,2,3,4\}\), missä numerot tarkoittavat värejä em. koodauksen mukaisesti.

Palloja on yhteensä 14. Satunnaisesti valitun yhden pallon värin pistetodennäköisyydet saadaan klassisen todennäköisyyden mukaan ja näin voidaan muodostaa satunnaismuuttujan tiheysfunktio eli pistetodennäköisyysfunktio \(f(x)\)

\[\begin{split}\begin{array}{rcl} f(1)&=&P(X=1)=\dfrac{4}{14}\\ f(2)&=&P(X=2)=\dfrac{5}{14}\\ f(3)&=&P(X=3)=\dfrac{2}{14}\\ f(4)&=&P(X=4)=\dfrac{3}{14} \end{array}\end{split}\]

Tässä tiheysfunktio ilmoitetaan luettelemalla kaikkien alkeistapausten todennäköisyydet listana ja mitään funktiolauseketta ei kannata yrittää löytää.

Kaikkien pistetodennäköisyyksien summa \(\dfrac{4}{14}+\dfrac{5}{14}+\dfrac{2}{14}+\dfrac{3}{14}=1\). Tapahtumien todennäköisyydet saadaan laskemalla pistetodennäköisyyksiä yhteen. Esimerkiksi todennäköisyys, että pallo on punainen tai sininen on

\[P(X=1 \ \textrm{tai}\ \ X=2)=P(X=1)+P(X=2)=\dfrac{4}{14}+\dfrac{5}{14}=\dfrac{9}{14}\]

Määritelmä 2.1.4

Diskreetin satunnaismuuttujan \(X\) kertymäfunktio (cumulative distribution function, cdf) on funktio \(F : \R \rightarrow [0, 1]\),

\[F(x) = P(X\leq x) = \sum_{t\leq x}f(t).\]

Kertymäfunktio ilmoittaa pisteeseen \(x\) mennessä kertyneen todennäköisyyden. Diskreetin satunnaismuuttujan kertymäfunktio on kasvava porrasfunktio (kohdassa \(x=x_i\) on \(f(x_i)\)-pituinen hyppäys), sekä lisäksi

\[\lim_{x\to-\infty}F(x)=0\qquad\text{ja}\qquad\lim_{x\to\infty}F(x)=1.\]

Jos kertymäfunktio tunnetaan, niin sen avulla voidaan laskea reaalilukuväleinä esitettävien tapahtumien todennäköisyyksiä. Esimerkiksi jos \(a < b\) joillekin otosavaruuden alkioille \(a\) ja \(b\), niin

\[\begin{split}\begin{aligned} P(a<X\leq b) &= P(\{X > a\} \cap \{X \leq b\}) \\ &= P(X > a) + P(X \leq b) - P(\{X > a\} \cup \{X \leq b\}) \\ &= 1 - P(X \leq a) + P(X \leq b) - P(\Omega) \\ &= F(b)-F(a). \end{aligned}\end{split}\]

Vastaavasti voidaan osoittaa, että \(P(a \leq X \leq b) = F(b) - F(a) + f(a)\), eli diskreetin satunnaismuuttujan tapauksessa on tärkeää huomata kuuluvatko rajat \(a\) ja \(b\) mukaan tapahtumaan vai eivät.

Huomautus 2.1.5

Opintojaksolla käytössä olevissa tietokoneohjelmistoissa Matlabissa ja R:ssä on valmiina useita diskreettien ja jatkuvien satunnaismuuttujien tiheys- tai kertymäfunktioita. Näiden avulla voidaan laskea tapahtumien todennäköisyyksiä em. tavalla.

Matlabissa tiheysfunktion laskeva komento on muotoa

   nimipdf(x,parametrit)

missä kirjainjonon ‘nimi’ tilalle tulee jakauman yksilöivä nimi ja kohtaan ‘parametrit’ annetaan jakauman parametrit (yksi tai useampia) pilkulla toisistaan erotettuna. Vastaavasti kertymäfunktio on muotoa

   nimicdf(x,parametrit

Lisäksi on kertymäfunktion käänteisfunktio muodossa

   nimiinv(p,parametrit)

Tämä antaa vastaukseksi arvon \(x\), jolle \(P(X\leq x)=p\) eli vastaus on kohta \(x\), jossa kertymäfunktio saa arvon \(p\), \(F(x)=p\)

R:ssä tiheysfunktio on muotoa

   dnimi(x,parametrit)

missä kirjainjonon ‘nimi’ tilalle tulee jakauman yksilöivä nimi ja kohtaan ‘parametrit’ annetaan jakauman parametrit (yksi tai useampia) pilkulla toisistaan erotettuna. Vastaavasti kertymäfunktio on muotoa

   pnimi(x,parametrit)

ja kertymäfunktion käänteisfunktio on

   qnimi(p,parametrit)

Parametrien ja arvojen merkitsemisessä voi olla eroavaisuuksia tämän materiaalin merkintöihin verrattuna. Jatkossa esimerkkien yhteydessä annetaan Matlabin ja R:n komennot.

Esimerkki 2.1.6

Heitetään kahta noppaa ja tulokset ovat satunnaismuuttujat \(X_1\) ja \(X_2\). Satunnaismuuttuja \(X\) on pienempi tuloksista. Jos noppien tulokset ovat samat, \(X\) on saa tämän yhteisen arvon.

Heittopareja \((X_1,X_2)\) on 36 erilaista ja ne ovat yhtä todennäköisiä. Seuraavan taulukon sisällä on merkittynä satunnaismuuttujan \(X=\min(X_1,X_2)\) arvot

\[\begin{split}\begin{array}{cc|cccccc} &&&&x_1&&&\\ &&1&2&3&4&5&6\\ \hline &1&1&1&1&1&1&1\\ &2&1&2&2&2&2&2\\ x_2&3&1&2&3&3&3&3\\ &4&1&2&3&4&4&4\\ &5&1&2&3&4&5&5\\ &6&1&2&3&4&5&6\\ \end{array}\end{split}\]

Satunnaismuuttujan \(X\) otosavaruus \(\Omega=\{1,2,3,4,5,6\}\) ja tiheysfunktio voidaan ilmoittaa luettelemalla pistetodennäköisyydet otosavaruuden eri pisteissä

\(f(k)=P(X=k)\)

\[\begin{array}{cccccc} f(1)=\dfrac{11}{36}&f(2)=\dfrac{9}{36}&f(3)=\dfrac{7}{36}&f(4)=\dfrac{5}{36}&f(5)=\dfrac{3}{36}&f(6)=\dfrac{1}{36} \end{array}\]

Tässä on mahdollista esittää tiheysfunktio myös lyhyesti funktiomuodossa

\[f(x)= \frac{13-2x}{36}, \mathrm{kun\ } x=1,2,3,4,5,6\]

Tavallisesti jätetään merkitsemättä \(f(x)=0\), kun \(x \notin \Omega\).

Satunnaismuuttujan jakaumaa voi havainnollistaa graafisesti janadiagrammilla, jossa arvon \(x\) kohdalle piirretään \(f(x)-\)pituinen pystysuora jana.

../_images/bba1.svg

Kertymäfunktion \(F(x)\) arvoja voidaan määrittää laskemalla yhteen pistetodennäköisyydet, jotka ovat kertyneet siihen mennessä. Esimerkiksi

\[F(3)=P(X\leq 3)=P(X=1)+P(X=2)+P(X=3)= \dfrac{11}{36}+\dfrac{9}{36}+\dfrac{7}{36}=\dfrac{27}{36}\]

Kertymäfunktion kuvaaja on porrasfunktio ja on määritelty kaikilla reaaliluvuilla (kuvassa vain osa kertymäfunktiosta)

../_images/bba2.svg

Yksinkertainen diskreetti todennäköisyysjakauma muodostuu suoraan klassisen todennäköisyyden kautta symmetristen alkeistapausten otosavaruudessa.

Määritelmä 2.1.7

Diskreetti satunnaismuuttuja \(X\) noudattaa diskreettiä tasajakaumaa (discrete uniform distribution), jos sen otosavaruudessa \(\Omega\) on äärellinen määrä \(n\) yhtä todennäköisiä alkeistapauksia. Tällöin satunnaismuuttujan \(X\) tiheysfunktio on

\[f(x)=\frac{1}{n},\qquad\text{kun }x\in\Omega.\]

Usein alkeistapaukset ovat peräkkäisiä kokonaislukuja arvojen \(a\) ja \(b\) välissä, ja tällöin merkitään \(X \sim \Tasd(a, b)\). Nyt \(\Omega=\{a,a+1,a+2, \ldots ,b\}\), otosavaruudessa on \(b-a+1\) alkiota ja tiheysfunktio

\[f(x)=\frac{1}{b-a+1},\qquad\text{kun }x\in\Omega.\]

Esimerkki 2.1.8

Nopanheiton tuloksen \(X\) otosavaruus \(\Omega = \{1,2,3,4,5,6\}\), ja symmetriaoletuksen nojalla \(X \sim \Tasd(1,6)\). Satunnaismuuttujan \(X\) tiheysfunktio on

\[f(x)=\frac{1}{6},\qquad\text{kun }x\in\Omega.\]

Esimerkki 2.1.9

Tiedetään että yhteensä \(N\) kappaleen joukossa on \(m\) kappaletta tuotetta A. Poimitaan yhteensä \(n\) kappaleen satunnaisotos ilman takaisinpanoa. Määritellään satunnaismuuttuja \(X\) kuvaamaan otoksessa olevien tuotteiden A lukumäärää. Mitä on \(P(X=x)\)?

Jos otoksessa on tuotetta A yhteensä \(x\) kappaletta (\(0 \leq x \leq n\)), niin muita kuin tuotetta A on \(n - x\) kappaletta. Tuloperiaatteen nojalla tällaisia erilaisia palauttamatta valittuja otoksia on \(\binom{m}{x}\binom{N-m}{n-x}\) kappaletta. Kaikkiaan \(n\) alkion otoksia voidaan muodostaa \(\binom{N}{n}\) kappaletta, joten klassisen todennäköisyyden mukaisesti

\[P(X = x) = \frac{\binom{m}{x}\binom{N-m}{n-x}}{\binom{N}{n}} = f(x).\qedhere\]

Määritelmä 2.1.10

Jos satunnaismuuttujan \(X\) tiheysfunktio on

\[f(x)=\frac{\binom{m}{x}\binom{N-m}{n-x}}{\binom{N}{n}}\]

sen sanotaan noudattavan hypergeometrista jakaumaa (hypergeometric distribution) parametrein \(N\), \(m\) ja \(n\), \(X \sim \Hyperg(N,m,n)\). Hypergeometrisen jakauman otosavaruus \(\Omega\) on kaikkien ehdon

\[\max\{0,n-(N-m)\}\leq x\leq\min\{n,m\}\]

toteuttavien kokonaislukujen \(x\) joukko.

Esimerkki 2.1.11

Laatikossa on \(m = 5\) valkoista ja \(7\) mustaa palloa, yhteensä siis \(N = 12\) palloa. Näistä valitaan palauttamatta \(n = 6\) palloa. Otokseen valikoituvien valkoisten pallojen lukumäärä \(X \sim \Hyperg(12,5,6)\), ja satunnaismuuttujan \(X\) otosavaruus on \(\Omega=\{0,1,2,3,4,5\}\). Tiheysfunktio on siis

\[f(x)=\frac{\binom{5}{x}\binom{7}{6-x}}{\binom{12}{6}},\qquad\text{kun } x\in\Omega.\]

Nyt todennäköisyys sille, että otoksessa olisi vähintään \(4\) valkoista palloa on

\[P(X=4)+P(X=5)=f(4)+f(5)=\frac{\binom{5}{4}\binom{7}{2}}{\binom{12}{6}}+\frac{\binom{5}{5}\binom{7}{1}}{\binom{12}{6}} = \frac{5\cdot 21}{924}+\frac{1\cdot 7}{924} \approx 0.1212.\]

Tapahtuman todennäköisyys \(P(X=4)+P(X=5)\) saadaan Matlabissa komennolla

   hygepdf(4,12,5,6) + hygepdf(5,12,5,6)  

Kertymäfunktiota käytettäessä tulee huomata, että piste \(X=4\) on mukana kertymäfunktion arvossa \(F(4)\). Siksi \(P(X=4)+P(X=5)=F(5)-F(3)\) ja tulos saadaan komennolla

   hygecdf(5,12,5,6) - hygecdf(3,12,5,6)

R:ssä parametrit esitetään toisella tavalla. Komennossa argumentit ovat (x, valkoisten lukumäärä = \(m\), mustien lukumäärä = \(N-m\), otoksen koko = \(n\)). Vastaavat komennot R:ssä ovat

   dhyper(4,5,7,6)+dhyper(5,5,7,6)

ja kertymäfunktion avulla

   phyper(5,5,7,6)-phyper(3,5,7,6)

Esimerkki 2.1.12

Kurssilla on \(5\) aihealuetta ja tentissä on \(4\) tehtävää satunnaisesti valituista neljästä aihealueesta, yksi kustakin. Kurssin \(250\) opiskelijaa valmistautuvat tenttiin opiskelemalla vain kaksi itse valitsemaansa aihealuetta täydellisesti. Kurssista pääsee läpi osaamalla puolet tenttitehtävistä. Kuinka moni

  1. pääsee läpi ensimmäisellä tenttikerralla,

  2. ei pääse läpi kolmella ensimmäisellä tenttikerralla?

  3. Viidestä aihealueesta voidaan valita neljä yhteensä \(\binom{5}{4} = 5\) eri tavalla. Jokainen mahdollinen tehtäväpari sisältyy kolmeen näistä kombinaatioista, jolloin todennäköisyys opiskelijalle vastata juuri harjoittelemiensa aihealueiden kysymyksiin on \(\frac{3}{5} = 0.6\). Koska opiskelija osaa vastata näiden aihealueiden tehtäviin täydellisesti, hän myös läpäisee tentin todennäköisyydellä \(0.6\). Läpi pääsevien opiskelijoiden lukumäärä on siis \(0.6\cdot 250 = 150\).

  4. Määritellään satunnaismuuttuja \(X\) kuvaamaan erään opiskelijan läpäisemän tentin järjestysnumeroa, jolloin sen otosavaruus on \(\Omega = \{1, 2, 3, \ldots\} = \Z_+\). Edellisen kohdan nojalla tiedetään, että \(P(X = 1) = 0.6\), ja tämä on myös todennäköisyys onnistua missä tahansa annetussa tentissä. Etsitään satunnaismuuttujan \(X\) tiheysfunktio, eli lasketaan \(P(X = x)\), missä \(x \in \Omega\). Jos opiskelija läpäisee tentin \(x\), hän on sitä ennen epäonnistunut yhteensä \(x - 1\) kertaa. Kun oletetaan, että tenttikerroilla onnistuminen on toisistaan riippumatonta, joten

    \[P(X = x) = (1 - 0.6)^{x - 1} \cdot 0.6 = 0.6 \cdot 0.4^{x - 1} = f(x).\]

    Opiskelijalle, joka ei läpäise ensimmäistä kolmea tenttiä on oltava \(X > 3\), ja tämän tilanteen todennäköisyys on

    \[\begin{split}\begin{aligned} P(X > 3) &= 1 - P(X \leq 3) \\ &= 1 - (P(X = 1) + P(X = 2) + P(X = 3)) \\ &= 1 - (0.6 \cdot 0.4^0 + 0.6 \cdot 0.4^1 + 0.6 \cdot 0.4^2) \\ &= 0.064. \end{aligned}\end{split}\]

    Kolme ensimmäistä tenttiä reputtaa siis \(0.064 \cdot 250 = 16\) opiskelijaa.

Määritelmä 2.1.13

Jos toistokokeen (koodattuina) tulosvaihtoehtoina on vain \(0\) tai \(1\) ja vaihtoehdon \(1\) muista kokeista riippumaton todennäköisyys on \(p\), niin ensimmäisenä tuloksen \(1\) antaneen toistokerran järjestysnumeroa kuvaava satunnaismuuttuja \(X\) noudattaa geometrista jakaumaa (geometric distribution), \(X \sim \Geom(p)\). Sen tiheysfunktio on

\[f(x) = p(1-p)^{x-1},\qquad\text{kun } x\in\Omega=\{ 1,2,3,\ldots \} = \Z_+.\]

Usein vaihtoehtoa \(1\) kutsutaan onnistumiseksi (success) ja vaihtoehtoa \(0\) epäonnistumiseksi (failure).

Geometrisessa jakaumassa on siis kyse ensimmäisen onnistumisen esiintymisestä toistokokeessa. Kyseessä on myös diskreetti jakauma, jolla on ääretön otosavaruus. Pistetodennäköisyydet lähestyvät nollaa, kun \(x\) kasvaa, mutta kuitenkin kaikilla alkeistapauksilla on nollaa suurempi todennäköisyys. Voidaan osoittaa, että pistetodennäköisyydet muodostavat geometrisen sarjan ja sarjan summa = koko otosavaruuden todennäköisyys \(=1\).

Esimerkki 2.1.14

Edellä esimerkissä \(X \sim \Geom(0.6)\). Poikkeavasti Matlabissa satunnaismuuttujalla tarkoitetaan epäonnistumisten määrää ennen onnistumista. Siksi tapahtuman

\(P(X>3)=1-P(X\leq 3)\) todennäköisyys saadaan Matlabissa komennolla

   1 - (geopdf(0,0.6) + geopdf(1,0.6) + geopdf(2,0.6))

tai kertymäfunktiolla

   1 - geocdf(2,0.6)

Samoin R:ssä satunnaismuuttuja on epäonnistumisten määrä ennen onnistumista ja vastaavat komennot ovat

   1 - (dgeom(0,0.6) + dgeom(1,0.6) + dgeom(2,0.6)) # tai
   1 - pgeom(2,0.6)

Mikä tämän luvun diskreeteistä jakaumista sopii seuraavanlaisen tilanteen mallintamiseen?

Laatikossa on \(3\) punaista ja \(4\) vihreää palloa, ja pitäisi laskea todennäköisyys jomman kumman värin ensiesiintymiselle jälkimmäisen noston yhteydessä kahden noston tapauksessa, kun ensimmäiseksi nostettu pallo palautetaan takaisin laatikkoon.

Palautusta lähetetään...