\[\newcommand{\N}{\mathbb N} \newcommand{\Z}{\mathbb Z} \newcommand{\Q}{\mathbb Q} \newcommand{\R}{\mathbb R} \renewcommand{\C}{\mathbb C} \newcommand{\ba}{\mathbf{a}} \newcommand{\bb}{\mathbf{b}} \newcommand{\bc}{\mathbf{c}} \newcommand{\bd}{\mathbf{d}} \newcommand{\be}{\mathbf{e}} \newcommand{\bbf}{\mathbf{f}} \newcommand{\bh}{\mathbf{h}} \newcommand{\bi}{\mathbf{i}} \newcommand{\bj}{\mathbf{j}} \newcommand{\bk}{\mathbf{k}} \newcommand{\bN}{\mathbf{N}} \newcommand{\bn}{\mathbf{n}} \newcommand{\bo}{\mathbf{0}} \newcommand{\bp}{\mathbf{p}} \newcommand{\bq}{\mathbf{q}} \newcommand{\br}{\mathbf{r}} \newcommand{\bs}{\mathbf{s}} \newcommand{\bT}{\mathbf{T}} \newcommand{\bu}{\mathbf{u}} \newcommand{\bv}{\mathbf{v}} \newcommand{\bw}{\mathbf{w}} \newcommand{\bx}{\mathbf{x}} \newcommand{\by}{\mathbf{y}} \newcommand{\bz}{\mathbf{z}} \newcommand{\bzero}{\mathbf{0}} \newcommand{\cA}{\mathcal{A}} \newcommand{\cB}{\mathcal{B}} \newcommand{\cC}{\mathcal{C}} \newcommand{\cD}{\mathcal{D}} \newcommand{\cE}{\mathcal{E}} \newcommand{\cF}{\mathcal{F}} \newcommand{\cG}{\mathcal{G}} \newcommand{\cH}{\mathcal{H}} \newcommand{\cI}{\mathcal{I}} \newcommand{\cJ}{\mathcal{J}} \newcommand{\cK}{\mathcal{K}} \newcommand{\cL}{\mathcal{L}} \newcommand{\cM}{\mathcal{M}} \newcommand{\cN}{\mathcal{N}} \newcommand{\cO}{\mathcal{O}} \newcommand{\cP}{\mathcal{P}} \newcommand{\cQ}{\mathcal{Q}} \newcommand{\cR}{\mathcal{R}} \newcommand{\cS}{\mathcal{S}} \newcommand{\cT}{\mathcal{T}} \newcommand{\cU}{\mathcal{U}} \newcommand{\cV}{\mathcal{V}} \newcommand{\cW}{\mathcal{W}} \newcommand{\cX}{\mathcal{X}} \newcommand{\cY}{\mathcal{Y}} \newcommand{\cZ}{\mathcal{Z}} \newcommand{\rA}{\mathrm{A}} \newcommand{\rB}{\mathrm{B}} \newcommand{\rC}{\mathrm{C}} \newcommand{\rD}{\mathrm{D}} \newcommand{\rE}{\mathrm{E}} \newcommand{\rF}{\mathrm{F}} \newcommand{\rG}{\mathrm{G}} \newcommand{\rH}{\mathrm{H}} \newcommand{\rI}{\mathrm{I}} \newcommand{\rJ}{\mathrm{J}} \newcommand{\rK}{\mathrm{K}} \newcommand{\rL}{\mathrm{L}} \newcommand{\rM}{\mathrm{M}} \newcommand{\rN}{\mathrm{N}} \newcommand{\rO}{\mathrm{O}} \newcommand{\rP}{\mathrm{P}} \newcommand{\rQ}{\mathrm{Q}} \newcommand{\rR}{\mathrm{R}} \newcommand{\rS}{\mathrm{S}} \newcommand{\rT}{\mathrm{T}} \newcommand{\rU}{\mathrm{U}} \newcommand{\rV}{\mathrm{V}} \newcommand{\rW}{\mathrm{W}} \newcommand{\rX}{\mathrm{X}} \newcommand{\rY}{\mathrm{Y}} \newcommand{\rZ}{\mathrm{Z}} \newcommand{\re}{\operatorname{Re}} \newcommand{\im}{\operatorname{Im}} \newcommand{\arsinh}{\operatorname{ar\,sinh}} \newcommand{\arcosh}{\operatorname{ar\,cosh}} \newcommand{\artanh}{\operatorname{ar\,tanh}} \newcommand{\diag}{\operatorname{diag}} \newcommand{\proj}{\operatorname{proj}} \newcommand{\rref}{\operatorname{rref}} \newcommand{\rank}{\operatorname{rank}} \newcommand{\Span}{\operatorname{span}} \renewcommand{\dim}{\operatorname{dim}} \newcommand{\alg}{\operatorname{alg}} \newcommand{\geom}{\operatorname{geom}} \newcommand{\id}{\operatorname{id}} \newcommand{\Var}{\operatorname{Var}} \newcommand{\Cov}{\operatorname{Cov}} \newcommand{\Corr}{\operatorname{Corr}} \newcommand{\Tasd}{\operatorname{Tasd}} \newcommand{\Ber}{\operatorname{Ber}} \newcommand{\Bin}{\operatorname{Bin}} \newcommand{\Geom}{\operatorname{Geom}} \newcommand{\Poi}{\operatorname{Poi}} \newcommand{\Hyperg}{\operatorname{Hyperg}} \newcommand{\Tas}{\operatorname{Tas}} \newcommand{\Exp}{\operatorname{Exp}} \newcommand{\tdist}{\operatorname{t}} \newcommand{\rd}{\mathrm{d}} \newcommand{\sij}[2]{\bigg/_{\mspace{-10mu}\,#1}^{\,#2}} \newcommand{\qedhere}{}\]

Odotusarvo, varianssi ja keskihajonta

Satunnaismuuttujien todennäköisyysjakaumia voidaan luonnehtia erilaisin tunnusluvuin. Pelkästään jakauman tyypin ja sen tunnuslukujen avulla voidaan tehdä hyödyllisiä johtopäätöksiä tarkasteltavasta satunnaiskokeesta. Tavallisimmat jakauman sijaintia kuvaavat tunnusluvut ovat odotusarvo, varianssi ja keskihajonta. Odotusarvo ilmoittaa jakauman keskikohdan, kun taas varianssi ja keskihajonta mittaavat jakauman hajaantumisen suuruutta.

Diskreetit satunnaismuuttujat

Määritelmä 3.1.1

Diskreetin satunnaismuuttujan \(X\), jonka otosavaruus on \(\Omega\) ja tiheysfunktio \(f(x)\), odotusarvo (mean, expected value) \(\rE(X)\), varianssi (variance) \(\Var(X)\) ja keskihajonta (standard deviation) \(\rD(X)\) ovat

\[\begin{split}\begin{aligned} \rE(X) &= \mu = \sum_{x \in \Omega} xf(x), \\ \Var(X) &= \sigma^2 = \sum_{x \in \Omega} (x - \mu)^2f(x), \\ \rD(X) &= \sigma = \sqrt{\Var(X)}. \end{aligned}\end{split}\]

Heitetään harhatonta, eli kaikille tulosvaihtoehdoille tasapuolista kolikkoa kolme kertaa.

Mikä on kruunien lukumäärän odotusarvo heittosarjassa?
Mikä on kruunien lukumäärän varianssi heittosarjassa?

Huomautus 3.1.2

Jos otosavaruudessa on ääretön määrä alkioita, on tunnusluku olemassa vain, kun sen määrittelevä sarja suppenee ja summa on termien järjestyksestä riippumaton. Diskreetin muuttujan odotusarvo on mahdollisten arvojen \(x\) todennäköisyyksillään \(P(X=x)=f(x)\) painotettu keskiarvo. Varianssi taas on odotusarvosta laskettujen neliöityjen poikkeamien \((x-\mu)^2\) todennäköisyyksillä painotettu keskiarvo.

Fysikaalisesta näkökulmasta satunnaismuuttujan odotusarvolla ja varianssilla on seuraavanlaiset tulkinnat. Jos ajatellaan, että yhden yksikön verran “todennäköisyysmassaa” on jaettu otosavaruuden \(\Omega\) pisteisiin \(x\) lukusuoralla pistetodennäköisyyden \(f(x)\) verran, niin odotusarvo ilmoittaa kyseisen lukusuoran massakeskipisteen ja varianssi sen hitausmomentin massakeskipisteakselin suhteen.

Esimerkki 3.1.3

Arpanopan silmäluvun \(X\) (tiheysfunktio \(f(x) = \frac{1}{6}\)) odotusarvo ja varianssi ovat

\[\begin{split}\begin{aligned} \rE(X) &= \sum_{x\in\Omega}xf(x) = \frac{1}{6}\sum_{i = 1}^{6}i = \frac{1}{6} \cdot \frac{6 \cdot (6 + 1)}{2} = \frac{7}{2}, \\ \Var(X) &= \sum_{x \in \Omega}(x - \mu)^2f(x) = \frac{1}{6}\sum_{i = 1}^{6}\left(i - \frac{7}{2}\right)^2 = \frac{35}{12}. \end{aligned}\end{split}\]

Seuraavan lauseen todistus jätetään harjoitustehtäväksi.

Lause 3.1.4

Jos \(X \sim \Tasd(1, n)\), niin

\[\rE(X) = \frac{n + 1}{2} \qquad\text{ja}\qquad \Var(X) = \frac{n^2 - 1}{12}.\]

Jatkuvat satunnaismuuttujat

Määritelmä 3.1.5

Jatkuvan satunnaismuuttujan \(X\), jonka otosavaruus on \(\Omega\) ja tiheysfunktio \(f(x)\), odotusarvo \(\rE(X)\), varianssi \(\Var(X)\) ja keskihajonta \(\rD(X)\) ovat

\[\begin{split}\begin{aligned} \rE(X) &= \mu = \int_{-\infty}^\infty xf(x)\,\rd x, \\ \Var(X) &= \sigma^2 = \int_{-\infty}^\infty(x-\mu)^2f(x)\,\rd x, \\ \rD(X) &= \sigma = \sqrt{\Var(X)}. \end{aligned}\end{split}\]
Mikä on \(\rE(X)\), kun tiheysfunktio \(f_X(x) = \frac{1}{2}\) välillä \([0, 2]\)?
Mikä on \(\Var(X)\), kun tiheysfunktio \(f_X(x) = \frac{1}{2}\) välillä \([0, 2]\)?

Jälleen määritelmä edellyttää, että asianmukaiset integraalit suppenevat. Muussa tapauksessa tunnuslukuja ei ole olemassa. Huomaa samankaltaisuus diskreetin ja jatkuvan muuttujan tunnuslukujen määritelmissä: jatkuvassa tapauksessa summaus yksinkertaisesti korvataan integroinnilla. Jatkuvan satunnaismuuttujan odotusarvoon ja varianssiin liittyy samankaltainen fysikaalinen tulkinta kuin diskreettiinkin tapaukseen.

Esimerkki 3.1.6

Olkoon \(X\) jatkuva satunnaismuuttuja, jonka tiheysfunktio

\[f(x)=2x, \qquad\text{kun } 0 < x < 1.\]

Tällöin

\[\begin{split}\begin{aligned} \rE(X) &= \int_{-\infty}^{\infty}xf(x)\,\rd x = \int_{0}^{1}2x^2\,\rd x = \sij{0}{1}\frac{2}{3}x^3 = \frac{2}{3}, \\ \Var(X) &= \int_{-\infty}^{\infty}(x - \mu)^2f(x)\,\rd x = \int_{0}^{1}2x\left(x - \frac{2}{3}\right)^2\,\rd x \\ &= \int_{0}^{1}\left(2x^3 - \frac{8}{3}x^2 + \frac{8}{9}x\right)\,\rd x = \sij{0}{1}\left(\frac{1}{2}x^4 - \frac{8}{9}x^3 + \frac{4}{9}x^2\right) = \frac{1}{18}. \end{aligned}\end{split}\]

Seuraavankin tuloksen todistaminen jätetään harjoitustehtäväksi.

Lause 3.1.7

Jos \(X \sim \Tas(a, b)\), niin

\[\rE(X)=\frac{a+b}{2}\qquad\text{ja}\qquad\Var(X)=\frac{(b-a)^2}{12}.\]

Tarkastellaan kahta satunnaismuuttujaa \(S\) ja \(P\). Alla olevaan kuvaan on piirretty satunnaismuuttujien tiheysfunktiot, satunnaismuuttujan \(S\) tiheysfunktio sinisellä ja satunnaismuuttujan \(P\) punaisella. Päättele jakaumien muotojen perusteella vastaukset seuraaviin kysymyksiin.

../_images/odotusarvo-jakaumat.png
Kumman satunnaismuuttujan odotusarvo on suurempi?
Kumman satunnaismuuttujan keskihajonta on suurempi?
Kumman satunnaismuuttujan varianssi on suurempi?
Palautusta lähetetään...