\[\newcommand{\N}{\mathbb N} \newcommand{\Z}{\mathbb Z} \newcommand{\Q}{\mathbb Q} \newcommand{\R}{\mathbb R} \newcommand{\C}{\mathbb C} \newcommand{\ba}{\mathbf{a}} \newcommand{\bb}{\mathbf{b}} \newcommand{\bc}{\mathbf{c}} \newcommand{\bd}{\mathbf{d}} \newcommand{\be}{\mathbf{e}} \newcommand{\bff}{\mathbf{f}} \newcommand{\bh}{\mathbf{h}} \newcommand{\bi}{\mathbf{i}} \newcommand{\bj}{\mathbf{j}} \newcommand{\bk}{\mathbf{k}} \newcommand{\bN}{\mathbf{N}} \newcommand{\bn}{\mathbf{n}} \newcommand{\bo}{\mathbf{0}} \newcommand{\bp}{\mathbf{p}} \newcommand{\bq}{\mathbf{q}} \newcommand{\br}{\mathbf{r}} \newcommand{\bs}{\mathbf{s}} \newcommand{\bT}{\mathbf{T}} \newcommand{\bu}{\mathbf{u}} \newcommand{\bv}{\mathbf{v}} \newcommand{\bw}{\mathbf{w}} \newcommand{\bx}{\mathbf{x}} \newcommand{\by}{\mathbf{y}} \newcommand{\bz}{\mathbf{z}} \newcommand{\bzero}{\mathbf{0}} \newcommand{\nv}{\mathbf{0}} \newcommand{\cA}{\mathcal{A}} \newcommand{\cB}{\mathcal{B}} \newcommand{\cC}{\mathcal{C}} \newcommand{\cD}{\mathcal{D}} \newcommand{\cE}{\mathcal{E}} \newcommand{\cF}{\mathcal{F}} \newcommand{\cG}{\mathcal{G}} \newcommand{\cH}{\mathcal{H}} \newcommand{\cI}{\mathcal{I}} \newcommand{\cJ}{\mathcal{J}} \newcommand{\cK}{\mathcal{K}} \newcommand{\cL}{\mathcal{L}} \newcommand{\cM}{\mathcal{M}} \newcommand{\cN}{\mathcal{N}} \newcommand{\cO}{\mathcal{O}} \newcommand{\cP}{\mathcal{P}} \newcommand{\cQ}{\mathcal{Q}} \newcommand{\cR}{\mathcal{R}} \newcommand{\cS}{\mathcal{S}} \newcommand{\cT}{\mathcal{T}} \newcommand{\cU}{\mathcal{U}} \newcommand{\cV}{\mathcal{V}} \newcommand{\cW}{\mathcal{W}} \newcommand{\cX}{\mathcal{X}} \newcommand{\cY}{\mathcal{Y}} \newcommand{\cZ}{\mathcal{Z}} \newcommand{\rA}{\mathrm{A}} \newcommand{\rB}{\mathrm{B}} \newcommand{\rC}{\mathrm{C}} \newcommand{\rD}{\mathrm{D}} \newcommand{\rE}{\mathrm{E}} \newcommand{\rF}{\mathrm{F}} \newcommand{\rG}{\mathrm{G}} \newcommand{\rH}{\mathrm{H}} \newcommand{\rI}{\mathrm{I}} \newcommand{\rJ}{\mathrm{J}} \newcommand{\rK}{\mathrm{K}} \newcommand{\rL}{\mathrm{L}} \newcommand{\rM}{\mathrm{M}} \newcommand{\rN}{\mathrm{N}} \newcommand{\rO}{\mathrm{O}} \newcommand{\rP}{\mathrm{P}} \newcommand{\rQ}{\mathrm{Q}} \newcommand{\rR}{\mathrm{R}} \newcommand{\rS}{\mathrm{S}} \newcommand{\rT}{\mathrm{T}} \newcommand{\rU}{\mathrm{U}} \newcommand{\rV}{\mathrm{V}} \newcommand{\rW}{\mathrm{W}} \newcommand{\rX}{\mathrm{X}} \newcommand{\rY}{\mathrm{Y}} \newcommand{\rZ}{\mathrm{Z}} \newcommand{\pv}{\overline} \newcommand{\iu}{\mathrm{i}} \newcommand{\ju}{\mathrm{j}} \newcommand{\im}{\mathrm{i}} \newcommand{\e}{\mathrm{e}} \newcommand{\real}{\operatorname{Re}} \newcommand{\imag}{\operatorname{Im}} \newcommand{\Arg}{\operatorname{Arg}} \newcommand{\Ln}{\operatorname{Ln}} \DeclareMathOperator*{\res}{res} \newcommand{\re}{\operatorname{Re}} \newcommand{\im}{\operatorname{Im}} \newcommand{\arsinh}{\operatorname{ar\,sinh}} \newcommand{\arcosh}{\operatorname{ar\,cosh}} \newcommand{\artanh}{\operatorname{ar\,tanh}} \newcommand{\sgn}{\operatorname{sgn}} \newcommand{\diag}{\operatorname{diag}} \newcommand{\proj}{\operatorname{proj}} \newcommand{\rref}{\operatorname{rref}} \newcommand{\rank}{\operatorname{rank}} \newcommand{\Span}{\operatorname{span}} \newcommand{\vir}{\operatorname{span}} \renewcommand{\dim}{\operatorname{dim}} \newcommand{\alg}{\operatorname{alg}} \newcommand{\geom}{\operatorname{geom}} \newcommand{\id}{\operatorname{id}} \newcommand{\norm}[1]{\lVert #1 \rVert} \newcommand{\tp}[1]{#1^{\top}} \renewcommand{\d}{\mathrm{d}} \newcommand{\sij}[2]{\bigg/_{\mspace{-15mu}#1}^{\,#2}} \newcommand{\abs}[1]{\lvert#1\rvert} \newcommand{\pysty}[1]{\left[\begin{array}{@{}r@{}}#1\end{array}\right]} \newcommand{\piste}{\cdot} \newcommand{\qedhere}{} \newcommand{\taumatrix}[1]{\left[\!\!#1\!\!\right]} \newenvironment{augmatrix}[1]{\left[\begin{array}{#1}}{\end{array}\right]} \newenvironment{vaugmatrix}[1]{\left|\begin{array}{#1}}{\end{array}\right|} \newcommand{\trans}{\mathrm{T}} \newcommand{\EUR}{\text{\unicode{0x20AC}}} \newcommand{\SI}[3][]{#2\,\mathrm{#3}} \newcommand{\si}[2][]{\mathrm{#2}} \newcommand{\num}[2][]{#2} \newcommand{\ang}[2][]{#2^{\circ}} \newcommand{\meter}{m} \newcommand{\metre}{\meter} \newcommand{\kilo}{k} \newcommand{\kilogram}{kg} \newcommand{\gram}{g} \newcommand{\squared}{^2} \newcommand{\cubed}{^3} \newcommand{\minute}{min} \newcommand{\hour}{h} \newcommand{\second}{s} \newcommand{\degreeCelsius}{^{\circ}C} \newcommand{\per}{/} \newcommand{\centi}{c} \newcommand{\milli}{m} \newcommand{\deci}{d} \newcommand{\percent}{\%} \newcommand{\Var}{\operatorname{Var}} \newcommand{\Cov}{\operatorname{Cov}} \newcommand{\Corr}{\operatorname{Corr}} \newcommand{\Tasd}{\operatorname{Tasd}} \newcommand{\Ber}{\operatorname{Ber}} \newcommand{\Bin}{\operatorname{Bin}} \newcommand{\Geom}{\operatorname{Geom}} \newcommand{\Poi}{\operatorname{Poi}} \newcommand{\Hyperg}{\operatorname{Hyperg}} \newcommand{\Tas}{\operatorname{Tas}} \newcommand{\Exp}{\operatorname{Exp}} \newcommand{\tdist}{\operatorname{t}} \newcommand{\rd}{\mathrm{d}}\]

Satunnaismuuttujan funktion odotusarvo

Satunnaismuuttujan \(X\) funktiona voidaan määritellä uusi muuttuja \(Y = h(X)\). Samoin uusi muuttuja voidaan muodostaa kahden tai useamman satunnaismuuttujan funktiona \(Y=h(X,Y)\). Näiden odotusarvot voidaan määrittää ilman, että tiedetään uuden muuttujan tiheysfunktiota.

Lause 3.2.1

Olkoon satunnaismuuttujan \(X\) otosavaruus \(\Omega_X\) ja tiheysfunktio \(f(x)\), sekä olkoon satunnaismuuttuja \(Y=h(X)\).

  1. Jos \(X\) on diskreetti, niin

    \[\rE(Y) = \rE(h(X)) = \sum_{x \in \Omega_X}h(x)f(x).\]
  2. Jos \(X\) on jatkuva, niin

    \[\rE(Y) = \rE(h(X)) = \int_{-\infty}^{\infty}h(x)f(x)\,\rd x.\]

Kahden muuttujan funktion tapauksessa saadaan vastaavat tulokset

Lause 3.2.2

Olkoon satunnaismuuttujien \(X\) ja \(Y\) yhteisjakauman otosavaruus \(\Omega\) ja tiheysfunktio \(f(x, y)\), sekä olkoon satunnaismuuttuja \(U = h(X, Y)\).

  1. Jos \((X, Y)\) on diskreetti, niin

    \[\rE(U)=\rE(h(X, Y)) = \sum_{(x,y)\in\Omega}h(x,y)f(x,y).\]
  2. Jos \((X, Y)\) on jatkuva, niin

    \[\rE(U)=\rE(h(X, Y)) = \iint_{\R^2} h(x,y)f(x,y)\,\rd x\rd y.\]

Esimerkki 3.2.3

Tarkastellaan peliä, jossa pelaajan voittama summa arvotaan heittämällä kolikkoa. Pelin kolikko on harhaton ja jokainen heittokerta on riippumaton muista heittokerroista. Voitto määräytyy sen mukaan, monennellako heitolla tulee ensimmäinen klaava siten, että pelaaja voittaa \(2^n\) euroa, jos klaava tulee heitolla \(n\). Mikä on voiton odotusarvo?

Rahanheitto on riippumattomien toistojen koe, jossa heitetään kolikkoa kunnes saadaan 1. onnistuminen = klaava. Satunnaismuuttuja \(X=\)‘Ensimmäisen klaavan heittokerta’ noudattaa siten geometrista jakaumaa \(X\sim\mathrm{Geo}(0.5)\) tiheysfunktiona

\(f(x) = 0.5 \cdot 0.5^{x - 1} = 0.5^{x}\) ja otosavaruutena \(\Omega=\{1,2,3,\ldots\}\).

Voitto on satunnaismuuttujan \(X\) funktio \(Y = h(X) = 2^X\), joten voiton odotusarvo

\[\rE(Y) = \sum_{x=1}^{\infty} h(x)f(x) = \sum_{x=1}^{\infty} 2^x \cdot 0.5^{x} = \sum_{x=1}^{\infty} 1^x = \sum_{x=1}^{\infty} 1 = \infty\]

eli voiton odotusarvo on ääretön. Tämä on esimerkki ns. Pietarin paradoksista (St. Petersburg paradox)

Lauseista seuraa käyttökelpoisia tuloksia odotusarvolle.

Lause 3.2.4

Jos \(X_1,X_2,\ldots,X_n\) ovat satunnaismuuttujia, sekä \(a_1, a_2, \ldots, a_n \in \R\), niin odotusarvo

\[\rE(a_1X_1+a_2X_2+\ldots+a_nX_n)=a_1\rE(X_1)+a_2\rE(X_2)+\ldots+a_n\rE(X_n).\]

Tätä kutsutaan odotusarvon lineaarisuusominaisuudeksi.

Erityisesti satunnaismuuttujien \(X,Y\) funktion \(aX+bY,\ a,b\in\R\) odotusarvo

\[\rE(aX+bY)=a\rE(X)+b\rE(Y),\]

ja

\[\rE(aX+b)=a\rE(X)+b.\]

Muiden kuin lineaaristen muunnosten kohdalla odotusarvo ei säilytä muunnoksen rakennetta. Esimerkiksi \(\rE(X^2)\neq \rE(X)^2\), kuten seuraavassa lauseessa todetaan. Tämä lause antaa toisen tavan laskea satunnaismuuttujan varianssi ja on käyttökelpoinen tulos joidenkin myöhempien tulosten osoittamisessa.

Lause 3.2.5

Satunnaismuuttujan \(X\) varianssi

\[\Var(X)=\rE(X^2)-\rE(X)^2.\]
Piilota/näytä todistus

Sekä diskreetissä että jatkuvassa tapauksessa muuttujan \(X\) varianssi on lausekkeen \((X - \rE(X))^2\) odotusarvo. Luvut \(\rE(X)\) ja \(\rE(X^2)\) ovat vakioita, jolloin

\[\begin{split}\begin{aligned} \Var(X)&=\rE((X-\rE(X))^2)\\ &=\rE(X^2-2\rE(X) X+\rE(X)^2)\\ &=\rE(X^2)-2\rE(X)\rE(X)+\rE(X)^2\\ &=\rE(X^2)-\rE(X)^2. \end{aligned}\end{split}\]

Esimerkki 3.2.6

Olkoon diskreetin satunnaismuuttujan \(X\) tiheysfunktio

\[f(x)=\frac{x}{10},\quad\text{kun }x \in \{1,2,3,4\}.\]

Nyt

\[\begin{split}\begin{array}{rcl} \rE(X)&=1\cdot\frac{1}{10}+2\cdot\frac{2}{10}+3\cdot\frac{3}{10}+4\cdot\frac{4}{10}=3,\\ \rE(X^2)&=1\cdot\frac{1}{10}+4\cdot\frac{2}{10}+9\cdot\frac{3}{10}+16\cdot\frac{4}{10}=10, \end{array}\end{split}\]

joten \(\Var(X) = 10 - 3^2 = 1\).

Esimerkki 3.2.7

Olkoon \(X\) jatkuva satunnaismuuttuja, jonka tiheysfunktio

\[f(x)=2x, \qquad\text{kun } 0 < x < 1.\]

Aiemmassa esimerkissä 3.1.6 saatiin \(\rE(X)=\frac{2}{3}\), ja tämän lisäksi

\[\rE(X^2)=\int_0^1x^2\,2x\,\rd x=\sij{0}{1}\frac{1}{2}x^4 = \frac{1}{2}.\]

Siis \(\Var(X) = \dfrac{1}{2} - \left(\dfrac{2}{3}\right)^2 = \dfrac{1}{18}\).

Myös satunnaismuuttujien \(X,Y\) lineaarisen muunnoksen varianssille voidaan osoittaa vastaava tulos. Varianssin kohdalla kuitenkin edellytetään satunnaismuuttujien riippumattomuutta.

Lause 3.2.8

Jos satunnaismuuttujat \(X_1,X_2,\ldots,X_n\) ovat riippumattomia ja \(a_1, a_2, \ldots, a_n\) vakioita, niin

\[\Var(a_1X_1+a_2X_2+\ldots+a_nX_n)= a_1^2\Var(X_1)+a_2^2\Var(X_2)+\cdots+a_n^2\Var(X_n).\]

Erityisesti, jos \(X\) ja \(Y\) ovat riippumattomia ja \(a,b\) ovat vakioita, niin

\[\Var(aX+bY)=a^2\Var(X)+b^2\Var(Y)\]

Yhden satunnaismuuttujan \(X\) funktion \(aX + b\) varianssi on

\[\Var(aX+b)=a^2\Var(X).\]
Mallinnetaan kaupungin lämpötilaa satunnaismuuttujalla, jonka keskiarvo ja keskihajonta ovat molemmat \(10\) celsiusastetta. Päivää voidaan kutsua “normaaliksi”, mikäli lämpötilat missään vaiheessa päivää eivät poikkea yli keskihajonnan verran keskiarvosta. Mikä on lämpötilan vaihteluväli normaalille päivälle Fahrenheit-asteina ilmaistuna?

Esimerkki 3.2.9

Olkoon satunnaismuuttujat \(X,Y\) ovat riippumattomia, joille \(\rE(X)=3\), \(\rE(Y)=-2\), \(\Var(X)=4\) ja \(\Var(Y)=9\)

Nyt

\[\rE(-X+5)=-\rE(X)+5=-1\cdot3+5= -2\]

ja

\[\rE(3X-Y)=3\rE(X)-\rE(Y)=3\cdot3+(-1)\cdot(-2)= 11\]

Edellä olevat odotusarvot olisivat samat, vaikka satunnaismuuttujat eivät olisi riippumattomia. Sen sijaan variansseja laskettaessa riippumattomuus on oleellinen. Samojen muunnosten varianssit ovat

\[\Var(-X-5)=\Var(-X)=(-1)^2\Var(X)=\Var(X)=4\]

ja

\[\Var(3X-Y)= 3^2\Var(X)+(-1)^2\Var(Y)=9\cdot 4+ 1\cdot 9 = 45\]

Ensimmäisessä kohdassa vakion lisääminen tai luvulla \(-1\) kertominen ei muuta varianssia. Huomaa myös, että \(\Var(X+X)=\Var(2X)= 2^2\Var(X)=4\Var(X)\) eikä suinkaan \(2\Var(X)\), sillä \(X\) ja \(X\) eivät tietenkään ole riippumattomia, vaan ne ovat täydellisesti riippuvia.

Keskihajonnat ovat \(\rD(X)=\sqrt{\Var(X)}=\sqrt4 =2\) ja \(\rD(Y)=\sqrt{\Var(Y)}=\sqrt9 =3\). Jos halutaan laskea, mitä on \(\rD(3X-Y)\), täytyy ensin laskea varianssi kuten edellä ja sen avulla \(\rD(3X-Y)=\sqrt{\Var(3X-Y)}=\sqrt{45}\). Keskihajonnalle ei siis ole vastaavaa lineaarisen muunnoksen kaavaa.

Palautusta lähetetään...