$\newcommand{\N}{\mathbb N} \newcommand{\Z}{\mathbb Z} \newcommand{\Q}{\mathbb Q} \newcommand{\R}{\mathbb R} \newcommand{\C}{\mathbb C} \newcommand{\ba}{\mathbf{a}} \newcommand{\bb}{\mathbf{b}} \newcommand{\bc}{\mathbf{c}} \newcommand{\bd}{\mathbf{d}} \newcommand{\be}{\mathbf{e}} \newcommand{\bff}{\mathbf{f}} \newcommand{\bh}{\mathbf{h}} \newcommand{\bi}{\mathbf{i}} \newcommand{\bj}{\mathbf{j}} \newcommand{\bk}{\mathbf{k}} \newcommand{\bN}{\mathbf{N}} \newcommand{\bn}{\mathbf{n}} \newcommand{\bo}{\mathbf{0}} \newcommand{\bp}{\mathbf{p}} \newcommand{\bq}{\mathbf{q}} \newcommand{\br}{\mathbf{r}} \newcommand{\bs}{\mathbf{s}} \newcommand{\bT}{\mathbf{T}} \newcommand{\bu}{\mathbf{u}} \newcommand{\bv}{\mathbf{v}} \newcommand{\bw}{\mathbf{w}} \newcommand{\bx}{\mathbf{x}} \newcommand{\by}{\mathbf{y}} \newcommand{\bz}{\mathbf{z}} \newcommand{\bzero}{\mathbf{0}} \newcommand{\nv}{\mathbf{0}} \newcommand{\cA}{\mathcal{A}} \newcommand{\cB}{\mathcal{B}} \newcommand{\cC}{\mathcal{C}} \newcommand{\cD}{\mathcal{D}} \newcommand{\cE}{\mathcal{E}} \newcommand{\cF}{\mathcal{F}} \newcommand{\cG}{\mathcal{G}} \newcommand{\cH}{\mathcal{H}} \newcommand{\cI}{\mathcal{I}} \newcommand{\cJ}{\mathcal{J}} \newcommand{\cK}{\mathcal{K}} \newcommand{\cL}{\mathcal{L}} \newcommand{\cM}{\mathcal{M}} \newcommand{\cN}{\mathcal{N}} \newcommand{\cO}{\mathcal{O}} \newcommand{\cP}{\mathcal{P}} \newcommand{\cQ}{\mathcal{Q}} \newcommand{\cR}{\mathcal{R}} \newcommand{\cS}{\mathcal{S}} \newcommand{\cT}{\mathcal{T}} \newcommand{\cU}{\mathcal{U}} \newcommand{\cV}{\mathcal{V}} \newcommand{\cW}{\mathcal{W}} \newcommand{\cX}{\mathcal{X}} \newcommand{\cY}{\mathcal{Y}} \newcommand{\cZ}{\mathcal{Z}} \newcommand{\rA}{\mathrm{A}} \newcommand{\rB}{\mathrm{B}} \newcommand{\rC}{\mathrm{C}} \newcommand{\rD}{\mathrm{D}} \newcommand{\rE}{\mathrm{E}} \newcommand{\rF}{\mathrm{F}} \newcommand{\rG}{\mathrm{G}} \newcommand{\rH}{\mathrm{H}} \newcommand{\rI}{\mathrm{I}} \newcommand{\rJ}{\mathrm{J}} \newcommand{\rK}{\mathrm{K}} \newcommand{\rL}{\mathrm{L}} \newcommand{\rM}{\mathrm{M}} \newcommand{\rN}{\mathrm{N}} \newcommand{\rO}{\mathrm{O}} \newcommand{\rP}{\mathrm{P}} \newcommand{\rQ}{\mathrm{Q}} \newcommand{\rR}{\mathrm{R}} \newcommand{\rS}{\mathrm{S}} \newcommand{\rT}{\mathrm{T}} \newcommand{\rU}{\mathrm{U}} \newcommand{\rV}{\mathrm{V}} \newcommand{\rW}{\mathrm{W}} \newcommand{\rX}{\mathrm{X}} \newcommand{\rY}{\mathrm{Y}} \newcommand{\rZ}{\mathrm{Z}} \newcommand{\pv}{\overline} \newcommand{\iu}{\mathrm{i}} \newcommand{\ju}{\mathrm{j}} \newcommand{\im}{\mathrm{i}} \newcommand{\e}{\mathrm{e}} \newcommand{\real}{\operatorname{Re}} \newcommand{\imag}{\operatorname{Im}} \newcommand{\Arg}{\operatorname{Arg}} \newcommand{\Ln}{\operatorname{Ln}} \DeclareMathOperator*{\res}{res} \newcommand{\re}{\operatorname{Re}} \newcommand{\im}{\operatorname{Im}} \newcommand{\arsinh}{\operatorname{ar\,sinh}} \newcommand{\arcosh}{\operatorname{ar\,cosh}} \newcommand{\artanh}{\operatorname{ar\,tanh}} \newcommand{\sgn}{\operatorname{sgn}} \newcommand{\diag}{\operatorname{diag}} \newcommand{\proj}{\operatorname{proj}} \newcommand{\rref}{\operatorname{rref}} \newcommand{\rank}{\operatorname{rank}} \newcommand{\Span}{\operatorname{span}} \newcommand{\vir}{\operatorname{span}} \renewcommand{\dim}{\operatorname{dim}} \newcommand{\alg}{\operatorname{alg}} \newcommand{\geom}{\operatorname{geom}} \newcommand{\id}{\operatorname{id}} \newcommand{\norm}[1]{\lVert #1 \rVert} \newcommand{\tp}[1]{#1^{\top}} \renewcommand{\d}{\mathrm{d}} \newcommand{\sij}[2]{\bigg/_{\mspace{-15mu}#1}^{\,#2}} \newcommand{\abs}[1]{\lvert#1\rvert} \newcommand{\pysty}[1]{\left[\begin{array}{@{}r@{}}#1\end{array}\right]} \newcommand{\piste}{\cdot} \newcommand{\qedhere}{} \newcommand{\taumatrix}[1]{\left[\!\!#1\!\!\right]} \newenvironment{augmatrix}[1]{\left[\begin{array}{#1}}{\end{array}\right]} \newenvironment{vaugmatrix}[1]{\left|\begin{array}{#1}}{\end{array}\right|} \newcommand{\trans}{\mathrm{T}} \newcommand{\EUR}{\text{\unicode{0x20AC}}} \newcommand{\SI}[3][]{#2\,\mathrm{#3}} \newcommand{\si}[2][]{\mathrm{#2}} \newcommand{\num}[2][]{#2} \newcommand{\ang}[2][]{#2^{\circ}} \newcommand{\meter}{m} \newcommand{\metre}{\meter} \newcommand{\kilo}{k} \newcommand{\kilogram}{kg} \newcommand{\gram}{g} \newcommand{\squared}{^2} \newcommand{\cubed}{^3} \newcommand{\minute}{min} \newcommand{\hour}{h} \newcommand{\second}{s} \newcommand{\degreeCelsius}{^{\circ}C} \newcommand{\per}{/} \newcommand{\centi}{c} \newcommand{\milli}{m} \newcommand{\deci}{d} \newcommand{\percent}{\%} \newcommand{\Var}{\operatorname{Var}} \newcommand{\Cov}{\operatorname{Cov}} \newcommand{\Corr}{\operatorname{Corr}} \newcommand{\Tasd}{\operatorname{Tasd}} \newcommand{\Ber}{\operatorname{Ber}} \newcommand{\Bin}{\operatorname{Bin}} \newcommand{\Geom}{\operatorname{Geom}} \newcommand{\Poi}{\operatorname{Poi}} \newcommand{\Hyperg}{\operatorname{Hyperg}} \newcommand{\Tas}{\operatorname{Tas}} \newcommand{\Exp}{\operatorname{Exp}} \newcommand{\tdist}{\operatorname{t}} \newcommand{\rd}{\mathrm{d}}$

# Satunnaisvektorin jakauma¶

Sovelluksissa satunnaiskokeen tuloksena saadaan usein havaintoarvot satunnaismuuttujille $$X_1, X_2, \ldots, X_p$$, jotka voidaan myös kerätä yhteen satunnaisvektoriin $$(X_1, X_2, \ldots, X_p)$$. Koetta kuvaavan matemaattisen mallin rakentaminen edellyttää, että yksittäisten komponenttien jakaumien lisäksi selvitetään myös niiden yhteisjakauma, eli satunnaisvektorin jakauma. Tällöin tehtävänä on mallintaa (havaintoarvojen pohjalta) satunnaisvektorin eri tapahtumien todennäköisyydet siten, että Kolmogorovin aksioomat toteutuvat. Kuten yksiulotteisessa tapauksessa, myös satunnaisvektorin tapahtumien todennäköisyydet annetaan tavallisesti tiheysfunktion avulla. Seuraavassa tarkastellaan lähinnä kaksiulotteisia satunnaisvektoreita $$(X, Y)$$, sillä yleistys $$p$$-ulotteiseen tapaukseen on monesti suoraviivainen.

## Diskreetti satunnaisvektori¶

Satunnaisvektori $$(X, Y)$$ on diskreetti (discrete), jos sen molemmat komponentit ovat diskreettejä satunnaismuuttujia. Diskreetin satunnaisvektorin otosavaruus on tason äärellinen tai ääretön diskreetti (numeroituva) osajoukko $$\Omega=\{(x_1, y_1), (x_2, y_2), \ldots, (x_n, y_n), \ldots\}$$.

Diskreetin satunnaisvektorin $$(X, Y)$$ tiheysfunktio (density function) $$f(x, y)$$ määritellään jokaisessa tason pisteessä $$(x, y)$$ asettamalla

$f(x, y) = P(X = x, Y = y),$

jos $$(x, y) \in \Omega$$, ja $$f(x, y)=0$$ muulloin. Arvot $$f(x, y)$$, missä $$(x, y) \in \Omega$$, ovat pistetodennäköisyyksiä. Niiden koko otosavaruuden $$\Omega$$ yli lasketun summan on oltava

$\sum_{(x,y)\in\Omega}f(x,y)=1.$

Tapahtuman $$A\subseteq\Omega$$ todennäköisyys on summa

$P(A)=\sum_{(x,y)\in A}f(x,y).$

Satunnaisvektorin $$(X,Y)$$ kertymäfunktio (cumulative distribution function) $$F$$ määritellään jokaisessa tason pisteessä $$(x, y)$$ asettamalla

$F(x, y) = P(X \leq x, Y \leq y) = \sum_{r \leq x, s \leq y}f(r, s).$

Esimerkki 2.4.1

Satunnaisvektorin $$(X,Y)$$ otosavaruus on $$\Omega=\{(0,1),(0,2),(1,0),(1,1),(2,0)\}$$, ja tiheysfunktio

$f(x,y) = c(x + 2y),\qquad\text{kun }(x, y) \in \Omega.$

Määritä vakion $$c$$ arvo, sekä laske todennäköisyydet $$P(X > Y)$$ ja $$P(X = 1)$$.

Piilota/näytä ratkaisu

Kaikkien pistetodennäköisyyksien summan on oltava $$1$$, joten

\begin{split}\begin{aligned} 1 &= \sum_{(x,y)\in\Omega}c(x + 2y) = c((0 + 2 \cdot 1) + (0 + 2 \cdot 2) + (1 + 2 \cdot 0) + (1 + 2 \cdot 1) + (2 + 2 \cdot 0)) \\ &= c(2 + 4 + 1 + 3 + 2) = 12c. \end{aligned}\end{split}

Tästä ratkaistaan $$c = \frac{1}{12}$$. Sijoittamalla tämä tiheysfunktion lausekkeeseen saadaan kysyttyjen tapahtumien todennäköisyyksiksi

\begin{split}\begin{aligned} P(X > Y) &= \sum_{x > y}f(x, y) = f(1, 0) + f(2, 0) = \frac{1}{12}((1 + 2 \cdot 0) + (2 + 2 \cdot 0)) = \frac{3}{12} \\ P(X = 1) &= \sum_{x = 1}f(x, y) = f(1, 0) + f(1, 1) = \frac{1}{12}((1 + 2 \cdot 0) + (1 + 2 \cdot 1)) = \frac{4}{12}. \end{aligned}\end{split}

## Jatkuva satunnaisvektori¶

Satunnaisvektori $$(X, Y)$$ on jatkuva (continuous), jos sen molemmat komponentit ovat jatkuvia satunnaismuuttujia. Jatkuvan satunnaisvektorin otosavaruus $$\Omega$$ on karteesisen tason $$\R^2 = \{(x, y) : x \in \R, y \in \R\}$$ osajoukko.

Jatkuvan satunnaisvektorin $$(X, Y)$$ tiheysfunktio (density function) on koko tasossa määritelty ei-negatiivinen funktio $$f(x, y)$$, jolle $$f(x, y) = 0$$ aina, kun $$(x, y) \not\in \Omega$$, ja jonka avulla tapahtuman $$A \subseteq \Omega$$ todennäköisyys voidaan esittää tasointegraalina

$P(A) = \iint_{A}f(x,y)\,\rd x\rd y.$

Tapahtuman $$A$$ todennäköisyys on geometrisesti tulkittuna pinnan $$z = f(x, y)$$ ja $$xy$$-tasoon sijoitetun joukon $$A$$ rajaaman suoran sylinterikappaleen tilavuus.

Tiheysfunktiota $$f(x, y)$$ kutsutaan (diskreetissäkin tapauksessa) myös satunnaismuuttujien $$X$$ ja $$Y$$ yhteisjakauman tiheysfunktioksi (density function of the joint distribution). Jotta jatkuvalle satunnaisvektorille olisi $$P(\Omega)=1$$, tiheysfunktion $$f(x, y)$$ on toteutettava ehto

$\iint_{\R^2}f(x,y)\,\rd x\rd y = \iint_\Omega f(x,y)\,\rd x\rd y = 1.$

Tasointegraali koko tason $$\R^2$$ yli tarkoittaa epäoleellista integraalia

$\iint_{\R^2}f(x,y)\,\rd x\rd y = \int_{-\infty}^\infty\int_{-\infty}^\infty f(x, y)\,\rd x\rd y = \int_{-\infty}^\infty\left(\int_{-\infty}^\infty f(x, y)\,\rd x\right)\rd y,$

missä sisempi integraali määritetään ensin.

Satunnaisvektorin $$(X,Y)$$ kertymäfunktio (cumulative distribution function) määritellään jokaisessa tason pisteessä $$(x, y)$$ asettamalla

$F(x,y) = P(X \leq x, Y \leq y) = \int_{-\infty}^{x}\left(\int_{-\infty}^{y}f(r,s)\,\rd s\right)\rd r,$

missä $$f(x,y)$$ on vektorin $$(X,Y)$$ tiheysfunktio. Pisteissä $$(x, y)$$, joissa tiheysfunktio on jatkuva, on voimassa

$\frac{\partial^2}{\partial y\partial x}F(x, y) = \frac{\partial}{\partial y}\left(\frac{\partial}{\partial x}F(x, y)\right) = f(x, y),$

missä $$\frac{\partial}{\partial z}$$ tarkoittaa osittaisderivointia muuttujan $$z$$ suhteen.

Esimerkki 2.4.2

Satunnaisvektorin $$(X,Y)$$ tiheysfunktio

$f(x, y) = cxy, \qquad\text{kun } (x, y) \in \Omega = \{(x, y) : 0 < x < y, 0 < y < 1\}.$

Määritä vakion $$c$$ arvo, sekä laske todennäköisyys $$P(X + Y < 1)$$.

Piilota/näytä ratkaisu

Otosavaruus $$\Omega$$ on sellaisenaan esitettynä $$y$$-projisoituva, eli muuttujan $$x$$ rajat voidaan ilmoittaa muuttujan $$y$$ avulla. Tällöin tasointegraali otosavaruuden $$\Omega$$ yli on sisäkkäinen integraali

\begin{split}\begin{aligned} \iint_{\Omega}f(x,y)\rd x\rd y &= c\int_0^1\left(\int_0^{y}xy\,\rd x\right)\rd y \\ &= c\int_0^1\left(\sij{0}{y}\frac{1}{2}yx^2\right)\rd y = c\int_0^1\frac{1}{2}y^3\,\rd y \\ &= c\sij{0}{1}\frac{1}{8}y^4 = \frac{c}{8} = 1. \end{aligned}\end{split}

Tästä ratkaistaan $$c = 8$$. Nyt todennäköisyys $$P(X + Y < 1)$$ saadaan laskettua tiheysfunktion tasointegraalina joukon

$A=\{(x, y) \in \Omega : x + y < 1\} = \left\{(x, y) : 0 < x < \frac{1}{2}, x < y < 1 - x\right\}$

yli. Seuraavat kuvat havainnollistavat otosavaruutta ja tapahtumaa otosavaruudessa. Nämä tapahtuman rajat ovat tasointegraalin rajoja

Kyseessä on $$x$$-projisoituva joukko, joten integrointi voidaan suorittaa ensin muuttujan $$y$$ suhteen, ja tällöin

\begin{split}\begin{aligned} P(X+Y<1) &= P\left(0<X<\frac{1}{2}, X<Y<1-X\right) \\ &= \int_{0}^{\frac{1}{2}}\left(\int_{x}^{1-x}8xy\,\rd y\right)\rd x = \int_0^{\frac{1}{2}}\left(\sij{x}{1-x}4xy^2\right)\rd x \\ &= \int_0^{\frac{1}{2}}\left(4x(1-2x+x^2)-4x^3\right)\rd x = \int_0^{\frac{1}{2}}(-8x^2+4x)\rd x \\ &= \sij{0}{\frac{1}{2}}\left(-\frac{8}{3}x^3+2x^2\right) = -\frac{1}{3}+\frac{1}{2} = \frac{1}{6}. \end{aligned}\end{split}

Mikä seuraavista kuvista havainnollistaa otosavaruutta

$\Omega = \{(x, y) \mid 0 \leq y^2 \leq x \leq 1 \text{ ja } x,y \geq 0\} \,?$
Palautusta lähetetään...