\[\newcommand{\N}{\mathbb N}
\newcommand{\Z}{\mathbb Z}
\newcommand{\Q}{\mathbb Q}
\newcommand{\R}{\mathbb R}
\newcommand{\C}{\mathbb C}
\newcommand{\ba}{\mathbf{a}}
\newcommand{\bb}{\mathbf{b}}
\newcommand{\bc}{\mathbf{c}}
\newcommand{\bd}{\mathbf{d}}
\newcommand{\be}{\mathbf{e}}
\newcommand{\bff}{\mathbf{f}}
\newcommand{\bh}{\mathbf{h}}
\newcommand{\bi}{\mathbf{i}}
\newcommand{\bj}{\mathbf{j}}
\newcommand{\bk}{\mathbf{k}}
\newcommand{\bN}{\mathbf{N}}
\newcommand{\bn}{\mathbf{n}}
\newcommand{\bo}{\mathbf{0}}
\newcommand{\bp}{\mathbf{p}}
\newcommand{\bq}{\mathbf{q}}
\newcommand{\br}{\mathbf{r}}
\newcommand{\bs}{\mathbf{s}}
\newcommand{\bT}{\mathbf{T}}
\newcommand{\bu}{\mathbf{u}}
\newcommand{\bv}{\mathbf{v}}
\newcommand{\bw}{\mathbf{w}}
\newcommand{\bx}{\mathbf{x}}
\newcommand{\by}{\mathbf{y}}
\newcommand{\bz}{\mathbf{z}}
\newcommand{\bzero}{\mathbf{0}}
\newcommand{\nv}{\mathbf{0}}
\newcommand{\cA}{\mathcal{A}}
\newcommand{\cB}{\mathcal{B}}
\newcommand{\cC}{\mathcal{C}}
\newcommand{\cD}{\mathcal{D}}
\newcommand{\cE}{\mathcal{E}}
\newcommand{\cF}{\mathcal{F}}
\newcommand{\cG}{\mathcal{G}}
\newcommand{\cH}{\mathcal{H}}
\newcommand{\cI}{\mathcal{I}}
\newcommand{\cJ}{\mathcal{J}}
\newcommand{\cK}{\mathcal{K}}
\newcommand{\cL}{\mathcal{L}}
\newcommand{\cM}{\mathcal{M}}
\newcommand{\cN}{\mathcal{N}}
\newcommand{\cO}{\mathcal{O}}
\newcommand{\cP}{\mathcal{P}}
\newcommand{\cQ}{\mathcal{Q}}
\newcommand{\cR}{\mathcal{R}}
\newcommand{\cS}{\mathcal{S}}
\newcommand{\cT}{\mathcal{T}}
\newcommand{\cU}{\mathcal{U}}
\newcommand{\cV}{\mathcal{V}}
\newcommand{\cW}{\mathcal{W}}
\newcommand{\cX}{\mathcal{X}}
\newcommand{\cY}{\mathcal{Y}}
\newcommand{\cZ}{\mathcal{Z}}
\newcommand{\rA}{\mathrm{A}}
\newcommand{\rB}{\mathrm{B}}
\newcommand{\rC}{\mathrm{C}}
\newcommand{\rD}{\mathrm{D}}
\newcommand{\rE}{\mathrm{E}}
\newcommand{\rF}{\mathrm{F}}
\newcommand{\rG}{\mathrm{G}}
\newcommand{\rH}{\mathrm{H}}
\newcommand{\rI}{\mathrm{I}}
\newcommand{\rJ}{\mathrm{J}}
\newcommand{\rK}{\mathrm{K}}
\newcommand{\rL}{\mathrm{L}}
\newcommand{\rM}{\mathrm{M}}
\newcommand{\rN}{\mathrm{N}}
\newcommand{\rO}{\mathrm{O}}
\newcommand{\rP}{\mathrm{P}}
\newcommand{\rQ}{\mathrm{Q}}
\newcommand{\rR}{\mathrm{R}}
\newcommand{\rS}{\mathrm{S}}
\newcommand{\rT}{\mathrm{T}}
\newcommand{\rU}{\mathrm{U}}
\newcommand{\rV}{\mathrm{V}}
\newcommand{\rW}{\mathrm{W}}
\newcommand{\rX}{\mathrm{X}}
\newcommand{\rY}{\mathrm{Y}}
\newcommand{\rZ}{\mathrm{Z}}
\newcommand{\pv}{\overline}
\newcommand{\iu}{\mathrm{i}}
\newcommand{\ju}{\mathrm{j}}
\newcommand{\im}{\mathrm{i}}
\newcommand{\e}{\mathrm{e}}
\newcommand{\real}{\operatorname{Re}}
\newcommand{\imag}{\operatorname{Im}}
\newcommand{\Arg}{\operatorname{Arg}}
\newcommand{\Ln}{\operatorname{Ln}}
\DeclareMathOperator*{\res}{res}
\newcommand{\re}{\operatorname{Re}}
\newcommand{\im}{\operatorname{Im}}
\newcommand{\arsinh}{\operatorname{ar\,sinh}}
\newcommand{\arcosh}{\operatorname{ar\,cosh}}
\newcommand{\artanh}{\operatorname{ar\,tanh}}
\newcommand{\sgn}{\operatorname{sgn}}
\newcommand{\diag}{\operatorname{diag}}
\newcommand{\proj}{\operatorname{proj}}
\newcommand{\rref}{\operatorname{rref}}
\newcommand{\rank}{\operatorname{rank}}
\newcommand{\Span}{\operatorname{span}}
\newcommand{\vir}{\operatorname{span}}
\renewcommand{\dim}{\operatorname{dim}}
\newcommand{\alg}{\operatorname{alg}}
\newcommand{\geom}{\operatorname{geom}}
\newcommand{\id}{\operatorname{id}}
\newcommand{\norm}[1]{\lVert #1 \rVert}
\newcommand{\tp}[1]{#1^{\top}}
\renewcommand{\d}{\mathrm{d}}
\newcommand{\sij}[2]{\bigg/_{\mspace{-15mu}#1}^{\,#2}}
\newcommand{\abs}[1]{\lvert#1\rvert}
\newcommand{\pysty}[1]{\left[\begin{array}{@{}r@{}}#1\end{array}\right]}
\newcommand{\piste}{\cdot}
\newcommand{\qedhere}{}
\newcommand{\taumatrix}[1]{\left[\!\!#1\!\!\right]}
\newenvironment{augmatrix}[1]{\left[\begin{array}{#1}}{\end{array}\right]}
\newenvironment{vaugmatrix}[1]{\left|\begin{array}{#1}}{\end{array}\right|}
\newcommand{\trans}{\mathrm{T}}
\newcommand{\EUR}{\text{\unicode{0x20AC}}}
\newcommand{\SI}[3][]{#2\,\mathrm{#3}}
\newcommand{\si}[2][]{\mathrm{#2}}
\newcommand{\num}[2][]{#2}
\newcommand{\ang}[2][]{#2^{\circ}}
\newcommand{\meter}{m}
\newcommand{\metre}{\meter}
\newcommand{\kilo}{k}
\newcommand{\kilogram}{kg}
\newcommand{\gram}{g}
\newcommand{\squared}{^2}
\newcommand{\cubed}{^3}
\newcommand{\minute}{min}
\newcommand{\hour}{h}
\newcommand{\second}{s}
\newcommand{\degreeCelsius}{^{\circ}C}
\newcommand{\per}{/}
\newcommand{\centi}{c}
\newcommand{\milli}{m}
\newcommand{\deci}{d}
\newcommand{\percent}{\%}
\newcommand{\Var}{\operatorname{Var}}
\newcommand{\Cov}{\operatorname{Cov}}
\newcommand{\Corr}{\operatorname{Corr}}
\newcommand{\Tasd}{\operatorname{Tasd}}
\newcommand{\Ber}{\operatorname{Ber}}
\newcommand{\Bin}{\operatorname{Bin}}
\newcommand{\Geom}{\operatorname{Geom}}
\newcommand{\Poi}{\operatorname{Poi}}
\newcommand{\Hyperg}{\operatorname{Hyperg}}
\newcommand{\Tas}{\operatorname{Tas}}
\newcommand{\Exp}{\operatorname{Exp}}
\newcommand{\tdist}{\operatorname{t}}
\newcommand{\rd}{\mathrm{d}}\]
Jatkuvan satunnaismuuttujan jakauma
Satunnaismuuttujan \(X\), jonka otosavaruus \(\Omega\) on (rajoitettu tai rajoittamaton) reaalilukuväli tai sellaisten yhdiste, sanotaan olevan jatkuva (continuous) tai jatkuvasti jakautunut (continuously distributed). Kuten diskreetin muuttujan tapauksessa, myös jatkuvan satunnaismuuttujan todennäköisyysjakaumaa mallinnetaan tiheysfunktiolla. Määritelmä kuitenkin poikkeaa hieman diskreetistä tapauksesta.
Huomautus 2.2.2
Jälleen satunnaismuuttujan \(X\) tiheysfunktio \(f(x)\) on määritelty kaikilla reaaliluvuilla, vaikka sen muoto kerrottaisiinkin vain otosavaruudessa. Implisiittinen oletus \(f(x) = 0\), kun \(x \in \R \setminus \Omega\) jätetään yleensä mainitsematta.
Tapahtuman \(\{x \in \Omega : a \leq x \leq b\}\) todennäköisyys jatkuvan satunnaismuuttujan tapauksessa lasketaan siis tiheysfunktion määrättynä (mahdollisesti epäoleellisena) integraalina
\[P(a\leq X\leq b)=\int_a^bf(x)\,\rd x,\]
kun \(a\) ja \(b\) ovat reaalilukuja, \(a = -\infty\) tai \(b = \infty\). Todennäköisyyttä voi havainnollistaa tiheysfunktion ja \(x-\)akselin jäävän alueen pinta-alana, kun \(x\in[a,b]\).
Määrätyn integraalin ominaisuuksien perusteella yllä määritelty todennäköisyysmitta \(P\) toteuttaa Kolmogorovin aksioomat.
Huomautus 2.2.3
Todennäköisyys sille, että jatkuva satunnaismuuttuja \(X\) saa yksittäisen arvon otosavaruudesta on nolla, sillä
\[P(X = a) = P(a \leq X \leq a) = \int_a^{a}f(x)\,\rd x = 0.\]
Näin jatkuvalle satunnaismuuttujalle
\[P(a\leq X\leq b)=P(a\leq X<b)=P(a<X\leq b)=P(a<X<b).\]
Tässä yllättävältä kuulostavassa ominaisuudessa ei kuitenkaan ole mitään ristiriitaa todellisuuden kanssa. Nimittäin jatkuvan satunnaismuuttujan arvoa ei voi mitata täysin tarkasti, vaan mittaustulosta edustaa paremminkin mittaustarkkuudesta riippuva reaalilukuväli. Jos esimerkiksi satunnaismuuttujan \(X\) arvoja mitataan yhden desimaalin tarkkuudella, niin arvon \(5{,}2\) realisoitumisen todennäköisyys on
\[P(5{,}15\leq X<5{,}25)=\int_{5{,}15}^{5{,}25}f(x)\,\rd x.\]
Diskreetissä tapauksessa tiheysfunktiolle löytyy intuitiivinen tulkinta pistetodennäköisyysfunktiona. Jatkuvan satunnaismuuttujan tapauksessa tiheysfunktion arvot eivät kuitenkaan kuvaa todennäköisyyksiä, vaan sen rooli on tulkittava toisin. Olkoon jatkuvasta satunnaismuuttujasta \(X\) kerätty väleiksi luokiteltu frekvenssijakauma. Piirretään tähän luokitukseen perustuva histogrammi siten, että kunkin osavälin kohdalle piirretyn pylvään pinta-ala kuvaa kyseisen välin todennäköisyyttä frekvenssitulkinnan mukaisesti. Tällöin pylvään korkeudeksi tulee vastaavalle osavälille osuneiden mittaustulosten suhteellinen frekvenssi jaettuna osavälin pituudella. Tällainen histogrammi lähestyy muuttujan \(X\) tiheysfunktion kuvaajaa, kun sekä koetoistojen määrää että osavälien lukumäärää kasvatetaan rajatta.
Jatkuvan satunnaismuuttujan kertymäfunktio määritellään samaan tapaan kuin diskreetillekin muuttujalle.
Kertymäfunktio on kasvava ja sillä on ominaisuudet
\[0\leq F(x)\leq 1, \qquad \lim_{x\to-\infty}F(x)=0 \qquad\text{ja}\qquad \lim_{x\to\infty}F(x)=1.\]
Lause 2.2.5
Pisteissä \(x\), joissa tiheysfunktio \(f(x)\) on jatkuva, on kertymäfunktiolla derivaatta
\[F'(x)=f(x).\]
Piilota/näytä todistus
Nyt löydetään sellainen vakio \(a\), että tiheysfunktio on jatkuva välillä \([a,x]\). Täten
\[F(x)=\int_{-\infty}^xf(t)\,\rd t = \int_{-\infty}^{a}f(t)\,\rd t + \int_a^x f(t)\,\rd t = C + \int_{a}^{x}f(t)\,\rd t,\]
missä \(C\) on vakio. Analyysin peruslauseen nojalla tällöin \(F'(x) = f(x)\).
Kertymäfunktion \(F\) avulla voi helposti esittää erilaisten tapahtumien todennäköisyydet, esimerkiksi
\[P(a \leq X \leq b) = F(b) - F(a), \qquad P(X \leq a) = F(a) \qquad\text{ja}\qquad P(X \geq a) = 1 - F(a).\]
Kaikissa epäyhtälömerkeistä voi jatkuvien satunnaismuuttujien tapahtumissa jättää yhtäsuuruuden myös pois.
Esimerkki 2.2.6
Työpaikassa kahvitauon pituus \(X\) minuuteissa on satunnaismuuttuja, jonka tiheysfunktio on
\[\begin{split}f(x) =
\begin{cases}
c(15 - x), & \text{kun } 5 \leq x \leq 15 \\
0, & \text{muulloin}.
\end{cases}\end{split}\]
Määritä vakion \(c\) arvo ja satunnaismuuttujan \(X\) kertymäfunktio.
Piilota/näytä ratkaisu
Määritetään aluksi vakio \(c\). Koska on oltava \(\int\limits_{-\infty}^{\infty} f(x)\,\rd x = 1\), joten
\[\begin{split}\begin{aligned}
\int_{-\infty}^{\infty}f(x)\,\rd x &= \int_{-\infty}^{5}0\,\rd x + \int_{5}^{15}c(15 - x)\,\rd x + \int_{15}^{\infty}0\,\rd x = c \sij{5}{15}\left(15x - \frac{1}{2}x^2\right) \\
&= c\left(15 \cdot 15 - \frac{1}{2} \cdot 15^2 - 15 \cdot 5 + \frac{1}{2} \cdot 5^2\right) = 50c = 1.
\end{aligned}\end{split}\]
Näin päätellään, että \(c = \frac{1}{50}\). Välillä \([5, 15]\) kertymäfunktioksi saadaan tällöin
\[\begin{split}\begin{aligned}
F(x) &= \int_{5}^{x}\frac{1}{50}(15 - t)\,\rd t = \frac{1}{50}\sij{5}{x}\left(15t - \frac{1}{2}t^2\right) \\
&= \frac{1}{50}\left(15x-\frac{1}{2}x^2-15\cdot 5 + \frac{1}{2}\cdot 5^2 \right) = -\frac{1}{100}x^2 + \frac{3}{10}x - \frac{5}{4}.
\end{aligned}\end{split}\]
Kaikille reaaliluvuille kertymäfunktio määritellään paloittain asettamalla
\[\begin{split}F(x) =
\begin{cases}
0, & \text{kun } x < 5 \\
-\frac{1}{100}x^2+\frac{3}{10}x-\frac{5}{4}, & \text{kun } 5 \leq x \leq 15 \\
1, & \text{kun } x > 15.
\end{cases}\qedhere\end{split}\]
Erityisesti laitteiden komponenttien elinikään liittyy seuraava erikseen määriteltävä jatkuva todennäköisyysjakauma.
Eksponenttijakauman kertymäfunktioksi saadaan arvoilla \(t\geq0\)
\[F(t) = P(T\leq t)=\int_{-\infty}^tf(u)\,\rd u=\int_0^t\lambda e^{-\lambda u}\,\rd u = \sij{0}{t}\left(-e^{-\lambda u}\right) = 1-e^{-\lambda t}.\]
Esimerkki 2.2.8
Tietyn sähköisen komponentin elinajan \(T\) (vuosissa) tiedetään olevan eksponentiaalisesti jakautunut parametrinaan \(\lambda=2\). Todennäköisyys sille, että komponentti kestää vielä korkeintaan yhden vuoden, kun se on jo kestänyt kaksi vuotta, on ehdollinen todennäköisyys
\[\begin{split}\begin{aligned}
P(T<2+1\mid T>2) &= \frac{P(2<T<3)}{P(T>2)}
= \frac{F(3)-F(2)}{1-F(2)}\\
&= \frac{(1-e^{-6})-(1-e^{-4})}{1-(1-e^{-4})}
= \frac{e^{-4}(-e^{-2}+1)}{e^{-4}} = 1-e^{-2}.
\end{aligned}\end{split}\]
Laskettaessa todennäköisyys \(P(T<1) = F(1) = 1 - e^{-2}\) saadaan sama tulos. Eli todennäköisyys, että komponentti kestää vielä yhden vuoden on sama uudella ja jo kaksi vuotta toimineella komponentilla! Tätä sovelluksissa tärkeää ilmiötä kutsutaan eksponenttijakauman unohtuvaisuusominaisuudeksi.
Diskreetti tasajakauma voidaan yleistää yksinkertaisesti jatkuvaksi vastinparikseen.