$\newcommand{\N}{\mathbb N} \newcommand{\Z}{\mathbb Z} \newcommand{\Q}{\mathbb Q} \newcommand{\R}{\mathbb R} \newcommand{\C}{\mathbb C} \newcommand{\ba}{\mathbf{a}} \newcommand{\bb}{\mathbf{b}} \newcommand{\bc}{\mathbf{c}} \newcommand{\bd}{\mathbf{d}} \newcommand{\be}{\mathbf{e}} \newcommand{\bff}{\mathbf{f}} \newcommand{\bh}{\mathbf{h}} \newcommand{\bi}{\mathbf{i}} \newcommand{\bj}{\mathbf{j}} \newcommand{\bk}{\mathbf{k}} \newcommand{\bN}{\mathbf{N}} \newcommand{\bn}{\mathbf{n}} \newcommand{\bo}{\mathbf{0}} \newcommand{\bp}{\mathbf{p}} \newcommand{\bq}{\mathbf{q}} \newcommand{\br}{\mathbf{r}} \newcommand{\bs}{\mathbf{s}} \newcommand{\bT}{\mathbf{T}} \newcommand{\bu}{\mathbf{u}} \newcommand{\bv}{\mathbf{v}} \newcommand{\bw}{\mathbf{w}} \newcommand{\bx}{\mathbf{x}} \newcommand{\by}{\mathbf{y}} \newcommand{\bz}{\mathbf{z}} \newcommand{\bzero}{\mathbf{0}} \newcommand{\nv}{\mathbf{0}} \newcommand{\cA}{\mathcal{A}} \newcommand{\cB}{\mathcal{B}} \newcommand{\cC}{\mathcal{C}} \newcommand{\cD}{\mathcal{D}} \newcommand{\cE}{\mathcal{E}} \newcommand{\cF}{\mathcal{F}} \newcommand{\cG}{\mathcal{G}} \newcommand{\cH}{\mathcal{H}} \newcommand{\cI}{\mathcal{I}} \newcommand{\cJ}{\mathcal{J}} \newcommand{\cK}{\mathcal{K}} \newcommand{\cL}{\mathcal{L}} \newcommand{\cM}{\mathcal{M}} \newcommand{\cN}{\mathcal{N}} \newcommand{\cO}{\mathcal{O}} \newcommand{\cP}{\mathcal{P}} \newcommand{\cQ}{\mathcal{Q}} \newcommand{\cR}{\mathcal{R}} \newcommand{\cS}{\mathcal{S}} \newcommand{\cT}{\mathcal{T}} \newcommand{\cU}{\mathcal{U}} \newcommand{\cV}{\mathcal{V}} \newcommand{\cW}{\mathcal{W}} \newcommand{\cX}{\mathcal{X}} \newcommand{\cY}{\mathcal{Y}} \newcommand{\cZ}{\mathcal{Z}} \newcommand{\rA}{\mathrm{A}} \newcommand{\rB}{\mathrm{B}} \newcommand{\rC}{\mathrm{C}} \newcommand{\rD}{\mathrm{D}} \newcommand{\rE}{\mathrm{E}} \newcommand{\rF}{\mathrm{F}} \newcommand{\rG}{\mathrm{G}} \newcommand{\rH}{\mathrm{H}} \newcommand{\rI}{\mathrm{I}} \newcommand{\rJ}{\mathrm{J}} \newcommand{\rK}{\mathrm{K}} \newcommand{\rL}{\mathrm{L}} \newcommand{\rM}{\mathrm{M}} \newcommand{\rN}{\mathrm{N}} \newcommand{\rO}{\mathrm{O}} \newcommand{\rP}{\mathrm{P}} \newcommand{\rQ}{\mathrm{Q}} \newcommand{\rR}{\mathrm{R}} \newcommand{\rS}{\mathrm{S}} \newcommand{\rT}{\mathrm{T}} \newcommand{\rU}{\mathrm{U}} \newcommand{\rV}{\mathrm{V}} \newcommand{\rW}{\mathrm{W}} \newcommand{\rX}{\mathrm{X}} \newcommand{\rY}{\mathrm{Y}} \newcommand{\rZ}{\mathrm{Z}} \newcommand{\pv}{\overline} \newcommand{\iu}{\mathrm{i}} \newcommand{\ju}{\mathrm{j}} \newcommand{\im}{\mathrm{i}} \newcommand{\e}{\mathrm{e}} \newcommand{\real}{\operatorname{Re}} \newcommand{\imag}{\operatorname{Im}} \newcommand{\Arg}{\operatorname{Arg}} \newcommand{\Ln}{\operatorname{Ln}} \DeclareMathOperator*{\res}{res} \newcommand{\re}{\operatorname{Re}} \newcommand{\im}{\operatorname{Im}} \newcommand{\arsinh}{\operatorname{ar\,sinh}} \newcommand{\arcosh}{\operatorname{ar\,cosh}} \newcommand{\artanh}{\operatorname{ar\,tanh}} \newcommand{\sgn}{\operatorname{sgn}} \newcommand{\diag}{\operatorname{diag}} \newcommand{\proj}{\operatorname{proj}} \newcommand{\rref}{\operatorname{rref}} \newcommand{\rank}{\operatorname{rank}} \newcommand{\Span}{\operatorname{span}} \newcommand{\vir}{\operatorname{span}} \renewcommand{\dim}{\operatorname{dim}} \newcommand{\alg}{\operatorname{alg}} \newcommand{\geom}{\operatorname{geom}} \newcommand{\id}{\operatorname{id}} \newcommand{\norm}[1]{\lVert #1 \rVert} \newcommand{\tp}[1]{#1^{\top}} \renewcommand{\d}{\mathrm{d}} \newcommand{\sij}[2]{\bigg/_{\mspace{-15mu}#1}^{\,#2}} \newcommand{\abs}[1]{\lvert#1\rvert} \newcommand{\pysty}[1]{\left[\begin{array}{@{}r@{}}#1\end{array}\right]} \newcommand{\piste}{\cdot} \newcommand{\qedhere}{} \newcommand{\taumatrix}[1]{\left[\!\!#1\!\!\right]} \newenvironment{augmatrix}[1]{\left[\begin{array}{#1}}{\end{array}\right]} \newenvironment{vaugmatrix}[1]{\left|\begin{array}{#1}}{\end{array}\right|} \newcommand{\trans}{\mathrm{T}} \newcommand{\EUR}{\text{\unicode{0x20AC}}} \newcommand{\SI}[3][]{#2\,\mathrm{#3}} \newcommand{\si}[2][]{\mathrm{#2}} \newcommand{\num}[2][]{#2} \newcommand{\ang}[2][]{#2^{\circ}} \newcommand{\meter}{m} \newcommand{\metre}{\meter} \newcommand{\kilo}{k} \newcommand{\kilogram}{kg} \newcommand{\gram}{g} \newcommand{\squared}{^2} \newcommand{\cubed}{^3} \newcommand{\minute}{min} \newcommand{\hour}{h} \newcommand{\second}{s} \newcommand{\degreeCelsius}{^{\circ}C} \newcommand{\per}{/} \newcommand{\centi}{c} \newcommand{\milli}{m} \newcommand{\deci}{d} \newcommand{\percent}{\%} \newcommand{\Var}{\operatorname{Var}} \newcommand{\Cov}{\operatorname{Cov}} \newcommand{\Corr}{\operatorname{Corr}} \newcommand{\Tasd}{\operatorname{Tasd}} \newcommand{\Ber}{\operatorname{Ber}} \newcommand{\Bin}{\operatorname{Bin}} \newcommand{\Geom}{\operatorname{Geom}} \newcommand{\Poi}{\operatorname{Poi}} \newcommand{\Hyperg}{\operatorname{Hyperg}} \newcommand{\Tas}{\operatorname{Tas}} \newcommand{\Exp}{\operatorname{Exp}} \newcommand{\tdist}{\operatorname{t}} \newcommand{\rd}{\mathrm{d}}$

# Jatkuvan satunnaismuuttujan jakauma¶

Satunnaismuuttujan $$X$$, jonka otosavaruus $$\Omega$$ on (rajoitettu tai rajoittamaton) reaalilukuväli tai sellaisten yhdiste, sanotaan olevan jatkuva (continuous) tai jatkuvasti jakautunut (continuously distributed). Kuten diskreetin muuttujan tapauksessa, myös jatkuvan satunnaismuuttujan todennäköisyysjakaumaa mallinnetaan tiheysfunktiolla. Määritelmä kuitenkin poikkeaa hieman diskreetistä tapauksesta.

Määritelmä 2.2.1

Funktio $$f : \R \to [0, \infty)$$ on otosavaruuden $$\Omega$$ jatkuvan satunnaismuuttujan $$X$$ tiheysfunktio ((probability) density function, pdf), jos

1. $$f(x)\geq 0$$ aina, kun $$x \in \Omega$$,
2. $$\int\limits_{-\infty}^{\infty}f(x)\,\rd x = 1$$,
3. $$P(a \leq X \leq b) = \int\limits_{a}^{b}f(x)\,\rd x$$ aina, kun $$a, b \in \R$$.

Huomautus 2.2.2

Jälleen satunnaismuuttujan $$X$$ tiheysfunktio $$f(x)$$ on määritelty kaikilla reaaliluvuilla, vaikka sen muoto kerrottaisiinkin vain otosavaruudessa. Implisiittinen oletus $$f(x) = 0$$, kun $$x \in \R \setminus \Omega$$ jätetään yleensä mainitsematta.

Tutkitaan tilannetta, jossa $$\ell$$-pituista tikkua heitetään alla olevan kuvan mukaiseen alueeseen. Onko tikun sijaintiin liittyen mahdollista keksiä sekä diskreetti, että jatkuva satunnaismuuttuja kuvaamaan tilannetta?

Tapahtuman $$\{x \in \Omega : a \leq x \leq b\}$$ todennäköisyys jatkuvan satunnaismuuttujan tapauksessa lasketaan siis tiheysfunktion määrättynä (mahdollisesti epäoleellisena) integraalina

$P(a\leq X\leq b)=\int_a^bf(x)\,\rd x,$

kun $$a$$ ja $$b$$ ovat reaalilukuja, $$a = -\infty$$ tai $$b = \infty$$. Todennäköisyyttä voi havainnollistaa tiheysfunktion ja $$x-$$akselin jäävän alueen pinta-alana, kun $$x\in[a,b]$$.

Määrätyn integraalin ominaisuuksien perusteella yllä määritelty todennäköisyysmitta $$P$$ toteuttaa Kolmogorovin aksioomat.

Huomautus 2.2.3

Todennäköisyys sille, että jatkuva satunnaismuuttuja $$X$$ saa yksittäisen arvon otosavaruudesta on nolla, sillä

$P(X = a) = P(a \leq X \leq a) = \int_a^{a}f(x)\,\rd x = 0.$

Näin jatkuvalle satunnaismuuttujalle

$P(a\leq X\leq b)=P(a\leq X<b)=P(a<X\leq b)=P(a<X<b).$

Tässä yllättävältä kuulostavassa ominaisuudessa ei kuitenkaan ole mitään ristiriitaa todellisuuden kanssa. Nimittäin jatkuvan satunnaismuuttujan arvoa ei voi mitata täysin tarkasti, vaan mittaustulosta edustaa paremminkin mittaustarkkuudesta riippuva reaalilukuväli. Jos esimerkiksi satunnaismuuttujan $$X$$ arvoja mitataan yhden desimaalin tarkkuudella, niin arvon $$5{,}2$$ realisoitumisen todennäköisyys on

$P(5{,}15\leq X<5{,}25)=\int_{5{,}15}^{5{,}25}f(x)\,\rd x.$

Diskreetissä tapauksessa tiheysfunktiolle löytyy intuitiivinen tulkinta pistetodennäköisyysfunktiona. Jatkuvan satunnaismuuttujan tapauksessa tiheysfunktion arvot eivät kuitenkaan kuvaa todennäköisyyksiä, vaan sen rooli on tulkittava toisin. Olkoon jatkuvasta satunnaismuuttujasta $$X$$ kerätty väleiksi luokiteltu frekvenssijakauma. Piirretään tähän luokitukseen perustuva histogrammi siten, että kunkin osavälin kohdalle piirretyn pylvään pinta-ala kuvaa kyseisen välin todennäköisyyttä frekvenssitulkinnan mukaisesti. Tällöin pylvään korkeudeksi tulee vastaavalle osavälille osuneiden mittaustulosten suhteellinen frekvenssi jaettuna osavälin pituudella. Tällainen histogrammi lähestyy muuttujan $$X$$ tiheysfunktion kuvaajaa, kun sekä koetoistojen määrää että osavälien lukumäärää kasvatetaan rajatta.

Jatkuvan satunnaismuuttujan kertymäfunktio määritellään samaan tapaan kuin diskreetillekin muuttujalle.

Määritelmä 2.2.4

Jatkuvan satunnaismuuttujan $$X$$ kertymäfunktio (cumulative distribution function, cdf) on funktio $$F : \R \rightarrow [0, 1]$$,

$F(x)=P(X\leq x)=\int_{-\infty}^{x}f(t)\,\rd t.$

Kertymäfunktio on kasvava ja sillä on ominaisuudet

$0\leq F(x)\leq 1, \qquad \lim_{x\to-\infty}F(x)=0 \qquad\text{ja}\qquad \lim_{x\to\infty}F(x)=1.$

Lause 2.2.5

Pisteissä $$x$$, joissa tiheysfunktio $$f(x)$$ on jatkuva, on kertymäfunktiolla derivaatta

$F'(x)=f(x).$
Piilota/näytä todistus

Nyt löydetään sellainen vakio $$a$$, että tiheysfunktio on jatkuva välillä $$[a,x]$$. Täten

$F(x)=\int_{-\infty}^xf(t)\,\rd t = \int_{-\infty}^{a}f(t)\,\rd t + \int_a^x f(t)\,\rd t = C + \int_{a}^{x}f(t)\,\rd t,$

missä $$C$$ on vakio. Analyysin peruslauseen nojalla tällöin $$F'(x) = f(x)$$.

Kertymäfunktion $$F$$ avulla voi helposti esittää erilaisten tapahtumien todennäköisyydet, esimerkiksi

$P(a \leq X \leq b) = F(b) - F(a), \qquad P(X \leq a) = F(a) \qquad\text{ja}\qquad P(X \geq a) = 1 - F(a).$

Kaikissa epäyhtälömerkeistä voi jatkuvien satunnaismuuttujien tapahtumissa jättää yhtäsuuruuden myös pois.

Esimerkki 2.2.6

Työpaikassa kahvitauon pituus $$X$$ minuuteissa on satunnaismuuttuja, jonka tiheysfunktio on

$\begin{split}f(x) = \begin{cases} c(15 - x), & \text{kun } 5 \leq x \leq 15 \\ 0, & \text{muulloin}. \end{cases}\end{split}$

Määritä vakion $$c$$ arvo ja satunnaismuuttujan $$X$$ kertymäfunktio.

Piilota/näytä ratkaisu

Määritetään aluksi vakio $$c$$. Koska on oltava $$\int\limits_{-\infty}^{\infty} f(x)\,\rd x = 1$$, joten

\begin{split}\begin{aligned} \int_{-\infty}^{\infty}f(x)\,\rd x &= \int_{-\infty}^{5}0\,\rd x + \int_{5}^{15}c(15 - x)\,\rd x + \int_{15}^{\infty}0\,\rd x = c \sij{5}{15}\left(15x - \frac{1}{2}x^2\right) \\ &= c\left(15 \cdot 15 - \frac{1}{2} \cdot 15^2 - 15 \cdot 5 + \frac{1}{2} \cdot 5^2\right) = 50c = 1. \end{aligned}\end{split}

Näin päätellään, että $$c = \frac{1}{50}$$. Välillä $$[5, 15]$$ kertymäfunktioksi saadaan tällöin

\begin{split}\begin{aligned} F(x) &= \int_{5}^{x}\frac{1}{50}(15 - t)\,\rd t = \frac{1}{50}\sij{5}{x}\left(15t - \frac{1}{2}t^2\right) \\ &= \frac{1}{50}\left(15x-\frac{1}{2}x^2-15\cdot 5 + \frac{1}{2}\cdot 5^2 \right) = -\frac{1}{100}x^2 + \frac{3}{10}x - \frac{5}{4}. \end{aligned}\end{split}

Kaikille reaaliluvuille kertymäfunktio määritellään paloittain asettamalla

$\begin{split}F(x) = \begin{cases} 0, & \text{kun } x < 5 \\ -\frac{1}{100}x^2+\frac{3}{10}x-\frac{5}{4}, & \text{kun } 5 \leq x \leq 15 \\ 1, & \text{kun } x > 15. \end{cases}\qedhere\end{split}$

Olkoon $$a < b$$ ja $$X : \Omega \to \mathbb R$$ satunnaismuuttuja. Onko seuraava muuttujan $$X$$ kertymäfunktioon $$F : \mathbb R \to [0, 1]$$ liittyvä väite oikein?

$P(a \leq X \leq b) = F(b) - F(a).$

Erityisesti laitteiden komponenttien elinikään liittyy seuraava erikseen määriteltävä jatkuva todennäköisyysjakauma.

Määritelmä 2.2.7

Satunnaismuuttuja $$T$$ noudattaa eksponenttijakaumaa (exponential distribution) parametrilla $$\lambda>0$$, $$T\sim\Exp(\lambda)$$, jos sen tiheysfunktio on

$f(t)=\lambda e^{-\lambda t},\qquad\text{kun }t\geq0.$

Eksponenttijakauman kertymäfunktioksi saadaan arvoilla $$t\geq0$$

$F(t) = P(T\leq t)=\int_{-\infty}^tf(u)\,\rd u=\int_0^t\lambda e^{-\lambda u}\,\rd u = \sij{0}{t}\left(-e^{-\lambda u}\right) = 1-e^{-\lambda t}.$

Esimerkki 2.2.8

Tietyn sähköisen komponentin elinajan $$T$$ (vuosissa) tiedetään olevan eksponentiaalisesti jakautunut parametrinaan $$\lambda=2$$. Todennäköisyys sille, että komponentti kestää vielä korkeintaan yhden vuoden, kun se on jo kestänyt kaksi vuotta, on ehdollinen todennäköisyys

\begin{split}\begin{aligned} P(T<2+1\mid T>2) &= \frac{P(2<T<3)}{P(T>2)} = \frac{F(3)-F(2)}{1-F(2)}\\ &= \frac{(1-e^{-6})-(1-e^{-4})}{1-(1-e^{-4})} = \frac{e^{-4}(-e^{-2}+1)}{e^{-4}} = 1-e^{-2}. \end{aligned}\end{split}

Laskettaessa todennäköisyys $$P(T<1) = F(1) = 1 - e^{-2}$$ saadaan sama tulos. Eli todennäköisyys, että komponentti kestää vielä yhden vuoden on sama uudella ja jo kaksi vuotta toimineella komponentilla! Tätä sovelluksissa tärkeää ilmiötä kutsutaan eksponenttijakauman unohtuvaisuusominaisuudeksi.

Diskreetti tasajakauma voidaan yleistää yksinkertaisesti jatkuvaksi vastinparikseen.

Määritelmä 2.2.9

Jatkuva satunnaismuuttuja $$X$$ noudattaa jatkuvaa tasajakaumaa (continuous uniform distribution) välillä $$[a,b]$$, $$X\sim \Tas(a,b)$$, jos sen otosavaruus on väli $$[a,b]$$ ja tiheysfunktio $$f(x)$$ on vakio tällä välillä. Tällöin satunnaismuuttujan $$X$$ tiheysfunktio on

$f(x)=\frac{1}{b-a},\qquad\text{kun }x\in[a,b].$

Yhdysvaltain kansallisen maanjäristystietokeskuksen (National Earthquake Information Center, NEIC) tietojen mukaan maan sisällä tapahtuu noin $$12~000$$$$14~000$$ maanjäristystä vuodessa. Nyt haluttaisiinkin selvittää, millä todennäköisyydellä maanjäristys tapahtuu seuraavan viikon sisällä tästä hetkestä.

Mikä tämän luvun jatkuvista jakaumista sopii yllä kuvatun tilanteen mallintamiseen?

Palautusta lähetetään...