\[\newcommand{\N}{\mathbb N} \newcommand{\Z}{\mathbb Z} \newcommand{\Q}{\mathbb Q} \newcommand{\R}{\mathbb R} \renewcommand{\C}{\mathbb C} \newcommand{\ba}{\mathbf{a}} \newcommand{\bb}{\mathbf{b}} \newcommand{\bc}{\mathbf{c}} \newcommand{\bd}{\mathbf{d}} \newcommand{\be}{\mathbf{e}} \newcommand{\bbf}{\mathbf{f}} \newcommand{\bh}{\mathbf{h}} \newcommand{\bi}{\mathbf{i}} \newcommand{\bj}{\mathbf{j}} \newcommand{\bk}{\mathbf{k}} \newcommand{\bN}{\mathbf{N}} \newcommand{\bn}{\mathbf{n}} \newcommand{\bo}{\mathbf{0}} \newcommand{\bp}{\mathbf{p}} \newcommand{\bq}{\mathbf{q}} \newcommand{\br}{\mathbf{r}} \newcommand{\bs}{\mathbf{s}} \newcommand{\bT}{\mathbf{T}} \newcommand{\bu}{\mathbf{u}} \newcommand{\bv}{\mathbf{v}} \newcommand{\bw}{\mathbf{w}} \newcommand{\bx}{\mathbf{x}} \newcommand{\by}{\mathbf{y}} \newcommand{\bz}{\mathbf{z}} \newcommand{\bzero}{\mathbf{0}} \newcommand{\cA}{\mathcal{A}} \newcommand{\cB}{\mathcal{B}} \newcommand{\cC}{\mathcal{C}} \newcommand{\cD}{\mathcal{D}} \newcommand{\cE}{\mathcal{E}} \newcommand{\cF}{\mathcal{F}} \newcommand{\cG}{\mathcal{G}} \newcommand{\cH}{\mathcal{H}} \newcommand{\cI}{\mathcal{I}} \newcommand{\cJ}{\mathcal{J}} \newcommand{\cK}{\mathcal{K}} \newcommand{\cL}{\mathcal{L}} \newcommand{\cM}{\mathcal{M}} \newcommand{\cN}{\mathcal{N}} \newcommand{\cO}{\mathcal{O}} \newcommand{\cP}{\mathcal{P}} \newcommand{\cQ}{\mathcal{Q}} \newcommand{\cR}{\mathcal{R}} \newcommand{\cS}{\mathcal{S}} \newcommand{\cT}{\mathcal{T}} \newcommand{\cU}{\mathcal{U}} \newcommand{\cV}{\mathcal{V}} \newcommand{\cW}{\mathcal{W}} \newcommand{\cX}{\mathcal{X}} \newcommand{\cY}{\mathcal{Y}} \newcommand{\cZ}{\mathcal{Z}} \newcommand{\rA}{\mathrm{A}} \newcommand{\rB}{\mathrm{B}} \newcommand{\rC}{\mathrm{C}} \newcommand{\rD}{\mathrm{D}} \newcommand{\rE}{\mathrm{E}} \newcommand{\rF}{\mathrm{F}} \newcommand{\rG}{\mathrm{G}} \newcommand{\rH}{\mathrm{H}} \newcommand{\rI}{\mathrm{I}} \newcommand{\rJ}{\mathrm{J}} \newcommand{\rK}{\mathrm{K}} \newcommand{\rL}{\mathrm{L}} \newcommand{\rM}{\mathrm{M}} \newcommand{\rN}{\mathrm{N}} \newcommand{\rO}{\mathrm{O}} \newcommand{\rP}{\mathrm{P}} \newcommand{\rQ}{\mathrm{Q}} \newcommand{\rR}{\mathrm{R}} \newcommand{\rS}{\mathrm{S}} \newcommand{\rT}{\mathrm{T}} \newcommand{\rU}{\mathrm{U}} \newcommand{\rV}{\mathrm{V}} \newcommand{\rW}{\mathrm{W}} \newcommand{\rX}{\mathrm{X}} \newcommand{\rY}{\mathrm{Y}} \newcommand{\rZ}{\mathrm{Z}} \newcommand{\re}{\operatorname{Re}} \newcommand{\im}{\operatorname{Im}} \newcommand{\arsinh}{\operatorname{ar\,sinh}} \newcommand{\arcosh}{\operatorname{ar\,cosh}} \newcommand{\artanh}{\operatorname{ar\,tanh}} \newcommand{\diag}{\operatorname{diag}} \newcommand{\proj}{\operatorname{proj}} \newcommand{\rref}{\operatorname{rref}} \newcommand{\rank}{\operatorname{rank}} \newcommand{\Span}{\operatorname{span}} \renewcommand{\dim}{\operatorname{dim}} \newcommand{\alg}{\operatorname{alg}} \newcommand{\geom}{\operatorname{geom}} \newcommand{\id}{\operatorname{id}} \newcommand{\Var}{\operatorname{Var}} \newcommand{\Cov}{\operatorname{Cov}} \newcommand{\Corr}{\operatorname{Corr}} \newcommand{\Tasd}{\operatorname{Tasd}} \newcommand{\Ber}{\operatorname{Ber}} \newcommand{\Bin}{\operatorname{Bin}} \newcommand{\Geom}{\operatorname{Geom}} \newcommand{\Poi}{\operatorname{Poi}} \newcommand{\Hyperg}{\operatorname{Hyperg}} \newcommand{\Tas}{\operatorname{Tas}} \newcommand{\Exp}{\operatorname{Exp}} \newcommand{\tdist}{\operatorname{t}} \newcommand{\rd}{\mathrm{d}} \newcommand{\sij}[2]{\bigg/_{\mspace{-10mu}\,#1}^{\,#2}} \newcommand{\qedhere}{}\]

Tsebyshevin epäyhtälö

Jos satunnaismuuttujan \(X\) tiheysfunktio tunnetaan, siihen liittyvien tapahtumien todennäköisyydet voidaan laskea tarkasti. Monesti kuitenkin tiheysfunktion tarkka muoto on tuntematon, jolloin on tyydyttävä vain arvioimaan erilaisia todennäköisyyksiä. Tässä esiteltävä Tsebyshevin epäyhtälö antaa tietyn satunnaismuuttujaan \(X\) liittyvän tapahtuman todennäköisyydelle ylärajan muuttujan \(X\) odotusarvon \(\mu\) ja varianssin \(\sigma^2\) avulla. Intuitiivinen ajatus epäyhtälön taustalla on, että suurin osa “todennäköisyysmassasta” sijaitsee odotusarvon ympärillä muutaman keskihajonnan \(\sigma\) pituisella välillä: varianssi ja keskihajonta mittaavat todennäköisyysmassan keskittymistä odotusarvon ympärille.

Lause 3.5.1

Jos satunnaismuuttujan \(X\) odotusarvo on \(\mu\) ja varianssi \(\sigma^2\), niin

\[P(|X - \mu| \geq t) \leq \frac{\sigma^2}{t^2} \qquad\text{ja}\qquad P(|X - \mu| < t) \geq 1 - \frac{\sigma^2}{t^2}\]

aina, kun \(t > 0\). Erityisesti tapauksessa \(t = k\sigma\)

\[P(|X - \mu| \geq k\sigma) \leq \frac{1}{k^2} \qquad\text{ja}\qquad P(|X - \mu| < k\sigma) \geq 1 - \frac{1}{k^2}\]

aina, kun \(k > 0\). Tätä kutsutaan Tsebyshevin epäyhtälöksi.

Näytä/piilota todistus

Todistetaan väite jatkuvalle satunnaismuuttujalle \(X\). Olkoon muuttujan \(X\) tiheysfunktio \(f(x)\), jolloin

\[P(|X - \mu| \geq t) = P(\{X \leq \mu - t\} \cup \{X \geq \mu + t\}) = \int_{-\infty}^{\mu - t}f(x)\,\rd x + \int_{\mu + t}^{\infty}f(x)\,\rd x.\]

Tapahtumalle \(|X - \mu| \geq t\) suotuisissa alkeistapauksissa \(X = x\) toteutuu \(|x - \mu| \geq t\), ja koska \(t\) oletettiin positiiviseksi, myös \((x - \mu)^2 \geq t^2\). Tämän vuoksi

\[f(x) = 1 \cdot f(x) \leq \frac{(x - \mu)^2}{t^2}f(x),\]

kun \(x \leq \mu - t\) tai \(x \geq \mu + t\), joten

\[P(|X - \mu| \geq t) \leq \int_{-\infty}^{\mu - t}\frac{(x - \mu)^2}{t^2}f(x)\,\rd x + \int_{\mu + t}^{\infty}\frac{(x - \mu)^2}{t^2}f(x)\,\rd x\]

Tässä \(\frac{(x - \mu)^2}{t^2}f(x) \geq 0\), kun \(x \in \R\), joten saatua lauseketta rajaa yläpuolelta integraali koko reaaliakselin yli. Siis

\[P(|X - \mu| \geq t) \leq \int_{-\infty}^{\infty}\frac{(x - \mu)^2}{t^2}f(x)\,\rd x = \frac{1}{t^2}\int_{-\infty}^{\infty}(x - \mu)^2f(x)\,\rd x = \frac{\sigma^2}{t^2}\]

ja ensimmäinen väite on todistettu. Toista muotoa varten havaitaan, että \(|X - \mu| < t\) on juuri käsitellyn tapahtuman komplementtitapahtuma, joten

\[1 - P(|X - \mu| < t) \leq \frac{\sigma^2}{t^2},\]

ja väite seuraa välittömästi. Tapaus \(t = k\sigma\), \(k > 0\) on sijoittamalla selvä: \(\frac{\sigma^2}{(k\sigma)^2} = \frac{1}{k^2}\).

Huomautus 3.5.2

Jos \(t \leq \sigma\), niin epäyhtälö väittää että \(P(|X - \mu| \geq t) \leq 1\), mikä tiedetään jo todennäköisyysmitan ominaisuuksista! Hyödyllisyyden näkökulmasta on siis käsiteltävä keskihajontaa suurempia etäisyyksiä odotusarvosta.

Tsebyshevin epäyhtälön avulla saadaan joitakin kaikkia todennäköisyysjakaumia koskevia heuristisia arvioita todennäköisyyden keskittymisestä odotusarvon ympärille. Valitun satunnaismuuttujan realisoituvat arvot ovat esimerkiksi todennäköisyydellä \(1 - \frac{1}{2^2} = \frac{3}{4} = 0{,}75\) korkeintaan etäisyydellä \(2\sigma\) odotusarvosta \(\mu\). Vastaavasti päätellään, että noin \(89~\%\) kaikista satunnaismuuttujalle realisoituvista arvoista on välillä \((\mu - 3\sigma, \mu + 3\sigma)\).

../_images/kuva26tsebysev.svg

Esimerkki 3.5.3

Kuulalaakereiden halkaisija \(X\) (millimetriä) on satunnaismuuttuja, jonka odotusarvo ja tiheysfunktio ovat tuntemattomia, mutta varianssin tiedetään olevan \(\sigma^2=0{,}09\). Tsebyshevin epäyhtälön nojalla satunnaisesti valitun laakerin halkaisija poikkeaa odotusarvosta vähintään \(0{,}7\) millimetriä on korkeintaan

\[P(|X-\mu|\geq0{,}7)\leq\frac{0{,}09}{0{,}7^2}\approx0{,}1837\]

Tilastotieteilijä haluaa estimoida populaation keskipituutta \(h\) (metreinä) perustuen riippumattomiin koko populaatiosta tasaisesti valittuihin otoksiin \(X_1,\ldots X_n\) joita on \(n\) kappaletta. Tilastotieteilijä käyttää otoskeskiarvoa \(M_n = (X_1+\cdots +X_n)/n\) estimaattina keskipituudelle \(h\) ja otosten \(X_i\) keskihajonnoille raakaa arvausta \(1{,}0\) metriä.

Kuinka suuri otoskoon \(n\) tulisi olla jotta satunnaismuuttujan \(M_n\) keskihajonta olisi korkeintaan \(1\) senttimetri?
Kuinka suuri otoskoon \(n\) tulisi olla, jotta Tsebyshevin epäyhtälö takaa sen, että estimaatti on viiden senttimetrin sisällä arvosta \(h\) vähintään \(99~\%\) todennäköisyydellä?
Palautusta lähetetään...