\[\newcommand{\N}{\mathbb N} \newcommand{\Z}{\mathbb Z} \newcommand{\Q}{\mathbb Q} \newcommand{\R}{\mathbb R} \newcommand{\C}{\mathbb C} \newcommand{\ba}{\mathbf{a}} \newcommand{\bb}{\mathbf{b}} \newcommand{\bc}{\mathbf{c}} \newcommand{\bd}{\mathbf{d}} \newcommand{\be}{\mathbf{e}} \newcommand{\bff}{\mathbf{f}} \newcommand{\bh}{\mathbf{h}} \newcommand{\bi}{\mathbf{i}} \newcommand{\bj}{\mathbf{j}} \newcommand{\bk}{\mathbf{k}} \newcommand{\bN}{\mathbf{N}} \newcommand{\bn}{\mathbf{n}} \newcommand{\bo}{\mathbf{0}} \newcommand{\bp}{\mathbf{p}} \newcommand{\bq}{\mathbf{q}} \newcommand{\br}{\mathbf{r}} \newcommand{\bs}{\mathbf{s}} \newcommand{\bT}{\mathbf{T}} \newcommand{\bu}{\mathbf{u}} \newcommand{\bv}{\mathbf{v}} \newcommand{\bw}{\mathbf{w}} \newcommand{\bx}{\mathbf{x}} \newcommand{\by}{\mathbf{y}} \newcommand{\bz}{\mathbf{z}} \newcommand{\bzero}{\mathbf{0}} \newcommand{\nv}{\mathbf{0}} \newcommand{\cA}{\mathcal{A}} \newcommand{\cB}{\mathcal{B}} \newcommand{\cC}{\mathcal{C}} \newcommand{\cD}{\mathcal{D}} \newcommand{\cE}{\mathcal{E}} \newcommand{\cF}{\mathcal{F}} \newcommand{\cG}{\mathcal{G}} \newcommand{\cH}{\mathcal{H}} \newcommand{\cI}{\mathcal{I}} \newcommand{\cJ}{\mathcal{J}} \newcommand{\cK}{\mathcal{K}} \newcommand{\cL}{\mathcal{L}} \newcommand{\cM}{\mathcal{M}} \newcommand{\cN}{\mathcal{N}} \newcommand{\cO}{\mathcal{O}} \newcommand{\cP}{\mathcal{P}} \newcommand{\cQ}{\mathcal{Q}} \newcommand{\cR}{\mathcal{R}} \newcommand{\cS}{\mathcal{S}} \newcommand{\cT}{\mathcal{T}} \newcommand{\cU}{\mathcal{U}} \newcommand{\cV}{\mathcal{V}} \newcommand{\cW}{\mathcal{W}} \newcommand{\cX}{\mathcal{X}} \newcommand{\cY}{\mathcal{Y}} \newcommand{\cZ}{\mathcal{Z}} \newcommand{\rA}{\mathrm{A}} \newcommand{\rB}{\mathrm{B}} \newcommand{\rC}{\mathrm{C}} \newcommand{\rD}{\mathrm{D}} \newcommand{\rE}{\mathrm{E}} \newcommand{\rF}{\mathrm{F}} \newcommand{\rG}{\mathrm{G}} \newcommand{\rH}{\mathrm{H}} \newcommand{\rI}{\mathrm{I}} \newcommand{\rJ}{\mathrm{J}} \newcommand{\rK}{\mathrm{K}} \newcommand{\rL}{\mathrm{L}} \newcommand{\rM}{\mathrm{M}} \newcommand{\rN}{\mathrm{N}} \newcommand{\rO}{\mathrm{O}} \newcommand{\rP}{\mathrm{P}} \newcommand{\rQ}{\mathrm{Q}} \newcommand{\rR}{\mathrm{R}} \newcommand{\rS}{\mathrm{S}} \newcommand{\rT}{\mathrm{T}} \newcommand{\rU}{\mathrm{U}} \newcommand{\rV}{\mathrm{V}} \newcommand{\rW}{\mathrm{W}} \newcommand{\rX}{\mathrm{X}} \newcommand{\rY}{\mathrm{Y}} \newcommand{\rZ}{\mathrm{Z}} \newcommand{\pv}{\overline} \newcommand{\iu}{\mathrm{i}} \newcommand{\ju}{\mathrm{j}} \newcommand{\im}{\mathrm{i}} \newcommand{\e}{\mathrm{e}} \newcommand{\real}{\operatorname{Re}} \newcommand{\imag}{\operatorname{Im}} \newcommand{\Arg}{\operatorname{Arg}} \newcommand{\Ln}{\operatorname{Ln}} \DeclareMathOperator*{\res}{res} \newcommand{\re}{\operatorname{Re}} \newcommand{\im}{\operatorname{Im}} \newcommand{\arsinh}{\operatorname{ar\,sinh}} \newcommand{\arcosh}{\operatorname{ar\,cosh}} \newcommand{\artanh}{\operatorname{ar\,tanh}} \newcommand{\sgn}{\operatorname{sgn}} \newcommand{\diag}{\operatorname{diag}} \newcommand{\proj}{\operatorname{proj}} \newcommand{\rref}{\operatorname{rref}} \newcommand{\rank}{\operatorname{rank}} \newcommand{\Span}{\operatorname{span}} \newcommand{\vir}{\operatorname{span}} \renewcommand{\dim}{\operatorname{dim}} \newcommand{\alg}{\operatorname{alg}} \newcommand{\geom}{\operatorname{geom}} \newcommand{\id}{\operatorname{id}} \newcommand{\norm}[1]{\lVert #1 \rVert} \newcommand{\tp}[1]{#1^{\top}} \renewcommand{\d}{\mathrm{d}} \newcommand{\sij}[2]{\bigg/_{\mspace{-15mu}#1}^{\,#2}} \newcommand{\abs}[1]{\lvert#1\rvert} \newcommand{\pysty}[1]{\left[\begin{array}{@{}r@{}}#1\end{array}\right]} \newcommand{\piste}{\cdot} \newcommand{\qedhere}{} \newcommand{\taumatrix}[1]{\left[\!\!#1\!\!\right]} \newenvironment{augmatrix}[1]{\left[\begin{array}{#1}}{\end{array}\right]} \newenvironment{vaugmatrix}[1]{\left|\begin{array}{#1}}{\end{array}\right|} \newcommand{\trans}{\mathrm{T}} \newcommand{\EUR}{\text{\unicode{0x20AC}}} \newcommand{\SI}[3][]{#2\,\mathrm{#3}} \newcommand{\si}[2][]{\mathrm{#2}} \newcommand{\num}[2][]{#2} \newcommand{\ang}[2][]{#2^{\circ}} \newcommand{\meter}{m} \newcommand{\metre}{\meter} \newcommand{\kilo}{k} \newcommand{\kilogram}{kg} \newcommand{\gram}{g} \newcommand{\squared}{^2} \newcommand{\cubed}{^3} \newcommand{\minute}{min} \newcommand{\hour}{h} \newcommand{\second}{s} \newcommand{\degreeCelsius}{^{\circ}C} \newcommand{\per}{/} \newcommand{\centi}{c} \newcommand{\milli}{m} \newcommand{\deci}{d} \newcommand{\percent}{\%} \newcommand{\Var}{\operatorname{Var}} \newcommand{\Cov}{\operatorname{Cov}} \newcommand{\Corr}{\operatorname{Corr}} \newcommand{\Tasd}{\operatorname{Tasd}} \newcommand{\Ber}{\operatorname{Ber}} \newcommand{\Bin}{\operatorname{Bin}} \newcommand{\Geom}{\operatorname{Geom}} \newcommand{\Poi}{\operatorname{Poi}} \newcommand{\Hyperg}{\operatorname{Hyperg}} \newcommand{\Tas}{\operatorname{Tas}} \newcommand{\Exp}{\operatorname{Exp}} \newcommand{\tdist}{\operatorname{t}} \newcommand{\rd}{\mathrm{d}}\]

Suhteellisen osuuden luottamusväli¶

Oletetaan, että \(X\sim\Bin(n,p)\), missä \(p\) on onnistumisen todennäköisyys \(n\)-toistokokeen yksittäisessä toistossa. Todennäköisyyden frekvenssitulkinnassa \(p\) on myös onnistumisten suhteellinen frekvenssi, eli niiden suhteellinen osuus kaikista toistoista. Satunnaismuuttuja \(X\) voidaan tulkita Bernoullin jakaumaa \(\Ber(p) = \Bin(1, p)\) noudattavien satunnaismuuttujien \(Y_1, Y_2, \ldots, Y_n\) summana \(X = Y_1 + Y_2 + \cdots + Y_n\), ja tällöin satunnaismuuttujat \(Y_1, Y_2, \ldots, Y_n\) muodostavat otoksen satunnaismuuttujasta \(Y \sim \Bin(1, p)\).

Monesti satunnaismuuttujan \(Y\) jakauman parametri \(p\) on tuntematon, jolloin sitä on estimoitava. Sekä binomijakauman ja otoskeskiarvon odotusarvo tunnetaan, jolloin

(1)¶\[\rE(Y) = \rE(\overline{Y}) = p,\]

missä

\[\overline{Y} = \frac{1}{n}\sum_{i = 1}^{n}Y_i = \frac{X}{n}.\]

Satunnaismuuttuja \(\hat{P} = \frac{1}{n}X\) on siis suhteellisen osuuden \(p\) harhaton estimaattori. Tässä binomijakaumaa noudattava \(X\) kuvaa onnistumisien frekvenssiä \(n\)-toistokokeessa, joten \(\hat{P}\) edustaa niiden suhteellista frekvenssiä. Muuttujan \(\hat{P}\) varianssi

\[\Var(\hat{P}) = \Var(\overline{Y}) = \frac{\Var(Y)}{n} = \frac{p(1 - p)}{n},\]

ja koska \(\hat{P} = \overline{Y}\), niin keskeisen raja-arvolauseen nojalla

\[\hat{P} \stackrel{.}{\sim} \rN\left(p, \frac{p(1 - p)}{n}\right),\]

kun otoskoko \(n\) on riittävän suuri.

Valitaan luottamustasoksi \(1 - \alpha\). Edellisen perusteella päätellään, että standardoitu suhteellinen osuus

\[Z = \frac{\hat{P} - p}{\sqrt{p(1 - p)/n}} \sim \rN(0, 1),\]

jolloin löydetään luku \(z_{\alpha/2}\), jolle \(P(Z > z_{\alpha/2}) = \frac{\alpha}{2}\). Normaalijakauman symmetrisyyden vuoksi myös \(P(Z < -z_{\alpha/2}) = \frac{\alpha}{2}\), ja täten

\[P\left(-z_{\alpha/2} < \frac{\hat{P} - p}{\sqrt{p(1 - p)/n}} < z_{\alpha/2}\right) = 1 - \alpha.\]

Toisin kuin odotusarvon ja varianssin tapauksissa, suhteellista osuutta \(p\) ei voida täsmällisesti rajata vain estimaattorista \(\hat{P}\) riippuvien päätepisteiden väliin. Menetellään sen sijaan seuraavasti. Juuri johdetusta seuraa, että

\[P\left(\hat{P} - z_{\alpha/2}\sqrt{\frac{p(1 - p)}{n}} < p < \hat{P} + z_{\alpha/2}\sqrt{\frac{p(1 - p)}{n}}\right) = 1 - \alpha.\]

Kun \(n\) on suuri, suhteellisen osuuden \(p\) harhattoman estimaattorin \(\hat{P}\) varianssi on niin pieni, että sille realisoituvat arvot ovat tyypillisesti hyvin lähellä parametrin \(p\) todellista arvoa. Siksi korvataan \(p\) neliöjuurilausekkeessa sen estimaattorilla \(\hat{P}\) ja todetaan, että

\[P\left(\hat{P} - z_{\alpha/2}\sqrt{\frac{\hat{P}(1 - \hat{P})}{n}} < p < \hat{P} + z_{\alpha/2}\sqrt{\frac{\hat{P}(1 - \hat{P})}{n}}\right) \approx 1 - \alpha.\]

Lause 5.7.1

Oletetaan, että \(X\sim\Bin(n,p)\). Parametrin \(p\) \(100(1-\alpha)~\%\):n väliestimaattori on likimain

\[\left[\hat{P}-z_{\alpha/2}\sqrt{\frac{\hat{P}(1-\hat{P})}{n}}, \hat{P}+z_{\alpha/2}\sqrt{\frac{\hat{P}(1-\hat{P})}{n}}\right],\]

missä \(\Phi(z_{\alpha/2})=1-\frac{\alpha}{2}\). Jos suhteelliselle osuudelle \(\hat{P}\) realisoituu arvo \(\hat{p}\), niin parametrin \(p\) \(100(1 - \alpha)~\%\):n luottamusväli on likimain

\[\left[\hat{p}-z_{\alpha/2}\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}, \hat{p}+z_{\alpha/2}\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\right].\]

Esimerkki 5.7.2

Tietyllä reitillä \(124\) yhteensä \(140\) viikottaisesta lennosta sujui ilman ongelmia (myöhästymisiä, huonoa säätä, laiterikkoja). Laske \(99~\%\):n luottamusväli todennäköisyydelle, jolla satunnaisesti valittu lento onnistuu ilman mainittuja vaikeuksia.

Piilota/näytä ratkaisu

Olkoon \(p\) todennäköisyys sille, että satunnaisesti valittu lento onnistuu, jolloin havaintoaineistossa ongelmattomien lentojen lukumäärä \(X\sim\Bin(140,p)\). Piste-estimaatti parametrille \(p\) saadaan laskettua ongelmattomien lentojen suhteellisena frekvenssinä

\[\hat{p} = \frac{124}{140} \approx 0.886.\]

Luottamustasoa \(99~\%\) vastaa \(\alpha = 0.01\). Likimääräisen luottamusvälin kaavassa

\[\left[\hat{p}-z_{\alpha/2}\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}, \hat{p}+z_{\alpha/2}\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\right]\]

esiintyvä luku \(z_{\alpha/2} \approx 2.5758\) saadaan taulukosta tai esimerkiksi Matlab- ja R-komennoilla norminv(1 - 0.01/2) ja qnorm(1 - 0.01/2). Näin onnistuneen lennon todennäköisyyden \(99~\%\):n luottamusväli on likimain

\[\begin{split}\begin{aligned} &\left[0.886-2.5758 \cdot \sqrt{\frac{0.886 \cdot (1-0.886)}{140}}, 0.886+2.5758\sqrt{\frac{0.886 \cdot (1-0.886)}{140}}\right] \\ &\approx [0.816, 0.955]. \end{aligned}\end{split}\]

Matlabilla tämän esimerkin laskut saa laskemalla kaavassa esiintyvät arvot

   ph = 124/140 % p:n estimaatti
   ph+norminv([0.005, 0.995])*sqrt(ph*(1-ph)/140)

R:llä tämän esimerkin laskut saa laskemalla kaavassa esiintyvät arvot

   ph <- 124/140 # p:n estimaatti
   ph+qnorm(0.005)*sqrt(ph*(1-ph)/140) # alaraja
   ph+qnorm(0.995)*sqrt(ph*(1-ph)/140) # yläraja

R:llä mosaic-paketista löytyy funktio binom.test, joka suorittaa suhteelliseen osuuteen liittyviä testejä. Niitä on useita erilaisia ja tässä monisteessa esiteltyä menetelmää kutsutaan usein Waldin menetelmäksi. Ota käyttöön mosaic-paketti library(mosaic)ja komennolla

   binom.test(x=124, n=140, conf.level=0.99, ci.method="Wald")

saadaan tuloksena mm. tämä sama luottamusväli.

Huomautus 5.7.3

Tässä esitelty luottamusväli binomijakauman todennäköisyysparametrille on hyvä approksimaatio vain, kun otoskoko on riittävän suuri. Pienemmille (ja suuremmillekin) otoksille on kehitetty myös tarkempia luottamusvälin kaavoja, jotka on toteutettu monissa tilastotieteen ohjelmistoissa (R, SPSS). Matlabin funktio

   [phat,pci] = binofit(124,140,0.01)

käyttää ns. Clopper-Pearson menetelmää luottamusvälin laskemiseen ja tuottaa myös joissakin tilanteissa tarkemman arvion luottamusvälille. R:n paketin mosaic komennossa binom.test olevaan parametriin ci.method voi antaa arvoksi jonkin arvoista "Clopper-Pearson", "binom.test", "Score", "Wilson", "prop.test", "Wald", "Agresti-Coull", "Plus4", jotka antavat erilaisia arvoja luottamusväleille. R:n paketissa stats on myös funktio binom.test, mutta siinä ei voi valita menetelmää luottamusvälin laskemiseen, vaan se käyttää Clopper-Pearson-menetelmää, joka on myös oletusarvo mosaic-paketin komennossa.