\[\newcommand{\N}{\mathbb N} \newcommand{\Z}{\mathbb Z} \newcommand{\Q}{\mathbb Q} \newcommand{\R}{\mathbb R} \newcommand{\C}{\mathbb C} \newcommand{\ba}{\mathbf{a}} \newcommand{\bb}{\mathbf{b}} \newcommand{\bc}{\mathbf{c}} \newcommand{\bd}{\mathbf{d}} \newcommand{\be}{\mathbf{e}} \newcommand{\bff}{\mathbf{f}} \newcommand{\bh}{\mathbf{h}} \newcommand{\bi}{\mathbf{i}} \newcommand{\bj}{\mathbf{j}} \newcommand{\bk}{\mathbf{k}} \newcommand{\bN}{\mathbf{N}} \newcommand{\bn}{\mathbf{n}} \newcommand{\bo}{\mathbf{0}} \newcommand{\bp}{\mathbf{p}} \newcommand{\bq}{\mathbf{q}} \newcommand{\br}{\mathbf{r}} \newcommand{\bs}{\mathbf{s}} \newcommand{\bT}{\mathbf{T}} \newcommand{\bu}{\mathbf{u}} \newcommand{\bv}{\mathbf{v}} \newcommand{\bw}{\mathbf{w}} \newcommand{\bx}{\mathbf{x}} \newcommand{\by}{\mathbf{y}} \newcommand{\bz}{\mathbf{z}} \newcommand{\bzero}{\mathbf{0}} \newcommand{\nv}{\mathbf{0}} \newcommand{\cA}{\mathcal{A}} \newcommand{\cB}{\mathcal{B}} \newcommand{\cC}{\mathcal{C}} \newcommand{\cD}{\mathcal{D}} \newcommand{\cE}{\mathcal{E}} \newcommand{\cF}{\mathcal{F}} \newcommand{\cG}{\mathcal{G}} \newcommand{\cH}{\mathcal{H}} \newcommand{\cI}{\mathcal{I}} \newcommand{\cJ}{\mathcal{J}} \newcommand{\cK}{\mathcal{K}} \newcommand{\cL}{\mathcal{L}} \newcommand{\cM}{\mathcal{M}} \newcommand{\cN}{\mathcal{N}} \newcommand{\cO}{\mathcal{O}} \newcommand{\cP}{\mathcal{P}} \newcommand{\cQ}{\mathcal{Q}} \newcommand{\cR}{\mathcal{R}} \newcommand{\cS}{\mathcal{S}} \newcommand{\cT}{\mathcal{T}} \newcommand{\cU}{\mathcal{U}} \newcommand{\cV}{\mathcal{V}} \newcommand{\cW}{\mathcal{W}} \newcommand{\cX}{\mathcal{X}} \newcommand{\cY}{\mathcal{Y}} \newcommand{\cZ}{\mathcal{Z}} \newcommand{\rA}{\mathrm{A}} \newcommand{\rB}{\mathrm{B}} \newcommand{\rC}{\mathrm{C}} \newcommand{\rD}{\mathrm{D}} \newcommand{\rE}{\mathrm{E}} \newcommand{\rF}{\mathrm{F}} \newcommand{\rG}{\mathrm{G}} \newcommand{\rH}{\mathrm{H}} \newcommand{\rI}{\mathrm{I}} \newcommand{\rJ}{\mathrm{J}} \newcommand{\rK}{\mathrm{K}} \newcommand{\rL}{\mathrm{L}} \newcommand{\rM}{\mathrm{M}} \newcommand{\rN}{\mathrm{N}} \newcommand{\rO}{\mathrm{O}} \newcommand{\rP}{\mathrm{P}} \newcommand{\rQ}{\mathrm{Q}} \newcommand{\rR}{\mathrm{R}} \newcommand{\rS}{\mathrm{S}} \newcommand{\rT}{\mathrm{T}} \newcommand{\rU}{\mathrm{U}} \newcommand{\rV}{\mathrm{V}} \newcommand{\rW}{\mathrm{W}} \newcommand{\rX}{\mathrm{X}} \newcommand{\rY}{\mathrm{Y}} \newcommand{\rZ}{\mathrm{Z}} \newcommand{\pv}{\overline} \newcommand{\iu}{\mathrm{i}} \newcommand{\ju}{\mathrm{j}} \newcommand{\im}{\mathrm{i}} \newcommand{\e}{\mathrm{e}} \newcommand{\real}{\operatorname{Re}} \newcommand{\imag}{\operatorname{Im}} \newcommand{\Arg}{\operatorname{Arg}} \newcommand{\Ln}{\operatorname{Ln}} \DeclareMathOperator*{\res}{res} \newcommand{\re}{\operatorname{Re}} \newcommand{\im}{\operatorname{Im}} \newcommand{\arsinh}{\operatorname{ar\,sinh}} \newcommand{\arcosh}{\operatorname{ar\,cosh}} \newcommand{\artanh}{\operatorname{ar\,tanh}} \newcommand{\sgn}{\operatorname{sgn}} \newcommand{\diag}{\operatorname{diag}} \newcommand{\proj}{\operatorname{proj}} \newcommand{\rref}{\operatorname{rref}} \newcommand{\rank}{\operatorname{rank}} \newcommand{\Span}{\operatorname{span}} \newcommand{\vir}{\operatorname{span}} \renewcommand{\dim}{\operatorname{dim}} \newcommand{\alg}{\operatorname{alg}} \newcommand{\geom}{\operatorname{geom}} \newcommand{\id}{\operatorname{id}} \newcommand{\norm}[1]{\lVert #1 \rVert} \newcommand{\tp}[1]{#1^{\top}} \renewcommand{\d}{\mathrm{d}} \newcommand{\sij}[2]{\bigg/_{\mspace{-15mu}#1}^{\,#2}} \newcommand{\abs}[1]{\lvert#1\rvert} \newcommand{\pysty}[1]{\left[\begin{array}{@{}r@{}}#1\end{array}\right]} \newcommand{\piste}{\cdot} \newcommand{\qedhere}{} \newcommand{\taumatrix}[1]{\left[\!\!#1\!\!\right]} \newenvironment{augmatrix}[1]{\left[\begin{array}{#1}}{\end{array}\right]} \newenvironment{vaugmatrix}[1]{\left|\begin{array}{#1}}{\end{array}\right|} \newcommand{\trans}{\mathrm{T}} \newcommand{\EUR}{\text{\unicode{0x20AC}}} \newcommand{\SI}[3][]{#2\,\mathrm{#3}} \newcommand{\si}[2][]{\mathrm{#2}} \newcommand{\num}[2][]{#2} \newcommand{\ang}[2][]{#2^{\circ}} \newcommand{\meter}{m} \newcommand{\metre}{\meter} \newcommand{\kilo}{k} \newcommand{\kilogram}{kg} \newcommand{\gram}{g} \newcommand{\squared}{^2} \newcommand{\cubed}{^3} \newcommand{\minute}{min} \newcommand{\hour}{h} \newcommand{\second}{s} \newcommand{\degreeCelsius}{^{\circ}C} \newcommand{\per}{/} \newcommand{\centi}{c} \newcommand{\milli}{m} \newcommand{\deci}{d} \newcommand{\percent}{\%} \newcommand{\Var}{\operatorname{Var}} \newcommand{\Cov}{\operatorname{Cov}} \newcommand{\Corr}{\operatorname{Corr}} \newcommand{\Tasd}{\operatorname{Tasd}} \newcommand{\Ber}{\operatorname{Ber}} \newcommand{\Bin}{\operatorname{Bin}} \newcommand{\Geom}{\operatorname{Geom}} \newcommand{\Poi}{\operatorname{Poi}} \newcommand{\Hyperg}{\operatorname{Hyperg}} \newcommand{\Tas}{\operatorname{Tas}} \newcommand{\Exp}{\operatorname{Exp}} \newcommand{\tdist}{\operatorname{t}} \newcommand{\rd}{\mathrm{d}}\]

Normaalijakauman varianssin luottamusväli

Olkoon \(X_1,X_2,\ldots,X_n\) otos satunnaismuuttujasta \(X\sim\rN(\mu, \sigma^2)\), jonka odotusarvo ja varianssi ovat tuntemattomia. Nyt lauseen 5.3.7 mukaan

\[W = \frac{(n-1)S^2}{\sigma^2}\sim\chi^2(n-1)\]

Olkoon \(1-\alpha\) valittu luottamustaso. \(\chi^2-\)jakauma on epäsymmetrinen, joten todennäköisyyden tasapainottamiseksi tarvitaan kaksi sellaista lukua \(w_1\) ja \(w_2\), että

\[P(W<w_1)=\frac{\alpha}{2} \qquad\text{ja}\qquad P(W>w_2)=\frac{\alpha}{2}.\]
../_images/chi2luottamusvali.svg

Tällöin

\[P\left(w_1<\frac{(n-1)S^2}{\sigma^2}<w_2\right)=1-\alpha,\]

tai kun varianssi \(\sigma^2\) ratkaistaan epäyhtälöparista, niin

\[P\left(\frac{(n-1)S^2}{w_2} <\sigma^2 < \frac{(n-1)S^2}{w_1} \right) = 1-\alpha.\]

Lause 5.6.1

Olkoon \(X_1,X_2,\ldots,X_n\) otos satunnaismuuttujasta \(X\sim\rN(\mu, \sigma^2)\). Varianssin \(\sigma^2\)

\(100(1-\alpha)~\%\):n väliestimaattori on

\[\left[\frac{(n-1)S^2}{w_2}, \frac{(n-1)S^2}{w_1}\right],\]

missä luvut \(w_1\) ja \(w_2\) on valittu siten, että \(P(W<w_1)=\frac{\alpha}{2}\) ja \(P(W>w_2)=\frac{\alpha}{2}\), kun \(W\sim\chi^2(n-1)\). Jos otosvarianssille realisoituu arvo \(s^2\), niin varianssin \(100(1-\alpha)~\%\):n luottamusväli on

\[\left[\frac{(n-1)s^2}{w_2}, \frac{(n-1)s^2}{w_1}\right].\]

Esimerkki 5.6.2

Kolmenkymmenen lasilevyn otoksessa saatiin paksuuden otosvarianssiksi \(0.0645\). Paksuuden oletetaan olevan normaalijakautunut. Laske paksuuden varianssille \(95~\%\):n luottamusväli.

Luottamustasoa \(95~\%\) vastaa \(\alpha = 0.05\). Luvut \(w_1 \approx 16.0471\) ja \(w_2 \approx 45.7223\) varianssin luottamusvälin kaavassa

\[\left[\frac{(n-1)s^2}{w_2}, \frac{(n-1)s^2}{w_1}\right]\]

saadaan taulukosta vapausastelukua \(30 - 1 = 29\) vastaavalta riviltä, tai esimerkiksi Matlabilla/R:llä. Nyt sijoittamalla saadaan varianssin \(95~\%\):n luottamusväliksi

\[\left[\frac{29 \cdot 0.0645}{45.7223}, \frac{29 \cdot 0.0645}{16.0471}\right] \approx [0.0409, 0.1166].\]

Huomaa, kuinka varianssin luottamusväli ei ole symmetrinen otosvarianssille realisoituneen arvon ympärillä.

Matlabilla luottamusvälin saa käyttämällä kaavaa ja annettuja arvoja

   29*0.0645./chi2inv([0.975, 0.025],29)

Huomaa piste jakomerkin edessä. Tämä tarvitaan, kun jakajana on vektori ja jakolasku suoritetaan vektorin komponenteittain.

Vastaavat luvut R:llä saadaan

   29*0.0645/qchisq(0.975,29) # alaraja
   29*0.0645/qchisq( 0.025,29) # yläraja

Esimerkki 5.6.3

Jos luottamusväli lasketaan suoraan havaintoaineistosta, voidaan ohjelmalla ensin laskea otosvarianssi ja otoskoko ja sitten toistaa edellä olevat laskut. Kun käsiteltävän muuttujan arvot on tallennettu pystyvektoriksi data, niin varianssin \(95~\%\):n luottamusväli saadaan Matlabilla

   v = var(data)
   n = length(data)
   ci = (n-1)*v./chi2inv([0.975, 0.025],n-1)

Otosvarianssin luottamusvälin saa myös valmiin Matlab-funktion normfit avulla. Funktion antaa vastauksena otoskeskiarvon, otoshajonnan ja niiden luottamusvälit. Esimerkiksi

   [muHat,sigmaHat,muCI,sigmaCI] = normfit(data,0.05)

antaa vastauksena vektoriin sigmaCI otoshajonnan 95% luottamusvälin. Luottamusaste \(1-\alpha\) (=0.95) annetaan parametrilla \(\alpha\) (=0.05). Varianssin luottamusväli saadaan korottamalla arvot toiseen potenssiin.

   sigmaCI.^2 % varianssin luottamusväli

R:llä luottamusvälin saa samalla tavalla laskien ensin tunnusluvut

   m <- mean(data)
   v <- var(data)
   n <- length(data)
   (n-1)*v/qchisq(0.975,(n-1)) # alaraja
   (n-1)*v/qchisq( 0.025,(n-1)) # yläraja

Otosvarianssin ja luottamusvälin saa myös valmiin R-funktion avulla seuraavasti. Tämä funktio löytyy EnvStats-paketista, joka täytyy asentaa koneelle ennen ensimmäistä käyttökertaa komennolla install.packages('EnvStats'). Jokaisen istunnon aluksi paketti otetaan käyttöön komennolla library(EnvStats), jonka jälkeen kaikki paketin funktiot ovat käytettävissä. Paketissa on mm. funktio varTest, joka suorittaa varianssiin liittyviä tilastollisia testejä. Komennolla

   varTest(data, conf.level = 0.95)

saadaan tuloksia, jotka sisältävät mm. otosvarianssin ja sen 95% luottamusvälin.

Kahdenkymmenenviiden mämmirasian otoksessa saatiin rasian painon otosvarianssiksi \(2{,}125\). Painon oletetaan olevan normaalijakautunut. Laske painon varianssille \(90~\%\):n luottamusväli.
Palautusta lähetetään...