- MATH.APP.210
- 5. Otosjakaumat ja estimointi
- 5.6 Normaalijakauman varianssin luottamusväli
Normaalijakauman varianssin luottamusväli¶
Olkoon X_1,X_2,\ldots,X_n otos satunnaismuuttujasta X\sim\rN(\mu, \sigma^2), jonka odotusarvo ja varianssi ovat tuntemattomia. Nyt lauseen 5.3.7 mukaan
Olkoon 1-\alpha valittu luottamustaso. \chi^2-jakauma on epäsymmetrinen, joten todennäköisyyden tasapainottamiseksi tarvitaan kaksi sellaista lukua w_1 ja w_2, että
Tällöin
tai kun varianssi \sigma^2 ratkaistaan epäyhtälöparista, niin
Lause 5.6.1
Olkoon X_1,X_2,\ldots,X_n otos satunnaismuuttujasta X\sim\rN(\mu, \sigma^2). Varianssin \sigma^2
100(1-\alpha)~\%:n väliestimaattori on
missä luvut w_1 ja w_2 on valittu siten, että P(W<w_1)=\frac{\alpha}{2} ja P(W>w_2)=\frac{\alpha}{2}, kun W\sim\chi^2(n-1). Jos otosvarianssille realisoituu arvo s^2, niin varianssin 100(1-\alpha)~\%:n luottamusväli on
Esimerkki 5.6.2
Kolmenkymmenen lasilevyn otoksessa saatiin paksuuden otosvarianssiksi 0.0645. Paksuuden oletetaan olevan normaalijakautunut. Laske paksuuden varianssille 95~\%:n luottamusväli.
Luottamustasoa 95~\% vastaa \alpha = 0.05. Luvut w_1 \approx 16.0471 ja w_2 \approx 45.7223 varianssin luottamusvälin kaavassa
saadaan taulukosta vapausastelukua 30 - 1 = 29 vastaavalta riviltä, tai esimerkiksi Matlabilla/R:llä. Nyt sijoittamalla saadaan varianssin 95~\%:n luottamusväliksi
Huomaa, kuinka varianssin luottamusväli ei ole symmetrinen otosvarianssille realisoituneen arvon ympärillä.
Matlabilla luottamusvälin saa käyttämällä kaavaa ja annettuja arvoja
29*0.0645./chi2inv([0.975, 0.025],29)
Huomaa piste jakomerkin edessä. Tämä tarvitaan, kun jakajana on vektori ja jakolasku suoritetaan vektorin komponenteittain.
Vastaavat luvut R:llä saadaan
29*0.0645/qchisq(0.975,29) # alaraja 29*0.0645/qchisq( 0.025,29) # yläraja
Esimerkki 5.6.3
Jos luottamusväli lasketaan suoraan havaintoaineistosta, voidaan ohjelmalla ensin laskea otosvarianssi ja otoskoko ja sitten toistaa edellä olevat laskut.
Kun käsiteltävän muuttujan arvot on tallennettu pystyvektoriksi data
, niin varianssin 95~\%:n luottamusväli saadaan Matlabilla
v = var(data) n = length(data) ci = (n-1)*v./chi2inv([0.975, 0.025],n-1)
Otosvarianssin luottamusvälin saa myös valmiin Matlab-funktion normfit
avulla. Funktion antaa vastauksena otoskeskiarvon, otoshajonnan ja niiden luottamusvälit. Esimerkiksi
[muHat,sigmaHat,muCI,sigmaCI] = normfit(data,0.05)
antaa vastauksena vektoriin sigmaCI
otoshajonnan 95% luottamusvälin. Luottamusaste 1-\alpha (=0.95) annetaan parametrilla \alpha (=0.05). Varianssin luottamusväli saadaan korottamalla arvot toiseen potenssiin.
sigmaCI.^2 % varianssin luottamusväli
R:llä luottamusvälin saa samalla tavalla laskien ensin tunnusluvut
m <- mean(data) v <- var(data) n <- length(data) (n-1)*v/qchisq(0.975,(n-1)) # alaraja (n-1)*v/qchisq( 0.025,(n-1)) # yläraja
Otosvarianssin ja luottamusvälin saa myös valmiin R-funktion avulla seuraavasti. Tämä funktio löytyy EnvStats-paketista, joka täytyy asentaa koneelle ennen ensimmäistä käyttökertaa komennolla install.packages('EnvStats')
. Jokaisen istunnon aluksi paketti otetaan käyttöön komennolla
library(EnvStats)
, jonka jälkeen kaikki paketin funktiot ovat käytettävissä. Paketissa on mm. funktio varTest
, joka suorittaa varianssiin liittyviä tilastollisia testejä. Komennolla
varTest(data, conf.level = 0.95)
saadaan tuloksia, jotka sisältävät mm. otosvarianssin ja sen 95% luottamusvälin.