- MATH.APP.210
- 6. Tilastollinen testaaminen
- 6.3 Varianssien testaus
Varianssien testaus¶
Olkoon X_1,X_2,\ldots,X_n otos satunnaismuuttujasta X\sim\rN(\mu, \sigma^2), jonka odotusarvo ja varianssi ovat tuntemattomia. Varianssin nollahypoteesin
testaaminen lähtee liikkeelle havainnosta, että sen sisältävä otossuure
Nollahypoteesin ollessa voimassa siis testisuureeksi saadaan
missä n on otoskoko ja S^2 muuttujan X otosvarianssi. Riippuen vaihtoehtoisesta hypoteesista merkitsevyystasoa \alpha vastaava kriittinen alue valitaan yksi- tai kaksiosaisena ei-symmetrisen \chi^2-jakauman toisesta tai molemmista reunoista. Kriittisen alueen muodot ja p-arvot on tiivistetty seuraavaan taulukkoon, jossa testisuureelle W realisoitunutta arvoa merkitään symbolilla w, ja merkinnöillä w_{1, \gamma} ja w_{2, \gamma} tarkoitetaan lukuja, joille P(W < w_{1, \gamma}) = \gamma ja P(W < w_{2, \gamma}) = 1 - \gamma.
Esimerkki 6.3.1
Oletetaan, että mittaustulos X on normaalijakaumasta X\sim\rN(\mu, \sigma^2) ja että aikaisempien tulosten perusteella varianssiksi on arvioitu \sigma^2=1100. Nyt halutaan tietää, onko varianssi pysynyt ennallaan ja suoritetaan 11 mittausta ja saadaan mittaustulokset 453, 460, 351, 421, 339, 439, 402, 422, 470, 310, 416. Suorita hypoteesin testaus 1~\%:n merkitsevyystasolla.
Nyt nollahypoteesi on muotoa H_0 : \sigma^2=1100 ja \alpha = 0{,}01. Realisoitunut otosvarianssi s^2 \approx 2761{,}1 (esimerkiksi Matlabin funktio var
). Tämän perusteella näyttäisi siltä, että jos varianssi on muuttunut, se on kasvanut. Valitaan vaihtoehtoiseksi hypoteesiksi siis H_1 : \sigma^2>1100.
Testisuure ja sen jakauma on
ja testisuureelle realisoituu arvo w \approx 25{,}1007. Kriittinen alue on jakauman oikeassa reunassa, ja taulukon vapausastelukua 10 vastaavalta riviltä, tai Matlabin komennolla chi2inv(1 - 0.01, 10)
(R-komennolla qchisq(1 - 0.01, 10)
) arvioidaan, että w_{2, \alpha} \approx 23{,}2093. Kriittinen alue on siis väli (23{,}2093, \infty) ja testisuureen realisoitunut arvo kuuluu sille. Nollahypoteesi hylätään ja päätellään, että todellinen varianssi on todennäköisesti suurempi kuin 1100. Testin p-arvoksi voidaan laskea Matlab-komennolla
1 - chi2cdf(25.1007, 10)
tai R-komennolla
1 - pchisq(25.1007, 10)
p = 1 - P(W < w) \approx 0{,}0052, mikä luonnollisesti johtaa samaan johtopäätökseen.
Kahden varianssin yhtäsuuruuden testaus¶
Myös kahden populaation varianssien yhtäsuuruutta voidaan testata, mutta sitä varten tarvitaan uusi jakauma.
Määritelmä 6.3.2
Jatkuva satunnaismuuttuja F noudattaa \rF-jakaumaa vapausasteluvuin n_1 ja n_2 (\rF distribution with parameters n_1 and n_2), F \sim \rF(n_1, n_2), jos sen tiheysfunktio
missä \Gamma(t) = \int_{0}^{\infty}e^{-x}x^{t - 1}\,\rd x on Eulerin gammafunktio. \rF-jakaumaa kutsutaan myös Fisherin tai Snedecorin jakaumaksi.
Liitetaulukoista löytyy tai valmisohjelmien (Matlab, R) funktioilla voi laskea muuttujan F \sim \rF(n_1, n_2) kertymäfunktion F(x)=P(F\leq x) ja sen käänteisfunktion arvoja.
Esimerkki 6.3.3
Oletetaan, että F \sim \rF(10, 15) ja tutkitaan mitä ovat luvut f_1 ja f_2, kun P(F \leq f_1) = 0{,}95 ja P(F \geq f_2) = 0{,}01. Taulukoiden arvot on rajattu kertymäfunktioiden arvoihin 0{,}95, 0{,}975 ja 0{,}99, jolloin ensimmäisestä taulukosta luetaan, että f_1 \approx 2{,}54 ja kolmannesta että f_2 \approx 3{,}80. Matlabin komentojen
finv(0.95, 10, 15), finv(1 - 0.01, 10, 15)
tai R-ohjelmiston komentojen
qf(0.95, 10, 15), qf(1 - 0.01, 10, 15)
avulla saadaan tarkemmat likiarvot f_1 \approx 2{,}5437 ja f_2 \approx 3{,}8049.
Harjoitustehtäväksi jätetään osoittaa, että jos F \sim \rF(n_1, n_2), niin
Sen seurauksena ehto P(F \leq x) = \alpha on yhtäpitävää ehdon P\left(\frac{1}{F} \geq \frac{1}{x}\right) = \alpha, eli
Tämä laajentaa \rF-jakauman taulukoiden käyttökelpoisuutta myös tapauksiin, joissa kertymäfunktion arvo P(F \leq x) \in \{0{,}05, 0{,}025, 0{,}01\}. Yksinkertaisempaa, tarkempaa ja yleisemmin toimivaa on kuitenkin hyödyntää esimerkiksi ohjelmistoihin toteutettuja kertymäfunktion käänteisfunktioita.
Erityisesti kahden \chi^2-jakautuneen satunnaismuuttujan sopivasti painotettu osamäärä on \rF-jakautunut.
Lause 6.3.4
Oletetaan, että satunnaismuuttujat W_1\sim\chi^2(n_1) ja W_2\sim\chi^2(n_2) ovat riippumattomia. Tällöin satunnaismuuttuja
\rF-jakaumaa käytetään normaalijakautuneiksi oletettujen satunnaismuuttujien varianssien yhtäsuuruuden testaamiseen seuraavan tuloksen perusteella.
Lause 6.3.5
Olkoot X_1, X_2, \ldots, X_n ja Y_1, Y_2, \ldots, Y_m otoksia riippumattomista satunnaismuuttujista X \sim \rN(\mu_X, \sigma_X^2) ja Y \sim \rN(\mu_Y, \sigma_Y^2). Tällöin
missä S_X^2 ja S_Y^2 ovat muuttujien X ja Y otosvarianssit.
Koska muuttujat X ja Y ovat riippumattomia, myös S_X^2 ja S_Y^2 ovat riippumattomia. Lauseen 5.3.8 mukaan
joten edellisen lauseen nojalla
kuten väitettiinkin.
Jos nyt X_1, X_2, \ldots, X_n ja Y_1, Y_2, \ldots, Y_m ovat otoksia riippumattomista normaalijakautuneista muuttujista X ja Y, joiden tuntemattomat varianssit ovat \sigma_X^2 ja \sigma_Y^2, niin
missä S_X^2 ja S_Y^2 ovat muuttujien X ja Y otosvarianssit. Yhtäsuuruustestin nollahypoteesiksi asetetaan H_0 : \sigma_X^2 = \sigma_Y^2, ja sen voimassa ollessa
joten valitaan se testisuureeksi. Riippuen vaihtoehtoisesta hypoteesista merkitsevyystasoa \alpha vastaava kriittinen alue valitaan yksi- tai kaksiosaisena epäsymmetrisen \rF-jakauman toisesta tai molemmista reunoista. Kriittisten alueiden muodot ja p-arvot on tiivistetty seuraavaan taulukkoon, jossa testisuureelle F realisoitunutta arvoa merkitään symbolilla f, ja merkinnöillä f_{1, \gamma} ja f_{2, \gamma} tarkoitetaan lukuja, joille P(F < f_{1, \gamma}) = \gamma ja P(F < f_{2, \gamma}) = 1 - \gamma.
Esimerkki 6.3.6
Kurssin A tenttiin osallistui 51 opiskelijaa ja tulosten otosvarianssi s_A^2=478. Rinnakkaisen kurssin B tenttiin osallistui 26 opiskelijaa otosvarianssin ollessa s_B^2=372. Voidaanko näitä havaintoja pitää näyttönä siitä, että tenttitulosten varianssit rinnakkaisilla kursseilla ovat erisuuret? Pistemäärien jakaumat oletetaan normaaleiksi.
Testataan siis hypoteesiparia H_0: \sigma_A^2=\sigma_B^2 ja H_1: \sigma_A^2\neq \sigma_B^2. Valitaan merkitsevyystasoksi \alpha=0{,}05, ja testisuureeksi
jolle realisoituu arvo f = \frac{478}{372} \approx 1{,}2849. Kriittinen alue on [0, f_{1, \alpha/2}) \cup (f_{2, \alpha/2}, \infty), missä päätepisteiksi ratkaistaan Matlabin komennolla
finv([0.05/2, 1 - 0.05/2], 50, 25)
tai R-ohjelmiston komennoilla
qf(0.05/2, 50, 25), qf(1 - 0.05/2, 50, 25)
arvot f_{1, \alpha/2} \approx 0{,}5212 ja f_{2, \alpha/2} \approx 2{,}0787. Testisuureelle realisoitunut arvo jää siis kriittisen alueen [0, 0{,}5212) \cup (2{,}0787, \infty) ulkopuolelle, joten nollahypoteesi jää voimaan. Vastaavasti p-arvoksi lasketaan Matlab-komennolla
2 * min([fcdf(1.2849, 50, 25), 1 - fcdf(1.2849, 50, 25)])
tai R-komennolla
2 * min(pf(1.2849, 50, 25), 1 - pf(1.2849, 50, 25))
arvo p \approx 0{,}5033, joka on selvästi suurempi kuin riskitaso \alpha. Tulosten valossa kurssien tenttien variansseja voidaan siis pitää yhtä suurina.