Loading [MathJax]/jax/output/CommonHTML/jax.js
Tämä kurssi on jo päättynyt.

Varianssien testaus

Olkoon X1,X2,,Xn otos satunnaismuuttujasta XN(μ,σ2), jonka odotusarvo ja varianssi ovat tuntemattomia. Varianssin nollahypoteesin

H0:σ2=σ20

testaaminen lähtee liikkeelle havainnosta, että sen sisältävä otossuure

(n1)S2σ2χ2(n1).

Nollahypoteesin ollessa voimassa siis testisuureeksi saadaan

W=(n1)S2σ20χ2(n1),

missä n on otoskoko ja S2 muuttujan X otosvarianssi. Riippuen vaihtoehtoisesta hypoteesista merkitsevyystasoa α vastaava kriittinen alue valitaan yksi- tai kaksiosaisena ei-symmetrisen χ2-jakauman toisesta tai molemmista reunoista. Kriittisen alueen muodot ja p-arvot on tiivistetty seuraavaan taulukkoon, jossa testisuureelle W realisoitunutta arvoa merkitään symbolilla w, ja merkinnöillä w1,γ ja w2,γ tarkoitetaan lukuja, joille P(W<w1,γ)=γ ja P(W<w2,γ)=1γ.

H1kriittinen aluep-arvoσ2<σ20[0,w1,α)P(W<w)σ2>σ20(w2,α,)1P(W<w)σ2σ20[0,w1,α/2)(w2,α/2,)2min{P(W<w),1P(W<w)}

Esimerkki 6.3.1

Oletetaan, että mittaustulos X on normaalijakaumasta XN(μ,σ2) ja että aikaisempien tulosten perusteella varianssiksi on arvioitu σ2=1100. Nyt halutaan tietää, onko varianssi pysynyt ennallaan ja suoritetaan 11 mittausta ja saadaan mittaustulokset 453,460,351,421,339,439,402,422,470,310,416. Suorita hypoteesin testaus 1 %:n merkitsevyystasolla.

Näytä/piilota ratkaisu

Nyt nollahypoteesi on muotoa H0:σ2=1100 ja α=0,01. Realisoitunut otosvarianssi s22761,1 (esimerkiksi Matlabin funktio var). Tämän perusteella näyttäisi siltä, että jos varianssi on muuttunut, se on kasvanut. Valitaan vaihtoehtoiseksi hypoteesiksi siis H1:σ2>1100.

Testisuure ja sen jakauma on

W=(n1)S2σ2χ2(10),

ja testisuureelle realisoituu arvo w25,1007. Kriittinen alue on jakauman oikeassa reunassa, ja taulukon vapausastelukua 10 vastaavalta riviltä, tai Matlabin komennolla chi2inv(1 - 0.01, 10) (R-komennolla qchisq(1 - 0.01, 10)) arvioidaan, että w2,α23,2093. Kriittinen alue on siis väli (23,2093,) ja testisuureen realisoitunut arvo kuuluu sille. Nollahypoteesi hylätään ja päätellään, että todellinen varianssi on todennäköisesti suurempi kuin 1100. Testin p-arvoksi voidaan laskea Matlab-komennolla

1 - chi2cdf(25.1007, 10)

tai R-komennolla

1 - pchisq(25.1007, 10)

p=1P(W<w)0,0052, mikä luonnollisesti johtaa samaan johtopäätökseen.

Tehtävää ladataan...

Kahden varianssin yhtäsuuruuden testaus

Myös kahden populaation varianssien yhtäsuuruutta voidaan testata, mutta sitä varten tarvitaan uusi jakauma.

Määritelmä 6.3.2

Jatkuva satunnaismuuttuja F noudattaa F-jakaumaa vapausasteluvuin n1 ja n2 (F distribution with parameters n1 and n2), FF(n1,n2), jos sen tiheysfunktio

f(x)=Γ(n1+n22)Γ(n12)Γ(n22)(n1n2)n12xn122(1+n1n2x)n1+n22,kun xΩ=R+,

missä Γ(t)=0exxt1dx on Eulerin gammafunktio. F-jakaumaa kutsutaan myös Fisherin tai Snedecorin jakaumaksi.

Liitetaulukoista löytyy tai valmisohjelmien (Matlab, R) funktioilla voi laskea muuttujan FF(n1,n2) kertymäfunktion F(x)=P(Fx) ja sen käänteisfunktion arvoja.

Esimerkki 6.3.3

Oletetaan, että FF(10,15) ja tutkitaan mitä ovat luvut f1 ja f2, kun P(Ff1)=0,95 ja P(Ff2)=0,01. Taulukoiden arvot on rajattu kertymäfunktioiden arvoihin 0,95, 0,975 ja 0,99, jolloin ensimmäisestä taulukosta luetaan, että f12,54 ja kolmannesta että f23,80. Matlabin komentojen

finv(0.95, 10, 15), finv(1 - 0.01, 10, 15)

tai R-ohjelmiston komentojen

qf(0.95, 10, 15), qf(1 - 0.01, 10, 15)

avulla saadaan tarkemmat likiarvot f12,5437 ja f23,8049.

Harjoitustehtäväksi jätetään osoittaa, että jos FF(n1,n2), niin

1FF(n2,n1).

Sen seurauksena ehto P(Fx)=α on yhtäpitävää ehdon P(1F1x)=α, eli

P(1F1x)=1α.

Tämä laajentaa F-jakauman taulukoiden käyttökelpoisuutta myös tapauksiin, joissa kertymäfunktion arvo P(Fx){0,05,0,025,0,01}. Yksinkertaisempaa, tarkempaa ja yleisemmin toimivaa on kuitenkin hyödyntää esimerkiksi ohjelmistoihin toteutettuja kertymäfunktion käänteisfunktioita.

Erityisesti kahden χ2-jakautuneen satunnaismuuttujan sopivasti painotettu osamäärä on F-jakautunut.

Lause 6.3.4

Oletetaan, että satunnaismuuttujat W1χ2(n1) ja W2χ2(n2) ovat riippumattomia. Tällöin satunnaismuuttuja

F=W1/n1W2/n2F(n1,n2).

F-jakaumaa käytetään normaalijakautuneiksi oletettujen satunnaismuuttujien varianssien yhtäsuuruuden testaamiseen seuraavan tuloksen perusteella.

Lause 6.3.5

Olkoot X1,X2,,Xn ja Y1,Y2,,Ym otoksia riippumattomista satunnaismuuttujista XN(μX,σ2X) ja YN(μY,σ2Y). Tällöin

F=S2X/σ2XS2Y/σ2YF(n1,m1),

missä S2X ja S2Y ovat muuttujien X ja Y otosvarianssit.

Näytä/piilota todistus

Koska muuttujat X ja Y ovat riippumattomia, myös S2X ja S2Y ovat riippumattomia. Lauseen 5.3.8 mukaan

(n1)S2Xσ2Xχ2(n1)ja(m1)S2Yσ2Yχ2(m1),

joten edellisen lauseen nojalla

(n1)S2X/σ2Xn1(m1)S2Y/σ2Ym1=S2X/σ2XS2Y/σ2YF(n1,m1),

kuten väitettiinkin.

Jos nyt X1,X2,,Xn ja Y1,Y2,,Ym ovat otoksia riippumattomista normaalijakautuneista muuttujista X ja Y, joiden tuntemattomat varianssit ovat σ2X ja σ2Y, niin

S2X/σ2XS2Y/σ2YF(n1,m1),

missä S2X ja S2Y ovat muuttujien X ja Y otosvarianssit. Yhtäsuuruustestin nollahypoteesiksi asetetaan H0:σ2X=σ2Y, ja sen voimassa ollessa

F=S2X/σ2XS2Y/σ2Y=S2XS2YF(n1,m1),

joten valitaan se testisuureeksi. Riippuen vaihtoehtoisesta hypoteesista merkitsevyystasoa α vastaava kriittinen alue valitaan yksi- tai kaksiosaisena epäsymmetrisen F-jakauman toisesta tai molemmista reunoista. Kriittisten alueiden muodot ja p-arvot on tiivistetty seuraavaan taulukkoon, jossa testisuureelle F realisoitunutta arvoa merkitään symbolilla f, ja merkinnöillä f1,γ ja f2,γ tarkoitetaan lukuja, joille P(F<f1,γ)=γ ja P(F<f2,γ)=1γ.

H1kriittinen aluep-arvoσ2X<σ2Y[0,f1,α)P(F<f)σ2X>σ2Y(f2,α,)1P(F<f)σ2Xσ2Y[0,f1,α/2)(f2,α/2,)2min{P(F<f),1P(F<f)}

Esimerkki 6.3.6

Kurssin A tenttiin osallistui 51 opiskelijaa ja tulosten otosvarianssi s2A=478. Rinnakkaisen kurssin B tenttiin osallistui 26 opiskelijaa otosvarianssin ollessa s2B=372. Voidaanko näitä havaintoja pitää näyttönä siitä, että tenttitulosten varianssit rinnakkaisilla kursseilla ovat erisuuret? Pistemäärien jakaumat oletetaan normaaleiksi.

Näytä/piilota ratkaisu

Testataan siis hypoteesiparia H0:σ2A=σ2B ja H1:σ2Aσ2B. Valitaan merkitsevyystasoksi α=0,05, ja testisuureeksi

F=S2AS2BF(50,25),

jolle realisoituu arvo f=4783721,2849. Kriittinen alue on [0,f1,α/2)(f2,α/2,), missä päätepisteiksi ratkaistaan Matlabin komennolla

finv([0.05/2, 1 - 0.05/2], 50, 25)

tai R-ohjelmiston komennoilla

qf(0.05/2, 50, 25), qf(1 - 0.05/2, 50, 25)

arvot f1,α/20,5212 ja f2,α/22,0787. Testisuureelle realisoitunut arvo jää siis kriittisen alueen [0,0,5212)(2,0787,) ulkopuolelle, joten nollahypoteesi jää voimaan. Vastaavasti p-arvoksi lasketaan Matlab-komennolla

2 * min([fcdf(1.2849, 50, 25), 1 - fcdf(1.2849, 50, 25)])

tai R-komennolla

2 * min(pf(1.2849, 50, 25), 1 - pf(1.2849, 50, 25))

arvo p0,5033, joka on selvästi suurempi kuin riskitaso α. Tulosten valossa kurssien tenttien variansseja voidaan siis pitää yhtä suurina.

Palautusta lähetetään...