- MAT-01530
- 7. Tilastollinen testaaminen
- 7.2 Odotusarvojen testaus
Odotusarvojen testaus¶
Odotusarvon testaus, varianssi tunnettu¶
Olkoon \(X_1,X_2,\ldots,X_n\) on otos muuttujasta \(X\sim\rN(\mu,\sigma^2)\), missä varianssi \(\sigma^2\) tunnetaan, ja asetetaan nollahypoteesiksi \(H_0: \mu=\mu_0\). Tällöin otoskeskiarvo \(\overline{X} \sim \rN\left(\mu, \frac{\sigma^2}{n}\right)\) ja erityisesti
joten nollahypoteesin ollessa voimassa
Valitaan siis testisuureeksi \(Z\). Vaihtoehtoisen hypoteesin muodosta riippuen kriittinen alue on standardinormaalijakauman toisessa tai molemmissa reunoissa oleva joukko, johon liittyvä todennäköisyys on valitun merkitsevyystason \(\alpha\) suuruinen. Eri vaihtoehtoisia hypoteeseja vastaavat kriittiset alueet ja \(p\)-arvot on tiivistetty seuraavaan taulukkoon. Siinä testisuureelle \(Z\) realisoitunutta arvoa merkitään symbolilla \(z\), ja merkinnöillä \(z_{\alpha}\) ja \(z_{\alpha/2}\) tarkoitetaan lukuja, joille \(\Phi(z_{\alpha}) = 1 - \alpha\) ja \(\Phi(z_{\alpha/2}) = 1 - \frac{\alpha}{2}\).
\(H_1\) | kriittinen alue | \(p\)-arvo |
---|---|---|
\(\mu < \mu_0\) | \((-\infty, -z_{\alpha})\) | \(\Phi(z)\) |
\(\mu > \mu_0\) | \((z_{\alpha}, \infty)\) | \(1 - \Phi(z)\) |
\(\mu \not= \mu_0\) | \((-\infty, -z_{\alpha/2}) \cup (z_{\alpha/2}, \infty)\) | \(2\min\{\Phi(z), 1 - \Phi(z)\}\) |
Esimerkki 7.2.1
Seudun vuotuisen sademäärän \(X\) (cm) keskiarvoksi \(100\) vuoden ajalta on saatu \(106{,}0\) ja keskihajonnaksi \(15{,}3\), ja oletetaan, että \(X\sim\rN(106{,}0, 15{,}3^2)\). Viimeisen \(5\) vuoden sademäärän keskiarvoksi on saatu \(89{,}3\). Millä todennäköisyydellä tällainen tulos olisi odotettavissa, jos keskisademäärissä ei ole tapahtunut muutosta? Onko syytä epäillä, että seudun sääolosuhteissa on tapahtunut pysyvänluonteinen muutos?
On testattava nollahypoteesia \(H_0 : \mu = 106{,}0\), missä \(\mu\) on sademäärän \(X\) todellinen odotusarvo viimeisen viiden vuoden ajalta. Mittaustulos \(\overline{x} = 89{,}3\) viittaisi siihen, että mahdollinen muutos olisi sademäärän pienentyminen, joten asetetaan vaihtoehtoiseksi hypoteesiksi \(H_1: \mu < 106{,}0\). Valitaan testin merkitsevyystasoksi \(\alpha = 0{,}01\).
Nollahypoteesin ollessa voimassa vuoden sademäärä \(X\sim\rN(106{,}0, 15{,}3^2)\), joten viiden vuoden sademäärän standardoitu otoskeskiarvo
jolle realisoituu arvo \(z \approx -2{,}4407\). Valitaan testisuureeksi \(Z\). Kysytty todennäköisyys on testin \(p\)-arvo
jolle lasketaan komennolla normcdf(-2.4407)
(Matlab), qnorm(-2.4407)
(R) tai taulukosta katsomalla likiarvo \(p \approx 0{,}0073\). Koska \(p < 0{,}01\), nollahypoteesi hylätään ja vaihtoehtoinen hypoteesi \(\mu < 106{,}0\) astuu voimaan. Johtopäätöksenä todetaan, että seudun keskisademäärä on vähentynyt.
Tarkastellaan saman hypoteesin testaamista vielä kriittisen alueen avulla. Vaihtoehtoisen hypoteesin muodon vuoksi kriittinen alue on jakauman \(\rN(0, 1)\) vasemmassa reunassa oleva reaalilukuväli \((-\infty, -z_{\alpha})\), jonka ylärajassa \(z_{\alpha}\) toteuttaa ehdon
missä yhteys \(\Phi(2{,}3263) \approx 0{,}99\) ratkaistaan komennolla norminv(0.99)
tai luetaan karkeampi likiarvo taulukosta. Testisuureen \(Z\) kriittiseksi alueeksi saadaan siis \((-\infty, -2{,}3263)\), ja koska realisoitunut testisuureen arvo \(z\) on tällä välillä, nollahypoteesi on hylättävä.
Huomautus 7.2.2
Keskeinen raja-arvolause takaa, että riittävän suurilla otoksilla minkä tahansa satunnaismuuttujan \(X\) otoskeskiarvo \(\overline{X}\) noudattaa likimain normaalijakaumaa. Tämän vuoksi edellinen menetelmä soveltuu rajoitetusti myös muille kuin normaalijakaumaa noudattaville satunnaismuuttujille.
Odotusarvon testaus, varianssi tuntematon¶
Kun normaalijakauman varianssi on tuntematon, joudutaan sen sijaan käyttämään otosvarianssia ja luottamusvälin konstruoimisessa \(t\)-jakaumaa. Satunnaismuuttuja
ja nollahypoteesin \(\mu = \mu_0\) ollessa voimassa
joten valitaan testisuureeksi \(T\). Vaihtoehtoisen hypoteesin muodosta riippuen kriittinen alue on \(t(n-1)\)-jakauman toisessa tai molemmissa reunoissa oleva joukko, johon liittyvä todennäköisyys on valitun merkitsevyystason \(\alpha\) suuruinen. Eri vaihtoehtoisia hypoteeseja vastaavat kriittiset alueet ja \(p\)-arvot on tiivistetty seuraavaan taulukkoon. Siinä testisuureelle \(T\) realisoitunutta arvoa merkitään symbolilla \(t\), ja merkinnöillä \(t_{\alpha}\) ja \(t_{\alpha/2}\) tarkoitetaan lukuja, joille \(P(T < t_{\alpha}) = 1 - \alpha\) ja \(P(T < t_{\alpha/2}) = 1 - \frac{\alpha}{2}\).
\(H_1\) | kriittinen alue | \(p\)-arvo |
---|---|---|
\(\mu < \mu_0\) | \((-\infty, -t_{\alpha})\) | \(P(T < t)\) |
\(\mu > \mu_0\) | \((t_{\alpha}, \infty)\) | \(1 - P(T < t)\) |
\(\mu \not= \mu_0\) | \((-\infty, -t_{\alpha/2}) \cup (t_{\alpha/2}, \infty)\) | \(2\min\{P(T < t), 1 - P(T < t)\}\) |
Esimerkki 7.2.3
Tehtaan ilmoituksen mukaan venttilivarren halkaisija noudattaa normaalijakaumaa ja on keskimäärin \(8{,}040\) mm. Tehdas ottaa uudesta tuotantoerästään \(40\) kappaleen otoksen tutkiakseen, onko tuotantoerän laatu yhtä hyvä kuin alkuperäisillä. Otoskeskiarvoksi saatiin \(\overline{x}=8{,}038\) mm ja otoskeskihajonnaksi \(s=0{,}006\) mm. Pitäisikö erä päästää markkinoille, jos väärän hylkäyspäätöksen riskiksi sallitaan \(5~\%\)?
Testataan nollahypoteesia \(H_0: \mu = 8{,}040\) riskitasolla (merkitsevyystasolla) \(\alpha = 0{,}05\). Koska halutaan selvittää, onko halkaisija muuttunut, mutta muutoksen suunta on epäselvä, valitaan vaihtoehtoiseksi hypoteesiksi \(H_1 : \mu \neq 8{,}040\).
Varianssi on tuntematon, joten käytetään testisuuretta
jolle nollahypoteesin ollessa voimassa realisoituu arvo
Testi on kaksisuuntainen, joten kriittinen alue koostuu kahdesta osasta. Taulukkoon ei ole merkitty riviä vapausasteluvulle \(39\), joten sitä käytettäessä testisuureen \(T\) oikeaa jakaumaa joudutaan approksimoimaan jakaumalla \(t(40)\). Matlabin komennolla
tinv(1 - 0.05/2, 39)
tai R-komennolla
qt(1 - 0.05/2, 39)
ratkaistaan \(t_{\alpha/2} \approx 2{,}0227\), joten \(t\)-jakauman symmetrisyyden perusteella kriittinen alue on \((-\infty, -2{,}0227) \cup (2.0227, \infty)\). Testisuureelle realisoitunut arvo osuu kriittiselle alueelle, joten hylätään nollahypoteesi ja todetaan, että venttiilivarren halkaisija on muuttunut ilmoitetusta. Varovaisena toimijana tehtaan ei siis tulisi päästää erää markkinoille.
Tutkitaan sitten vielä \(p\)-arvon avulla pienintä riskitasoa, jolla nollahypoteesi hylättäisiin. Kaksisuuntaiselle testille
jolle Matlabin
2 * min([tcdf(-2.108, 39), 1 - tcdf(-2.108, 39)])
ja R-ohjelmiston
2 * min(pt(-2.108, 39), 1 - pt(-2.108, 39))
antavat arvoksi \(p \approx 0{,}0415\). Siis esimerkiksi merkitsevyystasolla \(\alpha = 0{,}01\) nollahypoteesia ei hylätä, ja erä voitaisiin antaa myyntiin! Tämä ei silti kerro koko totuutta, sillä riskitason (tyypin I virheen todennäköisyyden) pienentyessä tyypin II virheen todennäköisyys kasvaa. Sallimalla vain pienempi \(1~\%\) väärän hylkäyksen riski onnistutaan kasvattamaan väärän hyväksynnän riskiä.
Kahden odotusarvon yhtäsuuruuden testaus¶
Olkoot \(X_1,X_2,\dots,X_n\) ja \(Y_1,Y_2,\dots,Y_m\) otoksia satunnaismuuttujista \(X\sim\rN(\mu_X,\sigma_X^2)\) ja \(Y\sim\rN(\mu_Y,\sigma_Y^2)\), ja pyritään vertailemaan odotusarvoja \(\mu_X\) ja \(\mu_Y\) tilastollisen testauksen keinoin. Kun tarkoitus on tutkia, ovatko populaatioiden odotusarvot yhtäsuuret, testataan nollahypoteesia
Otoskeskiarvot \(\overline{X}\) ja \(\overline{Y}\) ovat normaalijakautuneita, joten lauseen 6.1.3 mukaan
Kun varianssit oletetaan tunnetuiksi, nollahypoteesin testaamiseksi saadaan testisuure
Jos varianssit \(\sigma_X^2\) ja \(\sigma_Y^2\) ovat tuntemattomia, mutta ne voidaan olettaa yhtä suuriksi, eli \(\sigma_X^2 = \sigma_Y^2 = \sigma^2\), voidaan satunnaismuuttujien \(X\) ja \(Y\) otosvarianssien \(S_X^2\) ja \(S_Y^2\) avulla muodostaa niin sanottu yhteisotosvarianssi
joka on yhteisen varianssin \(\sigma^2\) harhaton estimaattori. Korvaamalla tunnettujen varianssien testisuureen \(Z\) lausekkeessa varianssit \(\sigma_X^2\) ja \(\sigma_Y^2\) yhteisotosvarianssilla saadaan \(t\)-jakautunut testisuure
Molempien testisuureiden jakaumat ovat symmetrisiä, joten merkitsevyystasoa \(\alpha\) vastaava kriittinen alue määräytyy vaihtoehtoisen hypoteesin mukaisesti samaan tapaan kuin yksittäisen odotusarvon testeissä jakauman toisesta tai molemmista reunoista.
Esimerkki 7.2.4
Olkoon \(4{,}1, 4{,}2, 4{,}8, 4{,}6, 4{,}9\) otos muuttujasta \(X\sim\rN(\mu_X,\sigma_X^2)\) ja olkoon \(3{,}9, 5{,}1, 4{,}4, 4{,}2\) otos muuttujasta \(Y\sim\rN(\mu_Y,\sigma_Y^2)\). Testaa hypoteesiparia
\(5~\%\):n riskitasolla, kun varianssit \(\sigma_X^2\) ja \(\sigma_Y^2\) oletetaan yhtä suuriksi.
Otosten perusteella lasketaan (Matlab/R, mean
ja var
), että
Koska todellisia variansseja ei tunneta, lasketaan yhteisotosvarianssi
Tällöin testisuure
ja sille realisoituu arvo \(t \approx 0{,}417\). Kriittisen alueen rajaksi määritetään \(t_{\alpha/2} \approx 2{,}3646\) komennolla tinv(1 - 0.05/2, 7)
(Matlab) tai qt(1 - 0.05/2, 7)
(R), jolloin kriittinen alue on kaksiosainen \((-\infty, -2{,}3646) \cup (2{,}3646, \infty)\). Testisuureen arvo ei kuulu kriittiselle alueelle, joten \(H_0\) jää voimaan ja testin perusteella satunnaismuuttujilla \(X\) ja \(Y\) on sama odotusarvo.
Kaksisuuntaisen testin \(p\)-arvoksi saadaan Matlab-komennolla
2 * min([tcdf(0.417, 7), 1 - tcdf(0.417, 7)])
tai R-komennolla
2 * min(pt(0.417, 7), 1 - pt(0.417, 7))
varsin korkea \(p \approx 0{,}6891 \geq \alpha\), missä \(\alpha\) on mikä vain tyypillinen merkitsevyystaso.