Processing math: 100%

Hypoteesit ja testaaminen

Tilastollisella hypoteesilla tarkoitetaan jotain populaatiojakauman ominaisuutta, joko sillä on tai sitten ei ole. Usein tällainen ominaisuus koskee jakauman parametreja tai todennäköisyyksiä. Hypoteesia testatessa pyritään selvittämään otosta käyttäen, onko tämä hypoteesi tosi vai ei. Koska testaus perustuu satunnaisotoksiin, johtopäätös ei koskaan ole täysin varma.

Tavallisesti testaamisen aluksi asetetaan nollahypoteesi H0 (null hypothesis) ja tälle vaihtoehtoinen hypoteesi eli vastahypoteesi H1 (alternative hypothesis). Testi suoritetaan aina sillä oletuksella, että nollahypoteesi pitää paikkansa. Jos myöhemmin saadaan vahvaa näyttöä siitä, että H0 ei pidäkään paikkaansa, niin se hylätään ja johtopäätöksenä hyväksytään H1. Muussa tapauksessa nollahypoteesi jää voimaan. Tällaisen päättelyn tuloksena tehty johtopäätös voi olla virheellinen kahdella tavalla.

  1. Tyypin I virhe (hylkäämisvirhe): hylätään H0, vaikka se on tosi.
  2. Tyypin II virhe (hyväksymisvirhe): H0 jää voimaan, vaikka se on väärä.
H0 on tosiH0 on vääräH0 hyväksytäänoikea johtopäätöstyypin II virheH0 hylätääntyypin I virheoikea johtopäätös

Tyypin I virheen todennäköisyyttä α sanotaan testin merkitsevyystasoksi eli riskitasoksi (risk, level of significance, size of the test). Tavallisesti merkitsevyystaso asetetaan etukäteen ja suhteellisen pieneksi: tyypillisiä valintoja ovat α=0.05=5 %, α=0.01=1 % ja α=0.001=0.1 %. Tällä valinnalla korostetaan sitä testaamisen perusoletusta, että nollahypoteesin oletetaan olevan tosi ja vasta riittävän suuri poikkeama aiheuttaa nollahypoteesin hylkäämisen.

Tyypin II virheen todennäköisyyttä β ei useinkaan voida laskea. Toivottavaa olisi, että virheiden todennäköisyydet olisivat molemmat mahdollisimman pieniä, mutta todennäköisyyden α pienentyessä β kasvaa ja kääntäen. Otoskoon kasvattaminen pienentää molempien virheiden todennäköisyyttä: suurempi otos edustaa paremmin koko populaatiota ja johtopäätökset ovat varmemmin oikein. Tilastollisen testin tarkoituksena on kuitenkin tutkia populaatiota helpommin tutkittavan otoksen avulla. Lukua 1β kutsutaan testin voimakkuudeksi (voimaksi) (power).

Mikä seuraavista väitteistä kuvaa parhaiten tilastollista testaamista?
Eräässä testitilanteessa valitaan riskitaso α ja otoskoko n. Millä seuraavista valinnoista mahdollisuus hylkäämisvirheen tekemiseen on suurimmillaan?
Entä millä valinnalla mahdollisuus hyväksymisvirheen tekemiseen on suurimmillaan?

Varsin usein hypoteesi koskee jakauman parametria θ ja nollahypoteesiksi asetetaan muotoa H0:θ=θ0 oleva väite. Vaihtoehtoisen hypoteesin tarkoituksena on kiistää tämä, eli se voi olla

H1:θθ0,H1:θ<θ0taiH1:θ>θ0.

Merkitsevyystasolla α tämän tyyppisten hypoteesien testaus on samankaltainen tilanne kuin parametrin θ100(1α) %:n luottamusvälin, luottamusalarajan tai luottamusylärajan määrittäminen.

Testaamista varten tarvitaan satunnaismuuttujan X otoksesta X1,X2,,Xn riippuva satunnaismuuttuja, eli testisuure t=t(X1,X2,,Xn) (test statistics), jonka jakauma tunnetaan nollahypoteesin ollessa voimassa. Tyypillisesti testisuureeksi valitaan jokin testattavan parametrin sisältävä lauseke, ja siinä esiintyy testin satunnaismuuttujaan liittyvä otossuure. Seuraavissa luvuissa keskitytään juuri testattavaan hypoteesiin liittyvän testisuureen oikeaan valintaan.

Kun oikea testisuure on valittu, määritetään sen harvinaisten arvojen joukko, eli kriittinen alue eli hylkäysalue (critical region) C, jolle ehdollinen todennäköisyys

P(tCH0 on tosi)=α.

Todennäköisyys, että testisuureen arvo kuuluu kriittiselle alueelle on siis merkitsevyystason α suuruinen. Koska hyväksymisvirhe β pyritään minimoimaan, kriittinen alue valitaan testisuureen jakauman reunoilta. Riippuen vaihtoehtoisen hypoteesin muodosta, testi on joko yksi- tai kaksisuuntainen (one-tailed, two-tailed test). Yksisuuntaisessa testissä vaihtoehtoinen hypoteesi on muotoa

H1:θ<θ0taiH1:θ>θ0,

ja yksiosainen kriittinen alue sijaitsee joko jakauman oikeassa tai vasemmassa reunassa.

../_images/yksisuuntainen_testi1ja2.svg

Kaksisuuntaisessa testissä vaihtoehtoinen hypoteesi on muotoa

H1:θθ0,

ja kaksiosainen kriittinen alue sijaitsee puoliksi jakauman molemmissa reunoissa.

../_images/kaksisuuntainen_testi.svg

Testisuureelle lasketaan otoksen perusteella arvo, jota verrataan kriittiseen alueeseen. Jos arvo on kriittisellä alueella, nollahypoteesi on todennäköisesti väärä ja se hylätään. Jos arvo ei kuulu kriittiselle alueelle, niin se on “tavallinen” arvo ja oletettua nollahypoteesiä ei ole perusteita epäillä.

Testauksen tulos voidaan ilmoittaa myös käyttäen havaittua merkitsevyystasoa (observed level of significance) eli p-arvoa (p-value). Tällöin kriittistä aluetta ei tarvitse määrittää. Testin p-arvo on pienin merkitsevyystaso, jolla H0 tulee hylätä. Tällöin nollahypoteesi hylätään merkitsevyystasolla α, jos p<α. Jos puolestaan pα, niin nollahypoteesi jää voimaan. Yksisuuntaisessa testauksessa p-arvo on realisoitunutta testisuuretta vastaava häntätodennäköisyys. Kaksisuuntaisessa testissä valitaan realisoitunutta testisuuretta vastaavista häntätodennäköisyyksistä pienempi ja kerrotaan se kahdella.

Kuvassa on havainnollistettu yksisuuntaisen testin p-arvoa väritetyn alueen pinta-alana.

../_images/parvo.svg
Testataan satunnaismuuttujan X jakauman parametriin θ (esimerkiksi normaalijakauman tapauksessa odotusarvoon μ) liittyvää väitettä. Mikä on tyypillisin valinta nollahypoteesiksi H0, jos a on jokin reaaliluku?
Käytetään testauksessa yksisuuntaista testiä, jonka kriittinen alue on jakauman oikeassa laidassa. Mikä on silloin ollut vaihtoehtoinen hypoteesi H1?
Testitilanteessa A on testattu täysin eri asiaa kuin testitilanteessa B. Tilanteessa A on saatu p-arvo pA=0,0178 ja tilanteessa B p-arvo pB=0,0762. Mitkä seuraavista väitteistä ovat totta?

Yhteenvetona voidaan todeta seuraavat tilastollisen testaamisen vaiheet.

  1. Asetetaan testattava hypoteesipari H0 ja H1, sekä oletetaan että nollahypoteesi H0 on voimassa.
  2. Valitaan testin merkitsevyystaso α, tavallisesti jokin luvuista 0.05, 0.01 tai 0.001.
  3. Valitaan testattavaan parametriin liittyvä testisuure t, jonka jakauma tunnetaan, kun nollahypoteesi oletetaan todeksi. Lasketaan sille otoksen perusteella realisoitunut arvo.
  4. Määritetään kriittinen alue vaihtoehtoisen hypoteesin perusteella, tai lasketaan p-arvo jos mahdollista.
  5. Jos testisuureen t arvo osuu kriittiselle alueelle, tai p<α, niin hylätään H0 ja hyväksytään H1. Muussa tapauksessa H0 jää voimaan.

Edellä esitetty kriittisen alueen määrääminen tai p-arvon laskeminen voidaan tehdä ohjelmistoihin toteutettujen jakaumien kertymäfunktioiden ja niiden käänteisfunktioiden, tai sitten jakaumataulukoiden avulla. Monet tilastolliset ohjelmistot laskevat suoraan testin p-arvon, mutta niiden käyttäjän vastuulle jää tehdä oikeat tulkinnat ja huomioida testin yksi- tai kaksisuuntaisuus.

Palautusta lähetetään...