Processing math: 100%
Tämä kurssi on jo päättynyt.

Hypoteesit ja testaaminen

Tilastollisella hypoteesilla tarkoitetaan jotain populaatiojakauman ominaisuutta, joko sillä on tai sitten ei ole. Usein tällainen ominaisuus koskee jakauman parametreja tai todennäköisyyksiä. Hypoteesia testatessa pyritään selvittämään otosta käyttäen, onko tämä hypoteesi tosi vai ei. Koska testaus perustuu satunnaisotoksiin, johtopäätös ei koskaan ole varma.

Tavallisesti testaamisen aluksi asetetaan nollahypoteesi H0 (null hypothesis) ja tälle vaihtoehtoinen hypoteesi H1 (alternative hypothesis). Testi suoritetaan aina sillä oletuksella, että nollahypoteesi pitää paikkansa. Jos myöhemmin saadaan vahvaa näyttöä siitä, että H0 ei pidäkään paikkaansa, niin se hylätään ja johtopäätöksenä hyväksytään H1. Muussa tapauksessa nollahypoteesi jää voimaan. Tällaisen päättelyn tuloksena tehty johtopäätös voi olla virheellinen kahdella tavalla.

  1. Tyypin I virhe (hylkäämisvirhe): hylätään H0, vaikka se on tosi.
  2. Tyypin II virhe (hyväksymisvirhe): H0 jää voimaan, vaikka se on väärä.
H0 on tosiH0 on vääräH0 hyväksytäänoikea johtopäätöstyypin II virheH0 hylätääntyypin I virheoikea johtopäätös

Tyypin I virheen todennäköisyyttä α sanotaan testin riskitasoksi eli merkitsevyydeksi (risk, level of significance, size of the test). Tavallisesti riskitaso asetetaan etukäteen ja suhteellisen pieneksi: tyypillisiä valintoja ovat α=0,05=5 %, α=0,01=1 % ja α=0,001=0,1 %. Tällä valinnalla korostetaan sitä testaamisen perusoletusta, että nollahypoteesin oletetaan olevan tosi ja vasta riittävän suuri poikkeama aiheuttaa nollahypoteesin hylkäämisen.

Tyypin II virheen todennäköisyyttä β ei useinkaan voida laskea. Toivottavaa olisi, että virheiden todennäköisyydet olisivat molemmat mahdollisimman pieniä, mutta todennäköisyyden α pienentyessä β kasvaa ja kääntäen. Otoskoon kasvattaminen pienentää molempien virheiden todennäköisyyttä: suurempi otos edustaa paremmin koko populaatiota ja johtopäätökset ovat varmemmin oikein. Tilastollisen testin tarkoituksena on kuitenkin tutkia populaatiota helpommin tutkittavan otoksen avulla. Lukua 1β kutsutaan testin voimakkuudeksi (power).

Tehtävää ladataan...

Varsin usein hypoteesi koskee jakauman parametria θ ja nollahypoteesiksi asetetaan muotoa H0:θ=θ0 oleva väite. Vaihtoehtoisen hypoteesin tarkoituksena on kiistää tämä, eli se voi olla

H1:θθ0,H1:θ<θ0taiH1:θ>θ0.

Riskitasolla α tämän tyyppisten hypoteesien testaus palautuu parametrin θ 100(1α) %:n luottamusvälin, luottamusalarajan tai luottamusylärajan määrittämiseen.

Testaamista varten tarvitaan satunnaismuuttujan X otoksesta X1,X2,,Xn riippuva satunnaismuuttuja, eli testisuure t=t(X1,X2,,Xn) (test statistics), jonka jakauma tunnetaan nollahypoteesin ollessa voimassa. Tyypillisesti testisuureeksi valitaan jokin testattavan parametrin sisältävä lauseke, ja siinä esiintyy testin satunnaismuuttujaan liittyvä otossuure. Seuraavissa luvuissa keskitytään juuri testattavaan hypoteesiin liittyvän testisuureen oikeaan valintaan.

Kun oikea testisuure on valittu, määritetään sen harvinaisten arvojen joukko, eli kriittinen alue (critical region) C, jolle ehdollinen todennäköisyys

P(tCH0 on tosi)=α.

Todennäköisyys, että testisuureen arvo kuuluu kriittiselle alueelle on siis riskitason α suuruinen. Koska hyväksymisvirhe β pyritään minimoimaan, kriittinen alue valitaan testisuureen jakauman reunoilta. Riippuen vaihtoehtoisen hypoteesin muodosta, testi on joko yksi- tai kaksisuuntainen (one-tailed, two-tailed test). Yksisuuntaisessa testissä vaihtoehtoinen hypoteesi on muotoa

H1:θ<θ0taiH1:θ>θ0,

ja yksiosainen kriittinen alue sijaitsee joko jakauman oikeassa tai vasemmassa reunassa.

../_images/yksisuuntainen_testi2.svg
../_images/yksisuuntainen_testi1.svg

Kaksisuuntaisessa testissä vaihtoehtoinen hypoteesi on muotoa

H1:θθ0,

ja kaksiosainen kriittinen alue sijaitsee puoliksi jakauman molemmissa reunoissa.

../_images/kaksisuuntainen_testi.svg

Testisuureelle lasketaan otoksen perusteella arvo, jota verrataan kriittiseen alueeseen. Jos arvo on kriittisellä alueella, nollahypoteesi on todennäköisesti väärä ja se hylätään. Jos arvo ei kuulu kriittiselle alueelle, niin se on “tavallinen” arvo ja oletettua nollahypoteesiä ei ole perusteita epäillä.

Testauksen tulos voidaan ilmoittaa myös käyttäen niin sanottua p-arvoa (p-value). Testin p-arvo on pienin riskitaso, jolla H0 tulee hylätä. Tällöin nollahypoteesi hylätään merkitsevyystasolla α, jos p<α. Jos puolestaan pα, niin nollahypoteesi jää voimaan. Yksisuuntaisessa testauksessa p-arvo on realisoitunutta testisuuretta vastaava häntätodennäköisyys. Kaksisuuntaisessa testissä valitaan realisoitunutta testisuuretta vastaavista häntätodennäköisyyksistä pienempi ja kerrotaan se kahdella.

Yhteenvetona voidaan todeta seuraavat tilastollisen testaamisen vaiheet.

  1. Asetetaan testattava hypoteesipari H0 ja H1, sekä oletetaan että nollahypoteesi H0 on voimassa.
  2. Valitaan testin merkitsevyystaso α, tavallisesti jokin luvuista 0,05, 0,01 tai 0,001.
  3. Valitaan testattavaan parametriin liittyvä testisuure t, jonka jakauma tunnetaan, kun nollahypoteesi oletetaan todeksi. Lasketaan sille realisoitunut arvo.
  4. Määritetään kriittinen alue vaihtoehtoisen hypoteesin perusteella, tai lasketaan p-arvo jos mahdollista.
  5. Jos testisuureen t arvo osuu kriittiselle alueelle, tai p<α, niin hylätään H0 ja hyväksytään H1. Muussa tapauksessa H0 jää voimaan.

Edellä esitetty kriittisen alueen määrääminen tai p-arvon laskeminen voidaan tehdä ohjelmistoihin toteutettujen jakaumien kertymäfunktioiden ja niiden käänteisfunktioiden, tai sitten jakaumataulukoiden avulla. Monet tilastolliset ohjelmistot laskevat suoraan testin p-arvon, mutta niiden käyttäjän vastuulle jää tehdä oikeat tulkinnat ja huomioida testin yksi- tai kaksisuuntaisuus.

Palautusta lähetetään...