Processing math: 100%

Suhteellisen osuuden testaus

Oletetaan, että XBin(n,p), missä p on onnistumisen todennäköisyys n-toistokokeen yksittäisessä toistossa. Aikaisemmin on osoitettu, että ˆP=1nX on suhteellisen osuuden p harhaton estimaattori. Muuttujan ˆP odotusarvo ja varianssi ovat

E(ˆP)=p   ja   Var(ˆP)=p(1p)n

Keskeisen raja-arvolauseen nojalla

ˆP.N(p,p(1p)n),

kun otoskoko n on riittävän suuri ja standardoitu suhteellinen osuus

Z=ˆPpp(1p)/nN(0,1).

Usein kiinnostuksen kohteena on suhteellinen osuus p ja siinä tapahtuvat muutokset. Asetetaan nollahypoteesiksi H0:p=p0. Tämän hypoteesin testaamiseen sopii testisuure

Z=ˆPp0p0(1p0)/nN(0,1)

ja testisuureen realisoitunut arvo otoksessa on

z=ˆpp0p0(1p0)/n

Eri vaihtoehtoisia hypoteeseja vastaavat kriittiset alueet ja p-arvot on tiivistetty seuraavaan taulukkoon. Siinä testisuureelle Z realisoitunutta arvoa merkitään symbolilla z, ja merkinnöillä zα ja zα/2 tarkoitetaan lukuja, joille Φ(zα)=1α ja Φ(zα/2)=1α2.

H1kriittinen aluep-arvop<p0(,zα)Φ(z)p>p0(zα,)1Φ(z)pp0(,zα/2)(zα/2,)2min{Φ(z),1Φ(z)}

Esimerkki 6.3.1

Yrityksen markkinaosuus on ollut aikaisemmin 35%. Yritys toteuttaa kyselyn, jossa 200 vastaajasta 82 sanoi käyttävänsä tämä yrityksen palveluja. Voidaanko tämän tuloksen perusteella päätellä, että markkinaosuus on kasvanut.

Nyt nollahypoteesiksi valitaan, että markkinaosuus ei ole muuttunut ja vaihtoehtoinen hypoteesi on, että osuus on kasvanut

H0:p=0.35,H1:p>0.35

Tämän otoksen (=kysely) perusteella laskettu estimaatti markkinaosuudeksi on ˆp=82/200=0.41 ja testisuure oletettaessa nollahypoteesi todeksi on

Z=ˆP0.350.35(10.35)/200N(0,1)

Tämän otoksen (=kysely) perusteella laskettu estimaatti markkinaosuudeksi on ˆp=82/200=0.41 ja siitä laskettu testisuureen arvo z=1.779.

Koska H1:p>0.35, lasketaan parvo jakauman oikeasta reunasta ja p=1Φ(1.779)=0.0376. Tehtävänannossa ei ole mainittu mitään merkitsevyystasosta. Jos merkitsevyystasoksi valittaisiin α=0.05 olisi johtopäätöksenä nollahypoteesin hylkääminen ja markkinaosuus olisi kasvanut. Merkitsevyystasolla α=0.01 nollahypoteesi jäisi voimaan.

Käytettäessä kriittistä aluetta johtopäätöksen tekemiseen saadaan α=0.05 mukaan kriittiseksi alueeksi C=[1.645,), sillä P(z<1.645)=0.95. Alaraja 1.645 saadaan taulukosta, Matlabilla norminv(0.95) tai R:llä qnorm(0.95). Testisuureen arvo z=1.779 osuu kriittiselle alueelle, joten merkitsevyystasolla 0.05 nollahypoteesi hylätään.

Ohjelmilla parvon saa toistamalla laskut. Matlabilla

   z = (0.41-0.35)/sqrt(0.35*(1-0.35)/200) % testisuureen arvo
   p = 1- normcdf(z) % p-arvo

ja R:llä

   z <- (0.41-0.35)/sqrt(0.35*(1-0.35)/200) # testisuureen arvo
   p <- 1- pnorm(z) % p-arvo

R:llä mosaic-paketista löytyy funktio binom.test, joka suorittaa suhteelliseen osuuteen liittyvän testin. Komennolla

   binom.test(x=82, n=200, p=0.35, conf.level=0.95,
              alternative="greater")

saadaan tuloksena mm. testisuureen arvo, sille laskettu luottamusväli ja testin johtopäätös. Saatu p-arvo poikkeaa hieman tässä esimerkissä lasketusta arvosta.

Palautusta lähetetään...