Processing math: 100%
Tämä kurssi on jo päättynyt.

Luottamusvälit

Edellä käsitellyt otoksen X1,X2,,Xn perusteella määritellyt otoskeskiarvo ¯X ja otosvarianssi S2 ovat satunnaismuuttujansa odotusarvon μ ja varianssin σ2 estimaattoreita. Ne ovat satunnaismuuttujia, joille realisoituu jokin arvo, kun otosmuuttujille mitataan arvot x1,x2,,xn, ja tätä arvoa kutsutaan odotusarvon tai varianssin piste-estimaatiksi. Sekä otoskeskiarvo että otosvarianssi ovat parametrinsa harhattomia (unbiased) estimaattoreita, eli niille realisoituvat arvot eivät systemaattisesti poikkea estimoitavan parametrin arvosta.

Estimaattoreiden ja estimaattien laskemista otoksen perusteella kutsutaan estimoinniksi. Tarkoituksena on saada arvioiduksi jokin populaatioon liittyvä numeerinen arvo eli parametri θ mitattua otosta käyttämällä. Piste-estimointi antaa vastaukseksi yhden arvon, josta ei voi päätellä mitään estimaatin tarkkuudesta. Tyypillisempi estimoinnin muoto onkin luottamusväliestimointi, jossa otoksen perusteella lasketaan reaalilukuväli, jolla oikean parametrin θ arvon luotetaan olevan.

Määritelmä 5.4.1

Satunnaismuuttujan X parametrin θ 100(1α) %:n väliestimaattori on satunnaisväli [^θ1,^θ2], missä ˆθ1=ˆθ1(X1,X2,,Xn) ja ˆθ2=ˆθ2(X1,X2,,Xn) ovat sellaisia satunnaismuuttujan X otoksesta X1,X2,,Xn riippuvia välin päätepisteitä, että

P(ˆθ1θˆθ2)=1α.

Realisoitunutta väliä [θ1,θ2] sanotaan silloin parametrin θ 100(1α) %:n luottamusväliksi (confidence interval). Luku 1α on välin luottamusaste (degree of confidence) ja päätepisteet ovat välin ylempi ja alempi luottamusraja.

Huomautus 5.4.2

Nopeasti ajateltuna luottamusvälin käsite voi kuulostaa siltä, että kyseessä on reaalilukuväli, jolle parametrin θ todellinen arvo kuuluu todennäköisyydellä 1α. Tämä on kuitenkin väärä tulkinta. Kun otos on valittu, niin saadaan yksi luottamusväli, jonka päätepisteet ovat kiinteät reaaliluvut. Koska parametri θ on myös tietty reaaliluku (vaikkakin tavallisesti tuntematon), parametri θ joko sisältyy luottamusväliin tai sitten ei.

Parametriin θ liittyvä väliestimaattori [ˆθ1,ˆθ2] muodostuu oikeastaan satunnaismuuttujista ˆθ1 ja ˆθ2, joille realisoituu otoksen valinnasta riippuen erilaisia arvoja. Jos otoksia kerättäisiin hyvin monta kappaletta, niin niiden perusteella lasketuista luottamusväleistä 100(1α) % sisältää parametrin θ todellisen arvon.

Mitä suurempaa luottamusastetta vaaditaan, sitä leveämmäksi luottamusväli tulee. Lisäksi väliestimaattorin määritelmä ei vielä kerro, mikä ehdon P(ˆθ1θˆθ2)=1α toteuttavista väleistä tulisi valita. Useimmiten vaaditaan, että väli on todennäköisyyden sijoittumisen suhteen symmetrinen, eli

P(θˆθ1)=P(θˆθ2)=α2.

Usein käytettyjä luottamustasoja ovat 90 %, 95 % ja 99 %, joita vastaavat niin sanotut riskitasot α=0,1, α=0,05 ja α=0,01. Väliestimoinnin toteuttaminen perustuu siihen, löydetään estimoitavaan parametriin liittyvä otossuure (satunnaismuuttuja), jonka jakauma tunnetaan. Seuraavissa luvuissa kuvaillaan tyypillisimpiin jakaumien parametreihin liittyvien luottamusväliestimaattien muodostamista.

Luottamusväli on
Studentin t-jakaumaa noudattavan satunnaismuuttujan T tiheysfunktio on yksihuippuinen ja symmetrinen. Tällöin
Palautusta lähetetään...