- MATH.APP.210
- 5. Otosjakaumat ja estimointi
- 5.3 Otosvarianssi
Otosvarianssi¶
Satunnaismuuttujan vaihtelua kuvaavat tärkeimmät otossuureet ovat otosvarianssi ja otoskeskihajonta.
Määritelmä 5.3.1
Olkoon X1,X2,…,Xn otos satunnaismuuttujasta X. Satunnaismuuttujan X otosvarianssi (sample variance) on satunnaismuuttuja
ja otoshajonta (sample standard deviation) S=√S2. Näiden satunnaismuuttujien realisoituneita arvoja (reaalilukuja) merkitään
ja s=√s2.
Satunnaismuuttujan X otosvarianssi on sen varianssin harhaton estimaattori.
Lause 5.3.2
Olkoon X1,X2,…,Xn otos satunnaismuuttujasta X. Muuttujan X otosvarianssi S2 on sen varianssin σ2 harhaton estimaattori, eli
Koska muuttujat Xi, i=1,2,…,n muodostavat otoksen satunnaismuuttujasta X, on oltava E(Xi)=E(X)=μ ja Var(Xi)=Var(X)=σ2. Väite seuraa odotusarvon lineaarisuudesta, kun otosvarianssin lausekkeessa merkitään Xi−¯X=(Xi−μ)−(¯X−μ) ja n∑i=1Xi=n¯X:
Tässä lauseessa on syy siihen, miksi otosvarianssin määritelmässä nimittäjään kirjoitetaan n−1 eikä n.
Tutkitaan sitten otosvarianssin jakaumaa. Normaalijakautuneiden satunnaismuuttujien muunnoksina saadaan eräitä uusia jakaumia, joita käytetään erityisesti tilastollisessa testaamisessa useiden testisuureiden jakaumina. Ensimmäisenä niistä määritellään χ2-jakauma.
Määritelmä 5.3.3
Jatkuva satunnaismuuttuja W noudattaa χ2-jakaumaa vapausastein n (χ2 distribution with n degrees of freedom), W∼χ2(n), jos sen tiheysfunktio
missä Γ(t)=∫∞0e−xxt−1dx on Eulerin gammafunktio.
Laskuja varten satunnaismuuttujan W∼χ2(n) kertymäfunktion F(t)=P(W≤t) ja sen käänteisfunktion arvoja on kerätty liitetaulukkoon eri vapausasteluvuilla. Monissa ohjelmissa on lisäksi valmiita funktioita arvojen laskemiseen.
Esimerkki 5.3.4
Oletetaan, että W∼χ2(14), ja etsitään ei-negatiiviset reaaliluvut w1 ja w2, joille P(W≤w1)=0,1 ja P(W≥w2)=0,1. Taulukossa valitaan ensin vapausastelukua 14 vastaava rivi, ja luetaan sitten, että P(W≤w1)=0,1=1−0,9, kun w1≈7,790. Vastaavasti luvusta w2 päätellään ensin, että P(W<w2)=1−0,1=0,9, joten w2≈21,064.
Matlabilla laskettaessa voidaan käyttää komentoa
w = chi2inv([0.1 0.9], 14);
etsimään vektori w
, jonka alkiot ovat w1 ja w2 tässä järjestyksessä. Vastaava R-komento on
qchisq(0.1, 14), qchisq(0.9, 14)
joita erikseen käyttämällä saadaan samat arvot luvuille w1 ja w2.
Lause 5.3.5
Satunnaismuuttujan W∼χ2(n) odotusarvo ja varianssi ovat
χ2-jakauman hyödyllisyys otosvarianssin kannalta käy ilmi seuraavien lauseiden myötä. Niiden todistukset sivuutetaan.
Lause 5.3.6
Oletetaan, että satunnaismuuttujat Zi∼N(0,1), i=1,2,…,n ovat riippumattomia. Tällöin niiden neliösumma
Lause 5.3.7
Jos satunnaismuuttujat W1∼χ2(n) ja W2∼χ2(m) ovat riippumattomia, sekä
joillekin satunnaismuuttujille Z1,Z2,…,Zn ja U1,U2,…,Um, niin silloin muuttujat Z1,…,Zn,U1,…,Um ovat riippumattomia ja siten
Olkoon X1,X2,…,Xn nyt otos satunnaismuuttujasta X∼N(μ,σ2). Muuttujan X otosvarianssin S2 jakauman sijaan tutkitaan otossuureen
jakaumaa.
Lause 5.3.8
Jos X1,X2,…,Xn on otos muuttujasta X∼N(μ,σ2), niin
- ¯X ja S2 ovat riippumattomia,
- otossuure (n−1)S2σ2∼χ2(n−1).
Ensimmäisen kohdan todistus sivuutetaan, ja toisesta kohdasta hahmotellaan todistuksen idea. Koska voidaan kirjoittaa
päätellään että
missä n∑i=1(Xi−μσ)2∼χ2(n) ja (¯X−μσ/√n)2∼χ2(1). Edellisen lauseen perusteella kahden riippumattoman χ2-jakautuneen muuttujan summa on χ2-jakautunut, ja vapausasteiden lukumäärät yhtälön molemmin puolin täsmäävät, jos (n−1)S2σ2∼χ2(n−1).
Tätä tulosta tarvitaan varianssin luottamusvälin määrittämisessä.