- MATH.APP.210
- 5. Otosjakaumat ja estimointi
- 5.3 Otosvarianssi
Otosvarianssi¶
Satunnaismuuttujan vaihtelua kuvaavat tärkeimmät otossuureet ovat otosvarianssi ja otoskeskihajonta.
Määritelmä 5.3.1
Olkoon X1,X2,…,Xn otos satunnaismuuttujasta X. Satunnaismuuttujan X otosvarianssi (sample variance) on satunnaismuuttuja
ja otoshajonta (sample standard deviation) S=√S2. Näiden satunnaismuuttujien realisoituneita arvoja (reaalilukuja) kutsutaan myös otosvarianssiksi ja otoshajonnaksi ja niitä merkitään
ja s=√s2.
Satunnaismuuttujan X otosvarianssi on sen varianssin harhaton estimaattori.
Lause 5.3.2
Olkoon X1,X2,…,Xn otos satunnaismuuttujasta X. Muuttujan X otosvarianssi S2 on sen varianssin σ2 harhaton estimaattori, eli
Koska muuttujat Xi, i=1,2,…,n muodostavat otoksen satunnaismuuttujasta X, on oltava E(Xi)=E(X)=μ ja Var(Xi)=Var(X)=σ2. Väite seuraa odotusarvon lineaarisuudesta, kun otosvarianssin lausekkeessa merkitään Xi−¯X=(Xi−μ)−(¯X−μ) ja n∑i=1Xi=n¯X:
Tässä lauseessa on syy siihen, miksi otosvarianssin määritelmässä nimittäjään kirjoitetaan n−1 eikä n.
Tutkitaan sitten otosvarianssin jakaumaa. Normaalijakautuneiden satunnaismuuttujien muunnoksina saadaan eräitä uusia jakaumia, joita käytetään erityisesti tilastollisessa testaamisessa useiden testisuureiden jakaumina. Ensimmäisenä niistä määritellään χ2-jakauma (lausutaan khii toiseen).
Määritelmä 5.3.3
Jatkuva satunnaismuuttuja W noudattaa χ2-jakaumaa vapausastein n (χ2 distribution with n degrees of freedom), W∼χ2(n), jos sen tiheysfunktio
missä Γ(t)=∫∞0e−xxt−1dx on Eulerin gammafunktio.
Laskuja varten satunnaismuuttujan W∼χ2(n) kertymäfunktion F(t)=P(W≤t) ja sen käänteisfunktion arvoja on kerätty liitetaulukkoon eri vapausasteluvuilla. Luonnollisesti arvot voi laskea myös ohjelmilla.
Esimerkki 5.3.4
Oletetaan, että W∼χ2(14), ja etsitään ei-negatiiviset reaaliluvut w1 ja w2, joille P(W≤w1)=0.1 ja P(W≥w2)=0.1. Taulukossa valitaan ensin vapausastelukua 14 vastaava rivi, ja luetaan sitten, että P(W≤w1)=0.1=1−0.9, kun w1≈7.790. Vastaavasti luvusta w2 päätellään ensin, että P(W<w2)=1−0.1=0.9, joten w2≈21.064.
Matlabilla laskettaessa voidaan käyttää komentoa
w = chi2inv([0.1 0.9], 14)
joka antaa vastaukseksi vektorin w=[w1,w2]. Vastaavasti R:llä arvot saadaan
chisq(0.1, 14) # w1 qchisq(0.9, 14) # w2
Lause 5.3.5
Satunnaismuuttujan W∼χ2(n) odotusarvo ja varianssi ovat
Todistus sivuutetaan.
χ2−jakauman hyödyllisyys otosvarianssin kannalta käy ilmi seuraavien lauseiden myötä. Niiden todistukset sivuutetaan.
Lause 5.3.6
Oletetaan, että satunnaismuuttujat Zi∼N(0,1), i=1,2,…,n ovat riippumattomia. Tällöin niiden neliösumma
Jos siis lasketaan yhteen n riippumattoman standardinormaalijakautuneen satunnaismuuttujan neliöt, saadaan χ2(n)−jakautunut satunnaismuuttuja.
Olkoon X1,X2,…,Xn otos satunnaismuuttujasta X∼N(μ,σ2). Muuttujan X otosvarianssin S2 jakauman sijaan tutkitaan otossuureen
jakaumaa. Voidaan osoittaa, että tämä otosvarianssin funktio on χ2−jakautunut.
Lause 5.3.7
Jos X1,X2,…,Xn on otos muuttujasta X∼N(μ,σ2), niin
- ¯X ja S2 ovat riippumattomia,
- otossuure (n−1)S2σ2∼χ2(n−1).
Ensimmäisen kohdan todistus sivuutetaan, ja toisesta kohdasta hahmotellaan todistuksen idea. Koska voidaan kirjoittaa
päätellään että
missä n∑i=1(Xi−μσ)2∼χ2(n) ja (¯X−μσ/√n)2∼χ2(1).
Kun χ2−jakautunut satunnaismuuttuja voidaan ajatella olevan N(0,1)−jakautuneiden muuttujien neliöiden summa, päätellään epäsuorasti, että (n−1)S2σ2∼χ2(n−1).
Tätä tulosta tarvitaan varianssin luottamusvälin määrittämisessä.