Processing math: 100%
Tämä kurssi on jo päättynyt.

Otosvarianssi

Satunnaismuuttujan vaihtelua kuvaavat tärkeimmät otossuureet ovat otosvarianssi ja otoskeskihajonta.

Määritelmä 5.3.1

Olkoon X1,X2,,Xn otos satunnaismuuttujasta X. Satunnaismuuttujan X otosvarianssi (sample variance) on satunnaismuuttuja

S2=1n1ni=1(Xi¯X)2,

ja otoshajonta (sample standard deviation) S=S2. Näiden satunnaismuuttujien realisoituneita arvoja (reaalilukuja) merkitään

s2=1n1ni=1(xi¯x)2

ja s=s2.

Satunnaismuuttujan X otosvarianssi on sen varianssin harhaton estimaattori.

Lause 5.3.2

Olkoon X1,X2,,Xn otos satunnaismuuttujasta X. Muuttujan X otosvarianssi S2 on sen varianssin σ2 harhaton estimaattori, eli

E(S2)=Var(X)=σ2.
Piilota/näytä todistus

Koska muuttujat Xi, i=1,2,,n muodostavat otoksen satunnaismuuttujasta X, on oltava E(Xi)=E(X)=μ ja Var(Xi)=Var(X)=σ2. Väite seuraa odotusarvon lineaarisuudesta, kun otosvarianssin lausekkeessa merkitään Xi¯X=(Xiμ)(¯Xμ) ja ni=1Xi=n¯X:

E(S2)=E(1n1ni=1(Xi¯X)2)=E(1n1ni=1((Xiμ)(¯Xμ))2)=E(1n1ni=1((Xiμ)22(Xiμ)(¯Xμ)+(¯Xμ)2))=1n1E(ni=1(Xiμ)22(¯Xμ)ni=1(Xiμ)+ni=1(¯Xμ)2)=1n1E(ni=1(Xiμ)22(¯Xμ)(n¯Xnμ)+n(¯Xμ)2)=1n1E(ni=1(Xiμ)2n(¯Xμ)2)=1n1(ni=1E((Xiμ)2)nE((¯Xμ)2))=1n1(ni=1Var(Xi)nVar(¯X))=1n1(nσ2nσ2n)=σ2.

Tässä lauseessa on syy siihen, miksi otosvarianssin määritelmässä nimittäjään kirjoitetaan n1 eikä n.

Tutkitaan sitten otosvarianssin jakaumaa. Normaalijakautuneiden satunnaismuuttujien muunnoksina saadaan eräitä uusia jakaumia, joita käytetään erityisesti tilastollisessa testaamisessa useiden testisuureiden jakaumina. Ensimmäisenä niistä määritellään χ2-jakauma.

Määritelmä 5.3.3

Jatkuva satunnaismuuttuja W noudattaa χ2-jakaumaa vapausastein n (χ2 distribution with n degrees of freedom), Wχ2(n), jos sen tiheysfunktio

f(x)=12n2Γ(n2)xn21ex2,kun xΩ=[0,),

missä Γ(t)=0exxt1dx on Eulerin gammafunktio.

Laskuja varten satunnaismuuttujan Wχ2(n) kertymäfunktion F(t)=P(Wt) ja sen käänteisfunktion arvoja on kerätty liitetaulukkoon eri vapausasteluvuilla. Monissa ohjelmissa on lisäksi valmiita funktioita arvojen laskemiseen.

Esimerkki 5.3.4

Oletetaan, että Wχ2(14), ja etsitään ei-negatiiviset reaaliluvut w1 ja w2, joille P(Ww1)=0,1 ja P(Ww2)=0,1. Taulukossa valitaan ensin vapausastelukua 14 vastaava rivi, ja luetaan sitten, että P(Ww1)=0,1=10,9, kun w17,790. Vastaavasti luvusta w2 päätellään ensin, että P(W<w2)=10,1=0,9, joten w221,064.

Matlabilla laskettaessa voidaan käyttää komentoa

w = chi2inv([0.1 0.9], 14);

etsimään vektori w, jonka alkiot ovat w1 ja w2 tässä järjestyksessä. Vastaava R-komento on

qchisq(0.1, 14), qchisq(0.9, 14)

joita erikseen käyttämällä saadaan samat arvot luvuille w1 ja w2.

Lause 5.3.5

Satunnaismuuttujan Wχ2(n) odotusarvo ja varianssi ovat

E(W)=njaVar(W)=2n
Piilota/näytä todistus
Harjoitustehtävänä. Hyödynnä odotusarvon määritelmää, osittaisintegrointia ja varianssille kehitettyä kaavaa.

χ2-jakauman hyödyllisyys otosvarianssin kannalta käy ilmi seuraavien lauseiden myötä. Niiden todistukset sivuutetaan.

Lause 5.3.6

Oletetaan, että satunnaismuuttujat ZiN(0,1), i=1,2,,n ovat riippumattomia. Tällöin niiden neliösumma

W=ni=1Z2i=Z21+Z22++Z2nχ2(n).

Lause 5.3.7

Jos satunnaismuuttujat W1χ2(n) ja W2χ2(m) ovat riippumattomia, sekä

W1=ni=1Z2ijaW2=mi=1U2i

joillekin satunnaismuuttujille Z1,Z2,,Zn ja U1,U2,,Um, niin silloin muuttujat Z1,,Zn,U1,,Um ovat riippumattomia ja siten

W1+W2χ2(n+m).
Tehtävää ladataan...

Olkoon X1,X2,,Xn nyt otos satunnaismuuttujasta XN(μ,σ2). Muuttujan X otosvarianssin S2 jakauman sijaan tutkitaan otossuureen

(n1)S2σ2=1σ2ni=1(Xi¯X)2=ni=1(Xi¯Xσ)2

jakaumaa.

Lause 5.3.8

Jos X1,X2,,Xn on otos muuttujasta XN(μ,σ2), niin

  1. ¯X ja S2 ovat riippumattomia,
  2. otossuure (n1)S2σ2χ2(n1).
Piilota/näytä todistus

Ensimmäisen kohdan todistus sivuutetaan, ja toisesta kohdasta hahmotellaan todistuksen idea. Koska voidaan kirjoittaa

(n1)S2σ2=ni=1(Xiμσ)2(¯Xμσ/n)2,

päätellään että

ni=1(Xiμσ)2=(n1)S2σ2+(¯Xμσ/n)2,

missä ni=1(Xiμσ)2χ2(n) ja (¯Xμσ/n)2χ2(1). Edellisen lauseen perusteella kahden riippumattoman χ2-jakautuneen muuttujan summa on χ2-jakautunut, ja vapausasteiden lukumäärät yhtälön molemmin puolin täsmäävät, jos (n1)S2σ2χ2(n1).

Tätä tulosta tarvitaan varianssin luottamusvälin määrittämisessä.

Palautusta lähetetään...