Processing math: 100%

Otosvarianssi

Satunnaismuuttujan vaihtelua kuvaavat tärkeimmät otossuureet ovat otosvarianssi ja otoskeskihajonta.

Määritelmä 5.3.1

Olkoon X1,X2,,Xn otos satunnaismuuttujasta X. Satunnaismuuttujan X otosvarianssi (sample variance) on satunnaismuuttuja

S2=1n1ni=1(Xi¯X)2,

ja otoshajonta (sample standard deviation) S=S2. Näiden satunnaismuuttujien realisoituneita arvoja (reaalilukuja) kutsutaan myös otosvarianssiksi ja otoshajonnaksi ja niitä merkitään

s2=1n1ni=1(xi¯x)2

ja s=s2.

Satunnaismuuttujan X otosvarianssi on sen varianssin harhaton estimaattori.

Lause 5.3.2

Olkoon X1,X2,,Xn otos satunnaismuuttujasta X. Muuttujan X otosvarianssi S2 on sen varianssin σ2 harhaton estimaattori, eli

E(S2)=Var(X)=σ2.
Piilota/näytä todistus

Koska muuttujat Xi, i=1,2,,n muodostavat otoksen satunnaismuuttujasta X, on oltava E(Xi)=E(X)=μ ja Var(Xi)=Var(X)=σ2. Väite seuraa odotusarvon lineaarisuudesta, kun otosvarianssin lausekkeessa merkitään Xi¯X=(Xiμ)(¯Xμ) ja ni=1Xi=n¯X:

E(S2)=E(1n1ni=1(Xi¯X)2)=E(1n1ni=1((Xiμ)(¯Xμ))2)=E(1n1ni=1((Xiμ)22(Xiμ)(¯Xμ)+(¯Xμ)2))=1n1E(ni=1(Xiμ)22(¯Xμ)ni=1(Xiμ)+ni=1(¯Xμ)2)=1n1E(ni=1(Xiμ)22(¯Xμ)(n¯Xnμ)+n(¯Xμ)2)=1n1E(ni=1(Xiμ)2n(¯Xμ)2)=1n1(ni=1E((Xiμ)2)nE((¯Xμ)2))=1n1(ni=1Var(Xi)nVar(¯X))=1n1(nσ2nσ2n)=σ2.

Tässä lauseessa on syy siihen, miksi otosvarianssin määritelmässä nimittäjään kirjoitetaan n1 eikä n.

Tutkitaan sitten otosvarianssin jakaumaa. Normaalijakautuneiden satunnaismuuttujien muunnoksina saadaan eräitä uusia jakaumia, joita käytetään erityisesti tilastollisessa testaamisessa useiden testisuureiden jakaumina. Ensimmäisenä niistä määritellään χ2-jakauma (lausutaan khii toiseen).

Määritelmä 5.3.3

Jatkuva satunnaismuuttuja W noudattaa χ2-jakaumaa vapausastein n (χ2 distribution with n degrees of freedom), Wχ2(n), jos sen tiheysfunktio

f(x)=12n2Γ(n2)xn21ex2,kun xΩ=[0,),

missä Γ(t)=0exxt1dx on Eulerin gammafunktio.

Laskuja varten satunnaismuuttujan Wχ2(n) kertymäfunktion F(t)=P(Wt) ja sen käänteisfunktion arvoja on kerätty liitetaulukkoon eri vapausasteluvuilla. Luonnollisesti arvot voi laskea myös ohjelmilla.

Esimerkki 5.3.4

Oletetaan, että Wχ2(14), ja etsitään ei-negatiiviset reaaliluvut w1 ja w2, joille P(Ww1)=0.1 ja P(Ww2)=0.1. Taulukossa valitaan ensin vapausastelukua 14 vastaava rivi, ja luetaan sitten, että P(Ww1)=0.1=10.9, kun w17.790. Vastaavasti luvusta w2 päätellään ensin, että P(W<w2)=10.1=0.9, joten w221.064.

Matlabilla laskettaessa voidaan käyttää komentoa

   w = chi2inv([0.1 0.9], 14)

joka antaa vastaukseksi vektorin w=[w1,w2]. Vastaavasti R:llä arvot saadaan

   chisq(0.1, 14) # w1
   qchisq(0.9, 14) # w2 

Lause 5.3.5

Satunnaismuuttujan Wχ2(n) odotusarvo ja varianssi ovat

E(W)=njaVar(W)=2n

Todistus sivuutetaan.

χ2jakauman hyödyllisyys otosvarianssin kannalta käy ilmi seuraavien lauseiden myötä. Niiden todistukset sivuutetaan.

Lause 5.3.6

Oletetaan, että satunnaismuuttujat ZiN(0,1), i=1,2,,n ovat riippumattomia. Tällöin niiden neliösumma

W=ni=1Z2i=Z21+Z22++Z2nχ2(n).

Jos siis lasketaan yhteen n riippumattoman standardinormaalijakautuneen satunnaismuuttujan neliöt, saadaan χ2(n)jakautunut satunnaismuuttuja.

Olkoon X1,X2,,Xn otos satunnaismuuttujasta XN(μ,σ2). Muuttujan X otosvarianssin S2 jakauman sijaan tutkitaan otossuureen

(n1)S2σ2

jakaumaa. Voidaan osoittaa, että tämä otosvarianssin funktio on χ2jakautunut.

Jos satunnaismuuttujan W tiheysfunktio on

f(x)=123xex/20ettdt,

niin se noudattaa χ2-jakaumaa.

Mikä on muuttujan W jakauman vapausasteluku?
Mikä on muuttujan W odotusarvo?
Mikä on muuttujan W varianssi?
Satunnaismuuttujat W1χ2(n) ja W2χ2(m) ovat riippumattomia, sekä löydetään satunnaismuuttujat Z1,Z2,,Zn ja U1,U2,,Um, joille W1=ni=1Z2i ja W2=mi=1U2i. Tällöin

Lause 5.3.7

Jos X1,X2,,Xn on otos muuttujasta XN(μ,σ2), niin

  1. ¯X ja S2 ovat riippumattomia,
  2. otossuure (n1)S2σ2χ2(n1).
Piilota/näytä todistus

Ensimmäisen kohdan todistus sivuutetaan, ja toisesta kohdasta hahmotellaan todistuksen idea. Koska voidaan kirjoittaa

(n1)S2σ2=1σ2ni=1(Xi¯X)2=ni=1(Xi¯Xσ)2=ni=1(Xiμσ)2(¯Xμσ/n)2,

päätellään että

ni=1(Xiμσ)2=(n1)S2σ2+(¯Xμσ/n)2,

missä ni=1(Xiμσ)2χ2(n) ja (¯Xμσ/n)2χ2(1).

Kun χ2jakautunut satunnaismuuttuja voidaan ajatella olevan N(0,1)jakautuneiden muuttujien neliöiden summa, päätellään epäsuorasti, että (n1)S2σ2χ2(n1).

Tätä tulosta tarvitaan varianssin luottamusvälin määrittämisessä.

Palautusta lähetetään...