- MATH.APP.210
- 5. Otosjakaumat ja estimointi
- 5.1 Riippumattomien satunnaismuuttujien summa ja keskiarvo
Riippumattomien satunnaismuuttujien summa ja keskiarvo¶
Jatkon kannalta erityisen tärkeä satunnaismuuttujien tyyppi on riippumattomien satunnaismuuttujien X1,X2,…,Xn summa Y=X1+X2+…+Xn. Ensimmäinen tähän satunnaismuuttujaan liittyvä kiinnostava ongelma on selvittää sen jakauma. Usein voidaan olettaa, että muuttujat Xi, i=1,2,…,n noudattavat samaa, tunnettua jakaumaa. Asiaa tutkitaan tyypillisesti seuraavan momentit generoivan funktion ominaisuuden ja induktioperiaatteen avulla.
Lause 5.1.1
Riippumattomien satunnaismuuttujien X1 ja X2 summan Y=X1+X2 momentit generoiva funktio
kun MX1(t) ja MX2(t) ovat muuttujien X1 ja X2 momentit generoivat funktiot.
Koska X1 ja X2 ovat riippumattomia, niin lauseen 2.6.8 mukaan myös niiden funktiot etX1 ja etX2, missä t∈R, ovat riippumattomia. Täten riippumattomien satunnaismuuttujien tulon odotusarvona
Esimerkki 5.1.2
Oletetaan, että X∼Bin(n,p) ja Y∼Bin(m,p), ja että muuttujat X ja Y ovat riippumattomia. Tällöin
eli MX+Y(t) on jakauman Bin(n+m,p) momenttifunktio. Täten momentit generoivan funktion yksikäsitteisyysominaisuuden nojalla X+Y∼Bin(n+m,p).
Tärkeänä tuloksena voidaan todistaa, että riippumattomien normaalijakautuneiden satunnaismuuttujien lineaarikombinaatio on normaalijakautunut.
Lause 5.1.3
Jos satunnaismuuttujat Xi∼N(μi,σ2i), i=1,2,…,n ovat riippumattomia ja kertoimet a1,a2,…,an∈R, niin muuttujien lineaarikombinaatio
missä
Käytetään induktiota.
Alkuaskel n=2. Lauseen 4.4.3 mukaan aiXi∼N(aiμi,a2iσ2i), missä i=1 tai i=2. Täten hyödyntämällä normaalijakauman momenttifunktiota ja lausetta 5.1.1 saadaan satunnaismuuttujan Y momentit generoivaksi funktioksi
MY(t)=Ma1X1(t)Ma2X2(t)=ea1μ1t+12a21σ21t2ea2μ2t+12a22σ22t2=e(a1μ1+a2μ2)t+12(a21σ21+a22σ22)t2,joka on myös jakauman N(a1μ1+a2μ2,a21σ21+a22σ22) momenttifunktion lauseke. Siis momentit generoivan funktion yksikäsitteisyysominaisuuden nojalla Y noudattaa tätä normaalijakaumaa, kuten väitettiinkin.
Induktioaskel. Oletetaan sitten, että
Y=a1X1+a2X2+⋯+akXk∼N(μY,σ2Y),missä k on luonnollinen luku. Nyt lisäksi Xk+1∼N(μk+1,σ2k+1), ja koska muuttujat X1,X2,…,Xk+1 ovat riippumattomia, myös a1X1+a2X2+⋯+akXk ja ak+1Xk+1 ovat riippumattomia. Voidaan siis todistaa samaan tapaan kuin alkuaskeleessa, että
Y+ak+1Xk+1∼N(μY+ak+1μk+1,σ2Y+a2k+1σ2k+1),kuten väitettiinkin.
Induktioperiaatteen nojalla väite on voimassa aina, kun n∈N.
Tarkastellaan sitten n-toistokoetta, jossa satunnaismuuttujalle X realisoituu jokin arvo, ja merkitään toistossa i realisoituvaa satunnaismuuttujaa Xi. Koetoistojen satunnaismuuttujien X1,X2,…,Xn sanotaan olevan otos satunnaismuuttujasta X, jolloin muuttujat Xi ovat riippumattomia ja noudattavat samaa jakaumaa kuin X. Erityisesti E(Xi)=E(X) ja Var(Xi)=Var(X). Satunnaisvektorille (X1,X2,…,Xn) realisoituvia arvoja (x1,x2,…,xn) kutsutaan toisinaan myös otokseksi, mutta tässä otoksella tarkoitetaan nimenomaan kokoelmaa satunnaismuuttujia.
Otoksesta X1,X2,…,Xn riippuvia otossuureita (statistics) Θ käytetään usein satunnaismuuttujan X jakauman tuntemattomien parametrien θ, kuten odotusarvon ja varianssin arviointiin, sekä parametreihin kohdistuvien väitteiden testaamiseen. Otossuureet muodostuvat otosmuuttujien Xi funktioina, ja ovat täten nekin satunnaismuuttujia, joilla on omat jakaumansa. Parametriin θ liittyvää otossuuretta Θ kutsutaan myös parametrin estimaattoriksi, ja sille realisoituvaa arvoa estimaatiksi tai piste-estimaatiksi. Satunnaismuuttujan X sijaintia kuvaava tärkein otossuure on otoskeskiarvo.
Määritelmä 5.1.4
Olkoon X1,X2,…,Xn otos satunnaismuuttujasta X, sekä luvut x1,x2,…,xn otosmuuttujien realisoituneet arvot. Satunnaismuuttujan X otoskeskiarvo (sample mean) on satunnaismuuttuja
ja sen realisoitunut arvo (reaaliluku)
Satunnaismuuttujan X otoskeskiarvon ¯X jakauman odotusarvo ja varianssi voidaan päätellä suoraan muuttujan X vastaavista parametreistä. Odotusarvon lineaarisuuden nojalla
ja jos satunnaismuuttujat Xi ovat riippumattomia (otosmuuttujina ne ovat), niin
lauseen 3.4.8 nojalla. Koska tässä muuttujat X1,X2,…,Xn muodostavat otoksen satunnaismuuttujasta X, niin E(Xi)=E(X) ja Var(Xi)=Var(X), i=1,2,…,n. Näin otoskeskiarvon odotusarvolle ja varianssille saadaan seuraava tulos.
Lause 5.1.5
Olkoon X1,X2,…,Xn otos satunnaismuuttujasta X. Tällöin muuttujan X otoskeskiarvon ¯X odotusarvo
ja varianssi
kun E(X)=μ ja Var(X)=σ2.
Satunnaismuuttujan X otoksesta X1,X2,…,Xn lasketun otossuureen Θ (satunnaismuuttuja) sanotaan olevan tietyn muuttujan X jakauman parametrin θ harhaton estimaattori (unbiased estimator), jos E(Θ)=θ. Otossuureelle realisoitunut arvo antaa tälle parametrille harhattoman estimaatin (unbiased estimate). Edellisen lauseen mukaan otoskeskiarvo ¯X odotusarvon E(X)=μ harhaton estimaatti.
Otoskeskiarvon keskihajontaa
kutsutaan keskiarvon keskivirheeksi (the standard error of the mean). Otoksesta arvioitu satunnaismuuttujan X odotusarvo ja sen virhearvio voidaan ilmaista muodossa μ±σ/√n. Tätä karkeaa arviota luotettavampi tapa on muodostaa odotusarvolle μ luottamusväli, joka suurella todennäköisyydellä sisältää varsinaisen odotusarvon.
Jos muuttuja X noudattaa normaalijakaumaa, niin lauseen 5.1.3 nojalla myös otoskeskiarvo ¯X noudattaa normaalijakaumaa.
Seuraus 5.1.6
Jos X1,X2,…,Xn on otos muuttujasta X∼N(μ,σ2), niin otoskeskiarvo
Aina ei voida olettaa, että satunnaismuuttujan X jakauma olisi normaalinen tai edes tunnettu. Seuraavaksi käsiteltävän keskeisen raja-arvolauseen mukaan suurilla otoksilla otoskeskiarvo noudattaa onneksi likimain normaalijakaumaa riippumatta satunnaismuuttujan X jakaumasta.