\[% MATHEMATICAL SYMBOLS --------------------------------------------------
% Lukualueet
\newcommand{\N}{\mathbb N}
\newcommand{\Z}{\mathbb Z}
\newcommand{\Q}{\mathbb Q}
\newcommand{\R}{\mathbb R}
\renewcommand{\C}{\mathbb C}
% Lihavoidut vektorit.
\newcommand{\ba}{\mathbf{a}}
\newcommand{\bb}{\mathbf{b}}
\newcommand{\bc}{\mathbf{c}}
\newcommand{\bd}{\mathbf{d}}
\newcommand{\be}{\mathbf{e}}
\newcommand{\bbf}{\mathbf{f}}
\newcommand{\bh}{\mathbf{h}}
\newcommand{\bi}{\mathbf{i}}
\newcommand{\bj}{\mathbf{j}}
\newcommand{\bk}{\mathbf{k}}
\newcommand{\bN}{\mathbf{N}}
\newcommand{\bn}{\mathbf{n}}
\newcommand{\bo}{\mathbf{0}}
\newcommand{\bp}{\mathbf{p}}
\newcommand{\bq}{\mathbf{q}}
\newcommand{\br}{\mathbf{r}}
\newcommand{\bs}{\mathbf{s}}
\newcommand{\bT}{\mathbf{T}}
\newcommand{\bu}{\mathbf{u}}
\newcommand{\bv}{\mathbf{v}}
\newcommand{\bw}{\mathbf{w}}
\newcommand{\bx}{\mathbf{x}}
\newcommand{\by}{\mathbf{y}}
\newcommand{\bz}{\mathbf{z}}
\newcommand{\bzero}{\mathbf{0}}
% Kaunokirjaimet
\newcommand{\cA}{\mathcal{A}}
\newcommand{\cB}{\mathcal{B}}
\newcommand{\cC}{\mathcal{C}}
\newcommand{\cD}{\mathcal{D}}
\newcommand{\cE}{\mathcal{E}}
\newcommand{\cF}{\mathcal{F}}
\newcommand{\cG}{\mathcal{G}}
\newcommand{\cH}{\mathcal{H}}
\newcommand{\cI}{\mathcal{I}}
\newcommand{\cJ}{\mathcal{J}}
\newcommand{\cK}{\mathcal{K}}
\newcommand{\cL}{\mathcal{L}}
\newcommand{\cM}{\mathcal{M}}
\newcommand{\cN}{\mathcal{N}}
\newcommand{\cO}{\mathcal{O}}
\newcommand{\cP}{\mathcal{P}}
\newcommand{\cQ}{\mathcal{Q}}
\newcommand{\cR}{\mathcal{R}}
\newcommand{\cS}{\mathcal{S}}
\newcommand{\cT}{\mathcal{T}}
\newcommand{\cU}{\mathcal{U}}
\newcommand{\cV}{\mathcal{V}}
\newcommand{\cW}{\mathcal{W}}
\newcommand{\cX}{\mathcal{X}}
\newcommand{\cY}{\mathcal{Y}}
\newcommand{\cZ}{\mathcal{Z}}
% Pystykirjaimet
\newcommand{\rA}{\mathrm{A}}
\newcommand{\rB}{\mathrm{B}}
\newcommand{\rC}{\mathrm{C}}
\newcommand{\rD}{\mathrm{D}}
\newcommand{\rE}{\mathrm{E}}
\newcommand{\rF}{\mathrm{F}}
\newcommand{\rG}{\mathrm{G}}
\newcommand{\rH}{\mathrm{H}}
\newcommand{\rI}{\mathrm{I}}
\newcommand{\rJ}{\mathrm{J}}
\newcommand{\rK}{\mathrm{K}}
\newcommand{\rL}{\mathrm{L}}
\newcommand{\rM}{\mathrm{M}}
\newcommand{\rN}{\mathrm{N}}
\newcommand{\rO}{\mathrm{O}}
\newcommand{\rP}{\mathrm{P}}
\newcommand{\rQ}{\mathrm{Q}}
\newcommand{\rR}{\mathrm{R}}
\newcommand{\rS}{\mathrm{S}}
\newcommand{\rT}{\mathrm{T}}
\newcommand{\rU}{\mathrm{U}}
\newcommand{\rV}{\mathrm{V}}
\newcommand{\rW}{\mathrm{W}}
\newcommand{\rX}{\mathrm{X}}
\newcommand{\rY}{\mathrm{Y}}
\newcommand{\rZ}{\mathrm{Z}}
% Operaattorit
\newcommand{\re}{\operatorname{Re}}
\newcommand{\im}{\operatorname{Im}}
\newcommand{\arsinh}{\operatorname{ar\,sinh}}
\newcommand{\arcosh}{\operatorname{ar\,cosh}}
\newcommand{\artanh}{\operatorname{ar\,tanh}}
%\newcommand{\dist}{\operatorname{d}}
\newcommand{\diag}{\operatorname{diag}}
\newcommand{\proj}{\operatorname{proj}}
\newcommand{\rref}{\operatorname{rref}}
\newcommand{\rank}{\operatorname{rank}}
\newcommand{\Span}{\operatorname{span}}
\renewcommand{\dim}{\operatorname{dim}}
\newcommand{\alg}{\operatorname{alg}}
\newcommand{\geom}{\operatorname{geom}}
\newcommand{\id}{\operatorname{id}}
% Todennäköisyyslaskenta
\newcommand{\Var}{\operatorname{Var}}
\newcommand{\Cov}{\operatorname{Cov}}
\newcommand{\Corr}{\operatorname{Corr}}
\newcommand{\Tasd}{\operatorname{Tasd}}
\newcommand{\Ber}{\operatorname{Ber}}
\newcommand{\Bin}{\operatorname{Bin}}
\newcommand{\Geom}{\operatorname{Geom}}
\newcommand{\Poi}{\operatorname{Poi}}
\newcommand{\Hyperg}{\operatorname{Hyperg}}
\newcommand{\Tas}{\operatorname{Tas}}
\newcommand{\Exp}{\operatorname{Exp}}
\newcommand{\tdist}{\operatorname{t}}
% Pysty-d differentiaaliin
\newcommand{\rd}{\mathrm{d}}
% Sijoitus integraaliin
\newcommand{\sij}[2]{\bigg/_{\mspace{-10mu}\,#1}^{\,#2}}\]
Binomijakauma
Palataan sitten tutkimaan tärkeimpiä diskreettejä ja jatkuvia todennäköisyysjakaumia. Niistä ensimmäinen muodostuu seuraavan Bernoullin kokeen toistona. Oletetaan, että satunnaiskokeen tulosvaihtoehdot (koodattuna) ovat \(0\) ja \(1\), eli tarkastelun kohteena oleva tapahtuma joko ei realisoidu tai realisoituu. Ensimmäistä vaihtoehtoa kutsutaan myös epäonnistumiseksi ja jälkimmäistä onnistumiseksi. Kiinnitetään onnistumisen todennäköisyydeksi \(p\), jolloin epäonnistumisen todennäköisyys on \(1 - p\).
Bernoullin jakauman kuvaama satunnaiskoe voidaan yleistää toistamalla sitä \(n\) kertaa siten, että jokainen toisto on toisista riippumaton. Onnistumisien lukumäärä tässä \(n\)-toistokokees-sa on uusi diskreetti satunnaismuuttuja \(X\), jonka mahdolliset arvot ovat kokonaislukuja \(0,1,\ldots,n\). Siihen liittyvät alkeistapaukset ovat nollista ja ykkösistä koostuvia jonoja, joissa on \(x\) kappaletta onnistumisia ja \(n - x\) kappaletta epäonnistumisia jossakin järjestyksessä. Koska onnistumisen todennäköisyys on \(p\) ja toistot ovat riippumattomia toisistaan, yksittäinen alkeistapaus realisoituu todennäköisyydellä \(p^{x}(1 - p)^{n - x}\). Vaihtoehtoja alkeistapahtumiksi, joihin liittyy \(x\) onnistumista, on \(\binom{n}{x}\) erilaista, joten
\[P(X=x)=\binom{n}{x}p^x(1-p)^{n-x}.\]
Binomijakauman tiheysfunktion \(f\) arvoja \(f(x) = b(x; n, p)\) otosavaruuden pisteissä sanotaan binomitodennäköisyyksiksi. Käyttämällä binomikaavaa
\[\sum_{x=0}^{n}\binom{n}{x}a^xb^{n-x}=(a+b)^n\]
binomitodennäköisyyksiin saadaan
\[\sum_{x=0}^{n}b(x; n, p) = \sum_{x=0}^{n}\binom{n}{x}p^x(1-p)^{n-x}=(p+1-p)^n = 1.\]
Satunnaismuuttujan \(X\sim\Bin(n,p)\) kertymäfunktio on
\[F(x)=P(X\leq x)=\sum_{t=0}^{\lfloor x\rfloor}b(t; n, p),\]
missä \(\lfloor x\rfloor = \max\{n \in \Z : n \leq x\}\) on suurin kokonaisluku \(n\), jolle \(n \leq x\). Taulukoista löytyy ja valmisohjelmilla (Matlab, R) voi laskea binomijakautuneen muuttujan kertymäfunktion ja sen käänteisfunktion arvoja.
Lause 5.2.3
Jos satunnaismuuttuja \(X\sim\Bin(n,p)\), niin sen momentit generoiva funktio \(M(t)=(pe^t+1-p)^n\), odotusarvo
\[\rE(X)=np\]
ja varianssi
\[\Var(X)=np(1-p).\]
Todistus
Satunnaismuuttujan \(X\) momentit generoivaksi funktioksi saadaan binomikaavan avulla
\[M(t) = \rE(e^{tX}) = \sum_{x=0}^{n}e^{tx}\binom{n}{x}p^x(1 - p)^{n-x} = \sum_{x=0}^{n}\binom{n}{x}(pe^t)^x(1 - p)^{n-x} = (pe^t + 1 - p)^n,\]
kuten väitettiin. Nyt
\[M'(t) = np(pe^t + 1 - p)^{n - 1}e^t \qquad\text{ja}\qquad M''(t) = np(pe^t + 1 - p)^{n - 2}e^t(npe^t + 1 - p),\]
jolloin
\[\rE(X) = M'(0) = np(p + 1 - p)^{n - 1} = np\]
ja
\[\begin{split}\begin{aligned}
\Var(X) &= M''(0) - M'(0)^2 = np(p + 1 - p)^{n - 2}(np + 1 - p) - n^2p^2 \\
&= np(np + 1 - p - np) = np(1 - p).
\end{aligned}\end{split}\]
Esimerkki 5.2.4
Tavallista kolikkoa heitetään \(5\) kertaa. Tuloksena saatujen kruunujen lukumäärää kuvaava satunnaismuuttuja \(X\) noudattaa binomijakaumaa parametrein \(n=5\) ja \(p=0{,}5\), eli \(X \sim \Bin(5, 0{,}5)\) tiheysfunktionaan
\[f(x)=\binom{5}{x}0{,}5^x(1-0{,}5)^{5-x}=\binom{5}{x}0{,}5^5,\qquad\text{kun } x\in\{0,1,\ldots,5\}\]
Esimerkki 5.2.5
Erään tuottajan transistoreista \(5~\%\) on viallisia. Asiakas ostaa \(6\) transistoria ja kuvaa viallisten laitteiden lukumäärää otoksessaan satunnaismuuttujalla \(X\). Laske todennäköisyys sille, että asiakas saa
- yksi tai kaksi viallista transistoria,
- vähintään yhden viallisen transistorin.
Ratkaisu
Kyseessä on \(6\)-toistokoe, jossa onnistumisen, eli viallisen transistorin saamisen todennäköisyys yksittäisellä toistolla on \(0{,}05\). Täten satunnaismuuttuja \(X\sim\Bin(6, 0{,}05)\) tiheysfunktionaan
\[f(x)=\binom{6}{x}0{,}05^x\cdot 0{,}95^{6-x},\qquad\text{kun }x\in\{0,1,\ldots,6\}.\]
Todennäköisyys sille, että asiakas saa yhden tai kaksi viallista transistoria on
\[P(1 \leq X \leq 2) = \binom{6}{1}\cdot0{,}05\cdot0{,}95^5+\binom{6}{2}\cdot0{,}05^2\cdot0{,}95^4\approx0{,}2627.\]
Matlabin komennot binopdf
ja binocdf
laskevat binomijakauman tiheys- ja kertymäfunktioiden arvoja, jolloin edelliset voitaisiin laskea myös komennoilla
sum(binopdf([1 2], 6, 0.05))
tai
binocdf(2, 6, 0.05) - binocdf(0, 6, 0.05)
R-ohjelman vastaavat komennot tiheys- ja kertymäfunktioille ovat dbinom
ja pbinom
, ja ratkaisu saataisiin laskulla
dbinom(1, 6, 0.05) + dbinom(2, 6, 0.05)
tai
pbinom(2, 6, 0.05) - pbinom(0, 6, 0.05)
Todennäköisyys sille, että asiakas saa vähintään yhden viallisen transistorin on
\[P(X\geq1)=1-P(X<1)=1-P(X=0)=1-0{,}95^6\approx0{,}2649,\]
ja samaan tulokseen päästään Matlab-komennolla
tai R-komennolla