\[\newcommand{\N}{\mathbb N} \newcommand{\Z}{\mathbb Z} \newcommand{\Q}{\mathbb Q} \newcommand{\R}{\mathbb R} \newcommand{\C}{\mathbb C} \newcommand{\ba}{\mathbf{a}} \newcommand{\bb}{\mathbf{b}} \newcommand{\bc}{\mathbf{c}} \newcommand{\bd}{\mathbf{d}} \newcommand{\be}{\mathbf{e}} \newcommand{\bff}{\mathbf{f}} \newcommand{\bh}{\mathbf{h}} \newcommand{\bi}{\mathbf{i}} \newcommand{\bj}{\mathbf{j}} \newcommand{\bk}{\mathbf{k}} \newcommand{\bN}{\mathbf{N}} \newcommand{\bn}{\mathbf{n}} \newcommand{\bo}{\mathbf{0}} \newcommand{\bp}{\mathbf{p}} \newcommand{\bq}{\mathbf{q}} \newcommand{\br}{\mathbf{r}} \newcommand{\bs}{\mathbf{s}} \newcommand{\bT}{\mathbf{T}} \newcommand{\bu}{\mathbf{u}} \newcommand{\bv}{\mathbf{v}} \newcommand{\bw}{\mathbf{w}} \newcommand{\bx}{\mathbf{x}} \newcommand{\by}{\mathbf{y}} \newcommand{\bz}{\mathbf{z}} \newcommand{\bzero}{\mathbf{0}} \newcommand{\nv}{\mathbf{0}} \newcommand{\cA}{\mathcal{A}} \newcommand{\cB}{\mathcal{B}} \newcommand{\cC}{\mathcal{C}} \newcommand{\cD}{\mathcal{D}} \newcommand{\cE}{\mathcal{E}} \newcommand{\cF}{\mathcal{F}} \newcommand{\cG}{\mathcal{G}} \newcommand{\cH}{\mathcal{H}} \newcommand{\cI}{\mathcal{I}} \newcommand{\cJ}{\mathcal{J}} \newcommand{\cK}{\mathcal{K}} \newcommand{\cL}{\mathcal{L}} \newcommand{\cM}{\mathcal{M}} \newcommand{\cN}{\mathcal{N}} \newcommand{\cO}{\mathcal{O}} \newcommand{\cP}{\mathcal{P}} \newcommand{\cQ}{\mathcal{Q}} \newcommand{\cR}{\mathcal{R}} \newcommand{\cS}{\mathcal{S}} \newcommand{\cT}{\mathcal{T}} \newcommand{\cU}{\mathcal{U}} \newcommand{\cV}{\mathcal{V}} \newcommand{\cW}{\mathcal{W}} \newcommand{\cX}{\mathcal{X}} \newcommand{\cY}{\mathcal{Y}} \newcommand{\cZ}{\mathcal{Z}} \newcommand{\rA}{\mathrm{A}} \newcommand{\rB}{\mathrm{B}} \newcommand{\rC}{\mathrm{C}} \newcommand{\rD}{\mathrm{D}} \newcommand{\rE}{\mathrm{E}} \newcommand{\rF}{\mathrm{F}} \newcommand{\rG}{\mathrm{G}} \newcommand{\rH}{\mathrm{H}} \newcommand{\rI}{\mathrm{I}} \newcommand{\rJ}{\mathrm{J}} \newcommand{\rK}{\mathrm{K}} \newcommand{\rL}{\mathrm{L}} \newcommand{\rM}{\mathrm{M}} \newcommand{\rN}{\mathrm{N}} \newcommand{\rO}{\mathrm{O}} \newcommand{\rP}{\mathrm{P}} \newcommand{\rQ}{\mathrm{Q}} \newcommand{\rR}{\mathrm{R}} \newcommand{\rS}{\mathrm{S}} \newcommand{\rT}{\mathrm{T}} \newcommand{\rU}{\mathrm{U}} \newcommand{\rV}{\mathrm{V}} \newcommand{\rW}{\mathrm{W}} \newcommand{\rX}{\mathrm{X}} \newcommand{\rY}{\mathrm{Y}} \newcommand{\rZ}{\mathrm{Z}} \newcommand{\pv}{\overline} \newcommand{\iu}{\mathrm{i}} \newcommand{\ju}{\mathrm{j}} \newcommand{\im}{\mathrm{i}} \newcommand{\e}{\mathrm{e}} \newcommand{\real}{\operatorname{Re}} \newcommand{\imag}{\operatorname{Im}} \newcommand{\Arg}{\operatorname{Arg}} \newcommand{\Ln}{\operatorname{Ln}} \DeclareMathOperator*{\res}{res} \newcommand{\re}{\operatorname{Re}} \newcommand{\im}{\operatorname{Im}} \newcommand{\arsinh}{\operatorname{ar\,sinh}} \newcommand{\arcosh}{\operatorname{ar\,cosh}} \newcommand{\artanh}{\operatorname{ar\,tanh}} \newcommand{\sgn}{\operatorname{sgn}} \newcommand{\diag}{\operatorname{diag}} \newcommand{\proj}{\operatorname{proj}} \newcommand{\rref}{\operatorname{rref}} \newcommand{\rank}{\operatorname{rank}} \newcommand{\Span}{\operatorname{span}} \newcommand{\vir}{\operatorname{span}} \renewcommand{\dim}{\operatorname{dim}} \newcommand{\alg}{\operatorname{alg}} \newcommand{\geom}{\operatorname{geom}} \newcommand{\id}{\operatorname{id}} \newcommand{\norm}[1]{\lVert #1 \rVert} \newcommand{\tp}[1]{#1^{\top}} \renewcommand{\d}{\mathrm{d}} \newcommand{\sij}[2]{\bigg/_{\mspace{-15mu}#1}^{\,#2}} \newcommand{\abs}[1]{\lvert#1\rvert} \newcommand{\pysty}[1]{\left[\begin{array}{@{}r@{}}#1\end{array}\right]} \newcommand{\piste}{\cdot} \newcommand{\qedhere}{} \newcommand{\taumatrix}[1]{\left[\!\!#1\!\!\right]} \newenvironment{augmatrix}[1]{\left[\begin{array}{#1}}{\end{array}\right]} \newenvironment{vaugmatrix}[1]{\left|\begin{array}{#1}}{\end{array}\right|} \newcommand{\trans}{\mathrm{T}} \newcommand{\EUR}{\text{\unicode{0x20AC}}} \newcommand{\SI}[3][]{#2\,\mathrm{#3}} \newcommand{\si}[2][]{\mathrm{#2}} \newcommand{\num}[2][]{#2} \newcommand{\ang}[2][]{#2^{\circ}} \newcommand{\meter}{m} \newcommand{\metre}{\meter} \newcommand{\kilo}{k} \newcommand{\kilogram}{kg} \newcommand{\gram}{g} \newcommand{\squared}{^2} \newcommand{\cubed}{^3} \newcommand{\minute}{min} \newcommand{\hour}{h} \newcommand{\second}{s} \newcommand{\degreeCelsius}{^{\circ}C} \newcommand{\per}{/} \newcommand{\centi}{c} \newcommand{\milli}{m} \newcommand{\deci}{d} \newcommand{\percent}{\%} \newcommand{\Var}{\operatorname{Var}} \newcommand{\Cov}{\operatorname{Cov}} \newcommand{\Corr}{\operatorname{Corr}} \newcommand{\Tasd}{\operatorname{Tasd}} \newcommand{\Ber}{\operatorname{Ber}} \newcommand{\Bin}{\operatorname{Bin}} \newcommand{\Geom}{\operatorname{Geom}} \newcommand{\Poi}{\operatorname{Poi}} \newcommand{\Hyperg}{\operatorname{Hyperg}} \newcommand{\Tas}{\operatorname{Tas}} \newcommand{\Exp}{\operatorname{Exp}} \newcommand{\tdist}{\operatorname{t}} \newcommand{\rd}{\mathrm{d}}\]

Suunnattu derivaatta ja gradientti

Kun korvataan standardikantavektori \(\be_i\) mielivaltaisella yksikkövektorilla \(\be\) osittaisderivaatan määritelmässä, voidaan funktion muutosnopeutta tutkia muissakin kuin vain koordinaattiakselien suunnissa.

Määritelmä 7.5.1

Funktion \(f\colon\R^n\to\R\) suunnattu derivaatta eli suuntaisderivaatta (directional derivative) pisteessä \(\bx\in\R^n\) yksikkövektorin \(\be\in\R^n\) suuntaan on

\[\begin{aligned} D_\be f(\bx)=\lim_{h\to0} \frac{f(\bx+h\be)-f(\bx)}{h} \end{aligned}\]

(mikäli raja-arvo on olemassa).

Jos edellä \(\be=\be_i\), niin \(D_\be f(\bx)=\dfrac{\partial f}{\partial x_i}(\bx)\). Piste \(\bx+h\be\) sijaitsee pisteen \(\bx\) kautta kulkevalla vektorin \(\be\) virittämällä suoralla. Seuraavissa kuvissa \(h>0\).

../_images/suunnDeriv1.svg
../_images/suunDeriv2.svg

Suunnattua derivaattaa ei yleensä lasketa erotusosamäärän raja-arvona, vaan käyttäen laskukaavaa, jossa esiintyy funktion kaikki osittaisderivaatat sisältävä vektori.

Määritelmä 7.5.2

Olkoon funktiolla \(f\colon\R^n\to\R\) kaikki osittaisderivaatat pisteessä \(\bx\). Vektoria

\[\nabla f(\bx)=\bigg(\frac{\partial f}{\partial x_1}(\bx),\ldots, \frac{\partial f}{\partial x_n}(\bx)\bigg)\]

kutsutaan funktion \(f\) gradientiksi (gradient) pisteessä \(\bx\). (\(\nabla\) luetaan ”nabla”.)

Suunnattu derivaatta yksikkövektorin \(\be\) suuntaan pisteessä \(\bx\) voidaan laskea gradientin avulla kaavalla

(1)\[D_\be f(\bx)=\nabla f(\bx)\piste\be.\]

Huomaa, että suunnatun derivaatan laskennassa käytettävää suuntaa ei useinkaan anneta suoraan yksikkösuuntana, vaan suuntavektorin \(\bu\) pituus on jotain muuta kuin \(1\). Tällöin yksikkövektori saadaan normeeraamalla,

\[\be = \frac{\bu}{\|\bu\|}.\]

Esimerkki 7.5.3

Laske funktion \(f(x,y,z)=x^3-xy^2-z\) hetkellinen muutosnopeus, kun pisteestä \(\bp=(1,1,0)\) lähdetään kulkemaan vektorin \(\bu=2\bi-3\bj+6\bk\) osoittamaan suuntaan.

Piilota/näytä ratkaisu

On laskettava suunnattu derivaatta yksikkövektorin

\[\be=\be_{\bu}=\frac{\bu}{\|\bu\|}=\frac{2\bi-3\bj+6\bk}{\sqrt{2^2+(-3)^2+6^2}}=\frac27\bi-\frac37\bj+\frac67\bk\]

suuntaan. Koska

\[\nabla f(x,y,z)=\left(3x^2-y^2,\,-2xy,\,-1\right),\]

niin

\[D_{\be}f(\bp)=\nabla f(\bp)\piste\be=(2,-2,-1)\piste\left(\frac27,\,-\frac37,\,\frac67\right)=\frac47.\]

Funktio siis kasvaa hetkellisesti \(4/7\) verran pituusyksikköä kohden lähdettäessä vektorin \(\bu\) suuntaisesti pisteestä \(\bp\).

Esimerkki 7.5.4

Tarkastellaan tilannetta, jossa ilmakehän lämpötila pisteessä \((x,y,z)\) (km) on

\[T(x,y,z)=\frac{xy}{1+z}\quad(^\circ\text{C})\]

ja sääluotaimen paikka hetkellä \(t\) (h) on annettu parametrisoituna käyränä

\[\br(t)=(t,\,2t,\,t-t^2)\quad(\text{km}).\]

Laske sääluotaimen kokema lämpötilan muutosnopeus paikan suhteen ajanhetkellä \(t=1/2\).

Piilota/näytä ratkaisu

Funktion \(\br\) derivaatta on \(\br'(t)=(1,2,1-2t)\). Hetkellä \(t=1/2\) luotaimen paikka on \(\br(1/2)=(1/2,1,1/4)=:\bp\) ja kulkusuunta käyrän tangenttisuunta \(\br'(1/2)=(1,2,0)=:\bu\). Normeerataan \(\bu\) ja lasketaan gradientti. Nyt

\[\be=\be_{\bu}=\frac{\bu}{\|\bu\|}=\frac{(1,2,0)}{\sqrt{1^2+2^2+0^2}}=\left(\frac{1}{\sqrt5},\,\frac{2}{\sqrt5},\,0\right)\]

ja

\[\nabla T(x,y,z)=\left(\frac{y}{1+z},\,\frac{x}{1+z},\,-\frac{xy}{(1+z)^2}\right).\]

Kysytty muutosnopeus on

\[D_{\be}T(\bp)=\nabla T(\bp)\piste\be=\left(\frac45,\,\frac25,\,-\frac{8}{25}\right)\piste\left(\frac{1}{\sqrt5},\,\frac{2}{\sqrt5},\,0\right)=\frac{8}{5\sqrt5}\approx0{,}72\quad(^\circ\text{C/km}).\qedhere\]

Tarkastellaan funktiota \(f(x,y) = xy+x^2y\).

Laske \(\nabla f(2,1)\).
Seuraavassa kohdassa lasketaan suunnattua derivaattaa suuntaan \(\bu\). Valitse seuraavista oikea suunta, kun tiedät että vektorin \(\bu\) pituus on \(\sqrt{5}\)
Laske nyt funktion \(f\) suunnattu derivaatta pisteessä \((2,1)\) suuntaan \(\bu\), jonka valitsit edellisessä kohdassa. Huomaa, että \(\bu\) ei ole yksikkövektori, joten se pitää normeerata.

Gradientti ei ole suinkaan vain suunnatun derivaatan laskennallinen apukeino, vaan kertoo myös sen ääriarvoista. Todistus sivuutetaan.

Lause 7.5.5 (Gradientin geometrinen tulkinta)

Olkoon \(f\colon\R^n\to\R\) differentioituva pisteessä \(\bx\).

  • Funktion \(f\) suunnatun derivaatan maksimiarvo pisteessä \(\bx\) on \(\|\nabla f(\bx)\|\) ja se saavutetaan gradientin \(\nabla f(\bx)\) suunnassa.
  • Funktio \(f\) vähenee nopeimmin gradientille vastakkaiseen suuntaan \(-\nabla f(\bx)\), jossa suunnassa kasvunopeus on \(-\|\nabla f(\bx)\|\).
  • Gradienttia vastaan kohtisuorissa suunnissa funktion paikallinen kasvunopeus on \(0\).

Toisin sanoen kussakin pisteessä gradienttivektori ilmoittaa suunnan, johon siirryttäessä funktio kasvaa paikallisesti (eli tehtäessä ”pieni” siirtymä) nopeimmin ja gradienttivektorin pituus ilmoittaa paikallisen kasvunopeuden kyseessä olevassa suunnassa.

Esimerkki 7.5.6

Esimerkissä 7.5.4 luotain kulkee pisteessä \(\bp=(1/2,1,1/4)\) suuntaan \((1,2,0)\), jolloin sen kokema lämpötilan muutosnopeus on noin \(0{,}72~^\circ\)C/km. Mihin suuntaan pisteestä \(\bp\) pitäisi lähteä, jotta lämpötila kasvaisi mahdollisimman nopeasti? Mikä olisi tällöin lämpötilan muutosnopeus?

Piilota/näytä ratkaisu

Olisi lähdettävä suuntaan

\[\nabla T(\bp)=\left(\frac45,\,\frac25,\,-\frac{8}{25}\right),\]

jolloin muutosnopeus olisi

\[\|\nabla T(\bp)\|=\sqrt{\left(\frac45\right)^2+\left(\frac25\right)^2+\left(-\frac{8}{25}\right)^2}\approx0{,}95\quad(^\circ\text{C/km}).\qedhere\]

Esimerkki 7.5.7

Olkoon tunturin korkeus pisteessä \((x,y)\) (m)

\[f(x,y)=\frac{11~000}{10+2\left(\dfrac{x}{100}\right)^2+4\left(\dfrac{y}{100}\right)^2}\quad(\text{m}).\]

Retkeilijä on huipun lähellä pisteessä \((200,300)\).

  • Mihin suuntaan rinne nousee jyrkimmin?
  • Missä suunnissa ei ole nousua?
Piilota/näytä ratkaisu

Funktion \(f\) gradientti on

\[\nabla f(x,y)=-\frac{11~000}{\left(10+2\left(\dfrac{x}{100}\right)^2+4\left(\dfrac{y}{100}\right)^2\right)^2}\left(\frac{4x}{100^2},\,\frac{8y}{100^2}\right),\]

joten nopeimman kasvun suunta on

\[\nabla f(200,300)=\left(-\frac{220}{729},\,-\frac{220}{243}\right)\approx(-0{,}30,\,-0{,}91).\]

Kasvunopeus on

\[\|\nabla f(200,300)\|=\sqrt{\left(-\frac{220}{729}\right)^2+\left(-\frac{220}{243}\right)^2}=\sqrt{\frac{959}{1053}}\approx0{,}95\quad(\text{m/m}).\]

Kasvunopeus on nolla gradienttia vastaan kohtisuorissa suunnissa, eli tässä tapauksessa vektorin

\[\left(\frac{220}{243},\,-\frac{220}{729}\right)\approx(0{,}91,\,-0{,}30)\]

virittämässä suunnassa.

Palautusta lähetetään...