Nejprve si připomeňme hlavní významy derivace u funkce jedné proměnné. Je-li
zvolena hodnota proměnné
Třetí užitečný pohled je, že derivace umožňuje aproximovat hodnoty funkce na okolí bodu a pomocí tečny, vzorec je (ve dvou podobách)
Žádná z těchto interpretací neobstojí u funkcí více proměnných. Je to jasné
již z obrázku funkce dvou proměnných: Pokud zvolíme bod
Touto úvahou jsme se nicméně dostali k jednomu z klíčových pojmů. Pokud nám někdo řekne, kterým směrem se z vydat, pak už má otázka na rychlost růstu grafu smysl.
Příklad.
Uvažujme funkci
Pohybujeme se na přímce dané parametrickou rovnicí
Jde samozřejmě o situaci s řezem, kterou jsme již viděli v
úvodní části.
Graf funkce f jsme proťali svislou rovinou nad přímkou danou vzorcem
Opravdu jsme dostali funkci
φ jedné proměnné, můžeme ji tedy
zderivovat a hodnota derivace v čase
Geometricky, graf funkce f jsme řízli svislou rovinou a tento řez pak představuje jednorozměrnou situaci, kde již derivaci spočítáme snadno.
Pokud se například vydáme z bodu
ve směru
Jak jsme již diskutovali, abychom dostali kompatibilní výsledek, musíme vyžadovat, aby se směry zadávaly pomocí vektorů velikosti 1. V našem případě bychom použili vektor
Podle výpočtu výše dostáváme, že v tomto směru se graf funkce f mění rychlostí
Toto už je také geometricky významná informace, například to opravdu souhlasí se směrnicí "tečny ve směru", tedy tečny, kterou bychom v bodě sestrojili na skutečném řezu grafem.
Pomocí tečny teď můžeme aproximovat hodnoty funkce ve směru
. Pro funkci
φ platí
Substitucí
dostáváme rovnocenný, ale mnohem příjemnější vzorec
Pokud nás zajímá jen aproximace, tak vlastně ani nemusíme normalizovat.
Vzorec
Každopádně závěr je, že pokud se chceme z bodu pohybovat jen v dotyčném směru, pak lze hodnoty funkce aproximovat (pro malá s) vzorcem
Užitečné úvahy, které jsme právě provedli, si zaslouží oficiální zakotvení.
Definice.
Nechť f je funkce definovaná na nějakém okolí bodu∈ℝn. Nechť je vektor zℝn. Řekneme, že funkce f je diferencovatelná v bodě ve směru , jestliže limita
konverguje.
Pak definujeme (směrovou) derivaci f v bodě ve směru jako
Je to vlastně derivace odpovídající funkce φ,
přičemž derivaci počítáme běžným způsobem. Ještě snadnější výpočet uvidíme brzy.
Jeden z výsledků onoho příkladu výše je nyní možné zachytit vzorcem
Definice je zavedena pro obecné směry , protože jsou aplikace, kde to má smysl (třeba fyzika), zde budeme směry normalizovat.
V úvodní části jsme uvedli, že řezy v souřadnicových směrech jsou
nejpříjemnější, protože nemusíme zavádět nový parametr, pracujeme s funkcemi
Jak by například vypadala derivace ve směru
Příklad.
Vraťme se k funkci
Nejprve to uděláme podle definice. Pohybujeme se po parametrické přímce
Alternativní přístup: Vezmeme funkci
Je vidět, že takto snadno získáme derivace obecně v libovolném bodě
V praxi se ty nulky nepíšou, prostě se prohlásí, že derivace
Protože se tyto derivace počítají tak snadno a zároveň jde o klíčové směry, není divu, že tato myšlenka má speciální jméno.
Definice.
Nechť f je funkce definovaná na nějakém okolí bodu∈ℝn. Uvažujme jednotkové vektoryi ve směru souřadnicových os,1 = (1,0,0,...,0), 2 = (0,1,0,...,0), ...,n = (0,0,0....,1). Pro
i = 1,...,n definujeme parciální derivaci f vzhledem kxi jakopokud tato existuje.
V praxi se parciálně derivuje podle dané proměnné tak, že si představujeme, že všechny ostatní proměnné jsou konstanty (a tudíž i všechny výrazy, které vytvoří), a derivuje se podle dané proměnné běžnými pravidly.
Příklad.
Uvažujme funkci
Parciální derivaci podle x získáme tak, že si představujeme, že y a z
jsou nějaká konkrétní čísla. Protože to děláme poprvé, tak si opravdu
zkusíme dát nějaká čísla místo y a z, třeba 13 a
π. Pak je i
Stejná úvaha, ale s "y" a "z" coby konstantami, nám posytne hledaný výsledek
Obdobně si pro parciální derivaci podle y můžeme představit, že namísto x a z jsou konstanty, třeba 23 a π, a rozmyslíme si v duchu, že výpočet by pak vypadal takto:
Na papír pak napíšeme
Samozřejmě zkušený derivátor (dle vzoru "terminátor") si čísla ani nepředstavuje, prostě se naučí dobře
předstírat, že někde je konstanta, a trochu si to rozmyslí. Ještě chybí
derivace podle z, na to si bereme x a y jako konstanty, pak je ovšem
celý člen
Mimochodem, ono kroucené značení ∂, které kupodivu nemá nějaké jméno (kromě "značky pro parciální derivaci"), se dá používat stejně příjemně jako derivační čárka k indikaci derivování konkrétních výrazů, jen se značí zleva. Například u té poslední derivace můžeme použití pravidla pro derivování složené funkce vyznačit zápisem
Již víme, že parciální derivace dává informace o tom, jak se funkce mění (roste, klesá) v klíčových směrech.
V tomto obrázku jsou obě parciální derivace záporné, takže graf klesá, pokud se z bodu posuneme ve směru souřadnicových os. Zdálo by se, že si v ostatních směrech funkce může dělat co chce, a to je obecně pravda. Pokud ovšem po funkci f požadujeme, aby se její graf "ostře nelámal", pak funkce tuto svobodu ztrácí. Poněkud překvapivě stačí docela málo, aby byl růst či klesání funkce ve všech směrech jednoznačně určen tím, jak se chová v souřadnicových směrech.
Věta.
Nechť f je funkce definovaná na nějakém okolí bodu∈ℝn. Jestliže existuje nějaké okolí bodu , že na něm pro všechnai = 1,...,n existují parciální derivace a jsou spojité v , pak má f v derivace ve všech směrech a pro každé platí
Požadavky na spojitost derivací jsou splněny často, v zásadě každá funkce zadaná algebraickým vzorcem s elementárními funkcemi (kromě absolutní hodnoty) toto splňuje, a pro takovéto funkce tedy derivaci v libovolném směru určíme čistě ze znalosti parciálních derivací. To ukazuje, že podmínka spojitých derivací má docela velké dopady.
Pro lepší manipulaci bývá zvykem schovat parciální drivace do jednoho balíčku.
Definice.
Nechť f je funkce definovaná na nějakém okolí bodu∈ℝn. Jestliže existují všechny parciální derivace() proi = 1,...,n, pak definujeme gradient f v jako vektor
Někdy se gradient značí také jako
Je dobré si uvědomit, že gradient je vektor z
Pro funkci se spojitými derivacemi (tedy pro naprostou většinu běžně potkávaných funkcí) se závěr poslední věty výše dá elegantně napsat pomocí skalárního součinu jako
D f () = ∇ f ()•.
Příklad.
Uvažujme zase
V bodě
Gradient v sobě skrývá zajímavé informace, je to jeden z klíčových pojmů.
Představme si, že jsme v bodě
, sedíme na grafu a
rozhlížíme se, jak
ten povrch vypadá. Podle toho, kterým směrem se díváme, graf stoupá či klesá
a rychlost stoupání či klesání je dána směrovou derivací. Jinak řečeno, je
dána výrazem
kde α je úhel mezi vektory
Vidíme, že stoupáme nejrychleji, pokud se vydáme tak, aby
Fakt.
Nechť f je funkce, která má na okolí bodu spojité první parciální derivace. Pak gradient∇ f () udává směr největšího růstu funkce v bodě , funkce tam roste rychlostí||∇ f ()||. Vektor
-∇ f () udává směr největšího spádu v bodě .
Jsme stále v bodě
a sedíme na grafu. Tímto místem grafu jistě prochází
nějaká úroveň, jmenovitě úroveň
Jinými slovy, směr, kterým z bodu vychází hladina konstantnosti, je kolmý na směr nejvyššího růstu daný gradientem. Zkusme si to představit prakticky. Stojíme na úbočí hory a zvažujeme, kdy se vydat. Opravdu platí, že směr s největším stoupáním musí být kolmý na směr po vrstevnici? Umím si živě představit tvary úbočí, kdy tomu tak není. Finta je v tom, že takové úbočí coby graf funkce dvou proměných pak nesplňuje podmínku spojitosti derivací.
Fakt.
Má-li funkce f na okolí bodu spojité první parciální derivace, pak je gradient∇ f () kolmý na hladinu konstantnosti procházející bodem .
Toto je velice užitečné. Mnohé útvary lze reprezentovat jako hladiny konstantnosti vhodné funkce, gradient pak umožňuje snadno získat kolmice k dotyčnému útvaru, což zase umožňuje pracovat s tečnými objekty.
Příklad.
Uvažujme elipsu danou rovnicí
chceme najít její
tečnu v bodě
Jedna možnost je použít přístup přes grafy. Daný bod leží na horní polovině elipsy, kde ji lze vnímat (pokud vzorec řešíme pro y) jako graf funkce
K nalezení tečny pro
směrnice tečny je proto
Alternativní přístup: Danou rovnici upravíme na příjemnější tvar
Tento vektor je kolmý na dotyčnou hladinu konstantnosti neboli naši elipsu,
proto je i kolmý na její tečnu. Rovnice přímky kolmé na
Již jsme si říkali, že pro funkci více proměnných nemá smysl mluvit o tečně.
Když si ale představíme graf funkce dvou proměnných, napadne nás, že by
mohly existovat tečné roviny. Pro funkce tří proměnných pak existují tečné
třírozměrné prostory (které vypadají "ploše", když jsou zasazeny do
čtyřrozměrného prostoru, ve kterém žije graf) atd. Obecně se plochému
n-rozměrnému objektu v prostoru
Jak je najdeme? Tím, že se na chvíli oprostíme od geometrie a podíváme se na tečny analyticky. Víme, že u funkcí jedné proměnné je tečna v bodě a taková přímka, která nejlépe ze všech přímek aproximuje chování f okolo bodu a,
f (a + h) ∼ f (a) + f ′(a)h.
Jak bychom co nejlépe aproximovali hodnoty funkce
Namísto pohybu jakoby diagonálního se do stejného místa
Z bodu
Dáme to dohromady:
V obrázku (plochu grafu vidíme zdola) jsou hodnoty použité při aproximaci zvýrazněny plnými kolečky, zatímco správné hodnoty kroužky. Vyznačili jsme i jednotlivé tečny ve směru os použité při aproximaci.
Pokud je funkce f dostatečně pěkná, tak se při pohybu o opravdu miniaturní kousek nestačí derivace příliš změnit, proto onen posun o h v argumentu zanedbáme a dostaneme
Jinak psáno,
Výraz na pravé straně opravdu definuje rovinu a je to přesně ta, kterou jsme hledali. Její rovnice je
neboli
Je to tedy rovina daná normálovým vektorem
Obdobná úvaha platí i ve více rozměrech, máme odhad
a tečnou nadrovinu
I zde se získá standardní tvar rovnice roznásobením.
Fakt.
Nechť funkce f má spojité první derivace na okolí bodu . Jestliže vektor∇ f () rozšíříme o jednu souřadnici navíc, jmenovitě přidáme −1 jako souřadnici(n + 1), dostaneme vektor vℝn + 1 kolmý na tečnou nadrovinu ke grafu f v bodě .
Příklad.
Uvažujme
Spočítali jsme výše, že
Skrz jaký bod má tečná rovina jít? Protože
0 = •((x, y,z) − (1,2,5)) = 2(x − 1) + 4(y − 2) − (z − 5) => 2x + 4y − z = 5.
Alternativa: Rovina kolmá na vektor
Další alternativa: Graf je dán rovnicí
a jsme hotovi.
Závěr: Tečná rovina ke grafu f v bodě daném
Ještě si na tomto příkladě zopakujeme další poznatky o gradientu.
Funkce f poroste nejrychleji, pokud se z bodu
Bod
Z normálového směru
Podobně jako u funkcí jedné proměnné, i funkce více proměnných lze derivovat
vícekrát, pokud nám to funkce dovolí. Třeba u funkce
Na rozdíl od případu jedné proměnné máme nicméně na výběr, dle čeho a co derivovat. U funkce dvou proměnných máme derivace prvního řádu a a obě tyto derivace můžeme následně derivovat podle x či podle y, čímž vzniknou celkem čtyři různé parciální derivace druhého řádu, například následující dvě. Ukážeme nejprve podrobný zápis postupu a pak standardní kondenzované značení:
Všimněte si pořadí derivování, symboly ve jmenovateli se berou zprava doleva, tedy začneme proměnnou nejvíce vpravo. Například parciální derivaci třetího řádu bychom získali tak, že nejdříve derivujeme f podle x, výsledek pak podle y a to zase dle x, zatímco pro získání bychom nejprve derivovali podle y a pak dvakrát dle x.
Definice.
Uvažujme funkci f definovanou na okolí bodu∈ℝn. Nechťi1,i2,...,im∈{1,2...,n} jsou indexy souřadnic. Definujeme odpovídající parciální derivaci řádu m funkce f indukcí jakoza předpokladu, že všechny potřebné derivace existují.
Pokud nejsou všechny indexy souřadnic
ik stejné, pak se taková derivace nazývá smíšená.
Podobně jako u derivací prvního řádu, i vyšší derivace se dají sebrat do jednoho celku.
Definice.
Předpokládejme, že funkce f má všechny parciální derivace druhého řádu v bodě . Pak definujeme její Hessovu matici v bodě jako
Prakticky řečeno, zderivujeme funkci f dle první proměnné, tuto drivaci pak zderivujeme znovu postupně podle všech proměnných a z výsledků vytvoříme první řádek matice, obdobně pak další. Poznamenejme, že na diagonále vidíme derivace typu , zatímco mimo ni jsou derivace smíšené.
Pro shrnutí derivací třetího řádu bychom potřebovali třírozměrnou matici, jakousi krychli, čímž se dostáváme k tenzorům, které tady rozhodně nechceme probírat. V mnoha aplikacích (většině?) si vystačíme s prvními dvěma derivacemi, spokojíme se s nimi i zde.
Parciálních derivací je totiž docela dost, například pokud pracujeme s
funkcí tří proměnných, tak je celkem
Věta.
Jestliže má funkce f všechny parciální derivace řádu m na nějakém okolí bodu a jsou všechny spojité v , pak při výpočtu konkrétní parciální drivace až po řád m nezáleží na pořadí derivování.
Mimo jiné to tedy znamená, že pokud je funkce f alespoň trochu rozumná (například zadaná vzorcem poskládaným z elementárních funkcí), tak je Hessova matice symetrická. Nabízí to určitou úsporu práce. U druhých derivací funkce dvou proměnných stačí počítat tři místo čtyř derivací, to ještě tak úžasné není a stejně bývá v praxi lepší spočítat všechny, protože shodnost smíšených funguje jako kontrola správnosti.
Výrazně lepší to ale je u vyšších řádů. Pro funkci dvou proměnných stačí počítat 4 derivace třetího řádu namísto osmi, pro funkci tří proměnných 10 derivací třetího řádu namísto 27 a 15 derivací čtvrtého řádu namísto 81. Popravdě řečeno to je spíše úspora teoretická, protože v praxi si většinou vystačíme s prvními dvěma řády, ale potěší.
Víme, že u funkcí jedné proměnné druhá derivace určuje znaménkem konvexitu a konkávitu funkce, velikost této derivace určuje míru zakřivení. Zde se přednášky obvykle zastaví. Jen pro zajímavost dodejme, že třetí derivace určuje vývoj konvexity/konkávity při pohledu zleva doprava. Kladná třetí derivace znamená, že se při pohledu zleva doprava zakřivení funkce "utahuje", jako když se blížíme ke středu šnekovy spirály, zatímco záporná třetí derivace signalizuje rozvolňování. O interpretaci vyšších řádů se ani nepokusíme.
Jako obvykle jsou ve více rozměrech věci ještě komplikovanější, takže se omezíme na význam druhé derivace, což už je mimochodem bonus, protože běžné kursy toto téma zcela ignorují.
Nejjednodušší je to s nesmíšenými derivacemi. Pokud graf funkce řízneme ve směru osy x, tak nám určuje konvexitu řezu, přesně jak jsme zvyklí, obdobnou informaci podávají , atd.
Na obrázku vidíme zajímavou situaci, kdy je funkce v jednom směru konvexní a
v druhém konkávní. Dostáváme tedy smíšené sigály o chování funkce v tomto
bodě a v této souvislosti se nabízí otázka, zda podobně jako u
růstu grafu je již chování v dalších směrech určeno konvexitou/konkávitou
v souřadnicových směrech. Je například pravda, že pokud bychom
pro funkci
Odpověď překvapivě zní, že ne, ještě se tam může dít spousta věcí, a to i když má funkce třeba spojité derivace libovolného řádu. Důvod tedy není v kvalitě funkce, ale v tom, že nesmíšené derivace druhého řádu nenesou dostatek informace. Jinými slovy, v okamžiku, kdy se začneme zajímat o zakřivení grafu, již nestačí dívat se jen na to, co se děje ve směru souřadnicových os. Potřebujeme ještě další informaci, což je přesně chvíle pro smíšené derivace.
Nejprve se podívejme na derivaci
a představme si situaci, že je kladná. Jak druhou věc v pořadí derivujeme podle y, tedy posouváme se ve směru osy y. Protože při tomto posouvání máme
znamená to, že funkce roste, tedy směrnice tečen ve směru x se zvětšují, tedy tyto tečny se vytáčejí směrem nahoru.
Umíte si představit situaci, kdy se pohybujete ve směru osy y a přitom se tečny ve směry x otáčejí směrem k většímu růstu? Takový graf je zkroucený, a to je význam smíšené druhé derivace, je to směr a míra zkroucení grafu. Ukážeme to na obrázku, na kterém se podíváme, co se děje okolo počátku.
Pro zjednodušení jsme si vybrali funkci, která je na obou osách konstantní, což mimo jiné znamená, že
Vidíme proto čistě vliv smíšené druhé derivace. Abychom ten jev viděli co nejlépe, otočili jsme osy a x jde doprava, jak jsme zvyklí při znázorňování směrnice tečny. Osa y pak nutně musí jít směrem od nás.
Pokud je funkce dostatečně hladká, tak by mělo platit
měli bychom tedy dostat stejný obrázek i při interpretaci výrazu
Pokud se pohybujeme ve směru osy x, tak se směrnice tečen ve směru y stáčejí nahoru. Obrázek toto odráží, větší směrnice "ypsilonové tečny" znamená příkřejší růst ve směru osy y, tedy směrem od nás.
Právě takovéto zkroucení grafu může způsobit, že konvexita v souřadnicových směrech ještě neznamená tvar dolíku, při zkoumání zakřivení grafu je třeba (matematickým způsobem) posoudit vzájemné působení konvexity v souřadnicových směrech a zkroucení grafu indikované smíšenou derivací. Všechny složky v Hessově matici (všechny derivace druhého řádu) tedy hrají stejně důležitou roli. Na toto téma samozřejmě narazíme v části o lokálních extrémech.
Funkce více proměnných: Lokální extrémy
Zpět na Extra - Funkce více proměnných