Funkce více proměnných: Lokální extrémy

Definice lokálního extrému se zcela přirozeně přenese do více rozměrů.

Definice.
Nechť f je funkce definovaná na nějakém okolí bodu ∈ℝn.

Řekneme, že f má v lokální maximum nebo že f () je lokální maximum, jestliže existuje okolí U = U() takové, že f () ≥ f () pro všechna U.

Řekneme, že f má v lokální minimum nebo že f () je lokální minimum, jestliže existuje okolí U = U() takové, že f () ≤ f () pro všechna U.

Obrázek níže pro případ dvou proměnných ukazuje vlevo dvě lokální maxima a vpravo jedno lokální minimum.

Podobně si to představujeme ve více dimenzích. Lokální maximum má vlastnost, že když skrze něj řízneme graf v libovolném směru (čímž se z toho stane situace funkce jedné proměnné), tak tam pořád máme lokální maximum v klasickém významu. Obdobná vlastnost platí pro lokální minimum.

Ve více dimenzích existuje ještě jeden zajímavý typ chování, který na obrázku vidíme mezi oněmi dvěma kopci. Pokud tam graf řízneme svislou rovinou ve směru vedoucím mezi vrcholy, pak v tom údolíčku mezi nimi vidíme na řezu lokální minimum. Když ale řízneme graf ve směru kolmém, tak v tom údolí uvidíme na řezu lokální maximum. Takovýmto bodům říkáme sedlo či sedlový bod a při zkoumání extrémů se také připlétají do hry, takže se běžně berou jako součást zkoumání extrémů.

Jak lokální extrémy najdeme? Postup je obdobný vyšetřování lokálních extrémů pro funkce jedné proměnné. Zhruba řečeno, nejprve najdeme kandidáty pomocí první derivace, pak je posoudíme pomocí druhé.

Když graf řízneme libovolnou svislou rovinou skrz nějaký lokální extrém , bude extrém i na řezu, tedy derivace v v tomto směru musí být nulová. Jestliže mají být všechny směrové derivace nulové, pak musí být nulový (jako vektor) i gradient v .

Jiná úvaha: V lokálním extrému je tečná nadrovina vodorovná, musí tedy mít normálový vektor svislý. Jak jsme se dozvěděli v předchozí části, jako normálový vektor je možné vzít

Tento vektor je svislý, pokud () = 0 pro všechna i neboli f () = .

Věta.
Nechť f je funkce definovaná na nějakém okolí bodu ∈ℝn. Jestliže má f v lokální extrém a gradient tam existuje, pak f () = .

Bodům, kde f () = , říkáme stacionární body. Najdeme je při troše štěstí řešením soustavy n rovnic () = 0 o n neznámých x1,...,xn.

Jako obvykle neplatí naopak, že stacionární body dávají lokální extrémy. Například typický sedlový bod u funkce dvou proměnných je také stacionární bod. Když tedy najdeme stacionární body, je potřeba je ještě klasifikovat. K tomu slouží Sylvestrovo kritérium. Je mnohem snažší si jej pamatovat, pokud si umíme představit, co se děje.

Lokální maximum se pozná podle toho, že je maximem ve všech řezech, mimo jiné i v řezech rovnoběžných s osami. V situaci jedné proměnné ovšem maximum poznáme snadno podle druhé derivace, takže ve více dimenzích u lokálního maxima očekáváme () < 0 pro všechna i. Podobně u lokálního minima zase očekáváme, že () > 0 pro všechna i.

Podívejme se na případ dvou proměnných. Extrém (tedy maximum i minimum) mají společné to, že jsou znaménka (x, y) a (x, y) shodná, což se dá vyjádřit podmínkou (x, y)⋅(x, y) > 0. Pokud naopak (x, y)⋅(x, y) < 0, tak se znaménka musí lišit, tedy v jednom řezu vidíme maximum, v druhém minimum, což ukazuje na sedlo.

Vidíme, že by součin nesmíšených druhých derivací mohl sloužit jako prvotní ukazatel, zda máme extrém nebo sedlo. Pokud vyjde, že je extrém, tak se k rozlišení maxima a minima stačí podívat na nějaký řez, tedy stačí uvažovat znaménko libovolné nesmíšené druhé derivace, třeba (x, y).

Tyto úvahy nejsou zcela špatně, je tu ovšem nepříjemná mezera. Viděli jsme, že extrémy vedou na kladné znaménko součinu těch dvou derivací, ale my bychom potřebovali opačný směr. Jestliže zjistíme, že znaménko toho součinu je kladné, znamená to, že máme lokální extrém? Bohužel ne.

Problém je v tom, že je třeba také vzít v úvahu vliv derivace smíšené, tedy musíme uvažovat souhru složek Hessovy matice

První rozhodnutí mezi extrémem a sedlem jsme před chvílí dělali pomocí součinu hlavní diagonály této matice, což čtenáři doufejme připomnělo determinant. Ukáže se, že to opravdu takto funguje, det(H) > 0 ukazuje na extrém, det(H) < 0 na sedlo. Dostáváme následující algoritmus.

Vyšetřování extrémů pro f (x, y).

1. Řešením rovnice f (x, y) = neboli soustavy

najdeme stacionární body .

2. Pro každý stacionární bod najdeme odpovídající Hessovu matici H = H().

3. Jestliže det(H) < 0, je v sedlový bod.

4. Jestliže det(H) > 0, je v lokální extrém. Je to lokální maximum pokud () < 0, a je to lokální minimum pokud () > 0.

V případech, kdy vychází v klíčových okamžicích nuly, rozhodovací algoritmus selhává, nic nevíme a je třeba použít pokročilejší metody, které jsou za rámec tohoto úvodu.

Pokud budeme chtít tento proces zobecnit pro více proměnných, musíme se na něj podívat trochu z jiné strany. Nejprve si všimneme, že ve čtvrtém kroku vlastně také zkoumáme znaménko matice, jmenovitě podmatice H dané levým horním rohem. To je zajímavá inspirace, představíme si rozsáhlou matici H a zeptáme se, co lze čekat od znamének levých horních subdeterminantů, které se tradičně značí Δi. Abychom se vyhnuli hlubší teorii, zjednodušíme si situaci představou, že všechny smíšené derivace jsou nulové, tedy H je diagonální matice, pak se determinant získá pronásobením diagonály.

Připomeňme, že u lokálního maxima očekáváme () < 0 pro všechna i, zatímco u lokálního minima zase očekáváme, že () > 0 pro všechna i.

Čtenář si jistě hravě domyslí, jak to funguje dál. Pro maxima se znaménka stále střídají, pro minima jsou všechny detetminanty kladné.

Pokud nastane jiná konstelace znamének, pak maximum ani minimum nenastává, pokud někde vyskočí nuly, pak tento rozhodovací proces neuspěl a nevíme, co se v děje.

To, co jsme právě odvodili pro případ diagonální H, platí i obecně.

Věta (Sylvestrovo kritérium).
Nechť f je definováno a má spojité derivace druhého řádu na nějakém okolí bodu , který je pro f stacionární, tedy f () = 0. Nechť H je Hessova matice f v , nechť Δi jsou její levé horní subdeterminanty.

Jestliže Δi > 0 pro všechna i, pak je f () lokální minimum.

Jestliže Δ1 < 0, Δ2 > 0, Δ3 < 0 atd. až (−1) nΔn > 0, pak je f () lokální maximum.

Algorimus na hledání a klasifikaci lokálních extrémů pro f ().

1. Řešením rovnice f () = neboli soustavy

najdeme stacionární body .

2. Pro každý stacionární bod najdeme odpovídající Hessovu matici H = H().

3. Spočítáme subdeterminanty Δi neboli determinanty levých horních submatic velikosti i×i.

4. Pokud Δi > 0 pro všechna i, je v bodě lokální minimum.
Pokud se znaménka střídají Δ1 < 0, Δ2 > 0, Δ3 < 0,..., je v bodě lokální maximum.

Příklad.
Najdeme a klasifikujeme lokální extrémy funkce f (x, y,z) = 2xy2 − 4xy + x2 + z2 − 2z.

Nejprve najdeme stacionární body. Rovnice f () = je v tomto případě

Je to soustava tří rovnic o třech neznámých, to zní nadějně, ale rovnice nejsou lineární, tudíž celá ta krásná teorie nepomůže. Jak řešíme obecné soustavy?

My si hned všimneme, že třetí rovnice je nezávislá, tudíž jistě z = 1. Co dál? Nejspolehlivější metoda je eliminační, kdy si postupně vyjadřujeme proměnné a snižujeme počet rovnic. Šlo by například vyjádřit z první rovnice x = 2y − y2 a dosadit do rovnice druhé, vznikla by tak rovnice třetího stupně s y jako neznámou a to se při troše štěstí a chytrém vytýkání dá umlátit (zkuste to). Vypadá to nicméně dobrodružně a je dobré znát alternativy.

Zaměříme se na druhou rovnici, kterou si přepíšeme do tvaru 4x(y − 1) = 0. Pokud se nám podaří vytvořit součin na straně jedné a nulu na straně druhé, bývá to velký bonus. V tomto případě například vidíme, že jsou dvě možnosti, x = 0 a y = 1.

V případě y = 1 dává první rovnice −2 + 2x = 0 neboli x = 1 a máme první stacionární bod, (1,1,1).

V případě x = 0 první rovnice zní y2 − 2y = 0 a máme dvě řešení, y = 0 a y = 2. Vzniknou další dva stacionární body, (0,0,1) a (0,2,1).

Teď je třeba všechny tři stacionární body prozkoumat, tedy potřebujeme Hessovu matici. Připravíme si druhé parciální derivace, díky symetrii u smíšených stačí šest:

Hessova matice je

A jdeme na to:

Bod (1,1,1):

Znaménka jsou postupně +, +, +, proto je f (1,1,1) = −2 lokální minimum.

Bod (0,0,1):

Znaménka jsou postupně +, -, -, proto f (0,0,1) = −1 není lokální extrém.

Bod (0,2,1):

Znaménka jsou postupně +, +, -, proto f (0,2,1) = 3 není lokální extrém.

Příklad.
Najdeme a klasifikujeme lokální extrémy funkce f (x, y) = xy e x - y2/2.

Nejprve najdeme stacionární body. Řešíme rovnice

Exponenciála je vždy kladná, mohou se jí rovnice vydělit a stačí řešit rovnice (1 + x)y = 0 a x(1 − y2) = 0. Rovnice jsme upravili do příznivého tvaru součinu a první dává dvě možnosti.

Jestliže y = 0, pak z druhé rovnice x = 0 a máme stacionární bod (0,0).

Jestliže x = −1, pak z druhé rovnice y = ±1 a máme stacionární body (−1,−1), (−1,1).

Připravíme si druhé parciální derivace:

Hessova matice je

Člen e x - y2/2 je vždy kladný, proto jeho vytknutí ze všech členů neovlivní znaménka determinantů, zajímá nás tedy spíše matice

Protože jde o funkci dvou proměnných, použijeme první algoritmus, kdy nejprve posoudíme Δ2.

Bod (0,0):

tedy Δ2 = −1 < 0 a f (0,0) = 0 je sedlo.

Bod (−1,1):

tedy Δ2 = 2 > 0 a máme lokální extrém. Protože Δ1 = 1 > 0, je f (−1,1) = −e−3/2 lokální minimum.

Bod (−1,−1):

tedy Δ2 = 2 > 0 a máme lokální extrém. Protože Δ1 = −1 < 0, je f (−1,−1) = e−3/2 lokální maximum.


Funkce více proměnných: Integrál
Zpět na Extra - Funkce více proměnných