Proč matematika a proč takhle?

Pro mnoho studentů není největším problémem u kalkulu samotný materiál, ale motivace. Proč bychom se měli učit všechny ty věci, ptají se, když tím začínají procházet, k čemu to je? A co je nejsmutnější, mnozí si ještě pořád kladou tyto otázky poté, co dokončí příslušný kurs.

Většina kursů má části zvané "Aplikace" (zde jsme se tím také provinili), ale studenti je tak nevidí. Není divu, aplikace integrálů se obvykle omezují na objemy rotačních těles a podobné věci, které zrovna neděláte každý den, a co se týče derivací, ani já už si nevzpomenu, kdy jsem naposledy potřeboval najít čtverec o největším obsahu, který lze vepsat do jablka.

Takové příklady se samozřejmě najdou i v Math Tutoru, a i když jsem se snažil zahrnout také příklady, které vypadají alespoň vzdáleně reálné ("related rates", sekce Aplikace v části Řady - Teorie - Řady funkcí atd.), přesto je nutné přiznat, že studenti mají zcela pravdu, když nejsou s podobnými vysvětleními spokojeni.

Další otázka, kterou si často kladou, je následující: Proč musí matematici všechno tak komplikovat? Jak někdo může najít nějaký smysl v tom zdánlivě nekonečném řetězci Definic a Vět (nemluvě už o důkazech)? Zkusíme teď ukázat pár důvodů, proč děláme matematiku a proč tímto způsobem.

K čemu je matematika?

I když to pro studenty kalkulu může být těžké k uvěření, matematika tohoto typu je naprosto nutná, jakmile začneme vážně studovat svět kolem nás, zvláště když nám začne vrtat hlavou, jestli se věci dějí náhodně, nebo se řídí nějakými pravidly. V zásadě všechny významné pojmy, které se probírají v typickém kursu matematické analýzy, nebyly ve skutečnosti vymyšleny jen tak z rozmaru matematiky, ale jinými vědci (zejména lidmi dnes zvanými fyzici), protože to prostě potřebovali. Matematika je především jazyk; jazyk, kterým popisujeme procesy, které se dějí kolem nás. Ovládat matematiku ve skutečnosti nespočívá v počítání derivací či integrálů, ale ve schopnosti zapsat naše myšlenky a pozorování pomocí matematiky a pak to použít k získání hlubšího náhledu do dotyčného jevu.

Můžeme si například všimnout, že když upustíme kámen, tak čím déle letí, tím větší dráhu urazí. To je dobrý začátek (a matematiku jsme na to nepotřebovali), ale toto zkoumání daleko nedojde, pokud se nezeptáme, jak ona vzdálenost na čase záleží. Je to závislost lineární (d = kt)? Je kvadratická (d = kt2)? Nebo třeba ještě jiná? Jen pokud si takové otázky položíme a odpovíme na ně, máme naději se dozvědět něco víc o gravitaci. A než se nadějeme, vymysleli jsme matematiku.

Hlavní výhoda matematiky coby jazyka je její přesnost. Jestliže lze nějaký proces popsat matematicky, pak (a jenom pak?) můžeme objevovat a také potvrzovat pravidelnosti a zákonitosti, které jsou v tomto procesu. Matematika je také soubor nástrojů, které nám umožňují extrahovat nové informace z popisu, který jsme dostali. A protože je matematika z podstaty přesná, zase jsou odpovědi, které takto dostaneme, spolehlivé.

Je pak přirozené, že ty oblasti vědy, které dokáží dobře využívat matematiku, také mají vysoce spolehlivé předpovědi. Když fyzik prohlásí, že se za dané situace něco stane, pak nám zkušenost říká, že se to tak opravdu stane. (Ve fyzice jsou samozřejmě také oblasti, kde jsou teorie nové a neověřené, kde se naše znalosti stále ještě rozvíjejí - pak se dá čekat nějaké to překvapení. To je ale v pořádku, taková překvapení pomáhají pokroku.) Například mechanika pohybu v gravitačním poli je už dobře pochopená, takže když se vypustí družice určitou rychlostí v určitém směru, tak jsme schopni předpovědět její další dráhu s úžasnou přesností - a tyto předpovědi fungují (pokud se tedy družici nestane nějaká nehoda).

Rozumíme také napětí a silám a co dělají s materiály, matematika nám dává odpovědi, díky kterým můžeme stavět vysoké budovy a odvážné mosty, které nepadají (skoro). Je mnoho podobných příkladů, kde je matematika zásadní, a možná se zeptáte, proč jste o nich neslyšeli v třídě. Tak za prvé, výukový čas je tak omezený a napjatý, že je typický přednášející rád, když zvládne alespoň základy, na nějaké bonusy už není čas. Za druhé, aby se o většině aplikací dalo alespoň trochu rozumně mluvit, je třeba dost dobrá znalost v jiných oblastech (diferenciální rovnice, fyzika,...), ale právě to (typický) prvák nemá. Ale dost omlouvání, jdeme dál.

Tento poslední příklad o inženýrských věcech se dotkl důležitého tématu. Když je struktura, kterou popisujeme, příliš komplikovaná, pak je odpovídající matematický popis (model této struktury, většinou soubor rovnic omezujících chování důležitých parametrů) také komplikovaný a nemusíme mít nástroje na jeho "vyřešení". Konec konců, přesné řešení neumíme najít dokonce ani pro jednoduchou rovnici x5 + x + 1 = 0, což naznačuje, že se toto stává docela často. Matematika pak většinou nabízí alespoň nástroje na přibližné řešení, zvláště rozvoj počítačů tady silně pomohl. Pokud se s nimi pracuje moudře, tak ty přibližné odpovědi fungují dobře, ale někdy... i ten most občas spadne.

Občas je situace tak komplikovaná, že ji dokonce nedokážeme ani matematicky přesně popsat. Tím se vysvětluje, proč nejde přímo navrhnout řekněme "dokonalé letadlo" s nejmenším odporem vzduchu a nejlepším výkonem. Když se letadlo pohybuje vzduchem, tak se toho děje tolik, že to fyzici nedokáží zcela popsat. Relativně věrné modely již existují, ale příslušné rovnice jsou zase tak složité, že je matematika nedokáže vyřešit (alespoň zatím a žádný pokrok není na obzoru). Počítače a přibližné metody docela napoví, ale nakonec musíme stejně vzít navržený tvar do aerodynamického tunelu a zeptat se přírody, co si o tom myslí, protože je vždycky možné, že má pro nás nějaké překvapení. Také auta, vlaky, závodní kola a podobné věci jdou do tunelu. Podobně dostáváme jen přibližné odpovědi o pevnosti konstrukce na straně jedné a silách na ni působících na straně druhé. Když se tedy navrhuje letadlo, tak vyrobí jeden kus speciálně jen proto, aby jej mohli zatížit a rozlámat a tak dokázat, že vydrží, na co bylo navrženo.

Odbočka, kterou můžete přeskočit: Na konci 20. století sloužily v akci dva "neviditelné" letouny, F−117 (ten ošklivý, s plochými tvary a ostrými hranami) a B-2 (ten hladký bombardér s ladnými tvary). Všechno to začalo prací ruského matematika, který zkoumal model odrazu radarových vln a zjistil, že síla tohoto odrazu je více ovlivněna hranami než velikostí objektu. Američané se rozhodli toto aplikovat na opravdické letadlo. Požadavek, aby letadlo rozumně létalo a zároveň bylo malé z pohledu radaru, byl dost odvážný, a tak se řešení hledalo masivním proháněním přibližných metod počítači. Když navrhovali F−117, tak ještě nebyly dostatečně silné počítače; výsledky byli schopni dostat, jen když problém zjednodušili předpokladem, že se letadlo skládá z plochých stěn, a letadlo bylo na světě. Když po nějaké době navrhovali B−2, tak už se počítače natolik vylepšily, že dokázaly zvládnout pekelné výpočty nutné pro práci se zakřivenými plochami. Nemusíte se mnou souhlasit, ale zdá se mi úžasné, že za evidentní rozdíl ve vzhledu těchto dvou letadel může několik let vývoje počítačů, a že dva základní faktory za tím vším je objev jednoho matematika a fakt, že kvůli přílišné složitosti nejsme schopni příslušný model přesně vyřešit.

Podobně neumíme spolehlivě předpovídat počasí nebo burzu, protože tyto dva systémy jsou příliš komplikované na to, aby se daly dostatečně popsat matematicky, nemluvě už o řešení výsledných modelů.

Složitost modelu ale není jediný problém. Někdy se prostě matematika nedá použít vůbec nebo skoro vůbec, protože abychom něco mohli popsat matematicky, musí to být především měřitelné. To spousta věcí není, typickými přiklady jsou psychologie či filosofie. Jediná matematika, která v psychologii funguje, je statistika, tudíž jsou i odpovědi statistické - užitečné při práci s velkými skupinami, ale s omezenou spolehlivostí, když dojde na jednotlivce. Možná jste si všimli (nebo si všimnete teď, když na to došlo), že všeobecná spolehlivost předpovědi je obvykle přímo svázána s tím, jak moc matematiky používá.

Většina matematiky, která se takto používá, závisí na sblížených pojmech derivování a integrování. Abychom viděli proč, nabízíme teď dva příklady. První je docela snadný, myslíme, že maturant by to měl být schopen sledovat (dokonce i dobrý třeťák). V tomto příkladě ukazujeme, jak se důležité pojmy z analýzy objeví zcela přirozeně, když se snažíme rozmyslet si docela jednoduchou situaci. Druhý příklad je méně triviální a předpokládá znalost materiálu z typického prvního kursu analýzy. Ukazuje, jak nám některé nápady probrané zde v Math Tutoru pomáhají při studiu tepla a vedou k důležité diferenciální rovnici.

Proč nemluví česky?

Z toho, co jsme napsali, je jedna věc jasná: Odpovědi, které matematika dává, musí být stoprocentně spolehlivé. Když vyřešíme kvadratickou rovnici pomocí populární básničky "bé na druhou mínus čtyři ácé", tak chceme mít naprostou jistotu, že čísla (číslo) vypadnuvší z toho vzorečku opravdu řeší dotyčnou rovnici (pokud tedy neuděláme chybku, ale to je jiná pohádka). Vyžádalo si to dost práce (a pár "revolucí v matematice" před zhruba sto lety), ale dnes panuje všeobecná shoda, že tuto spolehlivost máme. (Poznamenejme, že toto se týká jen matematiky samotné. Matematika dodává odpovědi v rámci modelu, ve kterém je použita, ale pokud tento model nepopisuje úplně přesně reálnou situaci, kterou studujeme, pak také odpovědi - i když matematicky přesné - nemusí být správné v reálném světě. Tento rozdíl mnoho lidí nechápe, a jak už jsme se dříve zmínili, věrnost matematického modelu může být v některých oblastech docela problém.)

Když se nad tím zamyslíte, brzy si uvědomíte, že pro dosažení takové spolehlivosti je absolutní nutností, aby byl jasný význam pojmů, se kterými matematika pracuje. Když si třeba pro srovnání vezmete náhodně pět filosofů, zavřete je do jedné místnosti a zeptáte se jich, co je to svobodná vůle, tak je docela dobrá šance, že se brzy strhne rvačka, a velice malá naděje, že se všichni shodnou. Pak se také nelze divit, že filosofové navzájem nesouhlasí se svými závěry. Podobně když se zeptáte, jestli je určitá konkrétní země demokratická či ne, tak bude odpověď záležet na tom, koho se zeptáte. Něco takového se v matematice nemůže povolit.

Právě proto máme definice. Dá se říci, že definice je test, který nám dovoluje rozhodnout. Nechť je například f funkce definovaná na reálné ose.

Definice: Řekneme, že f je lichá, jestliže splňuje podmínku f (−x) = −f (x) pro všechna reálná čísla x.

Toto je typická definice, většina z nich má tvar "Řekneme, že objekt f splňuje vlastnost P (nebo: nazýváme jej P), jestliže splňuje určitou podmínku C." Všimněte si, že jsme použili slovo "jestliže", ale je to vlastně špatně. Ve skutečnosti tím myslíme "tehdy a jen tehdy", definice je vždy výlučná. Řekneme, že objektu budeme říkat P, jestliže je Cf ) splněno, ale rozhodně také nechceme, aby se jako P označovaly jiné objekty, které to C nesplňují, to by zcela zničilo celý smysl dělání definic. Jenže matematici jsou líní a v definicích je tradiční psát jen "jestliže" a myslet tím "tehdy a jen tehdy".

Zpět k naší definici "lichého". Když se na takové definici shodnou všichni matematici, pak už se také nutně musí shodnout na tom, které funkce jsou liché a které ne. Je to velice jednoduché, když jim dáte nějakou konkrétní funkci, tak si všichni vyzkouší, zda je splněna ona podmínka výše. Protože je algebra univerzální, musí dostat stejné odpovědi. To je asi hlavní rozdíl mezi matematikou a tím filozofickým přikladem. I kdyby se filosofové na nějaké definici svobodné vůle shodli, tak bude vyjádřena slovy, která jsou z principu ne zcela jednoznačná, tudíž pak v konkrétních případech nemusí souhlasit, zda určitý jev tuto vůli vykazuje či ne. Problém tedy není v neochotě filosofů se shodnout, ale v nejednoznačnosti používaného jazyka. Opět se dostáváme k tomu, že v matematice potřebujeme jazyk speciální, který takové nejednoznačnosti vylučuje.

Definice má ještě další význam. Pokud nějak dokážeme, že určitý objekt f má vlastnost P, tak už ji všichni můžou použít, kdykoliv to potřebují, čili mohou spoléhat na Cf ). Kdysi se například dokázalo, že funkce sinus je lichá (důkaz je v knížkách). Každý teď proto může psát například sin(−13) = −sin(13) a být si jistý, že je to pravda. Jakmile se totiž dokáže, že je sinus lichý, pak se dá na podmínku z definice spolehnout.

Definici tedy používáme dvěma způsoby. Pokud máme nový objekt a chceme ukázat, že má žádanou vlastnost, pak musíme nějak ukázat, že je pro tento objekt splněna podmínka C. Pokud to ale na druhou stranu už někdo dokázal, tak už tu podmínku můžeme volně využívat, kdykoliv s tím objektem pracujeme.

Kde se definice berou? V jistém smyslu jsou libovolné. Představte si, že pojem "lichá" ještě nebyl definován a já se rozhodnu udělat toto:

Definice: Řekneme, že funkce f je lichá, jestliže splňuje f (0) = 13.

Co by se stalo? Nejprve je třeba zdůraznit, že na této definici není nic špatného. Je to naprosto normální definice. Na druhou stranu, i když je to má definice, tak musím přiznat, že ta definovaná vlastnost je víceméně k ničemu. Proto by ji také nikdo nepoužíval (kromě mě, kdybych si na ní zakládal) a jakmile bych umřel, tak by z matematiky vymizela. Snažíme se tady říct, že jméno vůbec není důležité, důležitý je smysl definice, a ten obvykle přichází z praktického použití. Když lidé pracovali s funkcemi, tak si všimli, že některé z nich mají tu zajímavou vlastnost, že když do nich strčí mínus, tak je to stejné, jako kdyby jej strčili před funkci. Co je důležitější, toto podivné chování se ukázalo jako docela užitečné a lidé to tu a tam použili. Dříve či později vás začne nudit pořád psát "protože funkce má todleto podivné chování, tak můžu udělat tohle či tamto," a prostě tomuto chování přiřadíte nějaké jméno. Namísto "lichá" jsme takové funkce mohli nazývat třeba "růžová" a všechno by fungovalo naprosto stejně. Tímto způsobem se objevila většina definic, jsou to zkratky pro vyjádření "s tímto objektem mohu dělat tuto určitou věc."

Někdy není první nápad, jak by měla definice vypadat, ten úplně nejlepší. Stalo se vícekrát, že lidé udělali definici vlastnosti P, ale když se dozvěděli více, tak zjistili, že ve většině situací vlastně říkají "tento objekt má vlastnost P a něco malého navíc." Tak se sešli a rozhodli tu definici upravit, takže pak už definice P také zahrnovala to něco malého. Stane se také, že se jeden pojem definuje nezávisle více lidmi. Není to tak vzácné, a protože tyto definice plynou z nějaké potřeby, tak spolu tyto nezávislé definice obvykle souhlasí. Někdy se ale také stane, že neříkají totéž, a pokud jsou obě verze užitečné a obě přilákají následovníky, tak máme nepříjemnou situaci, že jeden pojem může znamenat více věcí. Například jsme tady definovali konvexní a konkávní funkce; tato definice se používá ve (většině) Evropy a v Asii, ale v Jižní Americe mají ty jména přesně naopak!

Poučení z této pohádky je, že když se o matematice bavíte s lidmi, tak je dobré si ověřit, že používáte stejné definice. V 99.99 procentech tomu tak je, ale když se vám bude zdát, že je někde nějaké nedorozumění, tak je čas si na to posvítit.

Mimochodem jsme se tím dotkli druhé stránky definic. Mluvili jsme o tom, kde se berou myšlenky, ale kde se berou jména? Proč se lichá funkce jmenuje lichá a ne zaškudlená? Většinou se berou asociacemi, například u těch lichých funkcí je to zjevná narážka na mocniny xk pro lichá k. Tady už nějaká praxe nepomůže, většinou tedy přežije ten název, který někdo zavedl jako první. V tomto ohledu pak nezávislý vznik pojmů znamená větší problém, protože zatímco smysl definice je do jisté míry diktován potřebami, jména si lidi tahají z klobouku a snadno dojde k podobnému problému, jako je ten zmatek s funkcemi rostoucími, neklesajícími, ryze rostoucími a podobně.

 

Tím hlavním v matematice jsou ovšem věty. Typická věta říká: Jestli o nějakém objektu vím určitou věc, pak musí automaticky platit i nějaká jiná věc. Jestliže jste mrtví, pak nepíšete domácí úkoly. Jestliže v několikapatrovém baráku vybouráte všechny zdi v přízemí, tak spadne. Pokud si sednete na mraveniště s kolonií červených mravenců, tak toho budete za chvíli litovat. No, může být docela zábava hledat situace, za kterých tyto tři tvrzení nemusí platit, ale u matematického tvrzení musí být jakákoliv možnost, že by nefungovalo, zcela vyloučena (alespoň ve světě logiky a aritmetiky). Jestliže pro nějaké reálné číslo x platí x > 3, pak automaticky 2x > 6, na tom se prostě nemůže nic pokazit.

"Opravdické" matematické věty jsou samozřejmě drobet komplikovanější a tudíž je přirozeně i méně triviální zjistit, zda jsou opravdu správně. Protože ale chceme, aby byla matematika zcela spolehlivá, potřebujeme dokázat pravdivost všech tvzení, která v ní uděláme. Čímž se dostáváme k důkazům. Důkaz je v zásadě logické odvození, které (v typickém případě) ukazuje, že se z předpokladů věty dá dojít k jejímu závěru pomocí logického řetězce tvrzení; každá dvě sousední tvrzení v tomto řetězci musí být buď tak blízká, že je od jednoho k druhému jednoduchý (a tudíž snadno ověřitelný) logický či algebraický krok, nebo je můstek od jednoho k druhému vytvořen již dříve dokázanou větou.

Práce (teoretického) matematika se točí okolo objevování nových tvrzení a pak hledání důkazů pro tato tvrzení. Když se takový důkaz najde, tak je výsledek publikován a ostatní matematici se v něm začnou vrtat. Pokud se přesvědčí, že v argumentech nejsou žádné mezery či prostor pro pochybnost, pak je akceptován a toto tvrzení se stane větou. Někdy se najde chybka, občas k tomu dojde. Protože matematika není náboženství, matematici obvykle rychle přiznají omyl a buď tuto domnělou "větu" stáhnou, nebo k ní dodají opravdický důkaz. Věty, které tímto testem prošly, se shromažďují do knih a tvoří teorie, na ty už se dá spolehnout (s velice vzácnými výjimkami - pokud samozřejmě nepočítáme překlepy, tiskové chyby jsou s námi od počátku a zdá se, že tu přes všechen technický pokrok ještě zůstanou).

Tím se dostáváme k poslednímu tématu. Pokud chceme ověřit, že jsou důkazy správné, pak musíme být velice opatrní na to, jaký jazyk v nich používáme (vzpomeňme na ty filosofy). To matematiky v zásadě přímo nutí k přijetí určitého formalismu, něčeho, co lidem ztěžuje porozumění argumentům (a matematice obecně), ale má tu ohromnou výhodu, že to neumožňuje dva a více významů (na rozdíl od lidských jazyků). Jinými slovy, na řadu přichází epsilon a delta. Upřímně řečeno, my z nich taky nejsme zrovna nadšeni. Dokonce se matematici snažili obejít bez nich, ale bohužel pak dostávali odpovědi, které nebyly pravdivé, což prostě v matematice nejde připustit. S nechutí proto přijali onen nudný a nepříjemný formalismus a z matematiky se stal postrach studentů. (Poznámka: Relativně nedávno se objevil způsob, jak dělat kalkulus korektně a bez epsilonů. Problém je v tom, že je na to třeba nejprve strávit semestr studiem infinitezimál, což by se vám líbilo asi tak jako ty epsilony, a teprve pak by šlo začít s limitami, derivacemi atd.) Na začátku této sekce jsme napsali, co to znamená ovládat matematiku. Zde je další pokus: "Umět matematiku" znamená být schopen v pohodě překládat formální matematické výrazy do "lidštiny" a zpět. Pokud to umíte, tak zjistíte, že se často za těmi podivnými větami skrývají zajímavé myšlenky. Jednou z motivací pro vznik Math Tutoru byla právě snaha pomoci studentům vidět ony myšlenky za matematikou. Doufáme, že se nám to alespoň trochu povedlo.