Stelling van lagrange

raintjah

Beschouw functies
\(f,g:\rr^n \rightarrow \rr\)
met continue partiële afgeleiden. Veronderstel dat
\(f(x_1,...,x_n)\)
een extreme waarde bereikt in
\(x^*=(x_1^*,...,x_n^*)\)
onder de conditie dat
\(g(x_1,...,x_n)=0\)
. Veronderstel dat
\(\nabla g(x^*)\neq 0\)
Dan moet er een
\(\lambda^* \in \rr\)
bestaan zo dat
\(\nabla f(x^*) = \lambda^*\nabla g(x^*)\)

Zou iemand de intuïtie kunnen uitleggen achter deze stelling? Het bewijs snap ik technisch gezien wel, maar ik heb er geen inzicht in. Ik zie niet in waarom die twee gradiënten aan elkaar gelijk zouden moeten zijn...

Brinx

'Lagrange multipliers' is een handige term om op te zoeken als je meer over dit onderwerp wilt weten. Alvast een heel duidelijke uitleg kun je hier vinden: http://www.slimy.com/~steuard/teaching/tut...s/Lagrange.html

Ik zal zelf ook proberen om het hier toe te lichten. Ik doe dit absoluut niet in wiskundig strikte beschrijvingen, maar meer op een manier dat je voor je kunt zien hoe het werkt. Bij mij helpt zo'n beschrijving tenminste vaak.

'f' is de functie waarvan je een extreme waarde zoekt, terwijl je toegestane zoekgebied beperkt wordt door de eis dat 'g' nul moet zijn over dat zoekgebied. Om het visueel voor te stellen: stel dat 'f' een hoogtekaart weergeeft (dus f(x,y) geeft de hoogte op het punt (x,y)), en dat g(x,y) = 0 een of ander pad (een lijn) over dat terrein beschrijft, dat allerlei verschillende hoogtes doorkruist - alsof je een wandeling maakt over een heuvelachtig terrein, waarbij je niet van het pad af mag. \(\nabla{f}\) geeft voor een of ander punt in het domein van f de vector weer die op dat punt in de richting van de steilste toename ligt: als je zeg maar in die richting loopt (\(\nabla{f}\) is tenslotte een vector met een x- en y-component) win je per stap het snelste hoogte. Als je die vector telkens opnieuw uitrekent voor je huidige positie, en je blijft in de richting van die vector lopen, dan kom je op een gegeven moment vanzelf op een (lokaal) maximum van 'f' uit. En andersom natuurlijk, als je telkens tegen die vector in loopt kom je uiteindelijk op een (lokaal) minimum van 'f' uit.

Goed, maar nu kunnen we niet zomaar elke kant op lopen die we maar willen: we worden ten slotte in onze keus van richting beperkt door het pad waar we op zitten, en die beperking is in de wiskundige vorm g(x,y) = 0 gegoten. Overal op ons pas is 'g' dus nul. Dat betekent dat \(\nabla{g}\) altijd haaks op ons pad staat (zie je waarom?). 'g' kan namelijk van ons pad af allerlei andere waarden aannemen (net als 'f' dat doet), maar we blijfen op een 'hoogtelijn' van 'g' lopen: haaks op de richting van de steilste helling van 'g'.

Als je nu op een bepaald punt staat op het pad (en je niet op een lokaal extremum van 'f' staat), en je kijkt naar \(\nabla{f}\), dan wijst die in een of andere richting - doorgaans niet precies tangentieel aan het pad, maar ergens het struikgewas in zeg maar. Als je nu het pad afloopt zodanig dat je in ieder geval in de richting van de component van \(\nabla{f}\) loopt die wel tangentieel loopt aan het pad, win je in ieder geval een beetje hoogte, en kom je dichter bij een (lokaal) maximum van je hoogteprofiel langs het pad (de 'f'-waarden waar je langs komt lopen). Zodra je zo'n maximale waarde van 'f' op je pad bereikt, wijst \(\nabla{f}\) ook haaks van het pad af! Waarom? Als je zo'n maximum bereikt op je pad ga je weer naar beneden als je een stap verder zet, en ga je ook weer naar beneden als je een stap terug zet. Je loopt op dat punt dus heel even langs een hoogtelijn van 'f'! En dan geldt hetzelfde als wat al eerder met 'g' aan de hand was: de richting van de steilste helling staat altijd loodrecht op de hoogtelijnen. \(\nabla{f}\) en \(\nabla{g}\) wijzen daar dus dezelfde kant op, of wijzen in tegengestelde richtingen. Welke van die twee situaties je ook hebt, je kunt de ene vector altijd uitdrukken als een of ander getal (positief voor dezelfde kant, negatief voor de tegenovergestelde kant) vermenigvuldigd met de andere vector. Dat getal waar je mee vermenigvuldigt is dus die \(\lambda\).

Daar komt dat theorema zo'n beetje op neer.

TD

Misschien niet zozeer voor het inzicht, maar wel waarom het zeker juist is: als je van die stelling ook het bewijs ziet, zal direct duidelijk zijn waarom de gradiënten gelijk (moeten) zijn.

raintjah

Wat wordt bedoeld met haaks? Loodrecht? Zoja, dan begrijp ik niet waarom de gradient van g loodrecht op ons pad staat. Waarom neemt g het snelst toe in de richting loodrecht op g?

Wat wordt bedoeld met tangentieel?

TD

Ik zal Brinx op zijn verhaal laten antwoorden. Alvast dit: tangentieel is rakend

raintjah

Even een redenering.

Ons pad is toch een rechte in een 2D vlak hé? Een pad gevorm door alle xen en yen waarvoor g nul wordt. Wanneer je dus partieel afleid, moet die afgeleide ook nul geven. Want als voor alle x bijvoorbeeld g nul is, en je verandert x een klein beetje, dan moet het nog steeds nul zijn.

De gradïent (=de vector met als elementen de partieel afgeleiden...) van g toch altijd nul zijn? :s

Brinx

Ik zal aan de hand van je vragen het verhaal proberen toe te lichten.

raintjah schreef:Wat wordt bedoeld met haaks? Loodrecht? Zoja, dan begrijp ik niet waarom de gradient van g loodrecht op ons pad staat. Waarom neemt g het snelst toe in de richting loodrecht op g?

Wat wordt bedoeld met tangentieel?

'Haaks' is inderdaad 'loodrecht'. Als je wilt weten waarom de gradient van 'g' altijd loodrecht op het pad (waarvoor g = 0 geldt) staat, kun je beschouwen wat het geval zou zijn als dat niet zo was. Als de gradient niet haaks op de 'hoogtelijnen' zou staan, zou je dus, wanneer je langs zo'n hoogtelijn loopt, ook in de richting van een component van de gradient lopen, namelijk de projectie van de gradient op je looprichting (de gradient is namelijk per slot van rekening een vector, met een grootte en een richting!). Maar dat zou betekenen dat je wel degelijk van hoogte verandert - en dat is nou juist niet het geval. De gradient staat daarom altijd haaks op de hoogtelijnen.

raintjah

Ik snap het nog niet..

Je verliest me hier: '...namelijk de projectie van de gradient op je looprichting....', wat bedoel je met een projectie van de gradiënt?

Ik blijf met de gedachte zitten dat de gradiënt van g altijd de nulvector moet zijn...

Brinx

Even een korte toelichting over 'projectie':

Afbeelding

(bron: http://www.nixfiles.com/critters/figs/vproj.gif )

Stel dat vector 'v' in dit diagram de richting is van je 'pad' in een bepaald punt (x,y), waarvoor geldt dat g(x,y) = 0. De vector 'w' kun je zien als de gradient van 'f' op het punt (x,y), en de vector 'u' is dan de projectie van die gradient op je pad: de component van de gradient van 'f' die in de richting van je pad staat. Op deze manier kun je zien dat je zo'n vector als 'w' kan ontbinden in een component die langs je pad ligt, en nog een component (in deze figuur niet getekend) die loodrecht op je pad staat.

Begrijp je nu trouwens waarom de gradient van 'f' altijd loodrecht op de lokale hoogtelijn van 'f' staat?

Omdat 'g' naast je pad best waarden ongelijk 0 kan aannemen maar op je pad altijd 0 blijft, kun je je pad dus zien als hoogtelijn van 'g' - met constante hoogte 0. En dus staat de gradient van 'g' altijd loodrecht op je pad.

raintjah

Ahh... Ik snap het!

Je kan f als het ware in oneindig veel hoogtelijnen opdelen, op de maximale hoogte van je pad, raak je dus nét de hoogste hoogtelijn (omdat het er oneindig veel zijn) die je kan raken. In dat raakpunt van de twee hoogtelijnen wijzen de gradiënten dus in dezelfde (of tegengestelde) richting, want de gradiënt staat loodrecht op een hoogtelijn.

Maar nu bedenkt ik mij iets...

In die prent is dat toch niet het geval?

Brinx

Leuk dat je 't ziet! In je diagram wijzen de gradienten inderdaad niet dezelfde kant op. Daar zul je dus vanuit dat punt nog iets naar beneden moeten lopen langs het pad. Als dat betekent dat je hoogte verliest, klopt de tekening niet.

Dan kan de gradient van 'f' immers niet in die richting staan!

raintjah

'Ziet' de stelling die punten dan wel?

Brinx

Nu begeef ik me op wat gladder ijs (de wiskundigen hier kunnen ongetwijfeld de strikte eisen voor het opgaan van de stelling formuleren), maar ik geloof dat de stelling van Lagrange prima werkt zolang de afgeleiden van 'f' continu zijn. Stel je bijvoorbeeld een functie f(x,y) voor waarbij dat niet het geval is, zoals f(x,y) = -|x| - |y|. In het punt (0,0) zijn de afgeleiden naar x en naar y niet gedefinieerd, en langs de y-as is de afgeleide naar x niet gedefinieerd en vice versa. Wanneer het pad gegeven door je beperkende voorwaarden dus een maximum ervaart op een van die locaties kan de stelling van Lagrange geen uitkomst bieden.

In je diagram bevindt het punt zich trouwens niet op een lokaal maximum, als de gradienten van 'f' en van 'g' daar inderdaad correct aangegeven zijn (en de functie 'f' continue afgeleides heeft).

raintjah

Leuk dat je 't ziet! In je diagram wijzen de gradienten inderdaad niet dezelfde kant op. Daar zul je dus vanuit dat punt nog iets naar beneden moeten lopen langs het pad. Als dat betekent dat je hoogte verliest, klopt de tekening niet. Dan kan de gradient van 'f' immers niet in die richting staan!

Om dit topic te vervolledigen:

Nee, de stelling 'ziet' deze punten niet, omdat het niet voldoet aan de voorwaarden van de stelling. Er wordt namelijk geëist dat de gradiënt van g (de functie van de randvoorwaarde) NIET nul is, en dat is wel het geval op de tekening. Deze gradient mag nooit nul zijn, omdat in het bewijs van de stelling de impliciete functiestelling wordt toegepast, wanneer de gradient van g nul zou zijn, zou je volgens die stelling delen door nul (om het allemaal maar heel simplistisch uit te leggen (beter kan ik het namelijk niet)).

Gegroet.

Wetenschapsforum

Laatste berichten

Nieuwsberichten

Stelling van lagrange

Stelling van lagrange

Re: Stelling van lagrange

Re: Stelling van lagrange

Re: Stelling van lagrange

Re: Stelling van lagrange

Re: Stelling van lagrange

Re: Stelling van lagrange

Re: Stelling van lagrange

Re: Stelling van lagrange

Re: Stelling van lagrange

Re: Stelling van lagrange

Re: Stelling van lagrange

Re: Stelling van lagrange

Re: Stelling van lagrange