Movatterモバイル変換


[0]ホーム

URL:


Siirry sisältöön
Wikipedia
Haku

Lagrangen kertoimet

Wikipediasta

Lagrangen menetelmä on ranskalaisen matemaatikonJoseph-Louis Lagrangen mukaan nimetty menetelmä yhtälörajoitetunoptimointitehtävän ratkaisemiseksi.

Määritelmä

[muokkaa |muokkaa wikitekstiä]

Olkoonf{\displaystyle f\,} minimointitehtävänkohdefunktio jag{\displaystyle g\,} rajoite-ehtofunktio. Tarkastellaan näiden määrittämää rajoiteoptimointititehtävää

minf(x0,x1,){\displaystyle \min f(x_{0},x_{1},\dots )}
ehdollagi(x0,x1,)=0, i{1,,N}{\displaystyle {\text{ehdolla}}\quad g_{i}(x_{0},x_{1},\dots )=0,~i\in \{1,\dots ,N\}}

Tehtävä voidaan kirjoittaa muodossa, jota kutsutaanLagrangen funktioksiL,{\displaystyle L,}

L(x0,x1,,λ)=f(x0,x1,)+i=0Nλigi(x0,x1,){\displaystyle L(x_{0},x_{1},\dots ,\lambda )=f(x_{0},x_{1},\dots )+\sum _{i=0}^{N}\lambda _{i}g_{i}(x_{0},x_{1},\dots )}

KertoimiaλiR{\displaystyle \lambda _{i}\in \mathbb {R} } kutsutaanLagrangen kertoimiksi. Esitetyn optimointitehtävän käypä eli rajoite-ehdot täyttävä ratkaisu löydetään Lagrangen funktionL,{\displaystyle L,} ääriarvopisteessä(x0,x1,,xn){\displaystyle (x_{0}^{*},x_{1}^{*},\dots ,x_{n}^{*})}, jossa siisL(x0,x1,,xn)=0{\displaystyle \nabla L(x_{0}^{*},x_{1}^{*},\dots ,x_{n}^{*})=0}. Voidaan tulkita, että kertoimet ohjaavat ratkaisun rajoite-ehtojen määräämään käypään joukkoon.

Esimerkki

[muokkaa |muokkaa wikitekstiä]

Minimointitehtäväminf(x,y),g(x,y)=0{\displaystyle \min f(x,y),\quad g(x,y)=0} ratkaistaan seuraavasti:

Langrangen funktio esimerkille

L(x,y)=f(x,y)λg(x,y){\displaystyle L(x,y)=f(x,y)-\lambda g(x,y)}

Etsitään osittaisderivaatat ja niiden muodostama yhtälöryhmä

L(x,y,λ)={xL=xf(x,y)+λxg(x,y)yL=yf(x,y)+λyg(x,y)λL=g(x,y){\displaystyle \nabla L(x,y,\lambda )={\begin{cases}{\frac {\partial }{\partial x}}L={\frac {\partial }{\partial x}}f(x,y)+\lambda {\frac {\partial }{\partial x}}g(x,y)\\{\frac {\partial }{\partial y}}L={\frac {\partial }{\partial y}}f(x,y)+\lambda {\frac {\partial }{\partial y}}g(x,y)\\{\frac {\partial }{\partial \lambda }}L=g(x,y)\end{cases}}}

Ratkaistaan saadusta yhtälöryhmästä ääriarvopisteet (x{\displaystyle x^{*}},y{\displaystyle y^{*}},λ{\displaystyle \lambda ^{*}}) algebran menetelmin (ratkaisemalla derivaattojen nollakohdat yhtälöryhmästä).

Menetelmä

[muokkaa |muokkaa wikitekstiä]

Olkoonf{\displaystyle f\,} minimointitehtävänkohdefunktio jag{\displaystyle g\,} rajoite-ehtofunktio. Kutsutaan ehdong(x,y)=0{\displaystyle g(x,y)=0\,} määräämien pisteiden joukkoakäyräksiC{\displaystyle C\,}. Olkoot funktiotderivoituvia kaikkienmuuttujiensa suhteen käyränC{\displaystyle C\,} pisteissä. Oletetaan myös, että kohdefunktiof{\displaystyle f\,} onderivoituva tehtävänratkaisupisteen(x0,y0){\displaystyle (x_{0},y_{0})\,} ympäristössä. Kun lisäksi oletetaan, että piste(x0,y0){\displaystyle (x_{0},y_{0})\,} ei ole käyränC{\displaystyle C\,} päätepiste, jagradienttig(x0,y0)0{\displaystyle \nabla g(x_{0},y_{0})\neq 0\,}, on olemassa sellainen lukuλ0{\displaystyle \lambda _{0}\,} niin, että piste(x0,y0,λ0){\displaystyle (x_{0},y_{0},\lambda _{0})\,} on ns.Lagrangen funktionL{\displaystyle L\,}

L(x0,x1,,λ)=f(x0,x1,)+λg(x0,x1,){\displaystyle L(x_{0},x_{1},\dots ,\lambda )=f(x_{0},x_{1},\dots )+\lambda g(x_{0},x_{1},\dots )}

kriittinen piste. Toisin sanoen funktionf{\displaystyle f\,} käyrälläg(x,y)=0{\displaystyle g(x,y)=0\,} sijaitsevat ääriarvot voidaan löytää etsimällä Lagrangen funktion ääriarvot. Ääriarvot löydetään ratkaisemalla funktionL{\displaystyle L}osittaisderivaatojen nollakohta

0=Lx=f1(x,y)+λg(x,y){\displaystyle 0={\frac {\partial L}{\partial x}}=f_{1}(x,y)+\lambda g(x,y)}
0=Ly=f1(x,y)+λg(x,y){\displaystyle 0={\frac {\partial L}{\partial y}}=f_{1}(x,y)+\lambda g(x,y)}
0=Lλ=g(x,y){\displaystyle 0={\frac {\partial L}{\partial \lambda }}=g(x,y)}

eli

L(x0,x1,,xn,λ)=0{\displaystyle \nabla L(x_{0},x_{1},\dots ,x_{n},\lambda )=\mathbf {0} }

Geometrinen tulkinta

[muokkaa |muokkaa wikitekstiä]
Kohdefunktiona=f(x){\displaystyle \mathbf {a} =\nabla f(x)} ja rajoitusehdonb=g(x){\displaystyle \mathbf {b} =\nabla g(x)} gradientit Lagrangen funktion ratkaisupisteessä.

Lagrangen kerroinλ{\displaystyle \lambda \,} voidaan nähdä skaalaustekijänä, jolla rajoitusehdon gradienttivektoriag(x){\displaystyle \nabla g(x)\,} tulee kertoa, että siitä tuleeyhtä pitkä kuin kohdefunktion gradienttivektoristaf(x){\displaystyle \nabla f(x)\,} optimointitehtävän ratkaisupisteessä. Tulkinta yleistyy useamman rajoitusehdon tapaukseen, jolloinaktiivisia rajoitusehtoja vastaavat kertoimetλi{\displaystyle \lambda _{i}\,} valitaan niin, että niidenlineaarikombinaatio vastaavien gradienttien kanssa kumoaa kohdefunktion gradientin.

Herkkyystulkinta

[muokkaa |muokkaa wikitekstiä]

Herkkyystulkinnassa tarkastellaan, miten kohdefunktion arvo muuttuu, kun yhtälörajoitetta muutetaan. Tarkastellaanminf(x), h(x)=c{\displaystyle \min f(x),~h(x)=c} muotoista tehtävää, missäc{\displaystyle c}. Lagrangen kerroin ilmaisee kunka paljon kohdefunktion arvo muuttuu yhtälörajoituksen muuttuessa eli

cf(x)=λ{\displaystyle \nabla _{c}f(x)=-\lambda \,}

missäc{\displaystyle \nabla _{c}} tarkoittaa gradienttia rajoitusehdon muutoksen suhteen.

Esimerkki: pisteen etäisyys suorasta

[muokkaa |muokkaa wikitekstiä]
Pisteenp{\displaystyle p} etäisyys suoralta.

Esitetään tehtävä matemaattisessa muodossa ja ratkaistaan se Lagrangen menetelmällä. Olkoon pistep=(x0,y0){\displaystyle p=(x_{0},y_{0})} jasuoraax+by+c=0{\displaystyle ax+by+c=0}, missäa,b,cR{\displaystyle a,b,c\in \mathbb {R} } ovat mielivaltaisia vakioita.

Minimoidaan etäisyyden funktio

mind(x,y)=(xx0)2+(yy0)2{\displaystyle \min d(x,y)=(x-x_{0})^{2}+(y-y_{0})^{2}\,}

ehdolla

ax+by+c=0{\displaystyle ax+by+c=0}

Suoran yhtälö on siis optimointitehtävänehto.

Muodostetaan etäisyysfunktiosta ja ehdostaLagrangen funktio

L(x,y,λ)=d(x,y)+λg(x,y)=(xx0)2+(yy0)2+λ(ax+by+c){\displaystyle {\begin{aligned}L(x,y,\lambda )&=d(x,y)+\lambda g(x,y)\\&=(x-x_{0})^{2}+(y-y_{0})^{2}+\lambda (ax+by+c)\end{aligned}}}

Ratkaistaan funktionL{\displaystyle L} ääriarvot muuttujienx{\displaystyle x},y{\displaystyle y} jaλ{\displaystyle \lambda } suhteen etsimällä osittaisderivaattojen nollakohdat:

{xL=2(xx0)+λa=0yL=2(yy0)+λb=0λL=ax+by+c=0{\displaystyle {\begin{cases}{\frac {\partial }{\partial x}}L=2(x-x_{0})+\lambda a&=0\\{\frac {\partial }{\partial y}}L=2(y-y_{0})+\lambda b&=0\\{\frac {\partial }{\partial \lambda }}L=ax+by+c&=0\\\end{cases}}}

Katso myös

[muokkaa |muokkaa wikitekstiä]

Lähteet

[muokkaa |muokkaa wikitekstiä]
  • Robert A. Adams (1999),Calculus: A Complete Course 5. painos, Addison Wesley Longman,ISBN 0-201-79131-5.
Tämämatematiikkaan liittyvä artikkeli ontynkä. Voit auttaa Wikipediaalaajentamalla artikkelia.
Noudettu kohteesta ”https://fi.wikipedia.org/w/index.php?title=Lagrangen_kertoimet&oldid=23063748
Luokka:
Piilotetut luokat:

[8]ページ先頭

©2009-2026 Movatter.jp