Ero sivun ”Matemaattinen optimointi” versioiden välillä

Wikipediasta
Siirry navigaatioon Siirry hakuun
[arvioimaton versio][arvioimaton versio]
Poistettu sisältö Lisätty sisältö
Yonah (keskustelu | muokkaukset)
p pilkku lisätty ja reaalijoukon tunnus muutettu R -> \mathbb{R}
Rivi 1: Rivi 1:
'''Matemaattinen optimointi''' on sellaisen pisteen <math>x^{*} \in A</math> etsimistä jossa [[funktio]] <math>f : A \to R</math> saa pienimmän arvonsa. Pistettä <math>x^{*}</math> kutsutaan [[minimipiste|minimipisteeksi]]. Minimipisteen etsimistä kutsutaan ''minimoinniksi'' tai ''optimoinniksi''. Rajoitetussa optimointitehtävässä lähtöavaruudessa <math>A</math> on pisteitä, joita ei voida hyväksyä ratkaisuiksi.
'''Matemaattinen optimointi''' on sellaisen pisteen <math>x^{*} \in A</math> etsiminen, jossa [[funktio]] <math>f : A \to \mathbb{R}</math> saa pienimmän arvonsa. Tätä pistettä <math>x^{*}</math> kutsutaan [[minimipiste|minimipisteeksi]]. Minimipisteen etsimistä kutsutaan ''minimoinniksi'' tai ''optimoinniksi''. Rajoitetussa optimointitehtävässä lähtöavaruudessa <math>A</math> on pisteitä, joita ei voida hyväksyä ratkaisuiksi.


Vastaavasti ''maksimointi'' on sellaisen pisteen <math>y^{*} \in B</math> etsimistä, jossa funktio <math>g : B \to R</math> saa suurimman arvonsa <math>g(y^{*})</math>.
Vastaavasti ''maksimointi'' on sellaisen pisteen <math>y^{*} \in B</math> etsimistä, jossa funktio <math>g : B \to \mathbb{R}</math> saa suurimman arvonsa <math>g(y^{*})</math>.


Jokaista maksimointiongelmaa vastaa tietty minimointiongelma, joka ratkaisee maksimointiongelman. Funktion <math>g</math> maksimointi on sama tehtävä kuin funktion <math>f=-g</math> minimointi. Näin ollen matemaattisen optimointiteorian riittää tarkastella pelkästään minimointiongelmia. Funktiolla voi olla lokaaleja sekä globaaleja minimejä. Globaali minimi määritellään pisteeksi <math>\mathbf{x}^*</math>, jolle pätee <math>f(\mathbf{x}^*)\leq f(\mathbf{x})</math> kaikilla <math>\mathbf{x}</math>, jotka kuuluvat käypään alueeseen, eli sitä pienempää funktion arvoa ei voida saavuttaa käyvässä joukossa. Lokaali minimi määritellään pisteeksi <math>\mathbf{x}_{\mathrm{lok}}^*</math>, jolle on olemassa <math>\epsilon > 0</math> siten, että <math>f(\mathbf{x}_{\mathrm{lok}}^*) \leq f(\mathbf{x}_{\mathrm{lok}}^*+\mathbf{h})~,\forall \mathbf{h},~||\mathbf{h}||\leq \epsilon</math> ja <math>\mathbf{x}_{\mathrm{lok}}^*+\mathbf{h}</math> kuuluu käypään joukkoon. Ts. on olemassa jokin alue eli ympäristö, jossa piste <math>\mathbf{x}_{\mathrm{lok}}^*</math> antaa pienempiä funktion arvoja kun muut pisteet.
Jokaista maksimointiongelmaa vastaa tietty minimointiongelma, joka ratkaisee maksimointiongelman. Funktion <math>g</math> maksimointi on sama tehtävä kuin funktion <math>f=-g</math> minimointi. Näin ollen matemaattisen optimointiteorian riittää tarkastella pelkästään minimointiongelmia. Funktiolla voi olla lokaaleja sekä globaaleja minimejä. Globaali minimi määritellään pisteeksi <math>\mathbf{x}^*</math>, jolle pätee <math>f(\mathbf{x}^*)\leq f(\mathbf{x})</math> kaikilla <math>\mathbf{x}</math>, jotka kuuluvat käypään alueeseen, eli sitä pienempää funktion arvoa ei voida saavuttaa käyvässä joukossa. Lokaali minimi määritellään pisteeksi <math>\mathbf{x}_{\mathrm{lok}}^*</math>, jolle on olemassa <math>\epsilon > 0</math> siten, että <math>f(\mathbf{x}_{\mathrm{lok}}^*) \leq f(\mathbf{x}_{\mathrm{lok}}^*+\mathbf{h})~,\forall \mathbf{h},~||\mathbf{h}||\leq \epsilon</math> ja <math>\mathbf{x}_{\mathrm{lok}}^*+\mathbf{h}</math> kuuluu käypään joukkoon. Ts. on olemassa jokin alue eli ympäristö, jossa piste <math>\mathbf{x}_{\mathrm{lok}}^*</math> antaa pienempiä funktion arvoja kun muut pisteet.

Versio 23. lokakuuta 2009 kello 10.28

Matemaattinen optimointi on sellaisen pisteen etsiminen, jossa funktio saa pienimmän arvonsa. Tätä pistettä kutsutaan minimipisteeksi. Minimipisteen etsimistä kutsutaan minimoinniksi tai optimoinniksi. Rajoitetussa optimointitehtävässä lähtöavaruudessa on pisteitä, joita ei voida hyväksyä ratkaisuiksi.

Vastaavasti maksimointi on sellaisen pisteen etsimistä, jossa funktio saa suurimman arvonsa .

Jokaista maksimointiongelmaa vastaa tietty minimointiongelma, joka ratkaisee maksimointiongelman. Funktion maksimointi on sama tehtävä kuin funktion minimointi. Näin ollen matemaattisen optimointiteorian riittää tarkastella pelkästään minimointiongelmia. Funktiolla voi olla lokaaleja sekä globaaleja minimejä. Globaali minimi määritellään pisteeksi , jolle pätee kaikilla , jotka kuuluvat käypään alueeseen, eli sitä pienempää funktion arvoa ei voida saavuttaa käyvässä joukossa. Lokaali minimi määritellään pisteeksi , jolle on olemassa siten, että ja kuuluu käypään joukkoon. Ts. on olemassa jokin alue eli ympäristö, jossa piste antaa pienempiä funktion arvoja kun muut pisteet.

Optimointiongelma esitetään matemaattisesti yleensä muodossa missä on kohdefunktio ja käypä joukko. Käyvällä joukolla tarkoitetaan sitä joukko johon x:n on kuuluttava.

Optimointiteoria perustuu suurelta osin funktion derivaatan nollakohtaan. Myös konveksin joukon ja konveksin funktion käsitteet ovat osoittautuneet hyödylliseksi etenkin kun on etsitty funktion globaalia optimia.

Esimerkkejä

  • Funktio , kun , saavuttaa miniminsä pisteessä .
  • Funktiolla , kun , ei ole minimipistettä, sillä jokaista pistettä kohden on aina olemassa pienempi piste .
  • Funktiolla on kaksi nollakohtaa ja . Se on aina ei-negatiivinen, joten funktion minimiarvo on nolla. Huomaa, että kaksi eri :n arvoa antavat saman optimin, eli optimi ei ole yksikäsitteinen. Jos optimointi tehdään rajoitetussa joukossa , niin optimi on yksikäsitteinen.

Lineaarinen optimointi

Lineaarinen optimointi tarkoittaa optimointia kun kohdefunktio ja käypää aluetta rajoittavat ehdot ovat lineaarisia. Lineaarista optimointi kutsutaan myös lineaariseksi ohjelmoinniksi. Yleinen linearinen tehtävä voidaan esittää muodossa

Tässä ja merkeillä tarkoitetaan, että jokaista alkiota verrataan riveittäin toisiinsa. Voidaan osoittaa, että kaikki lineaariset optimointitehtävät voidaan esittään ali- ja ylijäämämuuttujien (engl. slack variable) avulla ns. standardimuodossa

missä , ja . Ts. aina kun tarkastellan yleistä lineaarista tehtävää, voidaan tarkastella pelkästään standarditehtävää menettämättä tuloksien yleispätevyyttä. Huomaa, että myös vektorit ja muuttuvat tehtävätyypin muunnoksessa.

Tuloksia

  • Lineaarisen optimointitehtävän käypä alue on n dimensioisen avaruuden monitahokas (engl. polyhedra).
  • Oletetaan, että tehtävänä on minimoida lineaarista kohdefunktiota epätyhjän monitahokkaan sisällä (ts. kyseessä on lineaarinen optimointitehtävä). Tällöin kohdefunktion optimaalinen arvo on tai on olemassa optimaalinen ratkaisu . Huomaa, että optimipisteen yksikäsitteisyyttä ei ole taattu.
  • Jos lineaarisen optimointitehtävän ratkaisu on äärellinen, tulee yksi ratkaisu löytymään jostain rajoittavan monitahokkaan S kulmasta. Jos kaksi pistettä ja ovat optimaalisia ovat myös pisteet muotoa optimaalisia. Tämän voi tulkita siten, että kahden kulman välillä oleva särmä on optimaalinen, jos kummatkin kulmat ovat optimaalisia. Todistus: Oletetaan, että annetut pisteet minimoivat kohdefunktion f. Voidaan osoittaa, että monitahokas on konveksi joukko, eli kaikilla pätee . Koska annetut pisteet ovat optimaalisia, eli niitä pienempiä arvoja funktio ei voi monitahokkaassa saada, pätee. Toisaalta , mikä voidaan kirjoittaa . Helposti voidaan huomata, että tapaus voidaan yleistää koskemaan n:ää pistettä, eli jos pisteet ovat optimaalisia, niin ovat myös niiden ns. konveksikombinaatiot myös optimaalisia. Todistus on analoginen kahden pisteen tapauksen kanssa.

Esimerkkejä

Lineaarinen optimointitehtävä

voidaan esittää standardimuodossa muunnoksella , missä ja . Kun lisätään vielä ali- ja ylijäämämuuttujat ja saadaan tehtäväksi

Jos siis valitaan , , ja

on tehtävä saatu standardimuotoon. Huomaa, että optimipisteessä vain toinen muuttujista ja on nollasta poikkeava, joten ylimääräiset muuttujat eivät vaikuta rajoitusehtoihin.

Epälineaarinen optimointi

Epälineaarisella optimoinnilla tarkoitetaan sellaisen optimointitehtävän ratkaisemista, joka on muotoa

missä , f on kohdefunktio, funktiot epäyhtälörajoitukset, yhtälörajoitukset ja X käypä joukko. Huomaa, että vaikka yhtälörajoitukset voidaan esittää pelkästään epäyhtälörajoitusten avulla (), ei näin kuitenkaan kannata tehdä: Monet johdetut tulokset olettavat rajoitusten lineaarista riippumattomuutta, jolloin kätevin tapa ratkaista on erotella yhtälö- ja epäyhtälörajoitukset.

Epälineaarinen ja lineaarinen tehtävä (LP) eroavat toisistaan monissa kohdissa. Ensinnäkin käyvän alueen muoto voi olla mielivaltainen epälineaarisessa tehtävässä, kun taas LP-tehtävän käypä joukko on aina monitahokas (joka on aina konveksi joukko). Toiseksi LP-tehtävän kohdefunktio on aina konveksi, joten etsittäessä funktion globaalia optimia voidaan hyödyntää konveksioptimoinnin tuloksia. Lisäksi huomataan, että epälineaarisen tehtävän optimi ei aina ole rajoittavan joukon reunoilla, vaan se voi sijaita muualla. Voidaan todistaa, että optimi sijaitsee tällöin kohdefunktion derivaatan nollakohdassa.

Epälineaarinen tehtävä on siis yleisempi muoto kuin lineaarinen tehtävä. Näin ollen kaikki tulokset, jotka on johdettu epälineaariselle tehtävälle, pätevät myös lineaariselle tehtävälle.


Välttämättömät optimaalisuusehdot

Kaikille epälineaarisille optimointitehtäville voidaan johtaa ns. välttämättömät optimaalisuusehdot. Niiden avulla voi tarkistaa voiko jokin piste olla optimi vai ei. Ts. jos jokin piste on optimaalinen, täyttää se optimaalisuusehdot. Matemaattisesti esitettynä: piste x on optimaalinen välttämättömät ehdot toteutuvat.

Epälineaariselle tehtävällä voidaan johtaa Karush-Kuhn-Tuckerin välttämättömät optimaalisuusehdot (välttämättömät KKT-ehdot), ja hieman yleisemmät Fritz-Johnin välttämättömät optimaalisuus ehdot (välttämättömät FJ ehdot). Näistä KKT-ehdot ovat hyödyllisempiä, sillä ne todella karsivat pois optimikandidaatteja. FJ-ehdot saadaan toteutumaan mielivaltaiselle käyvälle pisteelle lisäämällä sopivia merkityksettömiä rajoituksia.

Fritz-Johnin välttämättömät optimaalisuusehdot

Olkoon käypä joukko epätyhjä ja avoin sekä jonkin epälineaarisen tehtävän lokaali optimi. Tällöin on olemassa vektori siten, että

missä ja ovat m ja l vektoreita joiden i:nnet komponintit ovat ja . Luonnollisesti on oletettava, että gradientit ovat olemassa.

Karush-Kuhn-Tuckerin välttämättömät optimaalisuusehdot

Fritz-Johnin ehdot redusoituvat tietyin ehdoin KKT-ehdoiksi. Käytännössä näiden ehtojen on taattava, että FJ-ehtojen on nollasta poikkeava, jolloin jakamalla sillä puolittain saadaan ns. KKT-ehdot.

Olkoon jonkin epälineaarisen tehtävän lokaali optimi, jolla on sopivat rajoitusehdot. Tällöin on olemassa vektori siten, että

missä ja ovat m ja l vektoreita joiden i:nnet komponentit ovat ja .

Katso myös