Jensenin epäyhtälö

Wikipedia
Loikkaa: valikkoon, hakuun

Matematiikassa Jensenin epäyhtälöllä, nimetty tanskalaisen matemaatikko Johan Jensenin mukaan, voidaan arvioida konveksin funktion integraaleja.

Äärellinen muoto[muokkaa | muokkaa wikitekstiä]

Reaaliselle jatkuvalle konveksille funktiolle φ ja positiivisille painokertoimille ai on voimassa

\varphi\left(\frac{\sum a_{i} x_{i}}{\sum a_{i}}\right) \le \frac{\sum a_{i} \varphi (x_{i})}{\sum a_{i}}

Epäyhtälö on käännettävä jos φ on konkaavi.

Jos ai=1, on

\varphi\left(\frac{\sum x_{i}}{n}\right) \le \frac{\sum \varphi (x_{i})}{n}

Funktio log(x) on konkaavi, joten sijoittamalla φ(x) = log(x) saadaan aritmeettis-geometrinen epäyhtälö:

 \frac{x_1 + x_2 + \cdots + x_n}{n} \ge \sqrt[n]{x_1 x_2 \cdots x_n}.

Yleinen väittämä[muokkaa | muokkaa wikitekstiä]

Epäyhtälö voidaan kirjoittaa myös yleisemmässä muodossa mittateorian avulla. Se voidaan ilmaista myös todennäköisyysteorian avulla. Nämä väittämät ovat yhtäpitäviä.

Mittateoreettinen muotoilu[muokkaa | muokkaa wikitekstiä]

Olkoon (Ω,A,μ) mitta-avaruus siten, että μ(Ω) = 1. Jos g on reaaliarvoinen μ-integroituva ja jos φ on konveksi joukossa g, on voimassa

\varphi\left(\int_{\Omega} g\, d\mu\right) \le \int_\Omega \varphi \circ g\, d\mu.

Todennäköisyysteoreettinen muotoilu[muokkaa | muokkaa wikitekstiä]

Todennäköisyysteorian terminologialla μ on todennäköisyysmitta. Funktio g korvataan reaaliarvoisella satunnaismuuttujalla X. Tällöin jokainen integraali Ω:ssa todennäköisyysmitan μ suhteen voidaan tulkita odotusarvoksi. Tällöin, jos φ on konveksi funktio, on

\varphi\left(\Bbb{E}\{X\}\right) \leq \Bbb{E}\{\varphi(X)\}.\,

Todistus[muokkaa | muokkaa wikitekstiä]

Olkoon g μ-integroituva funktio mitta-avaruudessa Ω ja olkoon φ konveksi funktio g:n määrittelyjoukossa. Määritellään φ:n oikeanpuoleinen derivaatta x:ssä asettamalla

\varphi^\prime(x):=\lim_{t\to0^-}\frac{\varphi(x+t)-\varphi(x)}{t}

Koska φ on konveksi, oikean puolen osamäärä on vähenevä kun t lähestyy nollaa oikealta. Osamäärä on myös alhaalta rajoitettu: sitä rajoittavat termit muotoa

\frac{\varphi(x+t)-\varphi(x)}{t},

missä t < 0. Siten raja-arvo on aina olemassa.

Asetetaan nyt seuraavat merkinnät:

x_0:=\int_\Omega g\, d\mu,
a:=\varphi^\prime(x_0),
b:=\varphi(x_0)-x_0\varphi^\prime(x_0).

Tällöin kaikilla x on voimassa ax+b\leq\varphi(x). Tämä nähdään siitä, että jos x>x0 ja t = x − x0 > 0, on voimassa

\varphi^\prime(x_0)\leq\frac{\varphi(x_0+t)-\varphi(x_0)}{t}.

Siten

\varphi^\prime(x_0)(x-x_0)+\varphi(x_0)\leq\varphi(x)

kuten vaadittiin. Tapaus x < x0 todistetaan vastaavasti, kuten myös tapaus ax_0+b=\varphi(x_0).

φ(x0) voidaan siten kirjoittaa muodossa

ax_0+b=a\left(\int_\Omega g\,d\mu\right)+b.

Mutta koska μ(Ω) = 1, on kaikilla reaaliluvuilla k voimassa

\int_\Omega k\,d\mu=k.

Erityisesti

a\left(\int_\Omega g\,d\mu\right)+b=\int_\Omega(ag+b)\,d\mu\leq\int_\Omega\varphi\circ g\,d\mu.

Q.E.D.

Viitteet[muokkaa | muokkaa wikitekstiä]

Aiheesta muualla[muokkaa | muokkaa wikitekstiä]