Odotusarvo

Wikipedia
Loikkaa: valikkoon, hakuun

Odotusarvo on todennäköisyyslaskennassa ja tilastotieteessä satunnaisilmiön tuottamien lukujen odotettavissa oleva arvo. Numeerisia lukuarvoja tuottavia satunnaisilmiöitä kutsutaan satunnaismuuttujiksi. Satunnaismuuttujan tuottamat luvut ja niiden todennäköisyydet muodostavat yhdessä todennäköisyysjakauman. Odotusarvo on eräs todennäköisyysjakauman tunnusluku.[1][2][3][4]

Keskiarvo ja odotusarvo samaistetaan usein toisiinsa, vaikka odotusarvo on todennäköisyyslaskennan käsite ja keskiarvo lukuihin liittyvä tilastotieteen käsite. Odotusarvo on satunnaismuuttujan tuottaman äärettömän monen luvun keskiarvo. Se voidaan myös tulkita keskiarvoksi äärettömän monen äärellisten kokoisen otoksen keskiarvoista. Odotusarvo on ensimmäinen momentti ja sillä on sama yksikkö kuin satunnaismuuttujalla.[1][4][5][3]

Määritelmä ja merkinnät[muokkaa | muokkaa wikitekstiä]

Odotusarvo voidaan merkitä eri tavoilla \operatorname{E}(X)= \mu_X=\mu=\langle X \rangle . [5][4][2]

Matemaattisesti odotusarvo \operatorname{E}(X) määritellään diskreeteille ja jatkuville satunnaismuuttujille erikseen.

Diskreetti satunnaismuuttuja[muokkaa | muokkaa wikitekstiä]

Diskreetin satunnaismuuttujan X saamien kaikkien arvojen joukkoa kutsutaan todennäköisyyslaskennassa perusjoukoksi ja se merkitään \Omega= X =\{x_1,x_2,\dots ,x_n\}. Kunkin arvon esiintymistodennäköisyyttä merkitään vastaavasti p_1,p_2,\dots \text{ ja } p_n. Näitä todennäköisyyksiä kutsutaan usein pistetodennäköisyyksiksi ja niitä saatetaan merkitä myös

p_i=p(x_i)=f_X(x_i), [5]

jossa funktioita p(x_i) ja f_X(x_i) kutsutaan myös pistetodennäköisyysfunktioksi.

Diskreetin satunnaismuuttujan odotusarvo määritellään nyt (eri merkintätapoja käyttäen)

\operatorname{E}(X) = \sum_{i=1}^n x_i p_i =\sum_{x_i\in \Omega}x_ip(x_i)=\sum_{x_i\in X}x_if_X(x_i). [2][3][6]

Esimerkkinä nopanheitto[muokkaa | muokkaa wikitekstiä]

Pisteluvun odotusarvo kuusitahoiselle nopalle, jonka kaikkien pistelukujen todennäköisyys on yhtä suuri, on

\operatorname{E}(X) =1 \cdot \frac{1}{6} + 2 \cdot \frac{1}{6} + 3 \cdot \frac{1}{6} + 4 \cdot \frac{1}{6} + 5 \cdot \frac{1}{6} + 6 \cdot \frac{1}{6} =\frac{1+2+3+4+5+6}{6} = 3{,}5.[5][2]

Noppapelissä pelaaja voi odottaa etenevänsä pelilaudalla noin 3,5 askelta kierrosta kohti.[3]

Jatkuva satunnaismuuttuja[muokkaa | muokkaa wikitekstiä]

Jatkuvan satunnaismuuttujan X saamien reaalilukuarvojen joukko muodostaa vähintään yhden yhtenäisen lukuvälin I, joka on reaalilukujen osajoukko. Luvut I muodostavat satunnaismuuttujan perusjoukon \Omega ja se voidaan merkitä I = \Omega \in \mathbb{R}. Reaalilukuja ei voida luetella, joten yksittäiseen lukuun liittyvää todennäköisyyttäkään ei voida esittää luettelemalla. Sen sijaan jokaisen välin I luvulle voidaan liittää lukuarvo käyttämällä funktiota. Tätä funktiota kutsutaan todennäköisyyslaskennassa tiheysfunktioksi. Tiheysfunktion arvot eivät ole suoraan todennäköisyyksiä, mutta sen avulla voidaan eri tapahtumille laskea ne.[5]

Jatkuvan satunnaismuuttujan tiheysfunktio on f_X(x) ja tämän avulla määritellään satunnaismuuttujan odotusarvo

\operatorname{E}(X) = \int_{-\infty}^\infty x f_X(x)\, dx. [5][2]

Yleisempi jatkuva määritelmä[muokkaa | muokkaa wikitekstiä]

Määritellään satunnaismuuttujan \scriptstyle X: \Omega \rightarrow \mathbb{R} odotusarvo integraalina yli satunnaismuuttujan perusjoukon \scriptstyle \Omega todennäköisyysmitan \scriptstyle P suhteen

\operatorname{E}(X) = \int_\Omega X \, dP. [7]

Tämä voidaan kirjoittaa satunnaismuuttujan X kertymäfunktion F suhteen Lebesgue–Stieltjes-integraalilla

\operatorname{E}(X) = \int_{-\infty}^{\infty} x \, dP(X \leq x) = \int_{-\infty}^{\infty} x \, dF(x). [7]

Satunnaismuuttujan funktion odotusarvo[muokkaa | muokkaa wikitekstiä]

Jos g(x) on mitallinen funktio, voidaan laske sillekin odotusarvo \operatorname{E}(g(X)). Jos X on diskreetti satunnaismuuttuja, on odotusarvo

\operatorname{E}(g(X))=\sum_{x_i\in X}g(x_i)f_X(x_i). [6][7]

ja jos se on jatkuva, saadaan odotusarvoksi

\operatorname{E}(g(X))= \int_{-\infty}^\infty g(x) f_X(x)\, dx [7]

Tällä ajattelulla on mahdollista määrittää esimerkiksi origomomentteja \operatorname{E}(X^2)\dots \operatorname{E}(X^n) tai keskusmomentteja \operatorname{E}((X-\mu)^n).

Ehdollinen odotusarvo[muokkaa | muokkaa wikitekstiä]

Satunnaismuuttujan X ehdollinen odotusarvo alisigma-algebralla \scriptstyle \mathcal{G} \subset \mathcal{F} on \scriptstyle \mathcal{G}-mitallinen satunnaismuuttuja \scriptstyle \mathrm{E} (X \, | \, \mathcal{G}), jolle yhtälö

\int_G \mathrm{E} (X \, | \, \mathcal{G}) \, dP = \int_G X \, dP

pätee kaikilla \scriptstyle G \in \mathcal{G}. Satunnaismuuttujan X ehdollinen odotusarvo ehdolla satunnaismuuttuja Y on \scriptstyle \mathrm{E}(X \, | \, \sigma(Y)), missä \sigma (Y) tarkoittaa satunnaismuuttujan Y virittämää sigma-algebraa.

On huomattava, että ehdollinen odotusarvo on satunnaismuuttuja, eli funktio ehdollistettavasta muuttujasta. Ehdollinen odotusarvo ehdolla \scriptstyle G \in \mathcal{G} on \scriptstyle \mathrm{E} (X \, | \, \mathcal{G}) (\omega), missä \scriptstyle \omega \in G on reaaliluku.

Ominaisuuksia[muokkaa | muokkaa wikitekstiä]

Todennäköisyysmassalla tarkoitetaan todennäköisyyslaskennassa pistetodennäköisyysfunktion pylväikköä tai tiheysfunktion kuvaajan alle jäävää aluetta. Odotusarvo on sellainen satunnaismuuttujan arvo, joka vastaa tämän alueen painopistettä. Symmetrisen jakauman keskikohta on myös jakauman odotusarvo.[5]

Satunnaismuuttujan X, jonka ulostuloina on vain vakion a arvoja, odostusarvo on

\operatorname{E}[X] = a. [4]

Tästä seuraa myös, että \operatorname{E}[\operatorname{E}[X]] = \operatorname{E}[X] = a. [5]

Odotusarvon olemassaolo[muokkaa | muokkaa wikitekstiä]

Todennäköisyysjakaumalla ei välttämättä ole olemassa odotusarvoa, jos jakauma ei toteuta niin sanottua itseistä satunnaismuuttujan odotusarvoa (itseisarvo)

\sum_{x_i\in X}|x_i|p(x_i) < \infty

tai jatkuvassa tapauksessa

\int_{-\infty}^\infty |x| f_X(x)\, dx < \infty . [5][6][7]

Satunnaismuuttujan sanotaan olevan integroituva, jos sen odotusarvo on äärellinen eli \mathrm{E}(X) < \infty. Jos se ei ole integroituva, on se vielä kvasi-integroituva, jos \scriptstyle \mathrm{E} (\max \{ X,0 \}) < \infty tai \scriptstyle \mathrm{E} (\min \{ -X,0 \}) < \infty.

Summat ja lineaarikombinaatiot[muokkaa | muokkaa wikitekstiä]

Seuraaville satunnaismuuttujille X, Y ja \{X_1,X_2, \dots,X_n\} sekä reaaliluvuille a, b ja \{a_1,a_2, \dots,a_n\} voidaan johtaa seuraavia tuloksia.

Odotusarvo on lineaarinen operaattori, jolloin suorien summien odotusarvo on

\operatorname{E}(X \pm Y) = \operatorname{E}(X) \pm \operatorname{E}(Y) [5]

ja lineaarikombinaatioiden odotusarvo on

\operatorname{E}(a X + b Y) = a \operatorname{E}(X) + b \operatorname{E}(Y). [5][7]

Tällöin useamman satunnaismuuttujan tapauksissa on myös

\operatorname{E}(X_1 +X_2 + \dots +X_n) = \operatorname{E}(X_1) + \operatorname{E}(X_2) + \dots + \operatorname{E}(X_n) [4]

ja

\operatorname{E}(a_1X_1 +a_2X_2 + \dots +a_nX_n) = a_1\operatorname{E}(X_1) + a_2\operatorname{E}(X_2) + \dots + a_n\operatorname{E}(X_n). [4]

Luvun lisääminen satunnaismuuttujien arvoihin vaikuttaa myös sen odotusarvoon

\operatorname{E}(X+a)=\operatorname{E}(X)+\operatorname{E}(a)=\operatorname{E}(X)+a.

Satunnaismuuttujan ensimmäinen keskusmomentti on aina nolla, koska

\operatorname{E}(X-\mu_X)=\operatorname{E}(X)-\operatorname{E}(\mu_X)=\operatorname{E}(X)-\mu_X=\operatorname{E}(X)-\operatorname{E}(X)=0,

jos \mu_X=\operatorname{E}(X).

Tulot[muokkaa | muokkaa wikitekstiä]

Riippumattomien satunnaismuuttujien tulon odotusarvo on kahden satunnaismuuttujan tapauksessa

\operatorname{E}(X \cdot Y) = \operatorname{E}(X) \cdot \operatorname{E}(Y)

ja usean satunnaismuuttujan tapauksessa

\operatorname{E}(X_1\cdot X_2 \dots X_n) = \operatorname{E}(X_1) \cdot \operatorname{E}(X_2) \dots \operatorname{E}(X_n). [8]

Riippuvassa tapauksessa

\operatorname{E}(X \cdot Y) = \operatorname{E}(X) \cdot \operatorname{E}(Y) + \sigma(X,Y).

Lisäksi jos \scriptstyle X \geq 0, niin \scriptstyle \operatorname{E}(X) \geq 0, ja yleisemmin jos \scriptstyle X \geq Y, niin \scriptstyle \operatorname{E}(X) \geq \operatorname{E}(Y).

Ehdolliselle odotusarvolle pätee niin sanottu iteroidun odotusarvon laki

\operatorname{E}(X) = \operatorname{E}_Y \left( \operatorname{E}_X(X|Y) \right).

Populaatio- ja otoskeskiarvo[muokkaa | muokkaa wikitekstiä]

Odotusarvo on satunnaismuuttujan tärkein tunnusluku. Otoskeskiarvolla tarkoitetaan suppean otoksen keskiarvoa suuremmasta populaatiosta. Sen avulla on mahdollista selvittää odotusarvon suuruus likimääräisesti, mutta kuitenkin "edullisesti". Keskiarvoa on tällöin pidettävä odotusarvon estimaattorina.[9]

Kun lasketaan otoskeskiarvojen odotusarvoa, saadaan edellisten päättelysääntöjen avulla

\operatorname{E}(\bar{x}) = \operatorname{E}\left ( \frac1n\sum_{i=1}^n x_i \right ) = \frac1n\sum_{i=1}^n \operatorname{E}(x_i) = \frac1n\sum_{i=1}^n \operatorname{E}(X) = \frac1n n\operatorname{E}(X)=\operatorname{E}(X).

Tämä tarkoittaa sitä, että keskiarvon lausekkeella saadaan keskimäärin odotusarvon tuloksia eli estimaattori on harhaton.[10]

Keskiarvolla on toinen ominaisuus, joka liittyy estimointiin. Kun keskiarvon laskemiseksi kasvataetaan otoksen lukumäärää (otoksen ulostulot ovat riippumattomia toisistaan), käy keskiarvon varianssin

\sigma^2 \left ( \frac1n\sum_{i=1}^n x_i \right )= \frac{1}{n^2} \, \sigma^2 \left ( \sum_{i=1}^n x_i \right )= \frac{1}{n^2} \sum_{i=1}^n \sigma^2(x_i)=\frac{1}{n^2} \sum_{i=1}^n \sigma^2=\frac{\sigma^2}{n}.

Keskiarvo on tarkentuva odotusarvon estimaattori, koska varianssi pienenee kun otoksen lukumäärä n kasvaa.[10]

Suurten lukujen lakien mukaan satunnaismuuttujan keskiarvo toistokokeessa on sen odotusarvo ja keskiarvo on siten odotusarvon harhaton ja tarkentuva estimaattori.

Lähteet[muokkaa | muokkaa wikitekstiä]

  1. a b Etälukio: Todennäköisyysjakautuma ja satunnaisilmiön odotusarvo, Opetushallitus
  2. a b c d e Kivelä, Simo K.: Jakauman tunnusluvut, M niin kuin matematiikka, 10.8.2000
  3. a b c d Alatupa, Sami et al.: Pitkä Sigma 6, s. 66−79. (lukion pitkän matematiikan oppikirja). Helsinki: Otava, 2010. ISBN 978-951-31-5343-4.
  4. a b c d e f Weisstein, Eric W.: Expectation Value (Math World - A Wolfram Web Resource) Wolfram Research. (englanniksi)
  5. a b c d e f g h i j k Mellin, Ilkka: Moniulotteiset satunnaismuuttujat ja jakaumat, s.155−165, luentomoniste kurssista Todennäköisyyslaskenta, Aalto-yliopisto, 2007
  6. a b c Emet, Stefan: Johdatus todennäköisyyslaskentaan ja tilastotieteeseen, s.17−20, Matematiikan ja tilastotieteen laitos, Turun Yliopisto, 2014
  7. a b c d e f Ruskeapää, Heikki: Todennäköisyyslaskenta I(luentomoniste), Turun Yliopisto, 2012
  8. Mellin, Ilkka: Moniulotteiset satunnaismuuttujat ja jakaumat, s.204−225, luentomoniste kurssista Todennäköisyyslaskenta, Aalto-yliopisto, 2007
  9. Emet, Stefan: Johdatus todennäköisyyslaskentaan ja tilastotieteeseen, s.41−46, Matematiikan ja tilastotieteen laitos, Turun Yliopisto, 2014
  10. a b Weisstein, Eric W.: Arithmetic Mean (Math World - A Wolfram Web Resource) Wolfram Research. (englanniksi)