Todennäköisyysjakauma

Wikipedia
Loikkaa: valikkoon, hakuun

Todennäköisyysjakauma on todennäköisyyslaskennan käsite, jolla kuvataan satunnaismuuttujan todennäköisyyttä saada tietty arvo. Todennäköisyysjakauman määrittelee funktio, joka kuvaa jokaisen reaalilukujen välin todennäköisyydeksi siten, että todennäköisyyden aksioomat täyttyvät. Täsmällisesti määriteltynä se on todennäköisyysmitta, jonka lähtöjoukko on reaalilukujen Borel-joukko.

Jokaisella satunnaismuuttujalla on todennäköisyysjakauma, ja todennäköisyysjakauma sisältää olennaisen tiedon satunnaismuuttujasta. Olkoon X satunnaismuuttuja, jolloin todennäköisyys että se saa arvon väliltä [a,b] on P(a\leq X \leq b).

Kertymä- ja tiheysfunktio[muokkaa | muokkaa wikitekstiä]

Kertymäfunktio F(x) (engl. cumulative distribution function, lyh. CDF) kuvaa satunnaismuuttujan X todennäköisyysjakauman yksikäsitteisesti, ja se on määritelty kaikille reaaliluvuille x. Kertymäfunktio määritellään kaavalla

 F(x) = P(X \leq x).

Kertymäfunktiolla on seuraavat ominaisuudet:

  • F(x) on ei-vähenevä
  • F(-\infty)=0 ja F(\infty)=1
  • F(x) on oikealta jatkuva

Tiheysfunktio f(x) (engl. probability density function, lyh. PDF) on kertymäfunktion derivaatta. Tiheysfunktio on olemassa, jos kertymäfunktio on aidosti derivoituva. Tällöin tiheysfunktiolle pätee kaava

 F(a) = \int_{-\infty}^a f(x)\,dx.

Tiheysfunktiolla on seuraavat ominaisuudet:

  • f(x) \ge 0 kaikilla x.
  •  \int_{-\infty}^{\infty} f(x)\,dx = 1.

Satunnaismuuttuja on diskreetti, jos sen otosavaruus on numeroituva. Tällöin kertymäfunktio on porrasfunktio eli se koostuu äärellisestä määrästä epäjatkuvuuskohtaa merkitseviä hyppyjä. Diskreetin satunnaismuuttujan tiheysfunktiota vastaa pistetodennäköisyysfunktio P(x) (engl. probability mass function, PMF), joka kertoo diskreetin satunnaismuuttujan todennäköisyyden saada arvo x. Jos x ei kuulu otosavaruuteen, sen todennäköisyys on 0.

Todennäköisyysjakaumia[muokkaa | muokkaa wikitekstiä]

Suluissa annetaan esimerkki jakauman tulkinnasta.

Diskreettejä jakaumia[muokkaa | muokkaa wikitekstiä]

Diskreetti todennäköisyysjakauma on sellaisen satunnaismuuttujan jakauma, joka voi saada vain äärellisen tai korkeintaan numeroituvasti äärettömän määrän erilaisia arvoja, esimerkiksi vain kokonaislukuarvoja. Tällaista satunnaismuuttujaa sanotaan diskreetiksi satunnaismuuttujaksi. Tällöin myös todennäköisyys on jakautunut vain äärellisen tai numeroituvan muuttujan arvojen joukon kesken.

Tärkeitä diskreettejä todennäköisyysjakaumia ovat esimerkiksi:

Symmetrinen jakauma[muokkaa | muokkaa wikitekstiä]

Esimerkiksi jos satunnaismuuttuja on nopanheitto, se saa vain kuusi eri arvoa, nopan silmäluvut 1, 2,...,6. Koska säännölliselle nopalle jokaisen silmäluvun todennäköisyys on yhtä suuri, yksittäisen silmäluvun todennäköisyys saadaan jakamalla varman tapauksen todennäköisyys (joka on 1) kuudella. Siten vaikkapa silmäluvun 5 (kuten kaikkien muidenkin silmälukujen) todennäköisyys on 1/6. Tässä tapauksessa todennäköisyysjakauman sanotaan olevan tasainen. Jos diskreetin satunnaismuuttujan todennäköisyys on jakautunut tasaisesti, jakauman sanotaan olevan symmetrinen todennäköisyysjakauma.

Jos heitetään kahta noppaa joista ensimmäinen on vaikka sininen ja toinen punainen, voidaan tulos tulkita satunnaismuuttujaksi usealla tavalla. Voidaan pitää satunnaismuuttujana saatua lukuparia, esim. jos sinisellä tuli 2 ja punaisella 5, satunnaismuuttuja on (2,5). Myös voidaan ottaa satunnaismuuttujaksi suurempi saaduista nopan silmäluvuista, eli em. tapauksessa luku 5. Kolmas mahdollisuus on käyttää satunnaismuutujana silmälukujen summaa, eli edellä tarkastellussa tapauksessa satunnnaimuuttujan arvo on 7. Muitakin mahdollisuuksia satunnaismuuttujan valinnalle on löydettävissä.

Lukuparien tapauksessa kahden nopan heiton arvojoukko on kaikkien mahdollisten silmälukuparien joukko eli 6x6=36 lukuparia. On nähtävissä että kyseessä on symmetrinen todennäköisyysjakauma.

Sen sijaan jos satunnaismuuttuja on suurempi silmäluvuista, esimerkiksi satunnaismuuttujan arvo 1 tulee vain lukuparista (1,1), kun taas arvo 6 tulee peräti yhdestätoista eri lukuparista (1,6),(6,1),(2,6),(6,2),...,(5,6),(6,5) ja (6,6). Kyseessä ei siis ole ollenkaan symmetrinen todennäköisyysjakauma.

Binomijakauma[muokkaa | muokkaa wikitekstiä]

Jos jokin koe suoritetaan määräluku kertoja (n), ja tietty tulos saadaan joka kerta vakiotodennäköisyydellä p, sellaisten tapausten lukumäärä, joissa tämä tulos on saatu, noudattaa binomijakaumaa parametreilla (n, p). Esimerkkinä voidaan mainita kuutosten lukumäärä heitettäessä noppaa useita kertoja.

Poissonin jakauma[muokkaa | muokkaa wikitekstiä]

Poissonin jakauma kuvaa tiettyjen tapahtumien lukumäärää kiinteällä aikavälillä, kun tapahtumien todennäköisyys on ajassa vakio ja seuraavan tapahtuminen ei riipu lainkaan edellisestä. Poissonin jakaumaa voidaan pitää binomijakauman rajatapauksena, kun toistojen lukumäärä n kasvaa rajatta, mutta todennäköisyys p pienenee samassa suhteessa. Jakauma on näin ollen diskreetti, mutta kiinteällä aikavälillä tapahtumien lukumäärää ei ole kuitenkaan mitenkään rajoitettu. Toisin sanoen satunnaismuuttujan mahdolliset arvot ovat kaikki ei-negatiiviset kokonaisluvut, siis numeroituva, ei-äärellinen joukko.

Geometrinen jakauma[muokkaa | muokkaa wikitekstiä]

Geometrinen jakauma on myös esimerkki diskreetistä jakaumasta, jossa mahdollisia arvoja ovat kaikki ei-negatiiviset kokonaisluvut. Siinä kahden peräkkäisen kokonaislukuarvon todennäköisyyksien suhde on vakio, ja mitä suurempi luku, sitä pienempi todennäköisyys.

Jatkuvia jakaumia[muokkaa | muokkaa wikitekstiä]

Moniulotteisia jakaumia[muokkaa | muokkaa wikitekstiä]

Aiheesta muualla[muokkaa | muokkaa wikitekstiä]