Todennäköisyysjakauma

Kohteesta Wikipedia
Loikkaa: valikkoon, hakuun

Todennäköisyysjakauma kuvaa todennäköisyyslaskennassa kuinka yleisiä satunnaismuuttujan eri arvot ovat. Satunnaismuuttujiksi kutsutaan sellaisia satunnaisilmiöitä, joiden tuloksiin voidaan liittää numeerinen arvo. Arvon esiintymisen yleisyys määrätään todennäköisyysmittaa käyttämällä ja esitetään todennäköisyysfunktion avulla. Diskreettin satunnaismuuttujan eri arvojen yleisyyttä määrittävät niiden pistetodennäköisyyksien suuruudet. Satunnaismuuttujan perusjoukko ja niihin liittyvät todennäköisyysarvojen joukko muodostavat yhdessä todennäköisyysjakauman. Jatkuvan satunnaismuuttujan eri arvot muodostavat reaalilukujatkumon, jossa eri arvojen todennäköisyyksiä ei voida käsitellä yksittäin. Todennäköisyydet ilmaistaankin epäsuorasti käyttämällä tiheysfunktion käsitettä. Tiheysfunktiolla esitetään, kuinka todennäköisyydet painottuvat eri perusjoukon reaaliluvuille, mutta siitä ei voi suoraan lukea todennäköisyyksiä. Todennäköisyydet tulee laskea käyttämällä määrättyä integrointia yli valitun lukuvälin. Vaihtoehtoinen tapa määrittää jatkuvan satunnaismuuttujan todennäköisyysjakauma on käyttää kertymäfunktiota, joka myös määrittää todennäköisyysjakauman täysin yksikäsitteisesti.[1][2][3][4]

Osa jakaumista kuvaavat erilaisten kombinatoristen tapahtumien todennäköisyyksiä (Binomijakauma ja Geometrinen jakauma). Toiset liittyvät tilastolliseen päättelyyn ja niiden arviointiin (χ²-jakauma ja Studentin t-jakauma). On myös olemassa luonnonilmiöitä kuvaavia jakaumia (Normaalijakauma ja Maxwellin–Boltzmannin jakauma).[5]

Tarkasteltavat satunnaisilmiöt syntyvät usein useiden erilaisten satunnaisilmiöiden yhteisvaikutuksesta ja tarkasteltavat satunnaisilmiöt tapahtuvat näiden yhteisvaikutuksesta. Koska erilaiset satunnaisilmiöt voivat olla toisistaan riippuvia, on näissä tapauksissa paras muodostaa eri satunnaisilmiöiden yhteisjakauma. Yhteisjakaumalla voidaan analysoida paremmin eri tilanteita ja samalla huomioida tarkasteltavan satunnaisilmiön moninaisuus.

Käsitteitä[muokkaa | muokkaa wikitekstiä]

Yhden muuttujan todennäköisyysjakaumassa tulee tuntea satunnaismuuttujan perusjoukko ja kunkin satunnaismuuttujan arvoa vastaavan todennäköisyyden määräytymistapa. Perusjoukko ja sen todennäköisyysfunktio muodostavat yhdessä todennäköisyysjakauman.[6]

Satunaismuuttujat[muokkaa | muokkaa wikitekstiä]

Satunnaismuuttuja voi olla diskreettinen tai jatkuva. Käytännön sovelluksissa esiintyy myös näiden yhdistelmiäkin. Diskreettisen satunnaismuuttujan saamat arvot ovat erillisiä lukuja. Monissa tilanteissa satunnaismuuttuja saakin arvokseen luonnollisia lukuja. Esimerkiksi nopan eri tahkoille on voitu liittää luvut \{1,2,3,4,5,6\} ja kolikolle \{0,1\}, missä ne edustavat sanoja \{\text{kruuna},\text{klaava}\}. Arvoja voi olla myös ääretön määrä, sillä esimerkiksi kolikonheitossa "tarvittavien heittojen lukumäärä siihen, että saadaan ensimmäisen kerran kruuna", on \{1,2,3,\dots\}. Luonnosta voidaan ottaa esimerkki yksielektronisesta heliumatomista. Sen ainoan elektronin energiatila vaihtelee satunnaisesti perustilan ja viritettyjen tilojen välillä. Energiatilat ovat reaalukujen likiarvoja \{-54,4; -13,6; -6,0; -3,4; -2,2; -1,5; \dots\} (yksikkönä elektronivoltti), joita on teoriassa ääretön lukumäärä. Koska muita energiatiloja ei ole, ovat nämäkin arvot diskreettejä eli erillisiä.[6][2]

Jatkuvien satunnaismuutujien arvot ovat reaalilukuja, jotka muodostavat yhden tai useamman välin. Satunnaismuuttuja voi saada esimerkiksi kaksi arvoa, joiden erotus on mitättömän pieni. Tämä ominaisuus, että luvut voivat olla mielivaltaisen lähellä toisiaan, johtaa myös siihen, että niitä on ylinumeroituvasti ääretön määrä. Siis selvästi enemmän kuin diskreeteillä satunnaismuuttujilla, joita voi olla korkeintaan numeroituvasti ääretön lukumäärä. Tämä ero vaikuttaa ratkaisevasti siihen, kuinka muuttujien eri arvojen esiintymistodennäköisyydet ilmaistaan.[7][2]

Todennäköisyysfunktio[muokkaa | muokkaa wikitekstiä]

Pääartikkeli: Tiheysfunktio
Pääartikkeli: Kertymäfunktio

Todennäköisyysfunktiolla määritetään jokaiselle satunnaistapahtumalle todennäköisyys. Diskreetin satunnaismuuttujan eri arvolle voidaan liittää (esimerkiksi taulukoimalla) sen yleisyyttä ilmaiseva todennäköisyys. Jos diskreettejä arvoja on numeroituvasti ääretön määrä, tulisi todennäköisyydet ilmaista lausekkeella, jolla kullekin satunnaismuuttujan arvolle saadaan määritettyä todennäköisyys. Tapahtumaan voi sisältyä satunnaismuuttujan useita arvoja, jolloin tapahtuman todennäköisyys on näiden todennäköisyyksien summa. Sitä taulukkoa tai lauseketta, jolla josta todennäköisyyden arvo saadaan, kutsutaan pistetodennäköisyysfunktioiksi, tai pelkästään vain todennäköisyysfunktioksi.[8][2]

Jatkuvalla satunnaismuuttujalla on mahdollisia arvoja ylinumeroituva määrä, joten tapahtuman sisältävien yksittäisten todennäköisyyksien summaksi tulisi ääretön. Tämän takia kunkin satunnaismuuttujan arvon todennäköisyyttä ei voida ilmaista lukuarvona. Ongelman kiertämiseksi todennäköisyydet ilmaistaan tiheysfunktiolla.[7][9][2]

Tiheysfunktion arvo on sitä suurempi, mitä yleisempi on satunnaismuuttujan arvo. Se ei esitä todennäköisyyttä suoraan, vaan tiheysfunktiolla halutaan laskea tapahtumien todennäköisyyksiä. Jos satunnaismuuttuja X esittäisi esimerkiksi (onko tämä mahdollista?) maailman kaikkien miesten pituuksia, niin satunnaismuuttujan tiheysfunktio \phi(x) antaisi suuria arvoja niille pituuksille x, jotka ovat yleisiä, ja pieniä arvoja pituuksille, joita esiintyy harvoin (jättiläiset ja kääpiöt). Sellaisille pituuksille, joita ei tällä hetkellä esiinny yhtään (15-metrinen mies), on tiheysfunktion arvo lähes nolla tai tasan nolla. Tapauksen "miehen pituus on 150–170 senttimetriä" =150 \le X \le 170 todennäköisyys lasketaan tiheysfunktion määrätyllä integraalilla [7][9]

P(150 \le X \le 170)= \int_{150}^{170} \phi(x)dx.

Tiheysfunktion jatkuva käyttäminen voi tulla vaivalloiseksi ja integraalin laskeminen hankalilla tiheysfunktioilla voi ylittää käyttäjän laskutaidot. Tämän vuoksi jakaumasta julkaistaan myös valmiiksi integroituja kertymäfunktioita, jossa tapahtumat on helpommin laskettavissa. On olemassa myös tiheysfunktioita, joiden integraalit eivät ratkea matematiikan nykyisillä määritelmillä (esimerkiksi normaalijakauma). Näiden jakaumien yhteydessä tapahtumien todennäköisyydet määritellään kertymäfunktion arvoista muodostetusta taulukosta.[2]

Todennäköisyysjakaumia[muokkaa | muokkaa wikitekstiä]

Suluissa annetaan esimerkki jakauman tulkinnasta.

Diskreettejä jakaumia[muokkaa | muokkaa wikitekstiä]

Diskreetti todennäköisyysjakauma on sellaisen satunnaismuuttujan jakauma, joka voi saada vain äärellisen tai korkeintaan numeroituvasti äärettömän määrän erilaisia arvoja, esimerkiksi vain kokonaislukuarvoja. Tällaista satunnaismuuttujaa sanotaan diskreetiksi satunnaismuuttujaksi. Tällöin myös todennäköisyys on jakautunut vain äärellisen tai numeroituvan muuttujan arvojen joukon kesken.

Tärkeitä diskreettejä todennäköisyysjakaumia ovat esimerkiksi:

Symmetrinen jakauma[muokkaa | muokkaa wikitekstiä]

Esimerkiksi jos satunnaismuuttuja on nopanheitto, se saa vain kuusi eri arvoa, nopan silmäluvut 1, 2,...,6. Koska säännölliselle nopalle jokaisen silmäluvun todennäköisyys on yhtä suuri, yksittäisen silmäluvun todennäköisyys saadaan jakamalla varman tapauksen todennäköisyys (joka on 1) kuudella. Siten vaikkapa silmäluvun 5 (kuten kaikkien muidenkin silmälukujen) todennäköisyys on 1/6. Tässä tapauksessa todennäköisyysjakauman sanotaan olevan tasainen. Jos diskreetin satunnaismuuttujan todennäköisyys on jakautunut tasaisesti, jakauman sanotaan olevan symmetrinen jakauma eli diskreetti tasainen jakauma.

Jos heitetään kahta noppaa joista ensimmäinen on vaikka sininen ja toinen punainen, voidaan tulos tulkita satunnaismuuttujaksi usealla tavalla. Voidaan pitää satunnaismuuttujana saatua lukuparia, esim. jos sinisellä tuli 2 ja punaisella 5, satunnaismuuttuja on (2,5). Myös voidaan ottaa satunnaismuuttujaksi suurempi saaduista nopan silmäluvuista, eli em. tapauksessa luku 5. Kolmas mahdollisuus on käyttää satunnaismuutujana silmälukujen summaa, eli edellä tarkastellussa tapauksessa satunnnaimuuttujan arvo on 7. Muitakin mahdollisuuksia satunnaismuuttujan valinnalle on löydettävissä.

Lukuparien tapauksessa kahden nopan heiton arvojoukko on kaikkien mahdollisten silmälukuparien joukko eli 6x6=36 lukuparia. On nähtävissä että kyseessä on symmetrinen todennäköisyysjakauma.

Sen sijaan jos satunnaismuuttuja on suurempi silmäluvuista, esimerkiksi satunnaismuuttujan arvo 1 tulee vain lukuparista (1,1), kun taas arvo 6 tulee peräti yhdestätoista eri lukuparista (1,6),(6,1),(2,6),(6,2),...,(5,6),(6,5) ja (6,6). Kyseessä ei siis ole ollenkaan symmetrinen todennäköisyysjakauma.

Binomijakauma[muokkaa | muokkaa wikitekstiä]

Jos jokin koe suoritetaan määräluku kertoja (n), ja tietty tulos saadaan joka kerta vakiotodennäköisyydellä p, sellaisten tapausten lukumäärä, joissa tämä tulos on saatu, noudattaa binomijakaumaa parametreilla (n, p). Esimerkkinä voidaan mainita kuutosten lukumäärä heitettäessä noppaa useita kertoja.

Poissonin jakauma[muokkaa | muokkaa wikitekstiä]

Poissonin jakauma kuvaa tiettyjen tapahtumien lukumäärää kiinteällä aikavälillä, kun tapahtumien todennäköisyys on ajassa vakio ja seuraavan tapahtuminen ei riipu lainkaan edellisestä. Poissonin jakaumaa voidaan pitää binomijakauman rajatapauksena, kun toistojen lukumäärä n kasvaa rajatta, mutta todennäköisyys p pienenee samassa suhteessa. Jakauma on näin ollen diskreetti, mutta kiinteällä aikavälillä tapahtumien lukumäärää ei ole kuitenkaan mitenkään rajoitettu. Toisin sanoen satunnaismuuttujan mahdolliset arvot ovat kaikki ei-negatiiviset kokonaisluvut, siis numeroituva, ei-äärellinen joukko.

Geometrinen jakauma[muokkaa | muokkaa wikitekstiä]

Geometrinen jakauma on myös esimerkki diskreetistä jakaumasta, jossa mahdollisia arvoja ovat kaikki ei-negatiiviset kokonaisluvut. Siinä kahden peräkkäisen kokonaislukuarvon todennäköisyyksien suhde on vakio, ja mitä suurempi luku, sitä pienempi todennäköisyys.

Jatkuvia jakaumia[muokkaa | muokkaa wikitekstiä]

Moniulotteisia jakaumia[muokkaa | muokkaa wikitekstiä]

Lähteet[muokkaa | muokkaa wikitekstiä]

  1. Kivelä, Simo K.: Todennäköisyysfunktio P, M niin kuin matematiikka, 10.8.2000
  2. a b c d e f Alatupa, Sami et al.: Pitkä Sigma 6, s. 43−180. (lukion pitkän matematiikan oppikirja). Helsinki: Otava, 2010. ISBN 978-951-31-5343-4.
  3. Ruskeapää, Heikki: Todennäköisyyslaskenta I(luentomoniste), Turun Yliopisto, 2012
  4. Emet, Stefan: Johdatus todennäköisyyslaskentaan ja tilastotieteeseen, Matematiikan ja tilastotieteen laitos, Turun Yliopisto, 2014
  5. Kivelä, Simo K.: Normaalijakauma, M niin kuin matematiikka, 10.8.2000
  6. a b Kivelä, Simo K.: Todennäköisyyslaskennan peruskäsitteet, M niin kuin matematiikka, 10.8.2000
  7. a b c Kivelä, Simo K.: Jatkuvat jakaumat, M niin kuin matematiikka, 10.8.2000
  8. Kivelä, Simo K.: Diskreetit jakaumat, M niin kuin matematiikka, 10.8.2000
  9. a b Kivelä, Simo K.: Kertymäfunktio, M niin kuin matematiikka, 10.8.2000

Aiheesta muualla[muokkaa | muokkaa wikitekstiä]