Todennäköisyys

Wikipedia
Loikkaa: valikkoon, hakuun

Todennäköisyys on ilmiön tapahtumisen yleisyyden mitta, jonka arvo voidaan ilmaista kvalitatiivisesti tai kvantitatiivisesti. Todennäköisyys kvantifioidaan reaaliluvuksi väliltä 0 ja 1, vaikka joskus todennäköisyys ilmaistaan myös prosentteina. Todennäköisyys on 0, kun tapahtumaa ei voi sattua tai se ei satu koskaan. Todennäköisyys on 1, kun se tapahtuu varmasti tai se tapahtuu aina. Mikäli todennäköisyys on näiden arvojen väliltä, tapahtuma ei ole yleinen ja sen tapahtuminen on epävarmaa. Mitä suurempi on todennäköisyyden arvo, sitä yleisempi tapahtuma on tai sen varmemmin se tapahtuu.[1][2][3][4]

Todennäköisyyden yksikäsitteisestä määritelmästä on ollut vaikeaa päästä yksimielisyyteen. Koska todennäköisyys on ihmisen luoma omakohtainen käsite, ei sille löydy luonnontietellistä tai filosofista perustetta. Todennäköisyyden tulisi kuitenkin vastata arjen kokemusta tapahtuman yleisyydestä. Ensimmäinen käytetty eksakti määritelmä on klassinen todennäköisyyden määritelmä, jolla voitiin arvioida uhkapelien todennäköisyyksiä riittävän hyvin. Määritelmä oli kuitenkin liian yksinkertainen arjen muiden tapahtumien kuvaamiseen, sillä se oletti alkeistapauksien todennäköisyyksien olevan yhtä suuret. Puutettu korjaamaan esitettiin tilastollinen todennäköisyystulkinta, joka oli käyttökelpoisempi tilastollisten tapahtumien todennäköisyyden määrittämisessä. Se myös salli alkeistapauksille erisuuruiset todennäköisyydet ja oli siten klassisen määritelmän laajennus. Tämän rinnalla esitettiin myös toinen todennäköisyyden määritelmä. Subjektiivisessa eli bayesiläisessä todennäköisyyden määrittelyssä voidaan todennäköisyyden ajatella kuvaavan tiedon epävarmuutta.[3][4]

Näitä kaikkia vaivasivat puutteet, jotka jättivät todennäköisyyden perimmäisen määritelmän auki eivätkä ne kyenneet kertomaan, mitä todennäköisyys viimekädessä on. Lopulta neuvostoliittolainen Andrei Kolmogorov vuonna 1933 ilmestyneessä teoksessaan Grundbegriffe der Wahrscheinlichkeitsrechnung (suom. Todennäköisyysteorian perusteet) kiteytti todennäköisyyslaskennan perusteet matemaattisen tarkasti.[5] Kolmogorovin luomassa aksiomaattisessa järjestelmässä yhdistettiin joukko-oppi, todennäköisyyslaskenta ja mittateoria. Edelleenkään todennäköisyydelle ei annettu "perimmäistä selitystä", mutta nyt sen matemaattiset ongelmat saatiin ratkaistua. Nykyaikainen todennäköisyyslaskenta perustuu Kolmogorovin luomalle perustalle. Matemaattisempi ja kattavampi todennäköisyyslaskennan käsittely löytyy artikkelista todennäköisyysteoria.[6][3][4]

Todennäköisyyslaskentaa hyödynnetään monilla tietenaloilla, kuten esimerkiksi matematiikassa, luonnontieteissä (erityisesti fysiikassa), keinoälyssä, tietotekniikassa, tilastotieteessä, talouselämässä, uhkapeleissä, peliteoriassa ja filosofiassa.

Matemaattiset reunaehdot[muokkaa | muokkaa wikitekstiä]

Satunnaisilmiön perimäisiä rakenteita tai toimintoja ei tarvitse tuntea, vaan todennäköisyyslaskennassa kiinnitetään huomiota vain sen tuottamiin tuloksiin. Satunnaisilmiön sattumanvaraisesti syntyviä tai vaihtuvia tuloksia kutsutaan alkeistapauksiksi tai satunnaismuuttujien arvoiksi. Kaikki alkeistapauksien tai satunnaismuuttujan arvot tulee tuntea ja näiden arvojen esiintymisen yleisyys tulee voida mitata ja sitten esittää niiden todennäköisyys lukuarvoina. Vasta tämän jälkeen voidaan suorittaa todennäköisyyteen perustuvia arvioita satunnaisilmiön toiminnasta. Tapahtuman \scriptstyle A todennäköisyyttä merkitään usein \scriptstyle \mathbb{P}(A), \scriptstyle P(A), \scriptstyle p(A) tai \scriptstyle Pr(A).[7]

Kaikkien alkeistapauksien tai satunnaismuuttujan arvojen kokoelmaa kutsutaan perusjoukoksi tai otosavaruudeksi tai tapahtuma-avaruus. Perusjoukko sisältää kaikki ne alkeistapaukset tai satunnaismuuttujan arvot, joita voi sattua, eikä muita tapauksia tai arvoja tule esiintymään. Tähän varmuuteen perustuvat todennäköisyyslaksennan reunaehdot. Tapahtuma on sellaisten perusjoukon alkeistapauksien tai satunnaismuuttujan arvojen kokoelma, joka muodostaa osan perusjoukosta. Tapahtuma on siten perusjoukon osajoukko, ja ne tapaukset, jotka eivät kuulu tapahtumaan, ovat osa vastatapahtumaa eli komplementtitapahtumaa, joka on myös perusjoukon osajoukko. Tapahtuman \scriptstyle A ja vastatapahtuman \scriptstyle A^c osajoukot sisältävät eri tapaukset ja toisaalta yhdessä ne muodostavat koko perusjoukon eli \scriptstyle A \cup A^c = \Omega. Terveen järjen mukaisesti tulee olla niin, että jos tapahtuman todennäköisyys on \scriptstyle P(A)ja vastatapahtuman todennäköisyys on \scriptstyle P(A^c), tulee näiden summaksi \scriptstyle P(A) + P(A^c) = 1. Tapaus kuuluu siten tarkasteltavaan tapahtumaan tai sen vastatapahtumaan.[8][7]

Edellä selostettu ominaisuus, jossa tapahtuma ja sen vastatapahtuma sisältävät eri alkeistapaukset, on nimeltään toistensa poissulkevuus tai erillisyys. Yleisesti sanotaan, että saman perusjoukon kaksi tapahtumaa \scriptstyle A ja \scriptstyle B ovat erillisiä tapahtumia, jos niillä ei ole yhtään yhteistä alkeistapausta. Jos nämä tapahtumat yhdistetään suuremmaksi joukoksi, tulisi niiden yhdistelmä olla edellisiä yleisempi. Yleensä vaaditaankin erillisissä tapahtumissa, että todennäköisyydet on voitava laskea suoraan yhteen. Tätä kutsutaan todennäköisyyden additiiviseksi ominaisuudeksi. Sen avulla voidaan perustella myös tapahtuman ja sen vastatapahtuman tulos 1.[8]

Matemaattisesti on huomattu välttämätömäksi olettaa todennäköisyyden jatkuvuus. Se on vaikein "terveen järjen vaatimuksista" ymmärtää, mutta se onkin matemaatikkojen asettama lisävaatimus. Tarkastellaan kahta tapahtumaa, josta \scriptstyle A on tapahtuman \scriptstyle B osajoukko. Tapahtuma \scriptstyle A sisältää kaikki alkeistapaukset, jotka ovat myös tapahtumassa \scriptstyle B. Tapahtumassa \scriptstyle B on näiden tapauksien lisäksi vielä muitakin eli tapahtuma \scriptstyle B on suurempi tapahtuma kuin \scriptstyle A. Joukko-opillisesti tämä merkitään \scriptstyle A \subset B. Arkipäivän järjen mukaan tapahtuman \scriptstyle B todennäköisyys tulisi olla suurempi kuin tapahtuman \scriptstyle B eli \scriptstyle P(A) \le P(B).Todennäköisyyden jatkuvuus tarkoittaa sitä, että kaikille tapahtumille, jotka jotka ovat toistensa osajoukkoja seuraavasti [7][8]

A_1 \subset A_2 \subset A_3 \subset ...

tulisi todennäköisyydet kasvaa

P(A_1) \le P(A_2) \le P(A_3) \le ...

Vaikka tapahtumajoukkoa laajennettaisiin loputtomasti, tulisi sen laajinta yhdistettä kutsua myös tapahtumaksi ja sille tulisi voida laskea todennäköisyyden arvo. Siis

A_1 \subset A_2 \subset A_3 \subset ... = \bigcup_{i=1}^\infty A_i = \lim_{i \to \infty}A_i,

jonka todennäköisyys on

P\left ( \lim_{i \to \infty}A_i \right )=\lim_{i \to \infty}P(A_i).

Samaa ominaisuutta on vaadittu myös osajoukoille, jossa tapahtumien sisältämiä tapauksia karsitaan

A_1 \supset A_2 \supset A_3 \supset... = \bigcap_{i=1}^\infty A_i = \lim_{i \to \infty}A_i,

jolloin todennäköisyydet pienenevät ja lopullinen todennäköisyys olisi

P\left ( \lim_{i \to \infty}A_i \right )=\lim_{i \to \infty}P(A_i).

Näillä ajatuksilla voidaan perustella suurten lukujen lait, jotka vaadittiin tilastollisessa todennäköisyyden tulkinnassa.[7][8]

Edellä esitellyt todennäköisyyksien ominaisuudet ovat kuitenkin niin väljät, etteivät niillä voida määritä todennäköisyysmittaa tiukasti. Todennäköisyyden määrittelyyn jää runsaasti valinnanvaraa ja sille onkin käytössä erilaisia määritelmiä. Niiden matematiikka kuitenkin seuraa edellisiä yleisiä reunaehtoja.

Todennäköisyyslaskennan perusperiaatteita[muokkaa | muokkaa wikitekstiä]

Todennäköisyyslaskennassa tapahtuman \scriptstyle A todennäköisyys on jokin reaaliluku 0:n ja 1:n väliltä eli

0 \le P(A) \le 1. [1]

Tapahtuman \scriptstyle A vastatapahtuman eli komplementtitapahtuman \scriptstyle A^c todennäköisyys on

P(A^c)=1-P(A), [1]

koska tapahtumalle ja vastatapahtumalle tulee olla \scriptstyle P(A) + P(A^c) = 1. Esimerkiksi todennäköisyys sille ettei yhden nopan heitossa saada kuutosta on "1 − todennäköisyys saada kuutonen" eli {1} - \tfrac{1}{6} = \tfrac{5}{6}.

Jos kaksi tapahtumaa \scriptstyle A ja \scriptstyle B ovat erillisiä tapahtumia, niin todennäköisyys sille, että joko tapahtuma \scriptstyle A tai tai tapahtuma \scriptstyle B sattuu (myös molemmat voivat sattua) on

P(A\mbox{ tai }B) =  P(A \cup B)= P(A) + P(B). [1]

Esimerkiksi todennäköisyys heittää yhdellä nopalla silmäluvun yksi tai kaksi on P(1\mbox{ tai }2) = P(1) + P(2) = \tfrac{1}{6} + \tfrac{1}{6} = \tfrac{1}{3}.

Jos tapahtumat eivät ole erillisiä, niin silloin tapahtumista jätetään yhteiset tapaukset kerran pois ja todennäköisyyden arvosta ne vähennetään kerran pois:

\mathrm{P}\left(A \hbox{ tai } B\right)=\mathrm{P}\left(A\right)+\mathrm{P}\left(B\right)-\mathrm{P}\left(A \mbox{ ja } B\right). [1]

Jos kaksi tapahtumaa \scriptstyle A ja \scriptstyle B ovat riippumattomia tapahtumia, niin todennäköisyys sille, että sekä tapahtuma \scriptstyle A että tapahtuma \scriptstyle B sattuvat on

P(A \mbox{ ja }B) =  P(A \cap B) = P(A) P(B).\, [1]

Esimerkiksi, jos kahta kolikkoa heitetään, niin todennäköisyys sille, että molemmat ovat kruunia on \tfrac{1}{2} \cdot \tfrac{1}{2} = \tfrac{1}{4}.

Jos tapahtumat eivät ole riippumattomia, saadan todennäköisyys

P(A \mbox{ ja }B) =  P(A \cap B) = P(A) P(B|A).\, [1]

missä merkintä \scriptstyle P(B|A) tarkoittaa ehdollista todennäköisyyttä.

Tapahtuman \scriptstyle B ehdollinen todennäköisyys, on todennäköisyys tapahtumalle \scriptstyle B sillä ehdolla, että tapahtuma \scriptstyle A tapahtuu varmasti. Ehdollinen todennäköisyys merkitään \scriptstyle P(B|A), joka luetaan: "tapahtuman \scriptstyle B todennäköisyys ehdolla \scriptstyle A" ja se määritellään

P(B \mid A) = \frac{P(B \cap A)}{P(A)}.\, [1]

Jos tapahtuman \scriptstyle A todennäköisyys on 0, eli P(A)=0, niin P(B \mid A) ei ole määritelty, sillä 0:lla ei saa jakaa.

Lisää todennäköisyyslaskennasta artikkelissa todennäköisyysteoria.

Katso myös[muokkaa | muokkaa wikitekstiä]

Lähteet[muokkaa | muokkaa wikitekstiä]

  1. a b c d e f g h Alatupa, Sami et al.: Pitkä Sigma 3, s. 43−60. (lukion pitkän matematiikan oppikirja). Helsinki: Otava, 2010. ISBN 978-951-31-5343-4.
  2. Etälukio: Todennäköisyyden käsite
  3. a b c Koskenoja, Mika: Sattuman matematiikkaa I - klassinen todennäköisyys, matematiikkalehti Solmu, 2002
  4. a b c Laininen, Pertti: Todennäköisyys ja sen tilastollinen soveltaminen, Otatieto, 1998. - todennäköisyysmalli Viitattu 17.3.2007.
  5. Kolmogorov: Foundations of the Theory of Probability mathematik.com. Viitattu 17.3. 2007. (englanniksi)
  6. Lehtinen, Matti: 15. Todennäköisyyslaskenta: ajanvietteestä tiedettä (tai moniste), Matematiikan historista, 2000
  7. a b c d Ruskeapää, Heikki: Todennäköisyyslaskenta I(luentomoniste), Turun Yliopisto, 2012
  8. a b c d Saarnisaari, Harri: Todennäköisyys (luentomateriaalia), 2003

Kirjallisuutta[muokkaa | muokkaa wikitekstiä]

  • Pekka Tuominen: Todennäköisyyslaskenta I. Limes ry (1996).
  • Gustav Elfving ja Pekka Tuominen: Todennäköisyyslaskenta II. Limes ry (1990).
  • Laininen, Pertti: Todennäköisyys ja sen tilastollinen soveltaminen. 5. korjattu painos. Helsinki: Otatieto, 2001 (7. painos 2004). ISBN 951-672-312-8.

Aiheesta muualla[muokkaa | muokkaa wikitekstiä]