Bayesin teoreema

Wikipedia
Loikkaa: valikkoon, hakuun

Bayesin teoreema (myös Bayesin sääntö tai Bayesin laki) on ehdolliseen todennäköisyyteen liittyvä matemaattinen teoreema. Teoreeman voidaan tulkita kuvaavan käsitysten päivittämistä uuden todisteaineiston valossa a posteriori. Teoreema on nimetty sen kehittäneen 1700-luvulla eläneen brittiläisen pastorin ja matemaatikon Thomas Bayesin mukaan.

Kaavan soveltamiseen perustuu bayesilainen tilastotiede.

Teoreeman esittely[muokkaa | muokkaa wikitekstiä]

Tapahtuman A todennäköisyys ehdolla B (merkitään P(A|B)) on yleisessä tapauksessa eri asia kuin todennäköisyys tapahtumalle B ehdolla A (merkitään P(B|A)). Näiden kahden ehdollisen todennäköisyyden välillä on kuitenkin suhde, jota Bayesin teoreema kuvaa. Teoreema kuuluu seuraavasti:

P(B \mid A) = \frac{P(A \mid B)\;P(B)}{P(A)}\!

missä

  • P(A)\, on A:n priori-todennäköisyys. Se ei riipu B:stä (jota joskus kutsutaan havainnoksi).
  • P(A \mid B) on A:n todennäköisyys ehdolla B. Tätä kutsutaan myös posterioritodennäköisyydeksi.
  • P(B \mid A) on B:n todennäköisyys ehdolla A.
  • P(B)\, on B:n priori-todennäköisyys.

Esimerkki teoreeman käytöstä[muokkaa | muokkaa wikitekstiä]

Oletetaan, että meillä on kaksi purkillista keksejä. Purkissa A on 10 suklaakeksiä sekä 30 kookoskeksiä, kun taas purkissa B on molempia laatuja 20 kappaletta. Matti valitsee ensin sattumanvaraisesti toisen purkeista ja sitten nostaa valitsemastaan purkista sattumanvaraisesti yhden keksin. Havaitaan, että Matin valitsema keksi on kookoskeksi. Millä todennäköisyydellä se on peräisin purkista A?

Intuitiivisesti on tietenkin helppo nähdä, että koska kookoskeksejä on purkissa A enemmän kuin purkissa B, on todennäköisyyden oltava suurempi kuin 0,5. Tarkka todennäköisyys voidaan laskea Bayesin teoreeman avulla. Nyt

P(purkki\ A|kookoskeksi)

on todennäköisyys sille, että Matin valitsema purkki on purkki A siinä tapauksessa, että hän on valinnut purkista kookoskeksin. Tälle todennäköisyydelle etsimme ratkaisua.

P(kookoskeksi) on todennäköisyys sille, että Matin valitsema keksi on kookoskeksi. Tätä todennäköisyyttä kuvaa luonnollisesti kookoskeksien osuus kaikista mahdollisista kekseistä. Kookoskeksejä on ensimmäisessä purkissa 30 kappaletta ja toisessa purkissa 20 kappaletta eli yhteensä 50 kappaletta. Koska molemmissa purkeissa on 40 keksiä, on keksien kokonaismäärä 80 kappaletta. Näin saadaan

P(kookoskeksi) = \frac{50}{80}=0,625

Vastaavasti P(purkki\ A) on todennäköisyys sille, että Matin valitsema purkki on nimenomaan purkki A. Kahdesta purkista yhden tietyn valitsemisen todennäköisyys on luonnollisesti 0,5.

P(purkki\ A)=0,5

P(kookoskeksi|purkki\ A) on todennäköisyys sille, että Matin valitsema keksi on kookoskeksi siinä tapauksessa, että hän on valinnut purkin A. Koska purkissa A on yhteensä 40 keksiä, joista 30 on kookoskeksejä, saadaan todennäköisyydeksi

P(kookoskeksi|purkki\ A)=\frac{30}{40}=0,75

Tämän informaation avulla voimme nyt laskea todennäköisyyden sille, että Matin valitsema kookoskeksi on peräisin juuri purkista A:

P(purkki\ A|kookoskeksi) = \frac{P(kookoskeksi|purkki\ A) P(purkki\ A)}{P(kookoskeksi)} = \frac{0,75 \cdot 0,5}{0,625} = 0,6

On siis 60% todennäköisyys, että Matin kookoskeksi on purkista A.

Teoreeman johtaminen ehdollisesta todennäköisyydestä[muokkaa | muokkaa wikitekstiä]

Ehdollisen todennäköisyyden määritelmän mukaisesti tapahtuman A todennäköisyys ehdolla B on

P(A|B)=\frac{P(A \cap B)}{P(B)}.

Vastaavasti tapahtuman B todennäköisyys ehdolla A on

P(B|A) = \frac{P(A \cap B)}{P(A)}. \!

Näistä kahdesta yhtälöstä saadaan

P(A|B)\, P(B) = P(A \cap B) = P(B|A)\, P(A). \!

Jakamalla näin saadun yhtälön molemmat puolet tekijällä P(B) saadaan Bayesin teoreema

P(A|B) = \frac{P(B|A)\,P(A)}{P(B)}. \!


Tämä matematiikkaan liittyvä artikkeli on tynkä. Voit auttaa Wikipediaa laajentamalla artikkelia.