Simpsonin paradoksi

Wikipedia
Loikkaa: valikkoon, hakuun

Simpsonin paradoksi on tilastotieteessä esiintyvä paradoksi. Kyseinen paradoksi syntyy, kun kahden muuttujan välinen korrelaatio muuttuu päinvastaiseksi, otettaessa huomioon jokin kolmas muuttuja, joka korreloi molempien muuttujien kanssa. Esimerkiksi, jos peruskoululaisille tehtäisiin kaikille sama testi, voitaisiin huomata, että tupakoivat pärjäävät paremmin, kuin sellaiset jotka eivät tupakoi. Mutta kuitenkin, jos tarkasteluun lisätään testattavien ikä ja tutkitaan tupakoinnin vaikutusta ikäryhmien sisällä tulos kääntyy päinvastaiseksi.

Edward H. Simpson esitteli tämän ilmiön artikkelissaan vuonna 1951.[1] mutta Karl Pearson, et al. vuonna 1899[2] ja Udny Yule vuonna 1903,[3] ovat maininneet samankaltaisesta ilmiöstä aiemminkin. Nimen Simpsonin paradoksi esitteli Colin R.Blyth vuonna 1972.[4]

Esimerkkejä[muokkaa | muokkaa wikitekstiä]

Taudista parantuminen[muokkaa | muokkaa wikitekstiä]

Esimerkki on Judea Pearlin artikkelista vuodelta 1999.[5] Kyseessä on kokeellinen tutkimus, jossa koeasetelma on seuraava: Tutkitaan taudista paranemista lääkkeen avulla. Kokeessa on mukana 80 koehenkilöä; 40 naista ja 40 miestä. Lääkettä annetaan 10 naiselle ja 30 miehelle. Kontrolliryhmässä lumelääkettä saavat siis 30 naista ja 10 miestä. Paradoksi syntyy, kun tutkittaessa kaikkia koehenkilöitä lääke todetaan hyödylliseksi. Mutta kun tutkitaan erikseen miehiä ja erikseen naisia, huomataan että molemmissa sukupuoliryhmissä parantuneita onkin enemmän lumelääkettä saaneissa kuin varsinaista lääkettä saaneissa. Tämä saattaa kuulostaa järjenvastaiselta mutta tällainen tilanne todellakin voi syntyä. Alla olevissa taulukoissa on tilanteeseen sopiva esimerkkidata.

Molemmat sukupuolet
Parantuneita Ei-parantuneita Yhteensä Parantumisaste
Lääke 20 20 40 50%
Kontrolli 16 24 40 40%
Miehet
Parantuneita Ei-parantuneita Yhteensä Parantumisaste
Lääke 18 12 30 60%
Kontrolli 7 3 10 70%
Naiset
Parantuneita Ei-parantuneita Yhteensä Parantumisaste
Lääke 2 8 10 20%
Kontrolli 9 21 30 30%

Berkeleyn sukupuolisyrjintä[muokkaa | muokkaa wikitekstiä]

Yksi tunnetuimmista Simpsonin paradoksi esimerkeistä on Berkeleyn yliopiston sukupuolisyrjintä tapaus. Yliopisto haastettiin oikeuteen vuonna 1973 sukupuolisyrjinnästä. Väitettiin, että yliopistoon olisi miesten helpompi päästä kuin naisten.[6]

Hakijat Hyväksytyt
Miehet 8442 44%
Naiset 4321 35%

Yllä olevasta taulukosta nähdään, että mieshakijoista on päässyt 9 prosenttiyksikköä enemmän sisälle kuin naisista. Mutta tarkasteltaessa erikseen eri tiedekuntia huomataan, että itseasissa useammassa tiedekunnissa naisia on päässyt sisälle isompi osuus hakijoista. Aineisto kuudesta isoimmasta tiedekunnasta on listattu alla olevaan taulukkoon.

Tiedekunta Miehet Naiset
Hakijoita Hyväksyttyjä Hakijoita Hyväksyttyjä
A 825 62% 108 82%
B 560 63% 25 68%
C 325 37% 593 34%
D 417 33% 375 35%
E 191 28% 393 24%
F 272 6% 341 7%

Bickel et al.[6] esitti artikkelissaan, että kyseinen ilmiö johtuu luultavasti siitä, että useat naiset hakevat tiedekuntiin, joissa on pieni sisäänottoprosentti (esim. englanninkieli). Miehet puolestaan useammin hakevat opiskeleen sellaisia oppiaineita, joihin otetaan isompi prosentti hakijoista sisälle (esim. kemia ja tekniikka).

Ongelman ratkaisu[muokkaa | muokkaa wikitekstiä]

Vuonna 2000 pearl esitteli kirjassaan[7] do()-operaattorin. Sen ja kausaalilaskennan avulla simpsonin paradoksin aiheuttamat ongelmat saadaan katoamaan.[5]

Lähteet[muokkaa | muokkaa wikitekstiä]

  1. Simpson, Edward H. (1951). "The Interpretation of Interaction in Contingency Tables". Journal of the Royal Statistical Society, Ser. B 13: 238–241. 
  2. "Genetic (reproductive) selection: Inheritance of fertility in man" (1899). Philosophical Translations of the Royal Statistical Society, Ser. A 173: 534–539. 
  3. G. U. Yule (1903). "Notes on the Theory of Association of Attributes in Statistics". Biometrika 2 (2): 121–134. doi:10.1093/biomet/2.2.121. 
  4. Colin R. Blyth (June 1972). "On Simpson's Paradox and the Sure-Thing Principle". Journal of the American Statistical Association 67 (338): 364–366. doi:10.2307/2284382. 
  5. a b Pearl Judea (1999). "Simpson's Paradox: An Anatomy". 
  6. a b P.J. Bickel, E.A. Hammel and J.W. O'Connell (1975). "Sex Bias in Graduate Admissions: Data From Berkeley". Science 187 (4175): 398–404. doi:10.1126/science.187.4175.398. PMID 17835295.  .
  7. Judea Pearl. Causality: Models, Reasoning, and Inference, Cambridge University Press (2000, 2nd edition 2009). ISBN 0-521-77362-8.

Aiheesta muualla[muokkaa | muokkaa wikitekstiä]