Regressioepäjatkuvuusasetelma

Wikipediasta
Siirry navigaatioon Siirry hakuun

Regressioepäjatkuvuusasetelma (RDD) on kvasikokeellinen tutkimusmenetelmä, jossa kausaalisia vaikutuksia päätellään. Niissä on raja-arvo, jonka ylittäviin (tai alittaviin) kohteisiin suoritetaan interventio. Kun verrataan hyvin lähellä rajaa olevia tapauksia toisiinsa, voidaan arvioida intervention vaikutusta, vaikka intervention kohteeksi joutumista ei ole voitu satunnaistaa. Ensimmäisenä tällaisen kokeen tekivät Donald Thistlethwaite ja Donald Campbell arvioidessaan stipendiohjelmia,[1] RDD:stä on tullut yhä suositumpi viime vuosina.[2]

Näin saadaan estettyä vinoutunut otos sellaisissakin tilanteissa, joissa satunnaistettu vertailukoe olisi epäeettinen, vaikea tai kallis, siis esimerkiksi stipendien jakaminen arpomalla.

Esimerkki[muokkaa | muokkaa wikitekstiä]

Suomessa RDD:tä on sovellettu esimerkiksi tutkimuksessa, jossa selvitettiin eliittilukioiden vaikutuksia ylioppilaskirjoitusten tuloksiin.[3] Tutkimuksessa verrattiin keskenään niitä oppilaita, jotka juuri ja juuri alittivat tai ylittivät kuhunkin tarkasteltavana olleeseen lukioon vaaditun keskiarvorajan. Oppilaat olivat siis lähtökohtaisesti opintomenestykseltään hyvin samankaltaisia, mutta osa heistä pääsi sisään niin kutsuttuun eliittilukioon ja osa ei. Tutkimus osoitti, että eliittilukiossa opiskelulla ei ollut vaikutusta menestykseen ylioppilaskirjoituksissa tarkasteltujen oppilaiden tapauksissa.

Menetelmät[muokkaa | muokkaa wikitekstiä]

Yleensä käytetään ei-parametristä tai parametristä regressiota.

Ei-parametrinen estimointi[muokkaa | muokkaa wikitekstiä]

Yleisin ei-parametrinen menetelmä käyttää RDD yhteydessä on paikallinen lineaarinen regressio. Tämä on muotoa:

missä on käsittelyn raja-arvo, esimerkiksi lukion keskiarvoraja. on binaarinen muuttuja, joka on yksi, jos keskiarvo . Vakio kertoo, miten kaukana :stä olevat keskiarvot otetaan mukaan tutkimukseen:. Termit ottavat huomioon keskiarvon suoran vaikutuksen. Yleensä käytetään kolmiomaista ydintä[4], mutta suorakaiteen muotoinen ydin on suoraviivaisemmin tulkittavissa.[5]

Parametrinen estimointi[muokkaa | muokkaa wikitekstiä]

Esimerkki parametrisesta estimoinnista on:

where

ja on kokeen raja-arvo (esim. lukion keskiarvoraja). Huomaa, että polynomiosaa voidaan lyhentää tai pidentää tarpeen mukaan.

Muita esimerkkejä[muokkaa | muokkaa wikitekstiä]

  • Politiikka, jossa kokeen kohteeksi joutuminen määräytyy iän perusteella (esim. eläkkeet tai alkoholin minimi-ikäraja).
  • Vaaleissa, joissa poliitikko voittaa juuri ja juuri tulee valituksi.

Vaadittavat oletukset[muokkaa | muokkaa wikitekstiä]

Regressio-epäjatkuvuusasetelma olettaa, että valintarajan lähellä valikoituminen on "yhtä hyvää kuin satunnainen". Tätä voi testata monin tavoin.

Lähteet[muokkaa | muokkaa wikitekstiä]

  1. Thistlethwaite, Campbell D.: Regression-Discontinuity Analysis: An alternative to the ex post facto experiment. Journal of Educational Psychology, 1960, 51. vsk, nro 6, s. 309–317.
  2. Imbens ja Wooldridge: Recent Developments in the Econometrics of Program Evaluation. Journal of Economic Literature, 2009, 47. vsk, nro 1, s. 5–86.
  3. Tervonen, Kortelainen ja Kanninen: Eliittilukioiden vaikutukset ylioppilaskirjoitusten tuloksiin. VATT Tutkimukset 186/2017.
  4. Fan ja Gijbels: Local Polynomial Modelling and Its Applications. Chapman and Hall, 1996. ISBN 0-412-98321-4.
  5. Lee ja Lemieux: Regression Discontinuity Designs in Economics. Journal of Economic Literature, 2010, 48. vsk, nro 2, s. 281–355.