Luottamusväli
Luottamusväli on tilastotieteen käsite, joka kuvaa arviota välille, jolla populaation generoivan mallin parametri sijaitsee. Luottamusväliä käytetään määrittämään arvion luotettavuutta. Se on yksinkertaisesti havaittu väli (eli esimerkiksi väli, joka on laskettu havainnoista), joka vaihtelee otoksesta toiseen ja joka usein, mutta ei välttämättä, sisältää mielenkiinnon kohteena olevan parametrin, kun otantakoetta toistetaan. Sen, kuinka usein havaittu väli sisältää tämän parametrin, määrittelee luottamustaso.
Matemaattinen määritelmä
[muokkaa | muokkaa wikitekstiä]Soong[1] määrittelee luottamusvälin seuraavasti:
Olkoon otos peräisin jakaumasta , jonka parametriä halutaan arvioda. Olkoot ja kaksi tilastollista lukua siten, että . Tällöin väli on luottamusväli luottamustasolla parametrille , jos ja voidaan valita siten, että
.
Luottamusväli on siis pari satunnaismuuttujia, jossa rajat ovat muuttujia ja arvioitava parametri koko populaation oikea parametri, joka siis ei ole satunnaismuuttuja. Yleensä saa arvot 0,05 tai 0,01.
Käyttö ja tulkinnat
[muokkaa | muokkaa wikitekstiä]Luottamusväliä käytetään kuvaamaan epävarmuutta, joka syntyy siitä, että otoksesta laskettuja arvoja käytetään kuvaamaan koko populaatiota, vaikka otos itsessään ei välttämättä edusta täydellisesti koko populaatiota.[2] Esimerkiksi, jos haluttaisiin arvioida suomalaisten keskimääräistä pituutta käyttäen vain 1000 ihmisen otosta, pitäisi laskea luottamusväli saadulle otoskeskiarvolle.

Luottamusvälin tulkinnalla on vahva yhteys toistokokeeseen.[3] Kun luottamusväli lasketaan, voidaan olla varmoja vain :n varmuudella (esim. "95-prosenttisesti"), että arvioitu populaatioparametri sisältyy siihen luottamusväliin, joka on laskettu juuri kyseisestä otoksesta. Jos samasta populaatiosta otettaisiin useita otoksia, niin lopulta esimerkiksi 95 % niistä sisältäisi arvioidun parametrin.
Luottamusvälejä voidaan käyttää laadulliseen tulkintaan. Esimerkiksi, jos luottamusväli sisältää vain arvoja, jotka ovat tutkittavan ilmiön kannalta merkityksettömiä, voidaan olla halutulla varmuustasolla varmoja, että ilmiön vahvuus on merkityksetön. Toisena esimerkkinä voidaan pitää kahden keskiarvon vertailua. Jos tutkittavan erotuksen luottamusväli sisältää nollan, voidaan ajatella, että erotus ei ole merkittävä valitulla varmuudella.[3]
Esimerkkejä
[muokkaa | muokkaa wikitekstiä]Populaatiokeskiarvo
[muokkaa | muokkaa wikitekstiä]Jakauman keskiarvoa voidaan arvioida otoskeskiarvolla
jossa on otoskoko ja on satunnaismuuttuja. Mikäli satunnaismuuttujat ovat normaalijakautuneita tai keskeisen raja-arvolauseen ehdot toteutuvat, otoskeskiarvo noudattaa normaalijakaumaa , jossa on satunnaismuuttujien keskihajonta. Koska sitä ei yleisesti ottaen ole mahdollista tietää, pitää sitä arvioida käyttäen otoskeskihajontaa
Tällöin otoskeskiarvo noudattaa Studentin t-jakaumaa vapausasteella ja luottamusväliksi saadaan
jossa vastaa t-jakauman kertymäfunktion argumenttia todennäköisyydelle .[1][4]
Lineaarisen regression kerroin
[muokkaa | muokkaa wikitekstiä]Soong[1] määrittelee lineaarisen regression kerrointen luottamusvälit seuraavasti. Noudattakoon tutkittava ilmiö lineaarista suhdetta
, jossa
Tällöin datapisteisiin sovitettu suora on muotoa
Estimaattori residuaalien varianssille on
.
Estimaattoria hyödyntäen kertoimille voidaan laskea luottamusväli kaavalla
Vakiotermille rajat ovat
Bootstrappaus
[muokkaa | muokkaa wikitekstiä]Mikäli halutaan laskea luottamusvälejä esimerkiksi heteroskedastisuuden vallitessa, tai silloin, kun estimoitava parametri ei noudata normaalijakaumaa, voidaan käyttää ei-parametristä bootstrap-menetelmää.
Lähteet
[muokkaa | muokkaa wikitekstiä]- ↑ a b c Soong T.: Probabilistic Modeling and Analysis in Science and Engineering. Buffalo, New York: John Wiley & Sons, 1981. ISBN 0-471-08061-6 (englanniksi)
- ↑ Hazra A: Using the confidence interval confidently. J Thorac Dis, 2017, 9. vsk, nro 10. PubMed:29268424 doi:10.21037/jtd.2017.09.14 (englanniksi)
- ↑ a b Matti Uhari: Tutkimustulosten tulkinta luottamusvälien avulla. Lääketieteellinen Aikakauskirja Duodecim, 1992, 108. vsk, nro 13. Artikkelin verkkoversio.
- ↑ Sang Gyu Kwak ja Jong Hae Kim: Central limit theorem: the cornerstone of modern statistics. Korean Journal of Anesthesiology, 2017, 70. vsk, nro 2. Artikkelin verkkoversio. (englanniksi)