Siirry sisältöön

Luottamusväli

Wikipediasta

Luottamusväli on tilastotieteen käsite, joka kuvaa arviota välille, jolla populaation generoivan mallin parametri sijaitsee. Luottamusväliä käytetään määrittämään arvion luotettavuutta. Se on yksinkertaisesti havaittu väli (eli esimerkiksi väli, joka on laskettu havainnoista), joka vaihtelee otoksesta toiseen ja joka usein, mutta ei välttämättä, sisältää mielenkiinnon kohteena olevan parametrin, kun otantakoetta toistetaan. Sen, kuinka usein havaittu väli sisältää tämän parametrin, määrittelee luottamustaso.

Matemaattinen määritelmä

[muokkaa | muokkaa wikitekstiä]

Soong[1] määrittelee luottamusvälin seuraavasti:

Olkoon otos peräisin jakaumasta , jonka parametriä halutaan arvioda. Olkoot ja kaksi tilastollista lukua siten, että . Tällöin väli on luottamusväli luottamustasolla parametrille , jos ja voidaan valita siten, että

.

Luottamusväli on siis pari satunnaismuuttujia, jossa rajat ovat muuttujia ja arvioitava parametri koko populaation oikea parametri, joka siis ei ole satunnaismuuttuja. Yleensä saa arvot 0,05 tai 0,01.

Käyttö ja tulkinnat

[muokkaa | muokkaa wikitekstiä]

Luottamusväliä käytetään kuvaamaan epävarmuutta, joka syntyy siitä, että otoksesta laskettuja arvoja käytetään kuvaamaan koko populaatiota, vaikka otos itsessään ei välttämättä edusta täydellisesti koko populaatiota.[2] Esimerkiksi, jos haluttaisiin arvioida suomalaisten keskimääräistä pituutta käyttäen vain 1000 ihmisen otosta, pitäisi laskea luottamusväli saadulle otoskeskiarvolle.

Sata otosta, joista on laskettu 95 %:n luottamusvälit (vaakasuorat viivat). Normaalijakauman keskiarvo (pystysuora viiva) sisältyy 94:een laskettuun väliin.

Luottamusvälin tulkinnalla on vahva yhteys toistokokeeseen.[3] Kun luottamusväli lasketaan, voidaan olla varmoja vain :n varmuudella (esim. "95-prosenttisesti"), että arvioitu populaatioparametri sisältyy siihen luottamusväliin, joka on laskettu juuri kyseisestä otoksesta. Jos samasta populaatiosta otettaisiin useita otoksia, niin lopulta esimerkiksi 95 % niistä sisältäisi arvioidun parametrin.

Luottamusvälejä voidaan käyttää laadulliseen tulkintaan. Esimerkiksi, jos luottamusväli sisältää vain arvoja, jotka ovat tutkittavan ilmiön kannalta merkityksettömiä, voidaan olla halutulla varmuustasolla varmoja, että ilmiön vahvuus on merkityksetön. Toisena esimerkkinä voidaan pitää kahden keskiarvon vertailua. Jos tutkittavan erotuksen luottamusväli sisältää nollan, voidaan ajatella, että erotus ei ole merkittävä valitulla varmuudella.[3]

Populaatiokeskiarvo

[muokkaa | muokkaa wikitekstiä]

Jakauman keskiarvoa voidaan arvioida otoskeskiarvolla

jossa on otoskoko ja on satunnaismuuttuja. Mikäli satunnaismuuttujat ovat normaalijakautuneita tai keskeisen raja-arvolauseen ehdot toteutuvat, otoskeskiarvo noudattaa normaalijakaumaa , jossa on satunnaismuuttujien keskihajonta. Koska sitä ei yleisesti ottaen ole mahdollista tietää, pitää sitä arvioida käyttäen otoskeskihajontaa

Tällöin otoskeskiarvo noudattaa Studentin t-jakaumaa vapausasteella ja luottamusväliksi saadaan

jossa vastaa t-jakauman kertymäfunktion argumenttia todennäköisyydelle .[1][4]

Lineaarisen regression kerroin

[muokkaa | muokkaa wikitekstiä]

Soong[1] määrittelee lineaarisen regression kerrointen luottamusvälit seuraavasti. Noudattakoon tutkittava ilmiö lineaarista suhdetta

, jossa

Tällöin datapisteisiin sovitettu suora on muotoa

Estimaattori residuaalien varianssille on

.

Estimaattoria hyödyntäen kertoimille voidaan laskea luottamusväli kaavalla

Vakiotermille rajat ovat

Bootstrappaus

[muokkaa | muokkaa wikitekstiä]

Mikäli halutaan laskea luottamusvälejä esimerkiksi heteroskedastisuuden vallitessa, tai silloin, kun estimoitava parametri ei noudata normaalijakaumaa, voidaan käyttää ei-parametristä bootstrap-menetelmää.

  1. a b c Soong T.: Probabilistic Modeling and Analysis in Science and Engineering. Buffalo, New York: John Wiley & Sons, 1981. ISBN 0-471-08061-6 (englanniksi)
  2. Hazra A: Using the confidence interval confidently. J Thorac Dis, 2017, 9. vsk, nro 10. PubMed:29268424 doi:10.21037/jtd.2017.09.14 (englanniksi)
  3. a b Matti Uhari: Tutkimustulosten tulkinta luottamusvälien avulla. Lääketieteellinen Aikakauskirja Duodecim, 1992, 108. vsk, nro 13. Artikkelin verkkoversio.
  4. Sang Gyu Kwak ja Jong Hae Kim: Central limit theorem: the cornerstone of modern statistics. Korean Journal of Anesthesiology, 2017, 70. vsk, nro 2. Artikkelin verkkoversio. (englanniksi)

Aiheesta muualla

[muokkaa | muokkaa wikitekstiä]