Elinaika-analyysi

Wikipedia
Loikkaa: valikkoon, hakuun

Elinaika-analyysi on tilastotieteen osa-alue, joka tarkastelee havaintoyksikköjen siirtymistä tilasta toiseen ajan kuluessa. Se on saanut nimensä biologian sovelluksista, joissa mallinnetaan elinajan pituutta ja kuoleman hetkeä. Tekniikassa käytetään termiä reliabilitettianalyysi, jossa tyypillinen sovellus on koneen kestävyyden tutkiminen. Taloustieteessä taas käytetään termiä duraatioanalyysi.

Havaintoyksikön kuolemaa tai hajoamista kutsutaan elinaika-analyysissa tapahtumaksi. Analyysin tavoitteena on selvittää, mitkä tekijät aikaistavat tapahtumaa, mikä populaation osa selviää yli tietyn ajanhetken tai mikä on tapahtuman riski populaatiossa ajan funktiona.

Elinaika-analyysin käsitteitä[muokkaa | muokkaa wikitekstiä]

Elinaika-analyysissa keskeisenä kiinnostuksen kohteena on tapahtuman todennäköisyys ajan funktiona. Tämän vuoksi elinaikamallit keskittyvät tyypillisesti tarkasteltavan tapahtuman riskin tarkasteluun. Lähestymistapa poikkeaa tavanomaisista tilastollisista malleista, joissa mallitetaan ehdollista odotusarvoa.

Merkitään tapahtumaan liittyvän todennäköisyysjakauman tiheysfunktiota f(t), t\ge 0 . Elinajan kertymäfunktio F kertoo todennäköisyyden, että tapahtuma on tapauhtunut hetkeen t mennessä.

F(t) = \Pr(T \le t) = 1 - S(t) = 
\int_{0}^{t} f(t)

Välttöfunktio S kuvaa todennäköisyyttä selvitä yli ajanhetken t.

S(t) = \Pr(T > t)

Tiheysfunktion ja välttöfunktion avulla voidaan laskea vaarafunktio, joka on tapahtuman hetkellinen todennäköisyys hetkellä t, ehdolla että tapahtumaa ei ole sattunut ennen hetkeä t.

\lambda(t) = \Pr(t < T < t+dt\,|\,T > t) = \frac{f(t)}{S(t)} = \frac{S'(t)}{S(t)}

Edelleen voidaan määritellä kumulatiivinen vaarafunktio.

 \Lambda(t) = \int_0^{t} \lambda(u) \, du = -\log S(t)

Kaikki ylläolevat funktiot voidaan johtaa elinajalle t, kunhan ainakin yksi funktioista tunnetaan.

Havaintojen sensurointi[muokkaa | muokkaa wikitekstiä]

Sensuroinnin eri tyypit. Kuvassa musta viiva tarkoittaa, että havaintoyksiköllä ei ole havaittu tapauhtumaa ennen kyseistä hetkeä ja punainen viiva, että ei tiedetä, missä vaiheessa tapahtuma on välillä sattunut. Neliö tarkoittaa havainnon tekohetkeä (esim. kontrollikäynti) ja punainen risti tarkkaa tapahtuma-aikaa. Aikahetkenä 10 tutkimus lopetetaan (vihreä viiva). 1.yksikön elinaika tiedetään tarkasti ilman sensurointia. 2.yksikön tapauksessa on kyseessä vasemmalta sensurointi, 3. yksiköllä välisensurointi ja 4. yksiköllä oikealta sensurointi.

Elinaika-aineistoon liittyy osana sensurointi. Sensuroinnilla tarkoitetaan tilannetta, jossa tapahtuma on sattunut, mutta sattumisaikaa ei tiedetä tarkasti (vasemmalta sensurointi ja välisensurointi), tai tapahtumaa ei havaita jollekin havaintoyksikölle (oikealta sensurointi).

Vasemmalta sensuroinnilla tarkoitetaan tilannetta, jossa tapahtumasta tiedetään vain, että se on tapahtunut ennen tiettyä ajanhetkeä t.

Välisensuroinnilla tarkoitetaan tilannetta, jossa tapahtuman tiedetään tapahtuneen kahden aikapisteen t_1 ja t_2 välillä, mutta tarkkaa ajankohtaa ei tiedetä.

Oikealta sensuroinnissa tiedetään että havantoyksikön elinaika ylittää havainnoinnin loppumisajankohdan t. Oikealta sensurointi voidaan jakaa vielä alaluokkiin.

Tyypin 1 sensuroinnissa kullekin havaintoyksikölle on määrätty ennalta aika T, johon mennessä tapahtuneista tapahtumista tiedetään tapahtumisaika. Tyypillinen esimerkki tyypin 1 sensuroinnista on kliininen koe, jossa potilaita seurataan ennalta määritetty aika, vaikkakin kaikilla potilailla tapahtumaa ei ole kokeen loppumiseen mennessä ollut.

Tyypin 2 sensuroinnissa valitaan ennalta havaintojen määrä r ja koetta jatketaan kunnes tapahtuma on havaittu r osallistujalla (tyypillisesti r < osallistujien määrä n). Tällainen järjestely on yleinen esimerkiksi määriteltäessä jonkin koneen toiminta-aikaa ennen häiriötä, jolloin saadaan arvio ajasta, jossa r/n osa koneista särkyy.

Eräs yleistys tyypin 1 sensuroinnista on tilanne, jossa tutkimuksen havainnoinnin alkamis- ja päättymisaika on päätetty etukäteen ja jossa havainnointiyksiköiden seuraamisajankohdan aloitus vaihtelee. Tätä saatetaan kutsua myös tyypin 3 sensuroinniksi.

Elinaikafunktioiden estimointi[muokkaa | muokkaa wikitekstiä]

Parametrittomat menetelmät[muokkaa | muokkaa wikitekstiä]

Yksi välttöfunktion S(t) estimointiin käytetyistä menetelmistä on Kaplar-Meier -estimaattori. Olkoon kokeessa havaitut elinajat järjestyksessä t_1 < t_2 < ... < t_n , ja d_i tapahtumien määrä hetkellä t_i ja y_i juuri ennen hetkeä t_i mukana olevien havaintoyksiköiden määrä. Tällöin Kaplar-Meier estimaattori välttöfunktiolle on muotoa

 \hat{S_n(t)} = \prod_{t_i < t} \left( \frac{y_i - d_i}{y_i} \right)^{\delta_i}

missä \delta_i on 0, kun elinaika on havaittu tarkasti ja 1 kun havainto on sensuroitu.

Varianssi estimaattorille on

 \hat{Var}(\hat{S_n(t)}) = S_n(t)^2 \sum_{t_i < t} \frac{d_i}{y_i(y_i-d_i)}.

Kumulatiivista vaarafunktiota \Lambda(t) voidaan estimoida Nelson-Aalen estimaattorilla

 \hat{\Lambda(t)} = \sum_{t_i < t} \frac{d_i}{y_i} .

Varianssi estimaattorille on

 \hat{Var}(\hat{\Lambda(t)}) = \sum_{t_i < t} \frac{d_i}{y_i^2} .

Parametriset menetelmät[muokkaa | muokkaa wikitekstiä]

Paramaetrisissa menetelmissä voidaan olettaa elinajan t noudattavan jotain elinajalle käytettävää jakaumaa. Tällöin uskottavuusfunktio jakauman parametreille \mu voidaan kirjoittaa muodossa

 L(\mu, t) = \prod_{i = 1}^{n} f(\mu, t_i)^{\delta_i} \prod_{i \in O} S(\mu,t_i)
\prod_{i \in V} (1-S(\mu,t_i)) \prod_{i \in I} (S(\mu,t_{1i}) - S(\mu,t_{2i}))  ,

missä  \delta_i on 0, kun elinaika on havaittu tarkasti ja 1 kun sensuroitu ja  S(\mu, t) välttöfunktion arvo pisteessä t ehdolla parametrin arvot. Joukko O on oikealta sensuroidut havainnot, V on vasemmalta sensuroidut ja I on välisensuroidut. Tällöin kyseiseen sensuroituun havaintoon liittyvä termi uskottavuusfunktiossa kertoo todennäköisyyden, että havainto on kyseisellä välillä ehdolla parametrin arvot. Suurimman uskottavuuden estimaatit saadaan ratkaistua tavalliseen tapaan.

Elinajan t voidaan ajatella olevan myös jokin muunnos kovariaateista x, toisin sanoen t = h(x'\beta) , missä h on jokin aidosti kasvava funktio, x' on elinaikaan t liittyvät selittäjät ja β selittäjiin liittyvät regressiokertoimet. Tällöin voidaan arvoida selittäjien vaikutusta elinaikaan uskottavuuspäättelyn keinoin.

Nopeutetun elämän mallissa selittäjän vaihtelun kuvitellaan muuttavan ajan nopeutta, ts

 S_i(t, x) = \lambda_0(\text{exp}(x_i'\beta) t)\text{exp}(x_i'\beta) ,

missä \lambda_0 on tunnettu vaarafunktio.

Suhteellisen vaaran mallissa vaaran voimakkuus riippuu selittäjistä ts.

S_i(t,x) = \text{exp}(x_i'\beta) \lambda_0.

Vaaran voimakkuuden suhde S_i(t,x)/S_j(t,x) havaintoyksiköille i ja j on sama kuin selittäjivien muuttujien muunnosten suhde \text{exp}(x_i'\beta)/\text{exp}(x_j'\beta).

Semiparametrinen menetelmä - Coxin suhteellisen vaaran malli[muokkaa | muokkaa wikitekstiä]

Coxin suhteellisen vaaran malli perustuu edellä mainittuun suhteellisen vaaran malliin. Suhteellisen vaaran mallia kutsutaan semiparametriseksi, sillä se sisältää mielivaltaisen, parametrittoman vaarafunktion \lambda_0, sekä selittävistä muuttujista riippuvan parametrisen osan \text{exp}(x_i'\beta). Mallissa maksimoitavana on uskottavuusfunktio

 L(\beta) = \prod_{i=1}^{n} \left( \frac{\lambda_i}{\sum_{t_j > t_i} \lambda _j} \right)^{\delta_i},

missä \lambda_i = \text{exp}(x_i'\beta).

Elinajan jakaumia[muokkaa | muokkaa wikitekstiä]

Lähteet[muokkaa | muokkaa wikitekstiä]

  • Moeschberger, Melvin L., Klein, John P.: Survival Analysis: techniques for censored and truncated data. Springer, 1997. ISBN 978-147-57272-8-9.
  • Kalbfleisch, John D., Prentice, Ross L.: The Statistical Analysis of Failure Time Data. Hoboken (N. J.) : Wiley, 2002. ISBN 978-111-80312-3-0.