Kovarianssifunktio

Kovarianssifunktio on todennäköisyyslaskennassa, erityisesti stokastiikassa ja tilastotieteessä käytettävä riippuvuuden määrän ilmaisemiseen käytettävä mitta. Stokastisissa prosesseissa, jotka muistuttavat esimerkiksi aikasarjoja, käytetään autokorrelaatiota prosessin sisäisen riippuvuuden mittaamiseksi. Satunnaiskentissä, jotka muodostetaan moniston $\mathbb {R} ^{n}$ avulla, satunnaismuuttujien välillä olevan riippuvuuden määrää mitataan spatiaalisen autokorrelaation avulla. Riippuvuutta ilmaisevan kovarianssifunktion rinnalla käytetään myös korrelogrammia ja variogrammia.^[1]^[2]^[3]^[4]^[5]

Määritelmä[muokkaa | muokkaa wikitekstiä]

Kovarianssin määritelmä[muokkaa | muokkaa wikitekstiä]

Kahden satunnaismuuttujan $X$ ja $Y$ välinen riippuvuus määritellään kovarianssin avulla. Kovarianssi merkitään ja määritellään

\sigma (X,Y)=\sigma _{XY}=cov(X,Y)=E[(X-E[X])(Y-E[X])].

Lausekkeet voidaan kertoa auki

=E[(X-E[X])(Y-E[X])]=E[XY-XE[Y]-YE[X]+E[X]E[Y]].

Koska odotusarvo $E$ on lineaarinen operaattori ja jos sen arvot merkitään $E[X]=\mu _{X}$ ja $E[Y]=\mu _{Y}$ , saadaan

=E[XY-XE[Y]-YE[X]+E[X]E[Y]]=E[XY-Y\mu _{X}-X\mu _{Y}+\mu _{X}\mu _{Y}]

=E[XY]-E[Y]\mu _{X}-E[X]\mu _{Y}+\mu _{X}\mu _{Y}=E[XY]-\mu _{X}\mu _{Y}.

Satunnaiskentän kovarianssi[muokkaa | muokkaa wikitekstiä]

Satunnaiskenttien kohdassa $x$ olevat tai indeksillä $x$ merkityt satunnaismuuttujat voidaan esittää merkinnällä

Z_{x}=Z(x).

^[4]

Silloin merkinnät $Z(x)$ ja $Z(y)$ tarkoittavat eri pisteissä $x$ ja $y$ olevia satunnaismuuttujia. Näiden välinen riippuvuus on ollut tapana merkitä

\sigma (Z(x),Z(y))=\sigma (Z_{x},Z_{y})=\sigma (x,y)=\sigma _{xy}.

Käytännön sovelluksissa, jollainen on esimerkiksi geostatistiikka, satunnaiskenttiä $Z(x)$ ovat esimerkiksi maaston alueita ( $x\in \mathbb {R} ^{2}$ ) tai maanalaisia tilavuuksia ( $x\in \mathbb {R} ^{3}$ ). Tutkittavaa ilmiötä vastaavan matemaattisen satunnaiskentän stationäärisyys voi olla niin vahvaa, että kovarianssi riippuu pelkästään joko pisteiden välisestä etäisyydestä tai etäisyyden suuntavektorista. Tällaisissa tapauksissa kovarianssin arvot ovat esimerkiksi etäisyyden ja suunnan funktioita $\sigma (h,\alpha )$ tai pelkästään etäisyyden funktioita $\sigma (h)$ . Tämän tyyppisiä kovariansseja kutsutaan kovarianssifunktioiksi ja niitä merkitään $\sigma$ :n sijasta tavallisesti $C(h)$ .^[4]^[6]^[5]

Ominaisuuksia[muokkaa | muokkaa wikitekstiä]

Peruspiirteet[muokkaa | muokkaa wikitekstiä]

Jos satunnaismuuttujan varianssin arvo merkitään $\sigma ^{2}(X)=\sigma ^{2}$ , niin satunnaismuuttujan kovarianssi itsensä kanssa on $\sigma (X,X)=E[XX]-\mu _{X}\mu _{X}=E[X^{2}]-\mu ^{2}=\sigma ^{2}$ (varianssin määritelmän mukaan). Satunnaiskentissä, jossa satunnaismuuttujien riippuvuus heikkenee etäisyyden kasvaessa, on yleensä suurin riippuvuus lähekkäin sijaitsevilla satunnaismuuttujilla. Kovarianassifunktiossa tämä tapahtuu etäisyysarvoilla nolla eli $C(0),$ jolloin kovarianssi saa varianssin arvon eli $C(0)=\sigma ^{2}.$ ^[4]^[6]^[5]

Monesti halutaan, vaikka kokeellisesti eli tilastollisesti määritellyt kovarianssien arvot ovat tietyillä etäisyyksillä negatiivisia, kovarianssifunktion olevan positiividefiniitti eli $C(h)\geq 0.$ Mikäli negatiivisia riippuvuuksia löytyy, tarkoittaa se, että toisen satunnaismuuttujan arvot vähenisi kun toisen kasvaisi, ja päinvastoin. Tämä on luonnonsovelluksissa harvinaista, mutta taloussovelluksissa yleisempää.^[6]

Satunnaiskentissä riippuvuus yleensä heikkenee etäisyyden kasvaessa. Jos riippuvuuden heikkeneminen ja etäisyyden kasvaminen on koko ajan samansuuntaista, on kovarianssi etäisyyden suhteen vähenevä funktio. Kovarianssifunktion maksimi eli varianssi saavutetaan silloin origossa $C(0)=\sigma ^{2}$ .^[6]^[5]^[7]

Stationäärisyysoletuksien vaikutuksia[muokkaa | muokkaa wikitekstiä]

Satunnaiskentän vahva stationäärisyys takaa kaikille satunnaismuuttujille saman jakauman, samat momentit ja satunnaismuuttujien moniulotteiset jakaumat ovat invariantit paikan valinnalle. Nämä ehdot takaavat myös kovarianssifunktiolle saman arvon samalla etäisyydellä olevalle satunnaismuuttujaparille. Jos niiden toinen momentti on lisäksi äärellinen, on niillä äärellinen odotusarvo, joka on vakio, ja kovarianssifunktion arvo riippuu vain erotusvektorista. Tällaisia ideaalisia satunnaiskenttiä ei luonnosta kuitenkaan löydy.^[6]

Satunnaiskentän heikko stationäärisyys ei takaa samaa moniulotteista jakaumaa, joka on invariantti paikan valinnalle. Satunnaiskentän kaikilla satunnaismuuttujilla on kuitenkin äärellinen odotusarvo $E[Z(x)]=\mu$ ja toinen momentti $E[Z(x)^{2}].$ Kovarianssifunktio riippu vain etäisyysvektorista. Muita satunnaiskentän ominaisuuksia ei taata. Niiden seurauksena satunnaiskentän varianssi on vakio $\sigma ^{2}=C(0)$ ja korrelogrammi on rajoitettuna olemassa

\rho (h)={\frac {C(h)}{C(0)}}.

^[8]^[5]

Kovarianssifunktio on näiden lisäksi etäisyysvektorin suhteen symmetrinen eli $C(h)=C(-h)$ ja sen arvot ovat $|C(h)|\leq C(0).$ Kaikki edellä kerrotut vahvan ja heikon stationäärisyyden ominaisuudet ovat voimassa Gaussisella satunnaiskentällä.^[6]^[8]^[5]^[7]

Heikkokin stationäärisyys on käytännän kannalta erittäin vahva oletus ja tulee harvoin täytyttyä. Siksi on kehitetty sovelluksia varten sellainen stationäärisyysehto, jossa odotusarvo voi vaihdella ja toinen momentti voi olla ääretön.^[6]^[7]

Satunnaiskentän sisäinen stationäärisyys on määritelty niin, ettei kovarianssia voi käyttää, sillä se muuttuu negatiiviseksi. Kovarianssifunktion sijasta käytetään näissä tapauksissa variogrammia.^[1]^[6]^[9]^[5]^[7]

Kovarianssin estimaattori[muokkaa | muokkaa wikitekstiä]

Yleensä kovarianssifunktio määritetään tutkimuskentältä $z(x)$ määritetyistä näytteistä $z_{i}$ . Aluksi tulee kovarianssifunktion määrittelyssä huomioida sekä etäisyys että suunta, joista muodostetaan omat luokat ja joiden kovarianssit lasketaan luokittain. Jos kovarianssi on kuitenkin samanlainen eri suunnissa, voidaan eri suuntien etäisyydet yhdistää samaan etäisyysluokkaan. Kullekin etäisyysluokalle $h_{k}$ lasketaan sitten kovarianssien arvot^[8]

C(h_{k})={\frac {\sum _{\forall i,j}(z_{i}-\mu )(z_{j}-\mu )}{n-1}}.

Kun kaikki etäisyysluokat $h_{k}$ on määritetty, sovitetaan niihin kovarianssifunktion lauseke niin, että käyrä kulkee mahdollisimman lähellä kaikkia estimoituja etäisyysluokkien kovarianssiarvoja. Tätä käyrää kutsutaan kokeelliseksi eli empiiriseksi kovarianssifunktioksi.

Lähteet[muokkaa | muokkaa wikitekstiä]

Matheron, Georges: The Theory Of Regionalized Variables And Its Applications. julkaisusarjasta "Les Cahiers du Centre de Morphologie Mathématique de Fontainebleu", nro 5. Pariisi, Ranska: École Nationale Supérieure des Mines de Paris, 1971. Verkkoversio (pdf) (viitattu 24.8.2015). (englanniksi)
Koistinen, Esko: Geomatematiikan menetelmiä ja sovelluksia malmivaratutkimuksissa, Tutkimusraportti nro 52, Geologinen tutkimuslaitos, 1981
Heikkinen, Juha: Geostatistiikka (Arkistoitu – Internet Archive), luentomoniste, Helsingin Yliopisto, 2006

Viitteet[muokkaa | muokkaa wikitekstiä]

↑ ^a ^b Pohjois-Karjalan Ammattikorkeakoulu: Kriging
↑ Horttanainen, Esa-Pekka: Mat-2.108 Sovelletun matematiikan erikoistyö Spatiaalisen autokorrelaation testaaminen, s. 5−7, Systeemianalyysin opinnäytetyö, Aalto-yliopisto, 2003
↑ Koistinen, Esko: Geomatematiikan menetelmiä ja sovelluksia malmivaratutkimuksissa, 1981
↑ ^a ^b ^c ^d Heikkinen, Juha: Geostatistiikka, 2006, s. 2–8
↑ ^a ^b ^c ^d ^e ^f ^g Ronny Berndtsson: Spatial Dependence of Geochemical Elements in a Semiarid Agricultural Field: II. Geostatistical Properties, Soil Science Society of America, 2005
↑ ^a ^b ^c ^d ^e ^f ^g ^h Heikkinen, Juha: Geostatistiikka, 2006, s. 9–12
↑ ^a ^b ^c ^d Bohling, Geoff: Variograms, Kansas Geological Survey, 2005
↑ ^a ^b ^c Koistinen, Esko: Geomatematiikan menetelmiä ja sovelluksia malmivaratutkimuksissa, 1981, s. 12–14
↑ Koistinen, Esko: Geomatematiikan menetelmiä ja sovelluksia malmivaratutkimuksissa, 1981, s. 18–20

[pkamk-1] Pohjois-Karjalan Ammattikorkeakoulu: Kriging

[hep5-2] Horttanainen, Esa-Pekka: Mat-2.108 Sovelletun matematiikan erikoistyö Spatiaalisen autokorrelaation testaaminen, s. 5−7, Systeemianalyysin opinnäytetyö, Aalto-yliopisto, 2003

[ek-3] Koistinen, Esko: Geomatematiikan menetelmiä ja sovelluksia malmivaratutkimuksissa, 1981

[jh2-4] Heikkinen, Juha: Geostatistiikka, 2006, s. 2–8

[rb2-5] ↑ ^a ^b ^c ^d ^e ^f ^g Ronny Berndtsson: Spatial Dependence of Geochemical Elements in a Semiarid Agricultural Field: II. Geostatistical Properties, Soil Science Society of America, 2005

[jh9-6] ↑ ^a ^b ^c ^d ^e ^f ^g ^h Heikkinen, Juha: Geostatistiikka, 2006, s. 9–12

[gb-7] Bohling, Geoff: Variograms, Kansas Geological Survey, 2005

[ek12-8] Koistinen, Esko: Geomatematiikan menetelmiä ja sovelluksia malmivaratutkimuksissa, 1981, s. 12–14

[ek18-9] Koistinen, Esko: Geomatematiikan menetelmiä ja sovelluksia malmivaratutkimuksissa, 1981, s. 18–20

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

Kovarianssifunktio

Sisällys

Määritelmä[muokkaa | muokkaa wikitekstiä]

Kovarianssin määritelmä[muokkaa | muokkaa wikitekstiä]

Satunnaiskentän kovarianssi[muokkaa | muokkaa wikitekstiä]

Ominaisuuksia[muokkaa | muokkaa wikitekstiä]

Peruspiirteet[muokkaa | muokkaa wikitekstiä]

Stationäärisyysoletuksien vaikutuksia[muokkaa | muokkaa wikitekstiä]

Kovarianssin estimaattori[muokkaa | muokkaa wikitekstiä]

Lähteet[muokkaa | muokkaa wikitekstiä]

Viitteet[muokkaa | muokkaa wikitekstiä]

Navigointivalikko

Kovarianssifunktio

Määritelmä[muokkaa | muokkaa wikitekstiä]

Kovarianssin määritelmä[muokkaa | muokkaa wikitekstiä]

Satunnaiskentän kovarianssi[muokkaa | muokkaa wikitekstiä]

Ominaisuuksia[muokkaa | muokkaa wikitekstiä]

Peruspiirteet[muokkaa | muokkaa wikitekstiä]

Stationäärisyysoletuksien vaikutuksia[muokkaa | muokkaa wikitekstiä]

Kovarianssin estimaattori[muokkaa | muokkaa wikitekstiä]

Lähteet[muokkaa | muokkaa wikitekstiä]

Viitteet[muokkaa | muokkaa wikitekstiä]

Navigointivalikko

Haku