Kovarianssi

Kovarianssi on todennäköisyyslaskennassa ja tilastotieteessä kahden satunnaismuuttujan välisen riippuvuuden mitta. Se kuvaa, kuinka läheisesti muuttujat vaihtelevat yhdessä. Yksinkertaistaen voidaan havainnollistaa, että kovarianssi saa positiivisen arvon, kun satunnaismuuttujan arvot jäävät samalle puolelle odotusarvoihinsa nähden, ja vastaavasti negatiivisen arvon, kun niiden arvot jäävät eri puolille odotusarvoihinsa nähden. Kovarianssi on yhteisjakauman toinen keskusmomentti, jonka yksiköksi eli dimensioksi tulee kummankin satunnaismuuttujan yksiköiden tulo. Momentin käsitteeseen liittyy tulkinta, että kovarianssi on niin sanotun yhteisjakauman "todennäköisyysmassan painopisteen" $\scriptstyle (E[X],E[Y])$ ympärillä tapahtuvan vaihtelun mitta. Korrelaatio on kovarianssin normalisoitu tunnusluku, joka on puolestaan yksikötön.^[1]

Todennäköisyyslaskennassa kovarianssi on yhteisjakauman tunnusluku, kun taas tilastolaskennassa kovarianssi on todennäköisyyslaskennan tunnusluvun estimaatti.

Määritelmä ja merkinnät[muokkaa | muokkaa wikitekstiä]

Matemaattisesti kovarianssi $\sigma _{XY}$ on määritelty kahden reaaliarvoisen satunnaismuuttujan $X$ ja $Y$ avulla

\sigma _{XY}=\operatorname {E} [(X-\mu _{X})(Y-\mu _{Y})],

missä $E[X]=\mu _{X}$ ja $E[Y]=\mu _{Y}$ ovat vastaavasti satunnaismuuttujien odotusarvot. Kovarianssi voidaan merkitä erilaisilla vaihtoehtoisilla tavoilla, kuten esimerkiksi

\sigma _{XY}=\sigma (X,Y)=cov(X,Y)=Cov(X,Y).

^[1]

Yhteisjakaumassa voi esiintyä myös merkinnät $\sigma _{X}$ ja $\sigma _{Y}$ . Ne esittävät satunnaismuuttujien keskihajontoja $\sigma _{X}={\sqrt {\sigma _{X}^{2}}}$ ja $\sigma _{Y}={\sqrt {\sigma _{Y}^{2}}}$ .^[2]

Diskreetit satunnaismuuttujat[muokkaa | muokkaa wikitekstiä]

Diskreetin satunnaismuuttujaparin kovarianssi lasketaan

\sigma _{XY}=\sum _{x\in X}\sum _{y\in Y}(x-\mu _{X})(y-\mu _{Y})f_{XY}(x,y),

^[1]

missä $f_{XY}(x,y)$ on yhteisjakauman pistetodennäköisyysfunktio.

Jatkuvat satunnaismuuttujat[muokkaa | muokkaa wikitekstiä]

Jatkuvan satunnaismuuttujaparin kovarianssi on taas

\sigma _{XY}=\int _{-\infty }^{+\infty }\int _{-\infty }^{+\infty }(x-\mu _{X})(y-\mu _{Y})f_{XY}(x,y)dydx,\,

^[1]

missä $f_{XY}(x,y)$ on yhteisjakauman tiheysfunktio.

Ominaisuuksia[muokkaa | muokkaa wikitekstiä]

Rinnakkaiskaavan johtaminen[muokkaa | muokkaa wikitekstiä]

Yleisessä tilanteessa satunnaismuuttujat ovat toisistaan riippuvia jossakin mielessä. Silloin kovarianssi voidaan kehittää edelleen hyödyntämällä odotusarvo-operaattorin tunnetut ominaisuudet:^[1]

{\begin{aligned}\sigma (X,Y)&=\operatorname {E} [(X-\operatorname {E} [X])(Y-\operatorname {E} [Y])]\\&=\operatorname {E} [XY-X\operatorname {E} [Y]-\operatorname {E} [X]Y+\operatorname {E} [X]\operatorname {E} [Y]]\\&=\operatorname {E} [XY]-\operatorname {E} [X]\operatorname {E} [Y]-\operatorname {E} [X]\operatorname {E} [Y]+\operatorname {E} [X]\operatorname {E} [Y]\\&=\operatorname {E} [XY]-\operatorname {E} [X]\operatorname {E} [Y]\\&=\operatorname {E} [XY]-\mu _{X}\mu _{Y}.\end{aligned}}

Riippumattomuus[muokkaa | muokkaa wikitekstiä]

Jos satunnaismuuttujat ovat riippumattomia, saadaan odotusarvoksi

\operatorname {E} [XY]=\operatorname {E} [X]\operatorname {E} [Y]=\mu _{X}\mu _{Y}.

Yleisen kovarianssin kehitetystä lausekkeesta tulee silloin

{\begin{aligned}\operatorname {cov} (X,Y)&=\operatorname {E} [XY]-\operatorname {E} [X]\operatorname {E} [Y]\\&=\operatorname {E} [X]\operatorname {E} [Y]-\operatorname {E} [X]\operatorname {E} [Y]=0.\end{aligned}}

Siten, jos satunnaismuuttujat ovat riippumattomia toisistaan, saadaan kovarianssiksi nolla. Päinvastainen ei pidä aina paikkaansa, sillä kovarianssin ollessa nolla, ei satunnaismuuttujat aina ole riippumattomia toisistaan.^[2]^[1]

Arvojoukko[muokkaa | muokkaa wikitekstiä]

Kovarianssin yksikkö määräytyy satunnaismuuttujien tulosta. Koska korrelaation arvo jää välille $-1\leq r_{XY}\leq 1$ , saadaan kovarianssin arvolle väli $-\sigma _{X}\sigma _{Y}\leq \sigma _{XY}\leq \sigma _{X}\sigma _{Y}$ , missä $\sigma _{X}\sigma _{Y}$ on keskihajontojen tulo.

Päättelysääntöjä[muokkaa | muokkaa wikitekstiä]

Kovarianssille voidaan johtaa seuraavia laskusääntöjä ( $a,b$ ovat reaalivakioita):

\sigma (X,a)=0\,

\sigma (X,X)=\sigma ^{2}(X)\,

eli

\sigma _{XX}=\sigma _{X}^{2}

^[2]^[3]^[1] (varianssi)

\sigma (X,Y)=\sigma (Y,X)\,

^[2] (symmetrisyys)

\sigma (aX,bY)=ab\,\sigma (X,Y)\,

(kertoimien ulosotto)

\sigma (X+a,Y+b)=\sigma (X,Y)\,

(vakionlisäys)

\sigma (X+Z,Y)=\sigma (X,Y)+\sigma (Z,Y)\,

^[2] (summan kovarianssi)

\sigma (aX+bY,cW+dV)=ac\,\sigma (X,W)+ad\,\sigma (X,V)+bc\,\sigma (Y,W)+bd\,\sigma (Y,V)

(lineaarikombinaatiot)

\sigma \left(\sum _{i}{X_{i}},\sum _{j}{Y_{j}}\right)=\sum _{i}{\sum _{j}{\sigma \left(X_{i},Y_{j}\right)}}

^[2] (useiden satunnaismuuttujien summat)

Tilastollinen kovarianssi[muokkaa | muokkaa wikitekstiä]

Arvioitaessa kahden tilastomuuttujan kovarianssia, käytetään estimaattorina lauseketta

\sigma _{XY}=\sum _{i=1}^{n}{\frac {(x_{i}-{\bar {x}})(y_{i}-{\bar {y}})}{n}},

^[2]

missä otoksen suuruus on $n$ ja otoksen muuttujien keskiarvot ovat ${\bar {x}}$ ja ${\bar {y}}$ . Usein kuitenkin jaetaan summa otoksen suuruutta yhtä pienemmällä luvulla (vapausaste)

\sigma _{XY}=\sum _{i=1}^{n}{\frac {(x_{i}-{\bar {x}})(y_{i}-{\bar {y}})}{n-1}}.

^[4]

Satunnaisvektorit[muokkaa | muokkaa wikitekstiä]

Kun X ja Y ovat n- ja m-ulotteisia pystyvektoreita, n x m-ulotteinen kovarianssimatriisi on määritelty:

\sigma (X,Y)=\operatorname {E} ((X-\mu _{X})(Y-\mu _{Y})^{\top }).

Matriisit cov(X,Y) ja cov(Y,X) ovat toistensa transpooseja. Kun X on vektori, matriisia cov(X,X) sanotaan X:n kovarianssimatriisiksi tai pidemmin varianssi-kovarianssi-matriisiksi.^[5]

Korrelaatiokerroin[muokkaa | muokkaa wikitekstiä]

Kovarianssilla voidaan mitata satunnaismuuttujien riippuvuuksia, mutta satunnaismuuttujien keskihajonnat vaikuttavat myös kovarianssin arvoon. Tuloksesta voidaan puhdistaa keskihajontojen vaikutukset jakamalla kovarianssi niillä, jolloin saadaan uusi riippuvuuden mitta korrelaatiokerroin

\rho _{XY}={\frac {\sigma _{XY}}{\sigma _{X}\sigma _{Y}}}.

^[1]

Sen arvot vaihtelevat välillä $-1\leq \rho _{XY}\leq 1$ eikä sillä ole mittayksikköä.

Katso myös[muokkaa | muokkaa wikitekstiä]

Momenttifunktio

Lähteet[muokkaa | muokkaa wikitekstiä]

↑ ^a ^b ^c ^d ^e ^f ^g ^h Mellin, Ilkka: Moniulotteiset satunnaismuuttujat ja jakaumat, s.210−223, luentomoniste kurssista Todennäköisyyslaskenta, Aalto-yliopisto, 2007
↑ ^a ^b ^c ^d ^e ^f ^g Weisstein, Eric W.: Covariance (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)
↑ Weisstein, Eric W.: Variance (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)
↑ Mellin, Ilkka: Lineaarinen regressioanalyysi, s.240−266, luentomoniste kurssista Todennäköisyyslaskenta, Aalto-yliopisto, 2007
↑ Weisstein, Eric W.: Covariance Matrix (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)

[mellin210-1] ↑ ^a ^b ^c ^d ^e ^f ^g ^h Mellin, Ilkka: Moniulotteiset satunnaismuuttujat ja jakaumat, s.210−223, luentomoniste kurssista Todennäköisyyslaskenta, Aalto-yliopisto, 2007

[Covariance-2] ↑ ^a ^b ^c ^d ^e ^f ^g Weisstein, Eric W.: Covariance (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)

[Variance-3] Weisstein, Eric W.: Variance (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)

[mellin240-4] Mellin, Ilkka: Lineaarinen regressioanalyysi, s.240−266, luentomoniste kurssista Todennäköisyyslaskenta, Aalto-yliopisto, 2007

[CovarianceMatrix-5] Weisstein, Eric W.: Covariance Matrix (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)

[1]

[2]

[3]

[4]

[5]

Kovarianssi

Sisällys

Määritelmä ja merkinnät[muokkaa | muokkaa wikitekstiä]

Diskreetit satunnaismuuttujat[muokkaa | muokkaa wikitekstiä]

Jatkuvat satunnaismuuttujat[muokkaa | muokkaa wikitekstiä]

Ominaisuuksia[muokkaa | muokkaa wikitekstiä]

Rinnakkaiskaavan johtaminen[muokkaa | muokkaa wikitekstiä]

Riippumattomuus[muokkaa | muokkaa wikitekstiä]

Arvojoukko[muokkaa | muokkaa wikitekstiä]

Päättelysääntöjä[muokkaa | muokkaa wikitekstiä]

Tilastollinen kovarianssi[muokkaa | muokkaa wikitekstiä]

Satunnaisvektorit[muokkaa | muokkaa wikitekstiä]

Korrelaatiokerroin[muokkaa | muokkaa wikitekstiä]

Katso myös[muokkaa | muokkaa wikitekstiä]

Lähteet[muokkaa | muokkaa wikitekstiä]

Navigointivalikko

Kovarianssi

Määritelmä ja merkinnät[muokkaa | muokkaa wikitekstiä]

Diskreetit satunnaismuuttujat[muokkaa | muokkaa wikitekstiä]

Jatkuvat satunnaismuuttujat[muokkaa | muokkaa wikitekstiä]

Ominaisuuksia[muokkaa | muokkaa wikitekstiä]

Rinnakkaiskaavan johtaminen[muokkaa | muokkaa wikitekstiä]

Riippumattomuus[muokkaa | muokkaa wikitekstiä]

Arvojoukko[muokkaa | muokkaa wikitekstiä]

Päättelysääntöjä[muokkaa | muokkaa wikitekstiä]

Tilastollinen kovarianssi[muokkaa | muokkaa wikitekstiä]

Satunnaisvektorit[muokkaa | muokkaa wikitekstiä]

Korrelaatiokerroin[muokkaa | muokkaa wikitekstiä]

Katso myös[muokkaa | muokkaa wikitekstiä]

Lähteet[muokkaa | muokkaa wikitekstiä]

Navigointivalikko

Haku