Kovarianssi

Wikipedia
Loikkaa: valikkoon, hakuun

Kovarianssi tarkoittaa todennäköisyyslaskennassa kahden muuttujan välisen riippuvuuden mittaa. Se kuvaa, kuinka läheisesti muuttujat vaihtelevat yhdessä. Kovarianssi muuttuu positiivisemmaksi jokaisesta uudesta arvoparista, jotka poikkeavat keskiarvostaan samaan suuntaan. Vastaavasti se muuttuu negatiivisemmaksi, jos arvot poikkeavat eri suuntiin.

Matemaattisesti kovarianssi on määritelty kahden reaaliarvoisen satunnaismuuttujan X ja Y välillä seuraavasti:

\operatorname{cov}(X, Y) = \operatorname{E}((X - \mu) (Y - \nu)),

missä E on odotusarvo-operaattori, E(X)=\mu ja E(Y)=\nu.

Laskutoimituksissa käytetään usein lyhyempää muotoa:

\operatorname{cov}(X, Y) = \operatorname{E}(XY)- \mu\nu.

Jos X ja Y ovat riippumattomia, \operatorname{E}(XY) = \mu\nu ja \operatorname{cov}=0. Päinvastainen ei pidä aina paikkaansa.

Kovarianssin yksikkö määräytyy muuttujien X ja Y tulon perusteella. Korrelaatio on välille [-1,1] skaalattu riippuvuuden mitta.

Seuraavat ovat laskusääntöjä kovarianssille, jossa a on kiinteä vakio:

\operatorname{cov}(X, X) = \operatorname{var}(X)\,
\operatorname{cov}(X, Y) = \operatorname{cov}(Y, X)\,
\operatorname{cov}(aX, Y) = a\, \operatorname{cov}(X, Y)\,
\operatorname{cov}\left(\sum_i{X_i}, \sum_j{Y_j}\right) =    \sum_i{\sum_j{\operatorname{cov}\left(X_i, Y_j\right)}}

Kun X ja Y ovat n- ja m-ulotteisia pystyvektoreita, n x m-ulotteinen kovarianssimatriisi on määritelty:

\operatorname{cov}(X, Y) = \operatorname{E}((X-\mu)(Y-\nu)^\top).

Matriisit cov(X,Y) ja cov(Y,X) ovat toistensa transpooseja. Kun X on vektori, matriisia cov(X,X) sanotaan X:n kovarianssimatriisiksi tai pidemmin varianssi-kovarianssi-matriisiksi.

Katso myös[muokkaa | muokkaa wikitekstiä]