Varianssi

Wikipedia
Loikkaa: valikkoon, hakuun

Varianssi on todennäköisyyslaskennassa ja tilastotieteessä satunnaismuuttujan hajonnan mitta. Varianssi kuvaa sitä, kuinka paljon satunnaismuuttujan arvot keskimäärin vaihtelevat odotusarvosta. Kun arvot keskittyvät odotusarvon ympärille tiiviisti, on varianssin arvo pieni, ja kun arvot ovat hajallaan odotusarvon ympärillä, on sen arvo suuri. Reaaliarvoisen satunnaismuuttujan varianssi on sen toinen keskusmomentti. Varianssin yksikkö on satunnaismuuttujan yksikkö korotettuna toiseen potenssiin. Varianssin neliöjuurta sanotaan keskihajonnaksi, jonka yksikkö on sama kuin satunnaismuuttujalla.[1][2][3][4]

Määritelmä ja merkinnät[muokkaa | muokkaa wikitekstiä]

Matemaattisesti varianssi \sigma_X^2 määrritellään reaaliarvoisen satunnaismuuttujan X odotusarvon \operatorname{E} avulla

\sigma_X^2 = \operatorname{E}( ( X - \mu ) ^ 2 ), [2]

missä \mu=\operatorname{E}[X] on satunnaismuuttujan odotusarvo. Varianssian arvo on ääretön, ellei odotusarvo \operatorname{E}[X^2] ole äärellisenä olemassa. Varianssi voidaan merkitä myös

\sigma_X^2=\sigma^2(X)=\sigma^2=Var(X)=D^2(X). [2][4]

Varianssin avulla voidaan esittää myös keskihajonta eli standardipoikkeama \sigma_X=\sqrt{\sigma_X^2}. [2]

Diskreetti satunnaismuuttuja[muokkaa | muokkaa wikitekstiä]

Diskreetin satunnaismuuttujan varianssi lasketaan

\sigma_{X}^2=\sum_{x \in X} (x-\mu_X)^2f_{X}(x) , [2][3][4]

missä f_{X}(x) on jakauman pistetodennäköisyysfunktio.

Jatkuva satunnaismuuttuja[muokkaa | muokkaa wikitekstiä]

Jatkuvan satunnaismuuttujaparin varianssi on taas

\sigma_{X}^2=\int_{-\infty}^{+\infty} (x-\mu_X)^2f_{X}(x) dx , \, [2][3][4]

missä f_{X}(x) on jakauman tiheysfunktio.

Ominaisuuksia[muokkaa | muokkaa wikitekstiä]

Rinnakkaiskaavan johtaminen[muokkaa | muokkaa wikitekstiä]

Varianssin lauseketta voidaan kehittää edelleen käyttämällä hyväksi odotusarvon ominaisuuksia: [2]

\begin{align}
\sigma_X^2 &= \operatorname{E}\left[(X - \operatorname{E}[X])^2\right] \\
&= \operatorname{E}\left[X^2 - 2X\operatorname{E}[X] + (\operatorname{E}[X])^2\right] \\
&= \operatorname{E}\left[X^2\right] - 2\operatorname{E}[X]\operatorname{E}[X] + (\operatorname{E}[X])^2 \\
&= \operatorname{E}\left[X^2 \right] - (\operatorname{E}[X])^2\end{align}

Ensimmäistä muotoa kutsutaan toiseksi keskusmomentiksi ja viimeisessä muodossa käytetään toista ja ensimmäistä origomomenttia.[4]

Varianssin laskemiseksi on käytössä myös tekijämomentin sisältävä muoto:

\sigma^2=\operatorname{E}[X(X-1)]+\operatorname{E}[X]-(\operatorname{E}[X])^2 [3]

Ominaisuuksia[muokkaa | muokkaa wikitekstiä]

Varianssin arvo on aina epänegatiivinen. Kun varianssi on nolla, ei arvoissa esiinny vaihtelua ja satunnaismuuttuja antaa vain samoja arvoja. Siten

\sigma^2(X) \ge 0. [3]

Varianssi on kovarianssi kahden identtisen satunnaismuuttujan välillä

\sigma^2(X)=\sigma(X,X). [5] (kovarianssi)

Päättelysääntöjä summista[muokkaa | muokkaa wikitekstiä]

Jokaisen satunnaismuuttujan arvoon lisätty vakio ei vaikuta varianssin arvoon eli

\sigma^2(X+a)=\sigma^2(X), [2][3][4]

mutta arvojen kertominen vakiolla kasvattavat (|a| > 1) tai vähentävät (|a| < 1) varianssia

\sigma^2(aX)=a^2\sigma^2(X). [2][3][4]

Kahden satunnaismuuttujan lineaarikombinaatiossa varianssiin vaikuttaa myös satunnaismuuttujien kovarianssi

\sigma^2(aX \pm bY)=a^2\sigma^2(X) + b^2\sigma^2(X) \pm 2ab\,\sigma(X,X), [2]

mikä merkitään yleisemmässä tapauksessa

\sigma^2(a_1X_1+a_2X_2+\dots+a_nX_n)=\sum_{i=1}^n a_i^2\,\sigma^2(X_i) + 2\sum_{1 \le i < j \le n}a_ia_j\sigma(X_i,X_j). [2][4]

Nämä arvot voidaan käsitellä hallitummin kovarianssimatriisissa.[6] Tämä ominaisuus vaikuttaa myös satunnaismuuttujien summan varianssiin

\sigma^2(X_1+X_2+\dots + X_n)=\sum_{i=1}^n\sum_{j=1}^n \sigma(X_i,X_j)=\sum_{i=1}^n\sigma^2(X_i)+\sum_{i \ne j}\sigma(X_i,X_j). [4]

Kovarianssia ei tarvitse huomioida, mikäli satunnaismuuttujat ovat korreloimattomia \sigma(X_i,X_j)=0\ ,\ \forall\ (i\ne j) , jolloin

\sigma^2(X_1+X_2+\dots + X_n)=\sum_{i=1}^n\sigma^2(X_i).

Riippumattomat satunnaismuuttujat ovat aina korreloimattomia. Korreloimattomilla satunnaismuuttujilla välimerkki ei vaikuta varianssin arvoon

\sigma^2(X \pm Y)=\sigma^2(X) + \sigma^2(Y). [2]

Päättelysääntöjä tuloista[muokkaa | muokkaa wikitekstiä]

Kahden satunnaismuuttujan tu varianssi voidaan määrittää odotusarvon ominaisuuksien avulla

\begin{align}
\operatorname{Var}(XY) &= [E(X)]^2 \operatorname{Var}(Y) + [E(Y)]^2 \operatorname{Var}(X) + \operatorname{Var}(X)\operatorname{Var}(Y) \\
&= E(X^2) E(Y^2) - [E(X)]^2 [E(Y)]^2.
\end{align}

Populaatio- ja otosvarianssi[muokkaa | muokkaa wikitekstiä]

Varianssi lasketaan äärelliselle populaatiolle (y_1,\dots,y_N) seuraavasti

\sigma_x^2 = \frac{1}{N} \sum_{i=1}^N \left(y_i - \overline{y} \right)^ 2, \, [1][7][4]

missä \overline{y} on populaation keskiarvo. Tätä kutsutaan toisinaan otosvarianssiksi, mutta termin käyttö on vaihtelevaa. Kun (y_1,\dots,y_N) on otos laajemmasta populaatiosta, \sigma^2 on varianssin tarkentuva mutta harhainen estimaatti. Harhaton estimaatti on

s_x^2 = \frac{1}{N-1} \sum_{i=1}^N  \left(y_i - \overline{y} \right)^ 2, [1][7][4]

jota yleensä kutsutaan otosvarianssiksi. Suurten otosten tapauksessa ei ole käytännössä merkitystä kumpaa estimaattoria käytetään. Molempien keskihajonta saadaan ottamalla varianssista neliöjuuri.[7][4]

Lähteet[muokkaa | muokkaa wikitekstiä]

  1. a b c Alatupa, Sami et al.: Pitkä Sigma 6, s. 31−42. (lukion pitkän matematiikan oppikirja). Helsinki: Otava, 2010. ISBN 978-951-31-5343-4.
  2. a b c d e f g h i j k l Mellin, Ilkka: Moniulotteiset satunnaismuuttujat ja jakaumat, s.165−173, luentomoniste kurssista Todennäköisyyslaskenta, Aalto-yliopisto, 2007
  3. a b c d e f g Ruskeapää, Heikki: Todennäköisyyslaskenta I(luentomoniste), Turun Yliopisto, 2012
  4. a b c d e f g h i j k l Weisstein, Eric W.: Variance (Math World - A Wolfram Web Resource) Wolfram Research. (englanniksi)
  5. Weisstein, Eric W.: Covariance (Math World - A Wolfram Web Resource) Wolfram Research. (englanniksi)
  6. Weisstein, Eric W.: Covariance Matrix (Math World - A Wolfram Web Resource) Wolfram Research. (englanniksi)
  7. a b c Mellin, Ilkka: Lineaarinen regressioanalyysi, s.240−266, luentomoniste kurssista Todennäköisyyslaskenta, Aalto-yliopisto, 2007