Varianssi

Wikipediasta
Siirry navigaatioon Siirry hakuun

Varianssi on todennäköisyyslaskennassa ja tilastotieteessä satunnaismuuttujan hajonnan mitta. Varianssi kuvaa sitä, kuinka paljon satunnaismuuttujan arvot keskimäärin vaihtelevat odotusarvosta tai populaation keskiarvosta. Varianssissa yksittäisen mittauksen poikkeamat keskiarvosta tai odotusarvosta korotetaan toiseen potenssiin (neliöön). Varianssi saadaan ottamalla keskiarvo näistä neliöön korotetuista eroista. Kun arvot keskittyvät odotusarvon ympärille tiiviisti, on varianssin arvo pieni, ja kun arvot ovat hajallaan odotusarvon ympärillä, on sen arvo suuri. Reaaliarvoisen satunnaismuuttujan varianssi on sen toinen keskusmomentti. Varianssin yksikkö on satunnaismuuttujan yksikkö korotettuna toiseen potenssiin. Varianssin neliöjuurta sanotaan keskihajonnaksi, jonka yksikkö on sama kuin satunnaismuuttujalla.[1][2][3][4]

Määritelmä ja merkinnät[muokkaa | muokkaa wikitekstiä]

Matemaattisesti varianssi määritellään reaaliarvoisen satunnaismuuttujan odotusarvon avulla

[2]

missä on satunnaismuuttujan odotusarvo. Varianssin arvo on ääretön, ellei odotusarvo ole äärellisenä olemassa. Varianssi voidaan merkitä myös

[2][4]

Varianssin avulla voidaan esittää myös keskihajonta eli standardipoikkeama [2]

Diskreetti satunnaismuuttuja[muokkaa | muokkaa wikitekstiä]

Diskreetin satunnaismuuttujan varianssi lasketaan

[2][3][4]

missä on jakauman pistetodennäköisyysfunktio.

Jatkuva satunnaismuuttuja[muokkaa | muokkaa wikitekstiä]

Jatkuvan satunnaismuuttujaparin varianssi on taas

[2][3][4]

missä on jakauman tiheysfunktio.

Ominaisuuksia[muokkaa | muokkaa wikitekstiä]

Rinnakkaiskaavan johtaminen[muokkaa | muokkaa wikitekstiä]

Varianssin lauseketta voidaan kehittää edelleen käyttämällä hyväksi odotusarvon ominaisuuksia:[2]

Ensimmäistä muotoa kutsutaan toiseksi keskusmomentiksi ja viimeisessä muodossa käytetään toista ja ensimmäistä origomomenttia.[4]

Varianssin laskemiseksi on käytössä myös tekijämomentin sisältävä muoto:

[3]

Ominaisuuksia[muokkaa | muokkaa wikitekstiä]

Varianssin arvo on aina epänegatiivinen. Kun varianssi on nolla, ei arvoissa esiinny vaihtelua ja satunnaismuuttuja antaa vain samoja arvoja. Siten

[3]

Varianssi on kovarianssi kahden identtisen satunnaismuuttujan välillä

[5] (kovarianssi)

Päättelysääntöjä summista[muokkaa | muokkaa wikitekstiä]

Jokaisen satunnaismuuttujan arvoon lisätty vakio ei vaikuta varianssin arvoon eli

[2][3][4]

mutta arvojen kertominen vakiolla kasvattavat tai vähentävät varianssia

[2][3][4]

Kahden satunnaismuuttujan lineaarikombinaatiossa varianssiin vaikuttaa myös satunnaismuuttujien kovarianssi

[2]

mikä merkitään yleisemmässä tapauksessa

[2][4]

Nämä arvot voidaan käsitellä hallitummin kovarianssimatriisissa.[6] Tämä ominaisuus vaikuttaa myös satunnaismuuttujien summan varianssiin

[4]

Kovarianssia ei tarvitse huomioida, mikäli satunnaismuuttujat ovat korreloimattomia jolloin

Riippumattomat satunnaismuuttujat ovat aina korreloimattomia. Korreloimattomilla satunnaismuuttujilla välimerkki ei vaikuta varianssin arvoon

[2]

Päättelysääntöjä tuloista[muokkaa | muokkaa wikitekstiä]

Kahden satunnaismuuttujan tulon varianssi voidaan määrittää odotusarvon ominaisuuksien avulla

Populaatio- ja otosvarianssi[muokkaa | muokkaa wikitekstiä]

Varianssi lasketaan äärelliselle populaatiolle seuraavasti

[1][7][4]

missä on populaation keskiarvo. Tätä kutsutaan toisinaan otosvarianssiksi, mutta termin käyttö on vaihtelevaa. Kun on otos laajemmasta populaatiosta, on varianssin tarkentuva mutta harhainen estimaatti. Harhaton estimaatti on

[1][7][4]

jota yleensä kutsutaan otosvarianssiksi. Suurten otosten tapauksessa ei ole käytännössä merkitystä kumpaa estimaattoria käytetään. Molempien keskihajonta saadaan ottamalla varianssista neliöjuuri.[7][4]

Lähteet[muokkaa | muokkaa wikitekstiä]

  1. a b c Alatupa, Sami et al.: Pitkä Sigma 6, s. 31−42. (lukion pitkän matematiikan oppikirja). Helsinki: Otava, 2010. ISBN 978-951-31-5343-4.
  2. a b c d e f g h i j k l Mellin, Ilkka: Moniulotteiset satunnaismuuttujat ja jakaumat, s.165−173, luentomoniste kurssista Todennäköisyyslaskenta, Aalto-yliopisto, 2007
  3. a b c d e f g Ruskeapää, Heikki: Todennäköisyyslaskenta I (Arkistoitu – Internet Archive)(luentomoniste), Turun Yliopisto, 2012
  4. a b c d e f g h i j k l Weisstein, Eric W.: Variance (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)
  5. Weisstein, Eric W.: Covariance (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)
  6. Weisstein, Eric W.: Covariance Matrix (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)
  7. a b c Mellin, Ilkka: Lineaarinen regressioanalyysi, s.240−266, luentomoniste kurssista Todennäköisyyslaskenta, Aalto-yliopisto, 2007