Hajontaluku

Wikipedia
Loikkaa: valikkoon, hakuun
Keskihajonta normaalijakauman tapauksessa: yhden keskihajonnan etäisyys keskiarvosta rajaa todennäköisyysmassasta 68,27 %, kahden keskihajonnan etäisyys 95,45 % ja kolmen keskihajonnan etäisyys 99,73 %.

Hajontaluku on tilastotieteessä todennäköisyysjakauman hajonnan eli sen satunnaismuuttujan vaihtelun mitta.[1] Yleisimpiä hajontalukuja ovat keskihajonta, varianssi, otoskeskihajonta, otosvarianssi, kvantiili ja variaatiokerroin. [2] Hajontaluvut ovat keskilukujen ohella keskeisimpiä jakaumiin liittyviä käsitteitä.[1]

Hajonnan mittaaminen[muokkaa | muokkaa wikitekstiä]

Hajontaluku on reaaliluku, joka saa sitä suuremman arvon mitä enemmän vaihtelua jakauman satunnaismuuttujien arvoissa esiintyy. Yleensä tämä lasketaan mittaamalla havaittujen arvojen etäisyyttä havaintoarvojen odotus- tai keskiarvosta. Käytettävän hajontaluvun valinta riippuu käyttötarkoituksesta; eri hajontaluvut sopivat eri tilanteisiin riippuen, pyritäänkö tarkastelemaan jakauman absoluuttista vaiko suhteellista hajontaa. Jos otannassa ei ole vaihtelua, hajontaluku saa arvon nolla.[1]

Joskus hajontaa kuvattaessa käytetään mittauksen kohteen kanssa samaa yksikköä. Jos mittauksen kohteen yksikkö on esimerkiksi kilogramma, myös hajonnan yksikkönä käytetään kilogrammaa. Tällöin hajontalukua voi käyttää hajonnan absoluuttisten arvojen tarkasteluun. Tällaisia hajonnan mittoja ovat:

Yksiköttömät hajontaluvut kuvaavat suhteellista hajontaa satunnaismuuttujan odotusarvoon nähden. Usein nämä voidaan ilmaista prosentteina. Tällöin on mahdollista vertailla myös eri yksiköissä ilmaistujen jakaumien hajontoja. Yksiköttömiä hajontalukuja ovat:

Muita hajontalukuja ovat:

Yleisimmät hajontaluvut[muokkaa | muokkaa wikitekstiä]

Varianssi[muokkaa | muokkaa wikitekstiä]

Varianssi kuvaa, kuinka kaukana satunnaismuuttujan arvot ovat tyypillisesti sen odotusarvosta. Reaaliarvoisen satunnaismuuttujan varianssi on sen toinen keskimomentti. Varianssin neliöjuurta sanotaan keskihajonnaksi.

Diskreetin jakauman varianssi lasketaan kaavalla

Var(X)=\sigma^{2}_x = \operatorname{E}[ ( X - \mu_x ) ^ 2 ], jossa X on satunnaismuuttuja ja μ on sen odotusarvo tai keskiarvo.[3]

Jatkuvan jakauman varianssi lasketaan kaavalla Var(X)=\sigma^{2}_x = \int\limits_{-\infin}^{+\infin} (x-\mu_x)^2 f(x)dx .[3][1]

Keskihajonta[muokkaa | muokkaa wikitekstiä]

Satunnaismuuttujan standardipoikkeama eli keskihajonta kuvaa keskimääräistä poikkeamaa odotusarvosta. Keskihajonta on varianssin neliöjuuri: D(X)=\sigma_x = \sqrt{\sigma^{2}_x}.[2][3] Etuna varianssiin nähden on tulkinnan helppous, sillä keskihajonnan asteikko vastaa mittausten asteikkoa.

Otosvarianssi[muokkaa | muokkaa wikitekstiä]

Otosvarianssi on varianssi, joka lasketaan suuremman joukon osajoukosta. Kun n lukuarvon joukko y_1,y_2,\ldots,y_n on suuremman joukon Y osajoukko, tämän otosvarianssi on s^2 = \frac{\sum\limits_{i=1} ^{n} (y_{i} - \overline{y})^2}{n-1}, missä \overline{y} = \sum_{i = 1}^{n} \frac{y_{i}}{n} \, \, \, \, \,  { \ } on tutkittavan muuttujan y keskiarvo.[3]

Otoshajonta[muokkaa | muokkaa wikitekstiä]

Otoksen (y_1,\dots,y_n) keskihajonnan harhaton estimaatti eli otoshajonta on otosvarianssin neliöjuuri:

s = \sqrt{\frac{\sum\limits_{i=1} ^{n} (y_{i} - \overline{y})^2}{n-1}}.[3]

Kvantiiliväli[muokkaa | muokkaa wikitekstiä]

Kvantiilit ovat satunnaismuuttujan kertymäfunktiolta säännöllisin välein poimittuja prosenttipisteitä. Satunnaismuuttujan  x  \beta-kvantiili  k_\beta,  0 < \beta < 1, on luku, joka toteuttaa ehdot  P(x < k_\beta)<= \beta ja .[1]

Jakamalla todennäköisyysjakauman kertymäfunktio q kappaleeseen yhtä suuria joukkoja saadaan q-kvantiili. Osalle kvantiileista on vakiintuneet nimet: 100-kvantiilit ovat persentiilejä, 10-kvantiilit ovat desiilejä, 5-kvantiilit ovat kvintiilejä, ja 4-kvantiilit ovat kvartiileja. Kvantiilien avulla on mahdollista muodostaa kvantiiliväli, joka kuvaa todennäköisyyttä, jolla satunnaismuuttuja saa arvot kahden eri kvantiilin välillä.[1]

Variaatiokerroin[muokkaa | muokkaa wikitekstiä]

Variaatiokerroin on hajontaluku, joka ei ole mittayksikköön sidottu. Variaatiokertoimen avulla on mahdollista vertailla kahden eri mitta-asteikolla mitatun jakauman hajontoja. Variaatiokerroin v on määritelty keskihajonnan s ja keskiarvon \bar{x} osamääränä:

v = s/\bar{x}*100%.[4][1]

Vaihteluväli[muokkaa | muokkaa wikitekstiä]

Vaihteluväli on järjestys-, välimatka- ja suhdeasteikon muuttujille sopiva hajontaluku. Se kuvaa pienimmän ja suurimman muuttujan välin  [Min_x, Max_x], joka lasketaan näiden arvojen erotuksena  Max_x - Min_x.[2][1]

Käyttötarkoituksia[muokkaa | muokkaa wikitekstiä]

Hajonnan avulla on mahdollista saada kattavampi käsitys satunnaismuuttujan todennäköisimmistä arvoista. Esimekiksi joukkojen  A = (1, 1, 1, 9, 9, 9) ja B = (4, 5, 5, 5, 5, 6) lukuja arpomalla saadaan alkioiden arvojen yhtäsuuresta odotusarvosta huolimatta hyvin erilaisia tuloksia. Tunnettujen hajontalukujan avulla onkin mahdollista arvioida erilaisten tapahtumien todennäköisyyksiä, mikä on keskeistä muun muassa riskienhallinnassa.

Fysiikassa, kemiassa ja muissa mitattavissa luonnontieteissä mittaustulosten vaihtelua tarkastelemalla on mahdollista arvioida koetulosten luotettavuutta.

Biologiassa populaation ominaisuuksien määrittämisessä on keskeistä huomioida havaittujen ominaisuuksien vaihtelu.

Rahoitusmatematiikassa portfolion odotetun tuoton varianssi ja keskihajonta kuvaavat sijotukseen kohdistuvaa riskiä. Mitä pienempi hajonta on, sitä todennäköisemmin sijoituksesta saatu tuotto vastaa sen odotusarvoa ja sitä houkuttelevampi sijoituskohde on.

Taloustieteessä, rahoituksessa ja muissa tieteissä hajontaa pyritään selittämään regressioanalyysillä, joka kuvaa muuttujan saamia arvoja suhteessa toiseen muuttujaan.[5]

Katso myös[muokkaa | muokkaa wikitekstiä]

Aiheesta muualla[muokkaa | muokkaa wikitekstiä]

Lähteet[muokkaa | muokkaa wikitekstiä]

  1. a b c d e f g h Milton, J.S., Arnold, J.C.: Introduction to Probability and Statistics. McGraw-Hill Inc., 1995.
  2. a b c Hajontaluvut Yhteiskuntatieteellinen tietoarkisto. 31.08.2003. Tampereen yliopisto. Viitattu 10.4.2015.
  3. a b c d e Ilkka Mellin: Tilastolliset menetelmät: Kaavat. TKK, 2006.
  4. Nummenmaa, Lauri: Käyttäytymistieteiden Tilastolliset Menetelmät.. Tammi, 2004. ISBN 951-26-5203-X..
  5. Alan O. Sykes: Introduction to Regression Analysis The Inaugural Coase Lecture. Viitattu 10.04.2015.
Tämä matematiikkaan liittyvä artikkeli on tynkä. Voit auttaa Wikipediaa laajentamalla artikkelia.