Hajontaluku

Wikipedia
Loikkaa: valikkoon, hakuun
Keskihajonta normaalijakauman tapauksessa: yhden keskihajonnan etäisyys keskiarvosta rajaa todennäköisyysmassasta 68,27 %, kahden keskihajonnan etäisyys rajaa 95,45 % ja kolmen keskihajonnan etäisyys rajaa 99,73 %.

Hajontaluku on tilastotieteessä aineiston vaihtelun eli hajonnan mitta. Hajontaluku on reaaliluku, joka saa suuren arvon kun aineistossa on paljon vaihtelua. Jos aineistossa ei ole vaihtelua eli havainnot ovat samoja, saa se arvon nolla.

Yleisimpiä hajontalukuja ovat:

  • varianssi Var(X)=\sigma^{2}_x = \operatorname{E}[ ( X - \mu ) ^ 2 ]
    • Diskreetillä jakaumalla on varianssi, jos \sum\limits_{x_i \in \tau}(x_i - \mu_x)^2 p_i < \infin
    • Jatkuvalla jakaumalla on varianssi, jos \int\limits_{-\infin}^{+\infin} (x-\mu_x)^2 f(x)dx < \infin
  • keskihajonta, eli standardipoikkeama D(X)=\sigma_x = \sqrt{\sigma^{2}_x},

missä X on satunnaismuuttuja ja μ on sen odotusarvo. Keskihajonta on siis varianssin neliöjuuri. Keskihajonta kuvaa keskimääräistä poikkeamaa odotusarvosta. Sen etu varianssiin verrattuna on, että se on helppo tulkita, koska keskihajonnan asteikko vastaa mittausten asteikkoa.

Äärellisen joukon x_1,x_2,\ldots,x_n keskihajonta on

\sigma = \sqrt{\frac{\sum\limits_{i=1} ^{n} (x_{i} - \overline{x})^2}{n}},

missä

\bar{x} = \frac1n\sum\limits_{i=1}^n x_i = \frac{(x_1+\cdots+x_n)}{n},

on kyseisen joukon keskiarvo.

Otoskeskihajonta[muokkaa | muokkaa wikitekstiä]

Otoksen (y_1,\dots,y_n) keskihajonnan harhaton estimaatti eli otoshajonta on

s = \sqrt{\frac{\sum\limits_{i=1} ^{n} (y_{i} - \overline{y})^2}{n-1}}.

Kun luvut y_1,y_2,\ldots,y_n ovat satunnainen otos isommasta joukosta Y, luku s on harhaton estimaatti joukon Y keskihajonnasta. Intuitiivisesti tämä selittyy sillä, että otoskeskiarvo \overline{y} poikkeaa joukon Y todellisesta keskiarvosta otoksen suuntaan, mikä tuottaisi keskihajonnan (s yllä) kaavaan liian pienen osoittajan, mutta yhdellä pienennetty nimittäjä kompensoi tämän harhan ja näin saadaan mahdollisimman hyvä estimaatti perusjoukon X keskihajonnasta.

Jos käytettävissä olisi joukon Y todellinen keskiarvo eikä vain otoksesta y_1,y_2,\ldots,y_n laskettua otoskeskiarvoa \overline{y}, nimittäjässä pitäisi olla n kuten yleensäkin keskihajonnan kaavassa.

Katso myös[muokkaa | muokkaa wikitekstiä]

Aiheesta muualla[muokkaa | muokkaa wikitekstiä]

Tämä matematiikkaan liittyvä artikkeli on tynkä. Voit auttaa Wikipediaa laajentamalla artikkelia.