Hajontaluku

Wikipedia
Loikkaa: valikkoon, hakuun
Keskihajonta normaalijakauman tapauksessa: yhden keskihajonnan päässä keskiarvosta on todennäköisyysmassasta 68,27 %, kahden keskihajonnan päässä on 95,45 % ja kolmen keskihajonnan päässä on 99,73 %.

Hajontaluku on tilastotieteessä aineiston vaihtelun eli hajonnan mitta. Hajontaluku on reaaliluku, joka saa suuren arvon kun aineistossa on paljon vaihtelua. Jos aineistossa ei ole vaihtelua eli havainnot ovat samoja, saa se arvon nolla.

Yleisimpiä hajontalukuja ovat:

  • varianssi Var(X)=\sigma^{2}_x = \operatorname{E}[ ( X - \mu ) ^ 2 ]
    • Diskreetillä jakaumalla on varianssi, jos \sum\limits_{x_i \in \tau}(x_i - \mu_x)^2 p_i < \infin
    • Jatkuvalla jakaumalla on varianssi, jos \int\limits_{-\infin}^{+\infin} (x-\mu_x)^2 f(x)dx < \infin
  • keskihajonta, eli standardipoikkeama D(X)=\sigma_x = \sqrt{\sigma^{2}_x},

missä X on satunnaismuuttuja ja μ on sen odotusarvo. Keskihajonta on siis varianssin neliöjuuri. Keskihajonta kuvaa keskimääräistä poikkeamaa odotusarvosta. Sen etu varianssiin verrattuna on, että se on helppo tulkita, koska keskihajonnan asteikko vastaa mittausten asteikkoa.

Äärellisen joukon x_1,x_2,\ldots,x_n keskihajonta on

\sigma = \sqrt{\frac{\sum\limits_{i=1} ^{n} (x_{i} - \overline{x})^2}{n}},

missä

\bar{x} = \frac1n\sum\limits_{i=1}^n x_i = \frac{(x_1+\cdots+x_n)}{n},

on kyseisen joukon keskiarvo.

Otoskeskihajonta [muokkaa]

Otoksen (y_1,\dots,y_n) keskihajonnan harhaton estimaatti eli otoshajonta on

s = \sqrt{\frac{\sum\limits_{i=1} ^{n} (y_{i} - \overline{y})^2}{n-1}}.

Kun luvut y_1,y_2,\ldots,y_n ovat satunnainen otos isommasta joukosta Y, luku s on harhaton estimaatti joukon Y keskihajonnasta. Intuitiivisesti tämä selittyy sillä, että otoskeskiarvo \overline{y} poikkeaa joukon Y todellisesta keskiarvosta otoksen suuntaan, mikä tuottaisi keskihajonnan (s yllä) kaavaan liian pienen osoittajan, mutta yhdellä pienennetty nimittäjä kompensoi tämän harhan ja näin saadaan mahdollisimman hyvä estimaatti perusjoukon X keskihajonnasta.

Jos käytettävissä olisi joukon Y todellinen keskiarvo eikä vain otoksesta y_1,y_2,\ldots,y_n laskettua otoskeskiarvoa \overline{y}, nimittäjässä pitäisi olla n kuten yleensäkin keskihajonnan kaavassa.

Katso myös [muokkaa]

Aiheesta muualla [muokkaa]

Tämä matematiikkaan liittyvä artikkeli on tynkä. Voit auttaa Wikipediaa laajentamalla artikkelia tai samankaltaisia artikkeleita.