Moodi (tilastotiede)

Wikipediasta
Siirry navigaatioon Siirry hakuun

Moodi (Mo) eli tyyppiarvo[1] on havaintoaineiston useimmin esiintyvä arvo tai luokitellun aineiston luokkakeskus, jolla on suurin frekvenssi eli esiintymistiheys.

Moodi on aritmeettisen keskiarvon ja mediaanin ohella keskiluku, jolla ilmaistaan tietoa satunnaismuuttujasta tai populaatiosta. Kvalitatiivista muuttujaa kuvatessa moodi on keskiluvuista käyttökelpoisin, koska luvuilla ei ole järjestystä eikä määrätyn arvon voida sanoa olevan toiseen verrattuna enempää "keskellä". Kvantitatiivisessa aineistossa moodi kuvaa aineistoa parhaiten, jos jakauma ei ole kovin epäsäännöllinen.[2]

Aritmeettisen keskiarvon, mediaanin ja moodin vertailu

[muokkaa | muokkaa wikitekstiä]
Yleisten keskilukujen vertailu { 1, 2, 2, 3, 4, 7, 9 }
Tyyppi Kuvaus Esimerkki Tulos
Aritmeettinen keskiarvo Joukon jäsenten summa jaettuna sen jäsenten lukumäärällä: (1+2+2+3+4+7+9) / 7 4
Mediaani Mediaani on järjestetyn joukon keskimmäinen alkio. 1, 2, 2, 3, 4, 7, 9 3
Moodi havaintoaineiston useimmin esiintyvä arvo. 1, 2, 2, 3, 4, 7, 9 2
Käyttöesimerkki
[muokkaa | muokkaa wikitekstiä]

Kommuunissa asuu 6 henkilöä: 4 naista ja 2 miestä. Muuttuja "sukupuoli" jakaantuu arvoihin "nainen" (frekvenssi 4) ja "mies" (frekvenssi 2). Arvot "mies" ja "nainen" eivät ole lukuja, minkä vuoksi keskiarvon laskeminen ei ole mahdollista. Niillä ei ole määrättyä järjestystä, eikä näin ollen myöskään mediaania. Aineiston ainoa mielekäs keskiluku on moodi, joka kuvaa aineiston dominoivaa arvoa. Moodi on "nainen".

Luokitellun aineiston moodi

[muokkaa | muokkaa wikitekstiä]

Luokitellun aineiston tapauksessa moodi kuvaa frekvenssiltään suurinta luokkaa. Tasavälisellä luokituksella frekvenssijakauman moodi on siinä luokassa, jota vastaava frekvenssi on suurin tai sitä vastaava histogrammi saavuttaa maksiminsa. Vastaavasti, kun luokitus ei ole tasavälinen, ei myöskään jakauman moodi välttämättä ole suurimman frekvenssin luokassa. [3]

Moodi havaintoarvojen jakauman kuvaajana

[muokkaa | muokkaa wikitekstiä]

Luokittelemattomassa aineistossa moodi on sen muuttujan arvo, jonka frekvenssi on suurin [2]. Havaintoarvojen jakauman ollessa symmetrinen ja yksihuippuinen, havaintoarvojen keskiluvut moodi, mediaani ja aritmeettinen keskiarvo ovat identtiset [4]. Kahden identtisen huippuarvon esiintyessä kyseessä on kaksihuippuinen (bimodal) aineisto ja molemmat arvot ovat aineiston moodeja. Useamman kuin kahden arvon esiintyessä korkeimmalla tiheydellä kutsutaan havaintoaineistoa monihuippuiseksi (multimodal). Aineistolla ei sanota olevan moodia, jos yksikään arvo ei toistu. [5]

Moodi ja vinous

[muokkaa | muokkaa wikitekstiä]
Keskilukujen vertailu (aritmeettinen keskiarvo, mediaani, moodi) kahdessa logaritmisessa normaalijakaumassa, joissa eri vinous.

Aritmeettisen keskiarvon M, mediaanin Me ja moodin Mo asettuminen vinossa, jatkuvan muuttujan frekvenssijakaumassa.[3]

(i) Vasemmalle vinoilla jakaumilla

M < Me < Mo

(ii) Symmetrisillä jakaumilla

M ≈ Me ≈ Mo

(iii) Oikealle vinoilla jakaumilla

Mo > Me > M