Pareto-jakauma

Wikipedia
Loikkaa: valikkoon, hakuun
Pareto-jakauman tiheysfunktion kuvaajia eri k:n arvoilla.
Pareto-jakauman kumulatiivisen tiheysfunktion kuvaajia eri k:n arvoilla.

Pareto-jakauma on todennäköisyysjakauma, joka on nimetty italialaisen taloustieteilijä Vilfredo Pareton mukaan. Muilla tieteenaloilla sitä kutsutaan toisinaan Bradford-jakaumaksi.

Alun perin Pareto käytti jakaumaa kuvaamaan varallisuuden jakautumista ihmisten kesken. Jakauma näytti kuvaavan varsin hyvin, kuinka pieni joukko ihmisiä omistaa aina suhteellisesti isomman osuuden varallisuudesta yhteiskunnissa. Ideaa kutsutaan joskus yksinkertaisemmin Pareton periaatteeksi.

Esimerkkejä sovelluksista [muokkaa]

  • Sanojen osuus pitkissä teksteissä
  • Ihmisasutusten koko (vähän kaupunkeja, paljon kyliä)
  • Tiedostojen jakauma internet-liikenteessä, joka käyttää TCP-protokollaa (paljon pieniä ja vähän suuria tiedostoja)

Ominaisuudet [muokkaa]

Jos X on Pareto-jakautunut satunnaismuuttuja, niin todennäköisyys, että X on suurempi kuin jokin luku x on

\operatorname{P}(X>x)=\left(\frac{x}{x_\mathrm{m}}\right)^{-k}

kaikilla xxm, missä xm on (aina positiivinen) pienin mahdollinen X:n arvo ja k on positiivinen parametri. Pareto-jakaumilla on kaksi parametria: xm ja k. Kun jakaumaa käytetään varallisuuden jakauman mallinnukseen, k:ta kutsutaan Pareto-indeksiksi.

Näin ollen tiheysfunktio on

f(x;k,x_\mathrm{m}) = k\,\frac{x_\mathrm{m}^k}{x^{k+1}}\

kaikilla xxm. Pareto-jakaumaa noudattavan satunnaismuuttujan odotusarvo on

\operatorname{E}(X)=\frac{kx_m}{k-1} \,

(jos k \le 1, odotusarvo on ääretön). Sen varianssi on

\operatorname{Var}(X)=\left(\frac{x_m}{k-1}\right)^2 \frac{k}{k-2}

(jos k \le 2, varianssi on ääretön).

Aiheesta muualla [muokkaa]

Commons
Wikimedia Commonsissa on kuvia tai muita tiedostoja aiheesta Pareto-jakauma.