Log-normaalijakauma

Wikipediasta
Siirry navigaatioon Siirry hakuun
Log-normaalijakauma
Tiheysfunktio
Logaritminormaalijakauman tiheysfunktiota parametrien eri arvoilla
Kertymäfunktio
Logaritminormaalijakauman kertymäfunktioita parametrin σ eri arvoilla, kun μ=0
Merkintä
Parametrit μR
σ2 > 0
Määrittelyjoukko xR
Tiheysfunktio
Kertymäfunktio
Odotusarvo
Mediaani
Moodi
Varianssi
Vinous
Huipukkuus
Entropia
Momentit generoiva funktio määritelty vain luvuille, joilla on ei-positiivinen reaaliosa
Karakteristinen funktio esitys hajaantuu asymptoottisesti, mutta sopii numeeristen likiarvojen laskentaan
Fisherin informaatiomatriisi

Log-normaalijakauma[1] eli logaritminormaalijakauma[2] on toden­näköisyys­laskennassa sellaisen jatkuvan satunnaismuuttujan jakauma, jonka logaritmi on normaalisti jakautunut. Toisin sanoen, jos satunnais­muuttuja on log-normaalisti jakautunut, niin on normaalisti jakautunut, ja jos on normaalisti jakautunut, niin on log-normaalisti jakautunut.[2] Log-normaalisti jakautunut satunnais­muuttuja voi saada vain positiivisia reaali­luku­arvoja. Jakauma on käyttökelpoinen malli monille fysikaalisille, teknisille, taloustieteellisille ja muilla aloilla esiintyville muuttujille.

Jakaumaa nimitetään toisinaan myös Galtonin jakaumaksi Francis Galtonin mukaan.[3] Muita siihen toisinaan yhdistettyjä nimiä ovat McAlister, Gibrat ja Cobb-Douglas.[3]

Todennäköisyyslaskennan keskeisen raja-arvolauseen mukaan monen riippumattoman satunnaismuuttujan summa noudattaa sitä tarkemmin normaalijakaumaa, mitä enemmän näitä satunnaismuuttujia on. Samaan tapaan tarpeeksi monen toisistaan riippumattoman satunnaismuuttujan tulolla on taipumus noudattaa log-normaalijakaumaa sitä tarkemmin, mitä enemmän näitä muuttujia on.[4] Log-normaalijakaumalla on myös suurin entropia niistä jakaumista, joilla on tietty odotusarvo ja varianssi.[5]

Määritelmä[muokkaa | muokkaa wikitekstiä]

Jakauman muodostaminen ja parametrit[muokkaa | muokkaa wikitekstiä]

Olkoon standardinormaalijakaumaa noudattava satunnaismuuttuja, ja olkoot ja kaksi reaalilukua. Silloin satunnais­muuttujan

jakaumaa sanotaan log-normaalijakaumaksi parametrein and . Nämä parametrit ovat tällöin jakauman luonnollisen logaritmin odotusarvo ja keskihajonta, mutta eivät itse jakauman odotusarvo ja varianssi.

Normaalijakauman ja logaritminormaalijakauman välinen yhteys. Jos on normaalisti jakautunut, on logaritminormaalisti jakautunut.

Tämä yhteys pätee logaritmi- tai eksponenttifunktion kantaluvusta riippumatta. Jos on normaalisti jakautunut, samoin on myös , olivatpa ja mitkä tahansa positiiviset luvut (. Samoin jos on log-normaalisti jakautunut, samoin on satunnaismuuttujan laita, kun .

Sellaisen jakauman muodostamiseksi, jolla on haluttu odotusarvo ja varianssi , on valittava ja

Vaihtoehtoisesti voidaan käyttää "multiplikatiivisia" eli "geometrisia" parametreja ja . Niillä on suorempi tulkinta: on jakauman mediaani, ja liittyy jakauman leviämiseen jäljempänä selitettävällä tavalla.

Tiheysfunktio[muokkaa | muokkaa wikitekstiä]

Positiivinen satunnais­muuttuja X on log-normaalisti jakautunut, jos X:n logaritmi on normaalisti jakautunut, jolloin

Olkoon normaalijakauman N(0,1) kertymäfunktio ja sen tiheysfunktio. Tällöin saadaan:[2]

,

missä esimerkiksi tarkoittaa todennäköisyyttä sille, että satunnaismuuttujan X arvo on pienempi kuin x.

Kertymäfunktio[muokkaa | muokkaa wikitekstiä]

Log-normaalijakauman kertymäfunktio on

missä on normeeratun normaalijakauman N(0,1) kertymäfunktio.

Virhefunktion avulla kertymäfunktio voidaan esittää muodossa:[4]

missä erfc on komplementaarinen virhefunktio erfc(x) = 1 - erf(x).

Useamman muuttujan lognormaalijakauma[muokkaa | muokkaa wikitekstiä]

Jos on useamman muuttujan normaalijakauma, niin funktio noudattaa useamman muuttujan logaritmista normaalijakaumaa.[6][7], jonka odotusarvo on

ja kovarianssimatriisi

Useamman muuttujan logaritminormaalijakauma ei kuitenkaan ole kovin yleisessä käytössä, minkä vuoksi jäljempänä rajoitutaan käsittelemään yhden muuttujan jakaumaa.

Karakteristinen funktio ja momentit generoiva funktio[muokkaa | muokkaa wikitekstiä]

Logaritmisella normaalijakaumalla on kaikki momentit, ja

Tämä voidaan johtaa sijoittamalla integraaliin . Kuitenkaan odotusarvo ei ole määritelty millään argumentin positiivisella arvolla, koska sen määrittelevä integraali hajaantuu. Sen vuoksi logaritmisella normaalijakaumalla ei myöskään ole momentit generoivaa funktiota.[8] Tähän liittyy se, että logaritmisen normaalijakauman momentit eivät yksikäsitteisesti määrittele jakaumaa.

Karakteristinen funktio on määritelty reaaliarvoille , mutta ei sellaisille kompleksiluvuille, joilla on negatiivinen imaginaariosa, minkä vuoksi karakteristinen funktio ei ole analyyttinen origossa. Tämän vuoksi logaritmisen normaalijakauman karakteristista funktiota ei voida esittää päättymättömänä suppenevana sarjana.[9] Erityisesti sen muodollinen Taylorin sarja

hajaantuu. Funktiolle on kuitenkin voitu muodostaa vaihtoehtoisia hajaantuvia sarjaesityksiä.[9][10][11][12]

Karakteristiselle funktiolle ei tunneta suljetussa muodossa esitettävää lauseketta. Sille saadaan kuitenkin hyviä likiarvoja lausekkeesta[13]

missä on Lambertin W-funktio. Tämä likiarvo voidaan johtaa asymptoottisella menetelmällä, mutta se pätee likimäärin kaikilla :n arvoilla, joilla suppenee.

Ominaisuuksia[muokkaa | muokkaa wikitekstiä]

Geometriset eli multiplikatiiviset momentit[muokkaa | muokkaa wikitekstiä]

Logaritmisen normaalijakauman geometrinen eli multiplikatiivinen keskiarvo on . Se on samalla jakauman mediaani. Jakauman geometrinen eli multiplikatiivinen keskihajonta on .[14][15] Analogisesti aritmeettisten tilastollisten tunnuslukujen kanssa voidaan määritellä geometrinen varianssi , ja myös geometrista variaatiokerrointa[14] on ehdotettu. Viimeksi mainitun olisi tarkoitus olla analoginen tavallisen variaatiokertoimen kanssa lognormaalin aineiston tapauksessa, mutta tällä määritelmällä ei ole sellaista teoreettista perustaa, että sen perusteella voitaisiin arvioida itse variaatiokerrointa .

On huomattava, että geometrinen keskiarvo on aina pienempi kuin sen aritmeettinen keskiarvo. Tätä tosiasiaa sanotaan aritmeettis-geometriseksi epäyhtälöksi, ja se kuvastaa sitä tosiasiaa, että logaritmi­funktion kuvaaja on ylöspäin kupera. Itse asiassa pätee yhteys

[16]

Liikealalla termiä tulkitaan toisinaan kuperuus­korjaukseksi. Stokastisen analyysin kannalta kyseessä on sama korjaus­termi kuin geometrista Brownin liikettä koskevassa Itôn lemmassa.

Aritmeettiset momentit[muokkaa | muokkaa wikitekstiä]

Kun on mikä tahansa reaali- tai kompleksiluku, lognormaalisti jakautuneen satunnais­muuttujan n:s momentti on[3]

Erityisesti lognormaalisti jakautuneen satunnaismuuttujan aritmeettinen keskiarvo, odotusarvo, aritmeettinen varianssi ja aritmeettinen keskihajonta ovat:

.

Jakauman aritmeettinen variaatiokerroin määritellään sen keskihajonnan ja keskiarvon suhteena:

.

Logaritmisen normaalijakauman tapauksessa se on:

Tätä tulosta sanotaan joskus "geometriseksi variaatiokertoimeksi" (engl. Geometric coefficient of variation, GCV)[17][18]. Aritmeettisesta keskihajonnasta poiketen se on aritmeettisesta keskiarvosta riippumaton.

Parametrien ja arvot voidaan laskea, jos aritmeettinen keskiarvo ja varianssi tunnetaan:

Momentit eivät määritä toden­näköisyys­jakaumaa yksi­käsitteisesti. Toisin sanoen on muitakin jakaumia, joilla on samat momentit. Itse asiassa on koko joukko jakaumia, joilla on samat momentit kuin logaritmisella normaali­jakaumalla.

Moodi, mediaani ja kvantiilit[muokkaa | muokkaa wikitekstiä]

Kahden vinoudeltaan toisistaan poikkeavan logaritmisen normaali­jakauman odotus­arvot, mediaanit ja moodit

Jakauman moodi on piste, jossa sen tiheys­funktio saa suurimman arvonsa. Erityisesti se toteuttaa yhtälön , josta saadaan:

Koska logaritmisesti muunnettu muuttuja on normaalisti jakautunut ja koska kvantiilit säilyvät monotonisissa muutoksissa, muuttujan kvantiilit ovat:

missä on standardin normaalijakauman kvantiili.

Erityisesti logaritmisen normaalijakauman mediaani on sama kuin sen geometrinen keskiarvo.[19]

Osittainen odotusarvo[muokkaa | muokkaa wikitekstiä]

Satunnaismuuttujan osittainen odotusarvo kynnysarvon suhteen määritellään seuraavasti:

Vaihtoehtoisesti se voidaan kirjoittaa ehdollisen odotusarvon avulla muotoon . Logaritmisen normaalijakauman tapauksessa osittainen odotusarvo on:

missä on normaalijakauman kertymäfunktio. Osittaisen odotusarvon kaavalla on käyttöä vakuutusalalla ja taloustieteessä, ja sen avulla ratkaistaan Black–Scholesin kaavaan johtava osittaisdifferentiaaliyhtälö.

Ehdollinen odotusarvo[muokkaa | muokkaa wikitekstiä]

Log-normaalin satunnaismuuttujan ehdollinen odotusarvo kynnysarvon suhteen on sen osittainen odotusarvo jaettuna sen kumulatiivisella todennäköisyydellä olla tällä välillä:

Vaihtoehtoisia parametrointeja[muokkaa | muokkaa wikitekstiä]

Log-normaalijakauma määritetään tavallisimmin parametrien tai avulla, mutta vaihtoehtoisesti se voidaan parametroida useilla muillakin tavoilla. Todennäköisyysjakaumien tietokanta ProbOnto tuntee kaikkiaan seitsemän muuta tapaa parametroida log-normaalijakauma:[20][21]

Yhteenveto log-normaalien jakaumien parametroinneista
  • Normal1(μ,σ), parametreina odotusarvo μ ja keskihajonta σ[22]
  • LogNormal2(μ,υ), parametreina odotusarvo μ ja varianssi υ, molemmat logaritmisella asteikolla
  • LogNormal3(m,σ), parametreina mediaani m lineaarisella asteikolla ja keskihajonta σ logaritmisella asteikolla
  • LogNormal4(m,cv), parametreina mediaani m ja variaatiokerroin cv, molemmat lineaarisella asteikolla
  • LogNormal5(μ,τ), parametreina odotusarvo μ ja tarkkuus τ, molemmat logaritmisella asteikolla.[23]
  • LogNormal6(m,σg), parametreina mediaani m ja geometrinen keskihajonta σg, molemmat lineaarisella asteikolla[24]
  • LogNormal7(μNN), parametreina odotusarvo μN ja keskihajonta σN, molemmat lineaarisella asteikolla[25]
Esimerkkejä uudelleenparametroinneista[muokkaa | muokkaa wikitekstiä]

Tarkastellaan tilannetta, jossa samaa aineistoa halutaan mallintaa kahdella tavalla käyttämällä kahta erilaista optimointivälinettä, esimerkiksi PFIM[26] and PopED.[27] Näistä edellinen tukee LN2-, jälkimminen LN7-parametrointia. Siksi tarvitaan uudelleenparametrointia, sillä muutoin mallit johtaisivat eri tuloksiin.

Muunnokselle pätevät kaavat: .

Muunnokselle taas pätevät kaavat: .

Muut uudelleenparametrointikaavat löytyvät ProbOnto -tietokannasta.[20]

Monikerta, käänteisarvo ja potenssit[muokkaa | muokkaa wikitekstiä]

  • Vakiolla kertominen: Jos , niin .
  • Käänteisarvo: If , niin.
  • Potenssi: If , niin , kun .

Log-normaalisti jakautuneiden satunnaismuuttujien kerto- ja jakolasku[muokkaa | muokkaa wikitekstiä]

Jos kaksi riippumatonta log-normaalisti jakautunutta satunnaismuuttujaa, ja , kerrotaan keskenään, niiden tulo on sekin log-normaalisti jakautunut, parametreina ja , missä . Tämän avulla voidaan helposti muodostaa useammankin log-normaalin satunnaismuuttujan tulon jakauma: Jos ovat riippumatonta, log-normaalisti jakautunutta satunnaismuuttujaa, niin

Jos taas log-normaalisti jakautunut satunnaismuuttuja , jonka parametrit ovat ja , jaetaan toisella siitä riippumattomalla log-normaalisti jakautuneella satunnaismuuttujalla , jonka parametrit ovat ja , näiden osamäärä on sekin log-normaalisti jakautunut, parametreina ja .

Multiplikatiivinen keskeinen raja-arvolause[muokkaa | muokkaa wikitekstiä]

Samalla tavalla jakautuneiden riippumattomien positiivisten satunnaismuuttujien multiplikatiivinen eli geometrinen keskiarvo noudattaa logaritmista normaalijakaumaa sitä tarkemmin, mitä enemmän näitä muuttujia on. Tätä tulosta sanotaan multiplikatiiviseksi keskeiseksi raja-arvolauseeksi, ja se seuraa suoraan todennäköisyyslaskennan keskeisestä raja-arvolauseesta, kun sitä sovelletaan muuttujiin, jotka saadaan alkuperästen satunnaismuuttujien logaritmeina.

Muuta[muokkaa | muokkaa wikitekstiä]

Log-normaalijakaumaa noudattavalla aineistolla on symmetrinen Lorenzin käyrä.[28]

Jakauman harmoninen (), geometrinen () ja aritmeettinen keskiarvo () liittyvät toisiinsa seuraavasti:[29]

Log-normaalit jakaumat ovat äärettömästi jaollisia,[30], mutta eivät stabiileja jakaumia.[31]

Yhteydet muihin jakaumiin[muokkaa | muokkaa wikitekstiä]

  • Jos on normaalisti jakautunut, niin
  • Jos on jakautunut log-normaalisti, niin on jakautunut normaalisti.
  • Olkoot riippumattomia log-normaaleja jakaumia, joilla mahdollisesti on erisuuret parametrit ja , ja okoon . Tällöin :n jakaumaa ei voida esittää suljetussa muodossa, mutta sitä voidaan sen oikeassa päässä approksimoida toisella log-normaalilla jakaumalla .[32] Sen tiheysfunktion muoto tunnetaan myös 0:n läheisyydessä[31] missä se ei muistuta mitään log-normaalia jakaumaa. Sille saadaan L. F. Fentonin tunnetuksi tekemä, mutta R.I. Wilkinsonin jo aikaisemmin esittämä ja Marlowin matemaattisesti perustelema likiarvo[33]) käyttämällä toisen log-normaalin jakauman keskiarvoa ja varianssia:
Jos kaikilla muuttujilla on sama varianssiparametrin arvo , nämä kaavat yksinkertaistuvat muotoon

Vielä parempia likiarvoja voidaan saada arvioimalla jakauman tiheys- ja kertymäfunktiota Monte Carlo menetelmällä.[34][35]

  • Jos , niin muuttujan jakaumaa sanotaan kolmiparametriseksi log-normaaliksi, ja se on jakautunut välille .[36] , .
  • Log-normaalijakauma on erikoistapaus puolittain rajoitetusta Johnsonin jakaumasta.
  • Jos with , niin (Suzukin jakauma).
  • Lognormaalijakaumalle saadaan likiarvo, jonka integraali voidaan esittää alkeisfunktioiden avulla[37], käyttämällä sen määritelmässä normaalijakauman sijasta logistista jakaumaa. Tällöin jakauman kertymäfunktioksi saadaan:
Tämä on log-logistinen jakauma.

Tilastollisia päätelmiä[muokkaa | muokkaa wikitekstiä]

Parametrien estimointi[muokkaa | muokkaa wikitekstiä]

Lognormaalijakauman parametrien μ ja σ suurimman uskottavuuden estimaattorien määrittämiseksi voidaan käyttää samaa menetelmää, jolla ne määritellään normaalijakaumalle. Voidaan todeta, että

,

missä on normaalijakauman tiheysfunktio. Niinpä log-normaalijakauman uskottavuusfunktio on

.

Koska tässä ensimmäinen termi on vakio μ:n ja σ: suhteen, molemmat logaritmiset uskottavuusfunktiot, ja , saavat maksiminsa samoilla :n ja :n arvoilla. Niinpä suurimman uskottavuuden estimaattorit ovat samat kuin normaalijakaumalle havaintoarvoilla ,

Äärellisillä n:n arvoilla näillä estimaattoreilla esiintyy systemaattinen virhe. Tämä virhe on tosin :n osalta häviävän pieni, mutta :lle saadaan vähemmän vääristynyt arvo korvaamalla :n yhtälössä nimittäjä n arvolla n-1.

Jos yksittäisiä arvoja ei tunneta mutta aineiston keskiarvo ja keskihajonta s tunnetaan, vastaavat parametrit saadaan seuraavista kaavoista, jotka on muodostettu ratkaisemalla ja odotusarvon ja varianssin yhtälöistä:

.

Tilastollisia tunnuslukuja[muokkaa | muokkaa wikitekstiä]

Log-normaalisti jakautunutta aineistoa voidaan tehokkaimmin analysoida soveltamalla logaritmisesti muunnettuun aineistoon normaalijakaumaan perustuvia tunnettuja metodeja ja suorittaa sen jälkeen tuloksille käänteinen muunnos.

Hajontavälit[muokkaa | muokkaa wikitekstiä]

Tyypillisen esimerkin tästä muodostavat hajontavälit. Normaalisti jakautunut satunnaismuuttuja on noin kahden kolmasosan (68 %) todennäköisyydellä välillä ja noin 95 %:n todennäköisyydellä välillä . Sen vuoksi log-normaalisti jakautunut satunnaismuuttuja on

välillä todennäköisyydellä 2/3 ja
välillä todennäköisyydellä 95 %

Käyttämällä estimoituja parametreja suunnilleen samat prosenttiosuudet log-normaalisti jakautuneesta aineistosta on näillä väleillä.

:n luottamusväli[muokkaa | muokkaa wikitekstiä]

Samalla periaatteella todetaan, että :n luottamusväli on , missä on standardipoikkeama ja q Studentin t-jakauman 97,5 prosentin kvantiili, vapausasteluvulla n-1. Käänteisellä muunnoksella saadaan :n luottamusväliksi

with

Entropian ääriarvoperiaate vapaan parametrin määrittämiseksi[muokkaa | muokkaa wikitekstiä]

  • Sovelluksissa on määritettävä parametri. Kasvuproseseissa, joissa tuotto ja häviö tasapainottavat, saadaan Shannonin ääriarvoperiaatetta soveltamalla:
[38]
  • Tämän arvon avulla voidaan muodostaa skaalausrelaatio lognormaalijakauman maksimikohdan ja käännepisteiden välille.[38] Osoittautuu, että tämän yhteyden määrittää Neperin luku, ja sillä on tiettyjä geometrisia yhtäläisyyksiä minimipintaenergiaperiaatteen kanssa.
  • Nämä skaalausrelaatiot ovat osoittautuneet käyttökelpoisiksi useiden kasvuprosessien ennustamisessa. Sellaisia ovat esimerkiksi epidemioiden leviäminen, kiinteälle pinnalle muodostuvien nestepisaroiden laajeneminen, väestön kasvu, pyörteen syntyminen pesuallasta tyhjennettäessä, kielen piirteiden levinneisyys, turbulenssin nopeusprofiili ja monet muut.
  • Arvon avulla saadaan probabilistinen ratkaisu Draken epäyhtälölle.[39]

Esiintyminen ja sovelluksia[muokkaa | muokkaa wikitekstiä]

Log-normaalijakaumaa voidaan soveltaa moniin luonnonilmiöihin. Tyypillisessä tapauksessa sen käyttö voidaan perustella seuraavasti: Monet luonnon kasvuilmiöt muodostuvat suuresta määrästä pieniä muutoksia, joissa kohteen koko kasvaa pienen prosenttimäärän verran entisestään. Tällaiset muutokset kumuloituvat multiplikatiivisesti, mutta logaritmisella asteikolla additiivisesti. Jos jokaisen yksittäisen muutoksen vaikutus on mitättömän pieni, keskeinen raja-arvolauseen mukaan niiden summan jakauma on lähempänä normaalijakaumaa kuin yksittäisten muutoksen jakauma. Tästä seuraa, että kasvavien kohteiden koon logaritmilla on taipumus noudattaa normaalijakaumaa, jolloin koko itse noudattaa log-normaalijakaumaa. Tosin jos jakauman keskihajonta on tarpeeksi pieni, normaalijakaumaa voidaan käyttää sillekin hyvänä likiarvona.

Tämä keskeisen raja-arvolauseen multiplikatiivinen versio tunnetaan myös Gibratin lakina, Robert Gibratin (1904–1980) mukaan, joka muotoili sen liikeyrityksille.[40] Jos näiden pienten muutosten kertymisnopeus ei vaihtele ajan kuluessa, kasvu tulee koosta riippumattomaksi. Vaikka näin ei tapahtuisikaan, minkä tahansa ajan kuluessa kasvavan suureen jakaumalla on taipumus muodostua logartminormaaliksi.

Toinen perustelu jakauman käytölle on, että perustavien luonnonlakien mukaan monien suureiden arvot saadaan kertomalla ja jakamalla positiivisia muuttujia. Esimerkkeinä voidaan mainita gravitaatiolaki, jonka mukaisesti voima määräytyy kappaleiden massojen ja niiden etäisyyden mukaan, tai kemikaalien konsentraatiot liuoksessa tasapainon vallitessa, jotka määräytyvät lähtöaineiden alkutilanteessa vallinneiden konsentraation mukaan. Tällaisia tilanteita voidaan mallintaa olettamalla, että muuttujat noudattavat logaritmista normaalijakaumaa.

Silloinkin kun edellä esitetyt perustelut eivät päde, logaritminen normaalijakauma on usein uskottava ja empiiristen havaintojen mukaan pätevä malli. Esimerkkeinä voidaan mainita:

  • Ihmisten käyttäytymisestä:
    • Internetin keskustelupalstoille lähetettyjen kommenttien pituuden on todettu noudattavan logaritmista normaalijakaumaa.[41]
    • Aika, jonka käyttäjät pitävät verkosta lukemaansa artikkelia tai uutissivua auki, noudattaa myös logaritmista normaalijakaumaa.[42]
    • Shakkipelierien kestolla on taipumus noudattaa logaritmista normaalijakaumaa.[43]
    • Vääntöjen lukumäärä Rubikin kuutiota ratkaistaessa, sekä yleisesti että kullakin ratkaisijalla erikseen, näyttää noudattavan log-normaalia jakaumaa.[44]
  • Biologian ja lääketieteen alalta:
    • Elävien kudosten mitat kuten pituus, nahan pinta-ala ja paino.[45]
    • Nopeasti leviävissä epidemioissa kuten SARS:issa vuonna 2003 sairaalassa hoidettujen tapausten lukumäärän on voitu todeta noudattavan log-normaalijakaumaa ilman vapaita parametreja, jos entropialla on tunnettu arvio ja keskihajonta voidaan määrittää entropian tuotannon maksimiperiaatteella.[46]
    • Karvojen, kynsien ja hampaiden pituus niiden kasvusuunnassa noudattaa log-normaalijakaumaa.
    • Normalisoitu RNA-sekvenssin pituutta millä tahansa genomialueella voidaan hyvin approksimoida log-normaalijakaumalla.
    • Tietyt fysiologiset mittaustulokset kuten aikuisten ihmisten verenpaine noudattavat log-normaalijakaumaa, erikseen miehillä ja naisilla.[47]
    • Neurotieteissä ärsykkeiden kulkua neuronien välillä approksimoidaan usein log-normaalijakaumalla. Tämä havaittiin ensin aivokuoressa ja aivojuoviossa[48], myöhemmin myös hippokampuksessa[49] ja muualla aivoissa.[50][51]

Tämän vuoksi terveiltä henkilöiltä tehtyjen mittausten viitearvot voidaan asianmukaisemmin määritellä olettamalla suureiden noudattavan logaritmista normaalijakaumaa kuin olettamalla niiden jakautuneen symmetrisesti keskiarvon molemmin puolin.

Eri vuosien suurimmat yhdessä päivässä saadut sademäärät sovitettuina kumulatiiviseen logaritminormaalijakaumaan
  • Hydrologiassa logaritmista normaalijakaumaa käytetään mallinnettaessa esimerkiksi kuukauden tai vuoden suurinta yhdessä päivässä tullutta sademäärää tai jokien virtaamaa.[52]
Oikealla oleva CumFreq:illä tehty kuva esittää esimerkkiä log-normaalijakauman sovittamisesta eri vuosien suurimpiin yhden päivän sademääriin, ja se osoittaa myös binomijakaumaan perustuvan 90%:n luottamusvälin.[53]
Sadanta-aineistoa kuvaa kaavioon merkityt pisteet osana kumulatiivista frekvenssianalyysiä.
  • Yhteiskuntatieteissä ja demografiassa:
    • Todisteet viittaavat siihen, että väestön valtaosan (97%–99%) tulot ovat jakautuneet log-normaalisti.[54] (Sitä vastoin kaikkein suurituloisimpien tulot noudattavat Pareton jakaumaa.[55]
    • Finanssialalla, varsinkin Black–Scholes-mallissa vaihtokurssien, hintaindeksien ja osakekurssi-indeksien muutosten logaritmien oletetaan olevan normaalisti jakautuneet.[56] Nämä muuttujat nimittäin käyttäytyvät kuin koronkorko, eivät yksinkertaisen koron tavoin, ja ovat näin ollen multiplikatiivisia. Kuitenkin jotkut matemaatikot kuten Benoit Mandelbrot ovat väittäneet[57], että logaritminen Lévyn jakauma raskaine "häntineen" olisi parempi malli varsinkin pörssiromahdusten analysointiin. Itse asiassa osakekurssien jakaumilla usein on paksu "häntä".[58] Tämä pörssiromahduksia kuvaava paksuhäntäinen jakauma ei toteuta keskeisen raja-arvolauseen edellytyksiä.
    • Skientometriikassa on todettu, että tieteellisiin artikkeleihin tai patentteihin tehtyjen viittausten lukumäärä nopudattaa diskreettiä log-normaalia jakaumaa.[59][60]
    • Kaupunkien asukaslukujen on väitetty noudattavan log-normaalijakaumaa.
  • Teknologiassa
    • Luotettavuusanalyysissä lognormaalijakaumaa käytetään usein mallina sille, kuinka monta kertaa ylläpidettävää systeemiä on korjattava.[61]
    • Langattomassa tiedonsiirrossa paikallinen keskiteho ilmaistuna logaritmisella asteikolla kuten desibeleinä tai nepereinä noudattaa normaalijakaumaa.[62] Myös suurten rakennusten ja kukkuloiden radiosignaaleille aiheuttamaa varjostusta mallinnetaan usein log-normaalijakaumalla.
    • Julkisesti saatavilla olevien video- ja äänitiedostojen koko noudattaa log-normaalijakaumaa viiden suuruusluokan välillä.[63]
    • Tietokoneverkoissa ja Internet-tietoliikenteen analyysissä log-normaalijakauma on osoittautunut hyväksi tilastolliseksi malliksi liikenteen määrälle aikayksikköä kohti. Tämä on todettu soveltamalla tehokasta tilastollista lähestymistä suuriin ryhmiin todellisia Internet-jälkiä. Tässä yhteydessä log-normaalijakauman on todettu toimivan hyvin kahdessa tärkeässä käyttöyhteydessä: (1) ennakoitaessa sitä, kuinka suuren osan ajastaan liikenne ylittää tietyn rajan (palvelutasosopimuksissa tai linkin kapasiteetin arvioinnissa) sekä (2) ennustettaessa 95 %:n kvantiilihinnoittelua.[64]
Käännös suomeksi
Käännös suomeksi
Tämä artikkeli tai sen osa on käännetty tai siihen on haettu tietoja muunkielisen Wikipedian artikkelista.
Alkuperäinen artikkeli: en:Log-normal distribution

Lähteet[muokkaa | muokkaa wikitekstiä]

  1. Pentti Laininen: ”Tärkeitä jatkuvia jakaumismalleja”, Todennäköisyys ja sen tilastollinen soveltaminen, s. 96. Otatieto, 2001. ISBN 951-672312-8.
  2. a b c Pekka Tuominen, Pekka Norlamo: ”Satunnaismuuttujien yleistä teoriaa”, Todennäköisyyslaskenta, osa 2, s. 323. Limes ry, 1978. ISBN 951-745-023-0.
  3. a b c Norman L. Johnson, Samuel Kotz, N. Balakrishnan: ”Lognormal Distributions”, Continuous univariate distributions. Vol. 1. 2. painos. New York: John Wiley & Sons, 1994. ISBN 978-0-471-58495-7.
  4. a b Log Normal Distribution Wolfram MathWorld. Eric W. Weisstein. Viitattu 4.9.2020.
  5. Sung Y. Park, Anil K. Bera: Maximum entropy autoregressive conditional heteroskedasticity model. Journal of Econometrics, 2009, 150. vsk, nro 2, s. 219–230. doi:10.1016/j.jeconom.2008.12.014. Artikkelin verkkoversio. (Arkistoitu – Internet Archive)
  6. Ghasem Tarmast, Statistics Department, Faculty of Mathematical Science and Computer, Shahid Chamran University: Multivariate Log-Normal Distribution (PDF) isi.cbs.nl. 2001. Arkistoitu 19.7.2013. Viitattu 4.9.2020.
  7. Leigh J. Halliwell: The Lognormal Random Multivariate casact.org. 2015. Viitattu 4.9.2020.
  8. CC. Heyde: On a property of the lognormal distribution. Journal of the Royal Statistical Society, Series B, 1963, 25. vsk, nro 2, s. 392–393. ISBN 978-1-4419-5822-8. doi:10.1007/978-1-4419-5823-5_6.
  9. a b P. Holgate: The lognormal characteristic function. Communications in Statistics – Theory and Methods, 1989, 18. vsk, nro 12, s. 4539–4548. doi:10.1080/03610928908830173.
  10. R. Barakat: Sums of independent lognormally distributed random variables. Journal of the Optica Society of America, 1976, 66. vsk, nro 3, s. 211–216. doi:10.1364/JOSA.66.000211.
  11. E. Barouch, GM. Kaufman, ML. Glasser: On sums of lognormal random variables. Studies in Applied Mathematics, 1986, 75. vsk, nro 1, s. 37–55. doi:10.1002/sapm198675137. Artikkelin verkkoversio.
  12. Roy B. Leipnik: On Lognormal Random Variables: I – The Characteristic Function. Journal of the Australian Mathematical Society Series B, Tammikuu 1991, 32. vsk, nro 3, s. 327–347. doi:10.1017/S0334270000006901. Artikkelin verkkoversio.
  13. S. Asmussen, J.L. Jensen, L. Rojas-Nandayapa: On the Laplace transform of the Lognormal distribution. [ Methodology and Computing in Applied Probability, 2014, 18. vsk, nro 2, s. 441-458. Artikkelin verkkoversio.
  14. a b Thomas BL Kirkwood: Geometric means and measures of dispersion. Biometrics, 1979, 35. vsk, nro 4, s. 908–909.
  15. E. Limpert, W. Stahel, M. Abbt: Lognormal distributions across the sciences: keys and clues. BioScience, 2001, 51. vsk, nro 5, s. 341–352. doi:10.1641/0006-3568(2001)051[0341:LNDATS]2.0.CO;2.
  16. Onset-Duration Matching of Acoustic Stimuli Revisited: Conventional Arithmetic vs. Proposed Geometric Measures of Accuracy and Precision. Frontiers in Psychology, 2017, nro 7. doi:10.3389/fpsyg.2016.02013.
  17. FAQ: Issues with Efficacy Analysis of Clinical Trial Data Using SAS PharmaSUG2011. Viitattu 4.9.2020.
  18. MH Schiff: Head-to-head, randomised, crossover study of oral versus subcutaneous methotrexate in patients with rheumatoid arthritis: drug-exposure limitations of oral methotrexate at doses >=15 mg may be overcome with subcutaneous administration. Ann Rheum Dis, 2014, 73. vsk, nro 8, s. 1–3. doi:10.1136/annrheumdis-2014-205228.
  19. Leslie E. Daly, Geoffrey Joseph Bourke: Interpretation and uses of medical statistics. (5th edition) Journal of Epidemiology and Community Health, 2000, 46. vsk, nro 3. Wiley-Blackwell. doi:10.1002/9780470696750.
  20. a b ProbOnto probonto.org. Viitattu 4.9.2020.
  21. MH Swat, P. Grenon, S Wimalaratne: ProbOnto: ontology and knowledge base of probability distributions. Bioinformatis, 2016, 32. vsk, nro 17, s. 2719–2721. doi:10.1093/bioinformatics/btw170.
  22. Forbes et al.: Probability Distributions. John Wiley & Sons Inc., 2011.
  23. D. Lunn: The BUGS book: a practial introduction to Bayesian analysis. Texts in statistical science, 2012. CRC Press.
  24. E. Limpert, W. Stahel. M. Abbt: Log-normal distributions across the sciences: Keys and clues. BioScience, 2001, 51. vsk, nro 5, s. 341–352. doi:10.1641/0006-3568(2001)051[0341:LNDATS]2.0.CO;2.
  25. J. Nyberg: PopED - An extended, parallelized, population optimal design tool. Comput Methods Programs Biomed, 2012, 108. vsk, nro 2, s. 789–805. doi:10.1016/j.cmpb.2012.05.005.
  26. S. Retout, S. Duffull, F. Mentré: Development and implementation of the population Fisher information matrix for the evaluation of population pharmacokinetic designs. Comp Meth Pro Biomed, 2001, 65. vsk, nro 2, s. 141–151. doi:10.1016/S0169-2607(00)00117-6.
  27. PopED Manual, Release version 2.13. Technical report. PopED:n kehitystiimi, Uppsalan yliopisto, 2016.
  28. Christian Damgaard, Jacob Weiner: Describing inequality in plant size or fecundity. Ecology, 2000, 81. vsk, nro 4, s. 1139–1142. doi:10.1890/0012-9658(2000)081[1139:DIIPSO]2.0.CO;2.
  29. Lewis A. Rossman: Design stream flows based on harmonic means. Journal of Hydraulic Engineering, Heinäkuu 1990, 116. vsk, nro 7, s. 946–950. doi:10.1061/(ASCE)0733-9429(1990)116:7(946).
  30. Olof Thorin: On the infinite divisibility of the lognormal distribution. Scandinavian Actuarial Journal, 1977, nro 3, s. 121–148. doi:10.1080/03461238.1977.10405635.
  31. a b Gao Xin: Asymptotic Behavior of Tail Density for Sum of Correlated Lognormal Variables. International Journal of Mathematics and Mathematical Sciences, 2009, s. 1–28. doi:10.1155/2009/630857.
  32. S Asmussen, L. Rojas-Nandayapa: Asymptotics of Sums of Lognormal Random Variables with Gaussian Copula. Statistics and Probability Letters, 2008, 78. vsk, nro 16, s. 2709–2714. doi:10.1016/j.spl.2008.03.035. Artikkelin verkkoversio.
  33. N. A. Marlow: A normal limit theorem for power sums of independent normal random variables. Bell System Technical Journal, Marraskuu 1967, 46. vsk, nro 9, s. 2081–2089. doi:10.1002/j.1538-7305.1967.tb04244.x.
  34. Z I Botev, P. L'Ecuyer: ”Accurate computation of the right tail of the sum of dependent log-normal variates”, 2017 Winter Simulation Conference (WSC), s. 1880–1890. Las Vegasissa 3.-6.12.2017 pidetyn konferenssin julkaisu. IEEE, 2017. ISBN 978-1-5386-3428-8. doi:10.1109/WSC.2017.8247924.
  35. Orthonormal polynomial expansions and lognormal sum densities Cornell University. Viitattu 4.9.2020.
  36. B. Sangal, A. Biswas: The 3-Parameter Lognormal Distribution Applications in Hydrology. Water Resources Research, 1970, 6. vsk, nro 2, s. 505–515. doi:10.1029/WR006i002p00505.
  37. P. K. Swanee: Near Lognormal Distribution. Journal of Hydrologic Engineering, 2002, 7. vsk, nro 6, s. 441–444. doi:10.1061/(ASCE)1084-0699(2002)7:6(441).
  38. a b Wu Ziniu, Li Juan, Bai Chenyuan: Scaling Relations of Lognormal Type Growth Process with an Extremal Principle of Entropy. Entropy, {{{Vuosi}}}, 19. vsk, nro 56, s. 1–14. doi:10.3390/e19020056. Artikkelin verkkoversio.
  39. Frederck Bloetscher: Using predictive Bayesian Monte Carlo- Markov Chain methods to provide a probabilistic solution for the Drake equation. Acta Astronautica, 2019, nro 155, s. 118–130. doi:10.1016/j.actaastro.2018.11.033.
  40. John Sutton: Gibrat's Legacy. Journal of Economic Literature, Maaliskuu 1997, 32. vsk, nro 1, s. 40–59.
  41. Pawel Sobkowicz: Lognormal distributions of user post lengths in Internet discussions - a consequence of the Weber-Fechner law?. EPJ Data Science, 2013.
  42. Silence is also evidence: interpreting dwell time for recommendation from psychological perspective (konferenssijulkaisu, ACM International Conference on KDD) mldm.ict.ac.cn. 2013. Arkistoitu 10.5.2017. Viitattu 4.9.2020.
  43. What is the average length of a game of chess? chess.stackexchange.com. Viitattu 4.9.2020.
  44. Rubik's Cube Competitors' Mean times from 2019 competitions reddit.com. 21.8.2019. Viitattu 4.9.2020.
  45. Julian S. Huxley: Problems of relative growth. Lontoo, 1932. ISBN 978-0-486-61114-3.
  46. Jennifer S. K. Chan, Philip L. H. Yu: Modelling SARS data using threshold geometric process. Statistics in Medicine, 2006, 25. vsk, nro 11, s. 1826–1839. doi:10.1002/sim.2376.
  47. Robert Makuch, D. H. Freeman, M. F. Johnson: Justification for the lognormal distribution as a model for blood pressure. Journal of Chronic Diseases, 1979, 32. vsk, nro 3, s. 245–250. doi:10.1016/0021-9681(79)90070-5.
  48. Gabriele Scheler, Johann Schumann: ”Diversity and stability in neuronal output rates”, 36th Society for Neuroscience Meeting, Atlanta. konferenssijulkaisu. {{{Julkaisija}}}, 2006.
  49. Kenji Mizuseki, György Buszáki: Preconfigured, skewed distribution of firing rates in the hippocampus and entorhinal cortex. Cell Reports, 12.9.2013, nro 5, s. 1010–1021. doi:10.1016/j.celrep.2013.07.039.
  50. György Buszäki, Menju Mizuseki: The log-dynamic brain: how skewed distributions affect network operations. Nature Reviews. Neuroscience, 6.1.2017, 15. vsk, nro 4, s. 264–278. doi:10.1038/nrn3687.
  51. Adrien wohrer, Mark. D. Humphries, Christian K. Machens: Population-wide distributions of neural activity during perceptual decision-making. Progress in Neurobiology, 1.4.2013, nro 103, s. 156–193. ISSN 1873-5118. doi:10.1016/j.pneurobio.2012.09.004.
  52. R. J. Oosterbaan, H. P. Ritzema: ”chapter=6: Frequency and Regression Analysis”, Drainage Principles and Applications, Publication 16, s. 175–224. Wageningen, Alankomaat: International Institute for Land Reclamation and Improvement (ILRI), 1994. ISBN 978-90-70754-33-4. Teoksen verkkoversio.
  53. Cumulative frequency analysis with probability distribution fitting CumFreq. Viitattu 4.9.2020.
  54. Pareto's law of income distribution: Evidence from Germany, the United Kingdom and the United States EconWPA. Viitattu 4.9.2020.
  55. Hideki Takayasu (toim); Souma Wataru: ”Physics of Personal Income”, Empire Science of Financial Fluctuations: The Advent of Econophysics. Konferenssijulkaisu. Springer, 2002. doi:10.1007/978-4-431-66993-7.
  56. F. Black, M. Scholes: The Pricing of Options and Corporate Liabilities. Journal of Political Economy, 1973, 81. vsk, nro 3. doi:10.1086/260062.
  57. Benoit Mandelbrot: The (mis-)Behaviour of Markets. Basic Books, 2004. ISBN 9780465043552. Teoksen verkkoversio.
  58. P. Bunchen: Advamced Option Pricing. University of Sydney, 2007.
  59. Mike Thelwall, Paul Wilson: Regression for citation data: An evaluation of different methods. Journal of Infometrics, 2014, 8. vsk, nro 4, s. 963–971. doi:10.1016/j.joi.2014.09.011.
  60. Paul Sheridan, Taku Onodera: A Preferential Attachment Paradox: How Preferential Attachment Combines with Growth to Produce Networks with Log-normal In-degree Distributions. Scientific Reports, 2018, 8. vsk, nro 1. doi:10.1038/s41598-018-21133-2.
  61. Patrick O'Connor, Andre Kleyner: Practical Reliability Engineering, s. 35. John Wiley & Sons, 2011. ISBN 978-0-470-97982-2.
  62. Shadowing WirelessCommunication.NL. Arkistoitu 13.1.2012. Viitattu 4.9.2020.
  63. C. Gros, G. Kaczor, D. Markovic: Neuropsychological constraints to human data production on a global scale. The European Physical Journal B, 2012, 85. vsk, nro 28, s. 28. doi:10.1140/epjb/e2011-20581-3.
  64. Mohammed Alasmar, George Parisis, Richard G. Clegg, Nickolay Zakhleniuk: On the Distribution of Traffic Volumes in the Internet and its Implications arxiv.org. 11.2.2019. Viitattu 4.9.2020.