Zipfin laki

Kohteesta Wikipedia
Loikkaa: valikkoon, hakuun

Zipfin laki oli Harvardin kielitieteilijä George Kingsley Zipfin löydös, jonka mukaan n:nneksi käytetyimmän sanan (tai jonkin muun mitattavan yksikön, kuten äänteen) käyttötiheys missä tahansa luonnollisessa kielessä on käänteisesti verrannollinen lukuun n.

Zipfin laki on empiirinen tulos eikä teoreettinen malli. Syyt zipfiläisiin jakaumiin eri ilmiöissä vaihtelevat suuresti ja niiden perusteista on kiistaa. Zipfiläisiä jakaumia kuitenkin esiintyy tosielämässä.

Zipfin laki voidaan kuvata matemaattisesti:

f(k;s,N)=\frac{1/k^s}{\sum_{n=1}^N 1/n^s}.

Zipfiläinen jakauma todistetaan usein kuvaamalla data graafisesti, akseleina järjestysnumeron logaritmi ja frekvenssin logaritmi. Jos pisteet asettuvat likimäärin suoralle, kyseessä on Zipfin lain tapaus. Logaritmin kantaluvulla ei ole merkitystä tässä tapauksessa.

Toteutumisesta[muokkaa | muokkaa wikitekstiä]

Dahui, Li Menghui ja Di Zengru havaitsivat tutkimuksessaan ”True reason for Zipf’s law in language” (2005), että vaikka kielet normaalisti noudattavat Zipfin jakaumaa, kiina on poikkeus. Kiinan kieli lakkasi noudattamasta Zipfin jakaumaa Qin-dynastian jälkeen. Syyksi he esittivät sitä, että uusien kiinan sanamerkkien luominen ja merkistön satunnainen muuttuminen on hidasta.

R. N. Mantegna, S. V. Buldyrev, A. L. Goldberger, S. Havlin, C. K. Peng, M. Simons ja H. E. Stanley osoittivat tutkimuksessaan ”Linguistic Features of Noncoding DNA Sequences” (1994), että Tilke-DNA noudattaa Zipfin lakia ja geenit eivät.

Tämä kieliin tai kielitieteeseen liittyvä artikkeli on tynkä. Voit auttaa Wikipediaa laajentamalla artikkelia.