Zipfin laki

Wikipedia
Loikkaa: valikkoon, hakuun

Zipfin laki oli Harvardin kielitieteilijä George Kingsley Zipfin löydös, jonka mukaan n:nneksi käytetyimmän sanan (tai jonkin muun mitattavan yksikön, kuten äänteen) käyttötiheys missä tahansa luonnollisessa kielessä on käänteisesti verrannollinen lukuun n.

Zipfin laki on empiirinen tulos, eikä teoreettinen malli. Syyt zipfiläisiin jakaumiin eri ilmiöissä vaihtelevat suuresti ja niiden perusteista on kiistaa. Zipfiläisiä jakaumia kuitenkin esiintyy tosielämässä.

Zipfin laki voidaan kuvata matemaattisesti:

f(k;s,N)=\frac{1/k^s}{\sum_{n=1}^N 1/n^s}

Laki voidaan kirjoittaa myös muodossa

f(k;s,N)=\frac{1}{k^s H_{N,s}}

Zipfiläinen jakauma todistetaan usein kuvaamalla data graafisesti, akseleina järjestysnumeron logaritmi ja frekvenssin logaritmi. Jos pisteet asettuvat likimäärin suoralle, kyseessä on Zipfin lain tapaus. Logaritmin kantaluvulla ei ole merkitystä tässä tapauksessa.

Triviaa[muokkaa | muokkaa wikitekstiä]

  • Dahui, Li Menghui & Di Zengru löysivät tutkimuksessaan "True reason for Zipf’s law in language" (2005), että vaikka normaalisti analysoidut kielet, kuten englanti, ranska ja muut kielet noudattivat Zipfin jakaumaa, kiina on poikkeus. Kiinan kieli lakkasi noudattamasta Zipfin jakaumaa Qin -dynastian jälkeen. Syyksi he esittivät sitä, että uusien kiinan sanamerkkien luominen ja merkistön satunnainen muuttuminen on hitaampaa.
  • R. N. Mantegna, S. V. Buldyrev, A. L. Goldberger, S. Havlin, C. K. Peng, M. Simons & H. E. Stanley, "Linguistic Features of Noncoding DNA Sequences"(1994) osoitettiin, että Tilke-DNA noudattaa Zipfin lakia, ja geenit eivät.
Tämä kieliin tai kielitieteeseen liittyvä artikkeli on tynkä. Voit auttaa Wikipediaa laajentamalla artikkelia.