La loi de Zipf

Dans les années 30, un scientifique de l'université de Harvard, G.K. Zipf, a montré qu'en classant les mots d'un texte par fréquence décroissante, alors, on observe que la fréquence d'utilisation d'un mot est inversement proportionnel à son rang. La loi de Zipf stipule que la fréquence du second mot le plus fréquent est la moitié de celle du premier, la fréquence du troisième mot le plus fréquent, son tiers, etc. Cette loi peut s'exprimer de la manière suivante :

Fréquence d'un mot de rang N = (Fréquence du mot de rang 1) / N

Nous vous proposons de consulter un extrait de la section Linguistique et Statistique de l'Encyclopaedia Universalis afin de préciser la portée de cette loi.

En cliquant sur le bouton situé ci-dessous, vous aurez accès à une applet java vous permettant de tester cette propriété sur du corpus réel :

[Page principale]