Закон Ципфа (Зипфа) — эмпирическая закономерность распределения частоты слов естественного языка: если все слова а (или просто достаточно длинного текста) упорядочить по убыванию частоты их использования, то частота n-го слова в таком списке окажется приблизительно обратно пропорциональной его порядковому номеру n (так называемому рангу этого слова,

Например второе по используемости слово встречается примерно в два раза реже, чем первое, третье — в три раза реже, чем первое, и т. д.

Применение

править

Анализ текста

Анализатор текстов

Ссылки

править

Литература

править
  • Арапов М.В. Квантитативная лингвистика. М., 1988.
  • Яблонский А.И. Математические модели в исследовании науки. М.: Наука, 1986 351 с.