Закон Ципфа
Закон Ципфа (Зипфа) — эмпирическая закономерность распределения частоты слов естественного языка: если все слова а (или просто достаточно длинного текста) упорядочить по убыванию частоты их использования, то частота n-го слова в таком списке окажется приблизительно обратно пропорциональной его порядковому номеру n (так называемому рангу этого слова,
Например второе по используемости слово встречается примерно в два раза реже, чем первое, третье — в три раза реже, чем первое, и т. д.
Применение
правитьАнализ текста
Анализатор текстов
Ссылки
правитьЛитература
править- Арапов М.В. Квантитативная лингвистика. М., 1988.
- Яблонский А.И. Математические модели в исследовании науки. М.: Наука, 1986 351 с.