лексикографическая статистика

Теория и практика составления частотных словарей. Было замечено, что при большом количестве текстов около 80% его занимают две тысячи самых употребительных (частотных, активных лексем). Дж. Ципф в 1949 г. установил прямую зависимость частоты и ранга (порядкового номера в частотном словаре): r х f = с (ранг х частоту = слово). В 1954 году Б. Мандельброт разработал уточненную формулу: Рг = р(г+р)-b, где r – номер слова в списке по убывающим частотам, Рг – относительная частота (вероятность), а Р, р, b – константы данного текста. Со временем оказалось, что закон Ципфа-Мандельброта обладает относительностью: константы зависят от стиля, жанра, эпохи и т.п.

Источник: Словарь лингвистических терминов Жеребило на Gufo.me