Теория вероятностей и математическая статистика/Статистическое распределение выборки. Эмпирическая функция распределения.

Статистическое распределение выборки править

Математическая статистика — это раздел математики, в котором изучаются методы сбора, систематизации и обработки результатов наблюдений массовых случайных явлений для выявления существующих закономерностей.

Генеральной совокупностью называется общая группа объектов, подлежащих статистическому исследованию.

Выборочной совокупностью (выборкой) называется группа объектов, случайно отобранных из генеральной совокупности.

Число элементов выборки называется ее объемом. Пусть из генеральной совокупности случайным образом извлечена выборка объема  . Каждое наблюдаемое в выборке значение   называется вариантой.

Частота   — число наблюдений значения   в выборке.

Относительная частота   — отношение частоты   к объему выборки:  .

Последовательность вариант, записанных в порядке возрастания, называют вариационным рядом, а перечень вариант и соответствующих им частот или относительных частот — статистическим рядом:

         
         

где   расположены в порядке возрастания

Если вариационный ряд состоит из большого количества чисел (или исследуется некоторый непрерывный признак), то используют группированную выборку. Для ее получения диапазон, в котором заключены все наблюдаемые значения признака, называемый размахом  , разбивают на   равных частей длиной  . Число   частичных интервалов определяется по формуле   (  — целая часть числа  ). Тогда величина каждого частичного интервала равна  . При составлении статистического ряда в качестве   обычно выбирают середины полученных интервалов  , а в качестве   — число вариант, попавших в  -й интервал:

Интервал        
Частота        

Соединив точки с координатами   (или  ) получают полигон частот (или полигон относительных частот).

Эмпирическая функция распределения править

Эмпирическая функция распределения — это функция, имеющая вид  , где   — число вариант, меньших  .

Для группированной выборки или интервальных вариационных рядов строится гистограмма частот (относительных частот) — ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длиной  , а высоты равны   ( ). Верхнюю границу гистограммы относительных частот можно рассматривать как статистический аналог плотности распределения наблюдаемой случайной величины (суммарная площадь прямоугольников гистограммы равна единице).

Модой   называется значение признака (варианта), чаще всего встречающееся в изучаемой совокупности. В дискретном ряду распределения модой будет варианта с наибольшей частотой.

Медианой   называется варианта, которая находится в середине вариационного ряда. Медиана делит ряд пополам, по обе стороны от нее находится одинаковое количество единиц совокупности.

Для дискретного вариационного ряда с нечетным числом членов медиана равна серединному варианту, а для ряда с четным числом членов — полусумме двух серединных вариантов.

Примеры править

Пример 1 править

 
Рис. 1. Статистическое распределение выборки. Эмпирическая функция распределения для заданного распределения частот
 
Рис. 2. Решение задачи статистического распределения выборки в Mathcad

Выборка задана в виде распределения частот:

         
         
  1. Найти распределение относительных частот;
  2. Найти эмпирическую функцию распределения;
  3. Найти моду и медиану

Решение:

1) Объем выборки равен  . По определению относительная частота вычисляется по формуле  , следовательно, распределение относительных частот имеет вид

         
         

2) Эмпирическая функция распределения имеет вид  

3) Чаще всего встречается варианта  , поэтому она является модой распределения. Для вычисления медианы распределения необходимо последовательно найти сумму накопленных частот ряда. Это продолжается до получения накопленной суммы частот, превышающей половину суммы частот ряда. В примере сумма частот ряда равна 50, ее половина — 25. Накопленная сумма частот, превышающих 25, равна 30. Варианта, соответствующая этой сумме,  , и есть медиана ряда.

         
         
Сумма накопленных частот 5 5 + 8 = 13 13 + 17 = 30  

Пример 2 править

 
Рис. 3. Гистограмма относительных частот для выборки.

Дана выборка объема  : 26; 20; 45; 50; 30; 32; 46; 45; 34; 24; 35; 42; 34; 29; 34; 36; 30; 43; 23; 38; 48; 39; 40; 42; 38; 37; 43; 28; 36; 44.

Сделать интервальную группировку этой выборки. Построить гистограмму относительных частот по данным выборки.

Решение:

Размах выборки  . Количество частичных интервалов равно  . Ширина интервала  . Таблица интервальной группировки имеет следующий вид:

Интервал         [44; 50]
Середина интервала            
           
           
           

Для построения гистограммы необходимо вычислить   для каждого интервала. Гистограмма относительных частот изображена на рис. 3.

Упражнения править

1 Что такое относительная частота  ?

отношение частоты   к частоте  
отношение частоты   к объему выборки
отношение объема выборки к частоте  

2 Что такое Эмпирическая функция распределения?

это функция, имеющая вид  , где   — число вариант, меньших  
это функция, имеющая вид  , где   — число вариант, равных  
это функция, имеющая вид  , где   — число вариант, больших