Учебники

Статистика — функция выброса

Выделение в функции распределения вероятностей представляет собой число, которое более чем в 1,5 раза превышает длину данных, установленных вдали от нижнего или верхнего квартилей. В частности, если число меньше Q11.5 timesIQR или больше Q3+1.5 timesIQR, то это выброс.

Выброс определяется и задается следующей функцией вероятности:

формула

Outlier datas are ltQ11.5 timesIQR (или)  gtQ3+1.5 timesIQR

Outlier datas are ltQ11.5 timesIQR (или)  gtQ3+1.5 timesIQR

Где —

  • Q1 = Первый квартиль

  • Q2 = третий квартиль

  • IQR = межквартильный диапазон

Q1 = Первый квартиль

Q2 = третий квартиль

IQR = межквартильный диапазон

пример

Постановка задачи:

Рассмотрим набор данных, который представляет 8 различных периодических заданий учащихся. Набор информации о количестве заданий: 11, 13, 15, 3, 16, 25, 12 и 14. Изучите данные выбросов из числа периодических заданий учащихся.

Решение:

Данный набор данных:

11 13 15 3 16 25 12 14

Расположите его в порядке возрастания:

3 11 12 13 14 15 16 25

Значение первого квартиля () Q1

Q1= frac(11+12)2[7pt] =11.5

Q1= frac(11+12)2[7pt] =11.5

Значение третьего квартиля () Q3

Q3= frac(15+16)2[7pt] =15,5

Q3= frac(15+16)2[7pt] =15,5

Нижний диапазон выбросов (L)

Q11,5 timesIQR[7pt] =11,5(1,5 times4)[7pt] =11,56[7pt] =5.5

Q11,5 timesIQR[7pt] =11,5(1,5 times4)[7pt] =11,56[7pt] =5.5

Верхний диапазон выбросов (L)

Q3+1,5 timesIQR[7pt] =15,5+(1,5 times4)[7pt] =15,5+6[7pt] =21,5

Q3+1,5 timesIQR[7pt] =15,5+(1,5 times4)[7pt] =15,5+6[7pt] =21,5

В данной информации 5.5 и 21.5 больше, чем другие значения в данном наборе данных, т.е. за исключением 3 и 25, поскольку 3 больше 5.5, а 25 меньше 21.5.

Таким образом, мы используем 3 и 25 в качестве значений выбросов.