Выделение в функции распределения вероятностей представляет собой число, которое более чем в 1,5 раза превышает длину данных, установленных вдали от нижнего или верхнего квартилей. В частности, если число меньше Q1−1.5 timesIQR или больше Q3+1.5 timesIQR, то это выброс.
Выброс определяется и задается следующей функцией вероятности:
формула
Outlier datas are ltQ1−1.5 timesIQR (или) gtQ3+1.5 timesIQR
Outlier datas are ltQ1−1.5 timesIQR (или) gtQ3+1.5 timesIQR
Где —
-
Q1 = Первый квартиль
-
Q2 = третий квартиль
-
IQR = межквартильный диапазон
Q1 = Первый квартиль
Q2 = третий квартиль
IQR = межквартильный диапазон
пример
Постановка задачи:
Рассмотрим набор данных, который представляет 8 различных периодических заданий учащихся. Набор информации о количестве заданий: 11, 13, 15, 3, 16, 25, 12 и 14. Изучите данные выбросов из числа периодических заданий учащихся.
Решение:
Данный набор данных:
11 | 13 | 15 | 3 | 16 | 25 | 12 | 14 |
Расположите его в порядке возрастания:
3 | 11 | 12 | 13 | 14 | 15 | 16 | 25 |
Значение первого квартиля () Q1
Q1= frac(11+12)2[7pt] =11.5
Q1= frac(11+12)2[7pt] =11.5
Значение третьего квартиля () Q3
Q3= frac(15+16)2[7pt] =15,5
Q3= frac(15+16)2[7pt] =15,5
Нижний диапазон выбросов (L)
Q1−1,5 timesIQR[7pt] =11,5−(1,5 times4)[7pt] =11,5−6[7pt] =5.5
Q1−1,5 timesIQR[7pt] =11,5−(1,5 times4)[7pt] =11,5−6[7pt] =5.5
Верхний диапазон выбросов (L)
Q3+1,5 timesIQR[7pt] =15,5+(1,5 times4)[7pt] =15,5+6[7pt] =21,5
Q3+1,5 timesIQR[7pt] =15,5+(1,5 times4)[7pt] =15,5+6[7pt] =21,5
В данной информации 5.5 и 21.5 больше, чем другие значения в данном наборе данных, т.е. за исключением 3 и 25, поскольку 3 больше 5.5, а 25 меньше 21.5.
Таким образом, мы используем 3 и 25 в качестве значений выбросов.