Блокпосты представляют собой меру того, насколько хорошо распределены данные в наборе данных. Он делит набор данных на три квартиля. Этот график представляет минимум, максимум, медиану, первый квартиль и третий квартиль в наборе данных. Это также полезно при сравнении распределения данных по наборам данных путем рисования коробочных диаграмм для каждого из них.
Бокплоты создаются в R с помощью функции boxplot () .
Синтаксис
Основной синтаксис для создания боксплота в R —
boxplot(x, data, notch, varwidth, names, main)
Ниже приведено описание используемых параметров:
-
х — это вектор или формула.
-
данные — это фрейм данных.
-
Notch — логическое значение. Установите как TRUE, чтобы нарисовать метку.
-
varwidth является логическим значением. Установите значение true, чтобы нарисовать ширину поля пропорционально размеру выборки.
-
Имена — это групповые ярлыки, которые будут напечатаны под каждым коробочным графиком.
-
main используется, чтобы дать название графику.
х — это вектор или формула.
данные — это фрейм данных.
Notch — логическое значение. Установите как TRUE, чтобы нарисовать метку.
varwidth является логическим значением. Установите значение true, чтобы нарисовать ширину поля пропорционально размеру выборки.
Имена — это групповые ярлыки, которые будут напечатаны под каждым коробочным графиком.
main используется, чтобы дать название графику.
пример
Мы используем набор данных «mtcars», доступный в среде R, чтобы создать базовый блокплот. Давайте посмотрим на столбцы «mpg» и «cyl» в mtcars.
input <- mtcars[,c('mpg','cyl')] print(head(input))
Когда мы выполняем приведенный выше код, он дает следующий результат —
mpg cyl Mazda RX4 21.0 6 Mazda RX4 Wag 21.0 6 Datsun 710 22.8 4 Hornet 4 Drive 21.4 6 Hornet Sportabout 18.7 8 Valiant 18.1 6
Создание Boxplot
Приведенный ниже скрипт создаст график коробчатого графика для отношения между миль на галлон (миль на галлон) и цил (количество цилиндров).
# Give the chart file a name. png(file = "boxplot.png") # Plot the chart. boxplot(mpg ~ cyl, data = mtcars, xlab = "Number of Cylinders", ylab = "Miles Per Gallon", main = "Mileage Data") # Save the file. dev.off()
Когда мы выполняем приведенный выше код, он дает следующий результат —
Боксплот с надрезом
Мы можем нарисовать прямоугольник с надрезом, чтобы выяснить, как медианы разных групп данных соответствуют друг другу.
Приведенный ниже скрипт создаст график коробчатого графика с надрезом для каждой группы данных.
# Give the chart file a name. png(file = "boxplot_with_notch.png") # Plot the chart. boxplot(mpg ~ cyl, data = mtcars, xlab = "Number of Cylinders", ylab = "Miles Per Gallon", main = "Mileage Data", notch = TRUE, varwidth = TRUE, col = c("green","yellow","purple"), names = c("High","Medium","Low") ) # Save the file. dev.off()
Когда мы выполняем приведенный выше код, он дает следующий результат —