Учебники

R — Boxplots

Блокпосты представляют собой меру того, насколько хорошо распределены данные в наборе данных. Он делит набор данных на три квартиля. Этот график представляет минимум, максимум, медиану, первый квартиль и третий квартиль в наборе данных. Это также полезно при сравнении распределения данных по наборам данных путем рисования коробочных диаграмм для каждого из них.

Бокплоты создаются в R с помощью функции boxplot () .

Синтаксис

Основной синтаксис для создания боксплота в R —

boxplot(x, data, notch, varwidth, names, main)

Ниже приведено описание используемых параметров:

  • х — это вектор или формула.

  • данные — это фрейм данных.

  • Notch — логическое значение. Установите как TRUE, чтобы нарисовать метку.

  • varwidth является логическим значением. Установите значение true, чтобы нарисовать ширину поля пропорционально размеру выборки.

  • Имена — это групповые ярлыки, которые будут напечатаны под каждым коробочным графиком.

  • main используется, чтобы дать название графику.

х — это вектор или формула.

данные — это фрейм данных.

Notch — логическое значение. Установите как TRUE, чтобы нарисовать метку.

varwidth является логическим значением. Установите значение true, чтобы нарисовать ширину поля пропорционально размеру выборки.

Имена — это групповые ярлыки, которые будут напечатаны под каждым коробочным графиком.

main используется, чтобы дать название графику.

пример

Мы используем набор данных «mtcars», доступный в среде R, чтобы создать базовый блокплот. Давайте посмотрим на столбцы «mpg» и «cyl» в mtcars.

Live Demo

input <- mtcars[,c('mpg','cyl')]
print(head(input))

Когда мы выполняем приведенный выше код, он дает следующий результат —

                   mpg  cyl
Mazda RX4         21.0   6
Mazda RX4 Wag     21.0   6
Datsun 710        22.8   4
Hornet 4 Drive    21.4   6
Hornet Sportabout 18.7   8
Valiant           18.1   6

Создание Boxplot

Приведенный ниже скрипт создаст график коробчатого графика для отношения между миль на галлон (миль на галлон) и цил (количество цилиндров).

Live Demo

# Give the chart file a name.
png(file = "boxplot.png")

# Plot the chart.
boxplot(mpg ~ cyl, data = mtcars, xlab = "Number of Cylinders",
   ylab = "Miles Per Gallon", main = "Mileage Data")

# Save the file.
dev.off()

Когда мы выполняем приведенный выше код, он дает следующий результат —

Box Box с использованием R

Боксплот с надрезом

Мы можем нарисовать прямоугольник с надрезом, чтобы выяснить, как медианы разных групп данных соответствуют друг другу.

Приведенный ниже скрипт создаст график коробчатого графика с надрезом для каждой группы данных.

Live Demo

# Give the chart file a name.
png(file = "boxplot_with_notch.png")

# Plot the chart.
boxplot(mpg ~ cyl, data = mtcars, 
   xlab = "Number of Cylinders",
   ylab = "Miles Per Gallon", 
   main = "Mileage Data",
   notch = TRUE, 
   varwidth = TRUE, 
   col = c("green","yellow","purple"),
   names = c("High","Medium","Low")
)
# Save the file.
dev.off()

Когда мы выполняем приведенный выше код, он дает следующий результат —