Boxplot — графическое представление групп числовых данных через их квартили. Коробчатые участки также могут иметь линии, проходящие вертикально от прямоугольников (усов), указывающих на изменчивость за пределами верхнего и нижнего квартилей. Дно и верх коробки всегда являются первым и третьим квартилями, а полоса внутри коробки — всегда вторым квартилем (медиана). В SAS простой Boxplot создается с помощью PROC SGPLOT, а панельный boxplot создается с помощью PROC SGPANEL .
Обратите внимание, что мы создаем набор данных с именем CARS1 в первом примере и используем тот же набор данных для всех последующих наборов данных. Этот набор данных остается в рабочей библиотеке до конца сеанса SAS.
Синтаксис
Основной синтаксис для создания боксплота в SAS —
PROC SGPLOT DATA = DATASET; VBOX VARIABLE / category = VARIABLE; RUN; PROC SGPANEL DATA = DATASET;; PANELBY VARIABLE; VBOX VARIABLE> / category = VARIABLE; RUN;Ниже приведено описание используемых параметров:
-
DATASET — это имя используемого набора данных.
-
VARIABLE — это значение, используемое для построения Boxplot.
DATASET — это имя используемого набора данных.
VARIABLE — это значение, используемое для построения Boxplot.
Простой боксплот
В простом Boxplot мы выбираем одну переменную из набора данных, а другую — для формирования категории. Значения первой переменной классифицируются по количеству групп по числу различных значений во второй переменной.
пример
В приведенном ниже примере мы выбираем переменную мощность в качестве первой переменной и вводим в качестве переменной категории. Таким образом, мы получаем боксы для распределения значений лошадиных сил для каждого типа автомобиля.
PROC SQL; create table CARS1 as SELECT make, model, type, invoice, horsepower, length, weight FROM SASHELP.CARS WHERE make in ('Audi','BMW') ; RUN; PROC SGPLOT DATA = CARS1; VBOX horsepower / category = type; title 'Horsepower of cars by types'; RUN;
Когда мы выполняем приведенный выше код, мы получаем следующий вывод:
Boxplot в вертикальных панелях
Мы можем разделить Boxplots переменной на множество вертикальных панелей (столбцов). Каждая панель содержит поля для всех категориальных переменных. Но блокпосты далее группируются с использованием другой третьей переменной, которая делит график на несколько панелей.
пример
В приведенном ниже примере мы обрисовали график с помощью переменной ‘make’. Так как есть два разных значения make, мы получаем две вертикальные панели.
PROC SGPANEL DATA = CARS1; PANELBY MAKE; VBOX horsepower / category = type; title 'Horsepower of cars by types'; RUN;
Когда мы выполняем приведенный выше код, мы получаем следующий вывод:
Boxplot в горизонтальных панелях
Мы можем разделить Boxplots переменной на множество горизонтальных панелей (рядов). Каждая панель содержит поля для всех категориальных переменных. Но блокпосты далее группируются с использованием другой третьей переменной, которая делит график на несколько панелей. В приведенном ниже примере мы обрисовали график с помощью переменной ‘make’. Поскольку есть два разных значения make, мы получаем две горизонтальные панели.
PROC SGPANEL DATA = CARS1; PANELBY MAKE / columns = 1 novarname; VBOX horsepower / category = type; title 'Horsepower of cars by types'; RUN;
Когда мы выполняем приведенный выше код, мы получаем следующий вывод: