Учебники

SAS — Коробочные участки

Boxplot — графическое представление групп числовых данных через их квартили. Коробчатые участки также могут иметь линии, проходящие вертикально от прямоугольников (усов), указывающих на изменчивость за пределами верхнего и нижнего квартилей. Дно и верх коробки всегда являются первым и третьим квартилями, а полоса внутри коробки — всегда вторым квартилем (медиана). В SAS простой Boxplot создается с помощью PROC SGPLOT, а панельный boxplot создается с помощью PROC SGPANEL .

Обратите внимание, что мы создаем набор данных с именем CARS1 в первом примере и используем тот же набор данных для всех последующих наборов данных. Этот набор данных остается в рабочей библиотеке до конца сеанса SAS.

Синтаксис

Основной синтаксис для создания боксплота в SAS —

PROC SGPLOT  DATA = DATASET;
   VBOX VARIABLE / category = VARIABLE;
RUN; 

PROC SGPANEL  DATA = DATASET;;
PANELBY VARIABLE;
   VBOX VARIABLE> / category = VARIABLE;
RUN; 

Ниже приведено описание используемых параметров:

  • DATASET — это имя используемого набора данных.

  • VARIABLE — это значение, используемое для построения Boxplot.

DATASET — это имя используемого набора данных.

VARIABLE — это значение, используемое для построения Boxplot.

Простой боксплот

В простом Boxplot мы выбираем одну переменную из набора данных, а другую — для формирования категории. Значения первой переменной классифицируются по количеству групп по числу различных значений во второй переменной.

пример

В приведенном ниже примере мы выбираем переменную мощность в качестве первой переменной и вводим в качестве переменной категории. Таким образом, мы получаем боксы для распределения значений лошадиных сил для каждого типа автомобиля.

PROC SQL;
create table CARS1 as
SELECT make, model, type, invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

PROC SGPLOT  DATA = CARS1;
   VBOX horsepower 
   / category = type;

   title 'Horsepower of cars by types';
RUN; 

Когда мы выполняем приведенный выше код, мы получаем следующий вывод:

box_plot_1

Boxplot в вертикальных панелях

Мы можем разделить Boxplots переменной на множество вертикальных панелей (столбцов). Каждая панель содержит поля для всех категориальных переменных. Но блокпосты далее группируются с использованием другой третьей переменной, которая делит график на несколько панелей.

пример

В приведенном ниже примере мы обрисовали график с помощью переменной ‘make’. Так как есть два разных значения make, мы получаем две вертикальные панели.

PROC SGPANEL  DATA = CARS1;
PANELBY MAKE;
   VBOX horsepower   / category = type;

   title 'Horsepower of cars by types';
RUN; 

Когда мы выполняем приведенный выше код, мы получаем следующий вывод:

box_plot_2

Boxplot в горизонтальных панелях

Мы можем разделить Boxplots переменной на множество горизонтальных панелей (рядов). Каждая панель содержит поля для всех категориальных переменных. Но блокпосты далее группируются с использованием другой третьей переменной, которая делит график на несколько панелей. В приведенном ниже примере мы обрисовали график с помощью переменной ‘make’. Поскольку есть два разных значения make, мы получаем две горизонтальные панели.

PROC SGPANEL  DATA = CARS1;
PANELBY MAKE / columns = 1 novarname;

   VBOX horsepower   / category = type;

   title 'Horsepower of cars by types';
RUN; 

Когда мы выполняем приведенный выше код, мы получаем следующий вывод: