Учебники

SAS — Структура программы

Программирование SAS включает в себя сначала создание / чтение наборов данных в память, а затем выполнение анализа этих данных. Нам нужно понять поток, в котором написана программа, чтобы достичь этого.

Структура программы SAS

На приведенной ниже схеме показаны шаги, которые должны быть записаны в данной последовательности для создания программы SAS.

ps_flow_1

Каждая программа SAS должна иметь все эти шаги для завершения чтения входных данных, анализа данных и выдачи результатов анализа. Также оператор RUN в конце каждого шага необходим для завершения выполнения этого шага.

Шаг данных

Этот шаг включает в себя загрузку необходимого набора данных в память SAS и определение переменных (также называемых столбцами) набора данных. Он также фиксирует записи (также называемые наблюдениями или объектами). Синтаксис для оператора DATA такой, как показано ниже.

Синтаксис

DATA data_set_name;		#Name the data set.
INPUT var1,var2,var3; 		#Define the variables in this data set.
NEW_VAR;			#Create new variables.
LABEL;			      	#Assign labels to variables.
DATALINES;		      	#Enter the data.
RUN;

пример

В приведенном ниже примере показан простой случай именования набора данных, определения переменных, создания новых переменных и ввода данных. Здесь строковые переменные имеют $ в конце, а числовые значения без него.

DATA TEMP;
INPUT ID $ NAME $ SALARY DEPARTMENT $;
comm = SALARY*0.25;
LABEL ID = 'Employee ID' comm = 'COMMISION';
DATALINES;
1 Rick 623.3 IT
2 Dan 515.2 Operations
3 Michelle 611 IT
4 Ryan 729 HR
5 Gary 843.25 Finance
6 Nina 578 IT
7 Simon 632.8 Operations
8 Guru 722.5 Finance
;
RUN;

PROC Step

Этот шаг включает в себя вызов встроенной процедуры SAS для анализа данных.

Синтаксис

PROC procedure_name options; #The name of the proc.
RUN;

пример

В приведенном ниже примере показано использование процедуры MEANS для печати средних значений числовых переменных в наборе данных.

PROC MEANS;
RUN;

Шаг ВЫХОДА

Данные из наборов данных могут отображаться с помощью условных операторов вывода.

Синтаксис

PROC PRINT DATA = data_set;
OPTIONS;
RUN;

пример

В приведенном ниже примере показано использование выражения where в выходных данных для создания только нескольких записей из набора данных.

PROC PRINT DATA = TEMP;
WHERE SALARY > 700;
RUN;

Полная программа SAS

Ниже приведен полный код для каждого из вышеуказанных шагов.

ps_complete_code

Выход программы

Вывод кода выше виден на вкладке РЕЗУЛЬТАТЫ .