Программирование SAS включает в себя сначала создание / чтение наборов данных в память, а затем выполнение анализа этих данных. Нам нужно понять поток, в котором написана программа, чтобы достичь этого.
Структура программы SAS
На приведенной ниже схеме показаны шаги, которые должны быть записаны в данной последовательности для создания программы SAS.
Каждая программа SAS должна иметь все эти шаги для завершения чтения входных данных, анализа данных и выдачи результатов анализа. Также оператор RUN в конце каждого шага необходим для завершения выполнения этого шага.
Шаг данных
Этот шаг включает в себя загрузку необходимого набора данных в память SAS и определение переменных (также называемых столбцами) набора данных. Он также фиксирует записи (также называемые наблюдениями или объектами). Синтаксис для оператора DATA такой, как показано ниже.
Синтаксис
DATA data_set_name; #Name the data set. INPUT var1,var2,var3; #Define the variables in this data set. NEW_VAR; #Create new variables. LABEL; #Assign labels to variables. DATALINES; #Enter the data. RUN;
пример
В приведенном ниже примере показан простой случай именования набора данных, определения переменных, создания новых переменных и ввода данных. Здесь строковые переменные имеют $ в конце, а числовые значения без него.
DATA TEMP; INPUT ID $ NAME $ SALARY DEPARTMENT $; comm = SALARY*0.25; LABEL ID = 'Employee ID' comm = 'COMMISION'; DATALINES; 1 Rick 623.3 IT 2 Dan 515.2 Operations 3 Michelle 611 IT 4 Ryan 729 HR 5 Gary 843.25 Finance 6 Nina 578 IT 7 Simon 632.8 Operations 8 Guru 722.5 Finance ; RUN;
PROC Step
Этот шаг включает в себя вызов встроенной процедуры SAS для анализа данных.
Синтаксис
PROC procedure_name options; #The name of the proc. RUN;
пример
В приведенном ниже примере показано использование процедуры MEANS для печати средних значений числовых переменных в наборе данных.
PROC MEANS; RUN;
Шаг ВЫХОДА
Данные из наборов данных могут отображаться с помощью условных операторов вывода.
Синтаксис
PROC PRINT DATA = data_set; OPTIONS; RUN;
пример
В приведенном ниже примере показано использование выражения where в выходных данных для создания только нескольких записей из набора данных.
PROC PRINT DATA = TEMP; WHERE SALARY > 700; RUN;
Полная программа SAS
Ниже приведен полный код для каждого из вышеуказанных шагов.