Корреляционный анализ имеет дело с отношениями между переменными. Коэффициент корреляции является мерой линейной связи между двумя переменными. Значения коэффициента корреляции всегда находятся между -1 и +1. SAS предоставляет процедуру PROC CORR для нахождения коэффициентов корреляции между парой переменных в наборе данных.
Синтаксис
Основной синтаксис для применения PROC CORR в SAS —
PROC CORR DATA = dataset options; VAR variable;
Ниже приведено описание используемых параметров:
-
Набор данных — это имя набора данных.
-
Опции — это дополнительная опция с такой процедурой, как построение матрицы и т. Д.
-
Переменная — это имя переменной набора данных, используемого для нахождения корреляции.
Набор данных — это имя набора данных.
Опции — это дополнительная опция с такой процедурой, как построение матрицы и т. Д.
Переменная — это имя переменной набора данных, используемого для нахождения корреляции.
пример
Коэффициенты корреляции между парой переменных, доступных в наборе данных, можно получить, используя их имена в выражении VAR. В приведенном ниже примере мы используем набор данных CARS1 и получаем результат, показывающий коэффициенты корреляции между лошадиными силами и весом.
PROC SQL; create table CARS1 as SELECT invoice, horsepower, length, weight FROM SASHELP.CARS WHERE make in ('Audi','BMW') ; RUN; proc corr data = cars1 ; VAR horsepower weight ; BY make; run;
Когда приведенный выше код выполняется, мы получаем следующий результат —
Корреляция между всеми переменными
Коэффициенты корреляции между всеми переменными, доступными в наборе данных, можно получить, просто применив процедуру с именем набора данных.
пример
В приведенном ниже примере мы используем набор данных CARS1 и получаем результат, показывающий коэффициенты корреляции между каждой парой переменных.
proc corr data = cars1 ; run;
Когда приведенный выше код выполняется, мы получаем следующий результат —
Матрица корреляции
Мы можем получить матрицу рассеяния между переменными, выбрав опцию для построения матрицы в операторе PROC .
пример
В приведенном ниже примере мы получаем матрицу между лошадиными силами и весом.
proc corr data = cars1 plots = matrix ; VAR horsepower weight ; run;
Когда приведенный выше код выполняется, мы получаем следующий результат —