Учебники

SAS — корреляционный анализ

Корреляционный анализ имеет дело с отношениями между переменными. Коэффициент корреляции является мерой линейной связи между двумя переменными. Значения коэффициента корреляции всегда находятся между -1 и +1. SAS предоставляет процедуру PROC CORR для нахождения коэффициентов корреляции между парой переменных в наборе данных.

Синтаксис

Основной синтаксис для применения PROC CORR в SAS —

PROC CORR DATA = dataset options;
VAR variable;

Ниже приведено описание используемых параметров:

  • Набор данных — это имя набора данных.

  • Опции — это дополнительная опция с такой процедурой, как построение матрицы и т. Д.

  • Переменная — это имя переменной набора данных, используемого для нахождения корреляции.

Набор данных — это имя набора данных.

Опции — это дополнительная опция с такой процедурой, как построение матрицы и т. Д.

Переменная — это имя переменной набора данных, используемого для нахождения корреляции.

пример

Коэффициенты корреляции между парой переменных, доступных в наборе данных, можно получить, используя их имена в выражении VAR. В приведенном ниже примере мы используем набор данных CARS1 и получаем результат, показывающий коэффициенты корреляции между лошадиными силами и весом.

PROC SQL;
create table CARS1 as
SELECT invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

proc corr data = cars1 ;
VAR horsepower weight ;
BY make;
run;

Когда приведенный выше код выполняется, мы получаем следующий результат —

corr_ana_2

Корреляция между всеми переменными

Коэффициенты корреляции между всеми переменными, доступными в наборе данных, можно получить, просто применив процедуру с именем набора данных.

пример

В приведенном ниже примере мы используем набор данных CARS1 и получаем результат, показывающий коэффициенты корреляции между каждой парой переменных.

proc corr data = cars1 ;
run;

Когда приведенный выше код выполняется, мы получаем следующий результат —

corr_ana_1

Матрица корреляции

Мы можем получить матрицу рассеяния между переменными, выбрав опцию для построения матрицы в операторе PROC .

пример

В приведенном ниже примере мы получаем матрицу между лошадиными силами и весом.

proc corr data = cars1 plots = matrix ;
VAR horsepower weight ;
run;

Когда приведенный выше код выполняется, мы получаем следующий результат —