Учебники

SAS — линейная регрессия

Линейная регрессия используется для определения взаимосвязи между зависимой переменной и одной или несколькими независимыми переменными. Предлагается модель взаимосвязи, и оценки значений параметров используются для разработки оценочного уравнения регрессии.

Затем используются различные тесты, чтобы определить, является ли модель удовлетворительной. Если это так, оцененное уравнение регрессии может использоваться для прогнозирования значения зависимой переменной с учетом значений для независимых переменных. В SAS процедура PROC REG используется для нахождения модели линейной регрессии между двумя переменными.

Синтаксис

Основной синтаксис для применения PROC REG в SAS —

PROC REG DATA = dataset;
MODEL variable_1 = variable_2;

Ниже приведено описание используемых параметров:

  • Набор данных — это имя набора данных.

  • variable_1 и variable_2 являются именами переменных набора данных, используемого при поиске корреляции.

Набор данных — это имя набора данных.

variable_1 и variable_2 являются именами переменных набора данных, используемого при поиске корреляции.

пример

В приведенном ниже примере показан процесс поиска корреляции между двумя переменными лошадиными силами и весом автомобиля с помощью PROC REG. В результате мы видим значения перехвата, которые можно использовать для формирования уравнения регрессии.

PROC SQL;
create table CARS1 as
SELECT invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;
proc reg data = cars1;
model horsepower = weight ;
run;

Когда приведенный выше код выполняется, мы получаем следующий результат —

regression_1

Приведенный выше код также дает графическое представление различных оценок модели, как показано ниже. Будучи продвинутой процедурой SAS, она просто не останавливается на выдаче значений перехвата в качестве вывода.