Учебники

Алгоритмы регрессии — линейная регрессия

Линейная регрессия может быть определена как статистическая модель, которая анализирует линейные отношения между зависимой переменной с заданным набором независимых переменных. Линейная связь между переменными означает, что когда значение одной или нескольких независимых переменных будет изменяться (увеличиваться или уменьшаться), значение зависимой переменной также будет изменяться соответственно (увеличиваться или уменьшаться).

Математически связь может быть представлена ​​с помощью следующего уравнения —

Y= МХ+Ь

Здесь Y — это зависимая переменная, которую мы пытаемся предсказать.

X — это зависимая переменная, которую мы используем для прогнозирования.

m — наклон линии регрессии, который представляет влияние X на Y

b является константой, известной как ?Y-перехват. Если X = 0, Y будет равен ?b.

Кроме того, линейные отношения могут быть положительными или отрицательными по природе, как объяснено ниже —

Положительные Линейные Отношения

Линейные отношения будут называться положительными, если возрастает как независимая, так и зависимая переменная. Это можно понять с помощью следующего графика —

Положительные Линейные Отношения

Отрицательные линейные отношения

Линейные отношения будут называться положительными, если независимые возрастают, а зависимые переменные уменьшаются. Это можно понять с помощью следующего графика —

Отрицательные линейные отношения

Типы линейной регрессии

Линейная регрессия бывает следующих двух типов:

Простая линейная регрессия

Множественная линейная регрессия

Предположения

Ниже приведены некоторые предположения о наборе данных, которые сделаны моделью линейной регрессии.

Мультиколлинеарность. Модель линейной регрессии предполагает, что мультиколлинеарность данных очень мала или отсутствует. По сути, мультиколлинеарность возникает, когда независимые переменные или свойства имеют зависимость от них.

Автокорреляция. Другое допущение, которое предполагает модель линейной регрессии, заключается в том, что в данных очень мало или вообще нет автокорреляции. По сути, автокорреляция происходит, когда существует зависимость между остаточными ошибками.

Взаимосвязь между переменными. Модель линейной регрессии предполагает, что взаимосвязь между откликом и характеристическими переменными должна быть линейной.