Учебники

Статистика — Линейная регрессия

После того, как степень взаимосвязи между переменными была установлена ​​с использованием анализа взаимосвязи, естественно, углубиться в природу взаимосвязи. Регрессионный анализ помогает определить причинно-следственную связь между переменными. Можно предсказать значение других переменных (называемых зависимой переменной), если значения независимых переменных можно предсказать с помощью графического метода или алгебраического метода.

Графический метод

Он включает в себя построение диаграммы рассеяния с независимой переменной на оси X и зависимой переменной на оси Y. После этого линия рисуется таким образом, что она проходит через большую часть распределения, а оставшиеся точки распределены почти равномерно по обе стороны от линии.

Линия регрессии известна как линия наилучшего соответствия, которая суммирует общее движение данных. Он показывает наилучшие средние значения одной переменной, соответствующие средним значениям другой. Линия регрессии основана на критериях того, что это прямая линия, которая минимизирует сумму квадратов отклонений между прогнозируемыми и наблюдаемыми значениями зависимой переменной.

Алгебраический метод

Алгебраический метод строит два уравнения регрессии X на Y и Y на X.

Уравнение регрессии Y на X

Y=a+bX

Y=a+bX

Где —

  • Y = Зависимая переменная

  • X = Независимая переменная

  • a = Константа, показывающая Y-перехват

  • b = Константа, показывающая наклон линии

Y = Зависимая переменная

X = Независимая переменная

a = Константа, показывающая Y-перехват

b = Константа, показывающая наклон линии

Значения a и b получают с помощью следующих нормальных уравнений:

 sumY=Na+b sumX[7pt] sumXY=a sumX+b sumX2

 sumY=Na+b sumX[7pt] sumXY=a sumX+b sumX2

Где —

  • N = Количество наблюдений

N = Количество наблюдений

Уравнение регрессии X на Y

X=a+bY

X=a+bY

Где —

  • X = Зависимая переменная

  • Y = Независимая переменная

  • a = Константа, показывающая Y-перехват

  • b = Константа, показывающая наклон линии

X = Зависимая переменная

Y = Независимая переменная

a = Константа, показывающая Y-перехват

b = Константа, показывающая наклон линии

Значения a и b получают с помощью следующих нормальных уравнений:

 sumX=Na+b sumY[7pt] sumXY=a sumY+b sumY2

 sumX=Na+b sumY[7pt] sumXY=a sumY+b sumY2

Где —

  • N = Количество наблюдений

N = Количество наблюдений

пример

Постановка задачи:

Исследователь обнаружил, что существует взаимосвязь между весовыми тенденциями отца и сына. В настоящее время он заинтересован в разработке уравнения регрессии по двум переменным по приведенным данным:

Вес отца (в кг) 69 63 66 64 67 64 70 66 68 67 65 71
Вес сына (в кг) 70 65 68 65 69 66 68 65 71 67 64 72

развивать

  1. Уравнение регрессии Y на X.

  2. Уравнение регрессии по Y.

Уравнение регрессии Y на X.

Уравнение регрессии по Y.

Решение:

X X2 Y Y2 XY
69 4761 70 4900 4830
63 3969 65 4225 4095
66 4356 68 4624 4488
64 4096 65 4225 4160
67 4489 69 4761 4623
64 4096 66 4356 4224
70 4900 68 4624 4760
66 4356 65 4225 4290
68 4624 71 5041 4828
67 4489 67 4489 4489
65 4225 64 4096 4160
71 5041 72 5184 5112
 sumX=800  sumX2=53,402  sumY=810  sumY2=54750  sumXY=54,059

Уравнение регрессии Y на X

Y = a + bX

Где a и b получены нормальными уравнениями

 sumY=Na+b sumX[7pt] sumXY=a sumX+b sumX2[7pt]Где  sumY=810, sumX=800, sumX2=53,402[7pt], sumXY=54,049,N=12

 Rightarrow 810 = 12a + 800b … (i)

 Rightarrow 54049 = 800a + 53402 b … (ii)

 Rightarrow 810 = 12a + 800b … (i)

 Rightarrow 54049 = 800a + 53402 b … (ii)

Умножив уравнение (i) на 800 и уравнение (ii) на 12, получим:

96000 a + 640000 b = 648000 … (iii)

96000 + 640824 b = 648588 … (iv)

96000 a + 640000 b = 648000 … (iii)

96000 + 640824 b = 648588 … (iv)

Вычитая уравнение (iv) из (iii)

-824 b = -588

 Rightarrow b = -.0713

-824 b = -588

 Rightarrow b = -.0713

Подставляя значение b в уравнение (я)

810 = 12a + 800 (-0,713)

810 = 12а + 570,4

12а = 239,6

 Rightarrow a = 19,96

810 = 12a + 800 (-0,713)

810 = 12а + 570,4

12а = 239,6

 Rightarrow a = 19,96

Следовательно, уравнение Y на X можно записать в виде

Y=19,960,713X

Уравнение регрессии Y на X

X = a + bY

Где a и b получены нормальными уравнениями

 sumX=Na+b sumY[7pt] sumXY=a sumY+b sumY2[7pt]Где  sumY=810, sumY2=54750[7pt], sumXY=54,049,N=12

 Rightarrow 800 = 12a + 810a + 810b … (V)

 Rightarrow 54 049 = 810a + 54 750 … (vi)

 Rightarrow 800 = 12a + 810a + 810b … (V)

 Rightarrow 54 049 = 810a + 54 750 … (vi)

Умножив eq (v) на 810 и eq (vi) на 12, получим

9720 a + 656100 b = 648000 … (vii)

9720 + 65700 b = 648588 … (viii)

9720 a + 656100 b = 648000 … (vii)

9720 + 65700 b = 648588 … (viii)

Вычитание из формулы из уравнения

900b = -588

 Rightarrow b = 0,653

900b = -588

 Rightarrow b = 0,653

Подставляя значение b в уравнение (v)

800 = 12а + 810 (0,653)

12а = 271,07

 Rightarrow a = 22,58

800 = 12а + 810 (0,653)

12а = 271,07

 Rightarrow a = 22,58

Следовательно, уравнение регрессии X и Y