Остаточный анализ используется для оценки уместности модели линейной регрессии путем определения невязок и изучения графиков остаточных графиков.
остаточный
Остаток (e) относится к разнице между наблюдаемым значением (y) и прогнозным значением ( haty). У каждой точки данных есть один остаток.
residual=наблюдаемоезначение−прогнозируемоезначение[7pt]e=y− haty
residual=наблюдаемоезначение−прогнозируемоезначение[7pt]e=y− haty
Остаточный участок
График остатков — это график, на котором остатки находятся на вертикальной оси, а независимая переменная — на горизонтальной оси. Если точки случайно распределены вокруг горизонтальной оси, то для данных подходит модель линейной регрессии; в противном случае выберите нелинейную модель.
Типы остаточного участка
Следующий пример показывает несколько образцов на остаточных участках.
В первом случае точки распределяются случайным образом. Поэтому модель линейной регрессии является предпочтительной. Во втором и третьем случае точки разнесены не случайным образом, и это говорит о том, что метод нелинейной регрессии является предпочтительным.
пример
Постановка задачи:
Проверьте, подходит ли модель линейной регрессии для следующих данных.
х | 60 | 70 | 80 | 85 | 95 |
---|---|---|---|---|---|
y (фактическая стоимость) | 70 | 65 | 70 | 95 | 85 |
haty (прогнозируемая стоимость) | 65,411 | 71,849 | 78,288 | 81,507 | 87,945 |
Решение:
Шаг 1: Вычислить невязки для каждой точки данных.
х | 60 | 70 | 80 | 85 | 95 |
---|---|---|---|---|---|
y (фактическая стоимость) | 70 | 65 | 70 | 95 | 85 |
haty (прогнозируемая стоимость) | 65,411 | 71,849 | 78,288 | 81,507 | 87,945 |
e (Остаток) | 4,589 | -6,849 | -8,288 | 13,493 | -2,945 |
Шаг 2: — Нарисуйте график остаточного графика.
Шаг 3: — Проверьте случайность остатков.
Здесь график невязки имеет случайный характер: первый остаток является положительным, следующие два — отрицательным, четвертый — положительным, а последний — отрицательным. Поскольку картина довольно случайна, это указывает на то, что модель линейной регрессии подходит для вышеуказанных данных.