Учебники

Статистика — Остаточный анализ

Остаточный анализ используется для оценки уместности модели линейной регрессии путем определения невязок и изучения графиков остаточных графиков.

остаточный

Остаток (e) относится к разнице между наблюдаемым значением (y) и прогнозным значением ( haty). У каждой точки данных есть один остаток.

residual=наблюдаемоезначениепрогнозируемоезначение[7pt]e=y haty

residual=наблюдаемоезначениепрогнозируемоезначение[7pt]e=y haty

Остаточный участок

График остатков — это график, на котором остатки находятся на вертикальной оси, а независимая переменная — на горизонтальной оси. Если точки случайно распределены вокруг горизонтальной оси, то для данных подходит модель линейной регрессии; в противном случае выберите нелинейную модель.

Типы остаточного участка

Следующий пример показывает несколько образцов на остаточных участках.

Остаточные участки

В первом случае точки распределяются случайным образом. Поэтому модель линейной регрессии является предпочтительной. Во втором и третьем случае точки разнесены не случайным образом, и это говорит о том, что метод нелинейной регрессии является предпочтительным.

пример

Постановка задачи:

Проверьте, подходит ли модель линейной регрессии для следующих данных.

х 60 70 80 85 95
y (фактическая стоимость) 70 65 70 95 85
 haty (прогнозируемая стоимость) 65,411 71,849 78,288 81,507 87,945

Решение:

Шаг 1: Вычислить невязки для каждой точки данных.

х 60 70 80 85 95
y (фактическая стоимость) 70 65 70 95 85
 haty (прогнозируемая стоимость) 65,411 71,849 78,288 81,507 87,945
e (Остаток) 4,589 -6,849 -8,288 13,493 -2,945

Шаг 2: — Нарисуйте график остаточного графика.

Остаточный участок

Шаг 3: — Проверьте случайность остатков.

Здесь график невязки имеет случайный характер: первый остаток является положительным, следующие два — отрицательным, четвертый — положительным, а последний — отрицательным. Поскольку картина довольно случайна, это указывает на то, что модель линейной регрессии подходит для вышеуказанных данных.