R-квадрат измеряет долю вариации в вашей зависимой переменной (Y), которая объясняется вашими независимыми переменными (X) для модели линейной регрессии. Скорректированный R-квадрат корректирует статистику на основе количества независимых переменных в модели. R2 показывает, насколько хорошо слагаемые (точки данных) соответствуют кривой или линии. Скорректированный R2 также показывает, насколько хорошо термины соответствуют кривой или линии, но корректирует количество терминов в модели. Если вы добавляете в модель все больше и больше бесполезных переменных, скорректированный r-квадрат уменьшится. Если вы добавите больше полезных переменных, скорректированный r-квадрат увеличится.
Скорректированный R2adj всегда будет меньше или равен R2. Вам нужно только R2 при работе с образцами. Другими словами, R2 не требуется, если у вас есть данные от всего населения.
формула
R2adj=1−[ frac(1−R2)(n−1)nk−1]
R2adj=1−[ frac(1−R2)(n−1)nk−1]
Где —
-
n = количество точек в вашей выборке данных.
-
k = количество независимых регрессоров, то есть количество переменных в вашей модели, исключая константу.
n = количество точек в вашей выборке данных.
k = количество независимых регрессоров, то есть количество переменных в вашей модели, исключая константу.
пример
Постановка задачи:
Фонд имеет значение R-квадрата выборки, близкое к 0,5, и, несомненно, предлагает более высокий доход, скорректированный с учетом риска, с размером выборки 50 для 5 предикторов. Найти скорректированное значение R квадрат.
Решение:
Размер выборки = 50 Количество предикторов = 5 Выборка R — квадрат = 0,5. Подставим качества в уравнение,