Для нас важно количественно оценить производительность модели, чтобы использовать ее в качестве обратной связи и сравнения. В этом уроке мы использовали одну из самых популярных среднеквадратичных ошибок метрики ошибки. Существуют различные другие доступные метрики ошибок. В этой главе они кратко обсуждаются.
Средняя квадратическая ошибка
Это среднее квадрата разницы между прогнозируемыми и истинными значениями. Sklearn предоставляет это как функцию. Он имеет те же единицы, что и квадраты истинных и прогнозируемых значений, и всегда является положительным.
MSE= frac1n displaystyle sum limitnt=1 lgroupy′t−yt rgroup2
Где y′t — прогнозируемое значение,
yt — фактическое значение, и
n — общее количество значений в тестовом наборе.
Из уравнения ясно, что MSE более наказуемо за большие ошибки или выбросы.
Средняя квадратическая ошибка
Это квадратный корень среднеквадратичной ошибки. Это также всегда положительно и находится в диапазоне данных.
RMSE= sqrt frac1n displaystyle sum limitnt=1 lgroupy′t−yt rgroup2
Где y′t — прогнозируемое значение
yt является фактическим значением, и
n — общее количество значений в тестовом наборе.
Он находится во власти единства и, следовательно, более интерпретируем по сравнению с MSE. RMSE также более наказуемо за большие ошибки. Мы использовали RMSE метрику в нашем уроке.
Средняя абсолютная ошибка
Это среднее абсолютной разницы между прогнозируемыми и истинными значениями. Он имеет те же единицы, что и прогнозируемое и истинное значение, и всегда является положительным.
$$ MAE = \ frac {1} {n} \ displaystyle \ sum \ limit_ {t = 1} ^ {t = n} | у ‘{т} -y_ {т} \ lvert $$
Где y′t — прогнозируемое значение,
yt — фактическое значение, и
n — общее количество значений в тестовом наборе.
Средняя процентная ошибка
Это процент средней абсолютной разницы между прогнозируемыми и истинными значениями, деленный на истинное значение.
MAPE= frac1n displaystyle sum limitnt=1 fracy′t−ytyt∗100%
Где y′t — прогнозируемое значение,
yt — фактическое значение, а n — общее количество значений в тестовом наборе.
Однако недостатком использования этой ошибки является то, что положительная ошибка и отрицательная ошибка могут компенсировать друг друга. Следовательно, используется абсолютная процентная ошибка.
Средняя абсолютная ошибка в процентах
Это процент средней абсолютной разницы между прогнозируемыми и истинными значениями, деленный на истинное значение.
MAPE= frac1n displaystyle sum limitnt=1 frac|y′t−yt lvertyt∗100%
Где y′t — прогнозируемое значение
yt является фактическим значением, и
n — общее количество значений в тестовом наборе.