Учебники

Временной ряд — Метрики ошибок

Для нас важно количественно оценить производительность модели, чтобы использовать ее в качестве обратной связи и сравнения. В этом уроке мы использовали одну из самых популярных среднеквадратичных ошибок метрики ошибки. Существуют различные другие доступные метрики ошибок. В этой главе они кратко обсуждаются.

Средняя квадратическая ошибка

Это среднее квадрата разницы между прогнозируемыми и истинными значениями. Sklearn предоставляет это как функцию. Он имеет те же единицы, что и квадраты истинных и прогнозируемых значений, и всегда является положительным.

MSE= frac1n displaystyle sum limitnt=1 lgroupytyt rgroup2

Где yt — прогнозируемое значение,

yt — фактическое значение, и

n — общее количество значений в тестовом наборе.

Из уравнения ясно, что MSE более наказуемо за большие ошибки или выбросы.

Средняя квадратическая ошибка

Это квадратный корень среднеквадратичной ошибки. Это также всегда положительно и находится в диапазоне данных.

RMSE= sqrt frac1n displaystyle sum limitnt=1 lgroupytyt rgroup2

Где yt — прогнозируемое значение

yt является фактическим значением, и

n — общее количество значений в тестовом наборе.

Он находится во власти единства и, следовательно, более интерпретируем по сравнению с MSE. RMSE также более наказуемо за большие ошибки. Мы использовали RMSE метрику в нашем уроке.

Средняя абсолютная ошибка

Это среднее абсолютной разницы между прогнозируемыми и истинными значениями. Он имеет те же единицы, что и прогнозируемое и истинное значение, и всегда является положительным.

$$ MAE = \ frac {1} {n} \ displaystyle \ sum \ limit_ {t = 1} ^ {t = n} | у ‘{т} -y_ {т} \ lvert $$

Где yt — прогнозируемое значение,

yt — фактическое значение, и

n — общее количество значений в тестовом наборе.

Средняя процентная ошибка

Это процент средней абсолютной разницы между прогнозируемыми и истинными значениями, деленный на истинное значение.

MAPE= frac1n displaystyle sum limitnt=1 fracytytyt100%

Где yt — прогнозируемое значение,

yt — фактическое значение, а n — общее количество значений в тестовом наборе.

Однако недостатком использования этой ошибки является то, что положительная ошибка и отрицательная ошибка могут компенсировать друг друга. Следовательно, используется абсолютная процентная ошибка.

Средняя абсолютная ошибка в процентах

Это процент средней абсолютной разницы между прогнозируемыми и истинными значениями, деленный на истинное значение.

MAPE= frac1n displaystyle sum limitnt=1 frac|ytyt lvertyt100%

Где yt — прогнозируемое значение

yt является фактическим значением, и

n — общее количество значений в тестовом наборе.