Учебники

Аналитика больших данных — логистическая регрессия

Логистическая регрессия — это классификационная модель, в которой переменная ответа является категориальной. Этот алгоритм основан на статистике и используется для контролируемых задач классификации. В логистической регрессии мы стремимся найти вектор β параметров в следующем уравнении, которое минимизирует функцию стоимости.

logit(pi)=ln left( fracpi1pi right)= beta0+ beta1x1,i+...+ betakxk,i

Следующий код демонстрирует, как вписать модель логистической регрессии в R. Мы будем использовать здесь набор данных спама, чтобы продемонстрировать логистическую регрессию, ту же, что была использована для Наивного Байеса.

Исходя из результатов прогнозов с точки зрения точности, мы находим, что регрессионная модель достигает 92,5% точности в тестовом наборе по сравнению с 72%, достигнутыми классификатором Наивного Байеса.