Логистическая регрессия — это статистический метод бинарной классификации. В этом уроке вы узнали, как обучить машину использовать логистическую регрессию. При создании моделей машинного обучения наиболее важным требованием является доступность данных. Без адекватных и релевантных данных вы не сможете просто заставить машину учиться.
Когда у вас есть данные, вашей следующей главной задачей будет очистка данных, удаление ненужных строк, полей и выбор соответствующих полей для разработки вашей модели. После того, как это сделано, вам нужно отобразить данные в формат, требуемый классификатором для его обучения. Таким образом, подготовка данных является основной задачей в любом приложении машинного обучения. Когда вы будете готовы с данными, вы можете выбрать определенный тип классификатора.
В этом руководстве вы узнали, как использовать классификатор логистической регрессии, представленный в библиотеке sklearn . Для обучения классификатора мы используем около 70% данных для обучения модели. Мы используем остальные данные для тестирования. Мы проверяем точность модели. Если это не в приемлемых пределах, мы вернемся к выбору нового набора функций.
Еще раз проследите весь процесс подготовки данных, обучите модель и протестируйте ее, пока вы не будете удовлетворены ее точностью. Прежде чем приступить к любому проекту машинного обучения, вы должны изучить и ознакомиться с широким спектром методов, которые были разработаны до настоящего времени и которые успешно применялись в отрасли.