Не требуется, чтобы вы строили классификатор с нуля. Построение классификаторов является сложным и требует знания нескольких областей, таких как статистика, теории вероятностей, методы оптимизации и так далее. На рынке имеется несколько готовых библиотек, которые имеют полностью протестированную и очень эффективную реализацию этих классификаторов. Мы будем использовать одну из таких готовых моделей от sklearn .
Склеарн Классификатор
Создание классификатора логистической регрессии из набора инструментов sklearn тривиально и выполняется одним оператором программы, как показано здесь:
In [22]: classifier = LogisticRegression(solver='lbfgs',random_state=0)
После того, как классификатор создан, вы будете подавать свои тренировочные данные в классификатор, чтобы он мог настраивать свои внутренние параметры и быть готовым к предсказаниям ваших будущих данных. Чтобы настроить классификатор, мы запускаем следующий оператор —
In [23]: classifier.fit(X_train, Y_train)
Классификатор теперь готов к тестированию. Следующий код является результатом выполнения двух вышеприведенных операторов:
Out[23]: LogisticRegression(C = 1.0, class_weight = None, dual = False, fit_intercept=True, intercept_scaling=1, max_iter=100, multi_class='warn', n_jobs=None, penalty='l2', random_state=0, solver='lbfgs', tol=0.0001, verbose=0, warm_start=False))
Теперь мы готовы протестировать созданный классификатор. Мы рассмотрим это в следующей главе.