7) контролируемое против неконтролируемого обучения

Что такое контролируемое машинное обучение?

При обучении под наблюдением вы обучаете машину, используя данные, которые хорошо «помечены ». Это означает, что некоторые данные уже помечены с правильным ответом. Это можно сравнить с обучением, которое происходит в присутствии руководителя или учителя.

Алгоритм контролируемого обучения учится на помеченных данных обучения, помогает вам прогнозировать результаты непредвиденных данных. Успешное построение, масштабирование и развертывание точного контролируемого машинного обучения Модель науки о данных требует времени и технических знаний от команды высококвалифицированных специалистов по обработке данных. Более того, специалист по обработке данных должен перестроить модели, чтобы убедиться, что предоставленная информация остается верной, пока ее данные не изменятся.

В этом уроке вы узнаете

Что такое контролируемое машинное обучение?
Что такое обучение без учителя?
Почему контролируемое обучение?
Почему неконтролируемое обучение?
Как работает контролируемое обучение?
Как работает обучение без учителя?
Типы контролируемых методов машинного обучения
Типы неконтролируемых методов машинного обучения
Обучение под присмотром против обучения без присмотра

Что такое обучение без учителя?

Обучение без учителя — это метод машинного обучения, при котором вам не нужно контролировать модель. Вместо этого вам нужно позволить модели работать самостоятельно для обнаружения информации. В основном это касается немаркированных данных.

Необученные алгоритмы обучения позволяют выполнять более сложные задачи обработки по сравнению с контролируемым обучением. Хотя неконтролируемое обучение может быть более непредсказуемым по сравнению с другими методами естественного обучения, основанными на глубоком и усиленном обучении.

Почему контролируемое обучение?

Контролируемое обучение позволяет собирать данные или производить вывод данных из предыдущего опыта.
Помогает оптимизировать критерии производительности, используя опыт
Управляемое машинное обучение помогает вам решать различные типы реальных вычислительных задач.

Почему неконтролируемое обучение?

Вот основные причины использования неконтролируемого обучения:

Неуправляемое машинное обучение находит в данных все виды неизвестных закономерностей.
Неуправляемые методы помогут вам найти функции, которые могут быть полезны для категоризации.
Это происходит в режиме реального времени, поэтому все входные данные должны быть проанализированы и помечены в присутствии учащихся.
Получать немаркированные данные с компьютера легче, чем помечать данные, что требует ручного вмешательства.

Как работает контролируемое обучение?

Например, вы хотите обучить машину, которая поможет вам предсказать, сколько времени вам потребуется, чтобы отвезти вас домой с работы. Здесь вы начинаете с создания набора помеченных данных. Эти данные включают

Погодные условия
Время суток
каникулы

Все эти детали ваши входные данные. Вывод — это количество времени, которое потребовалось, чтобы вернуться домой в тот день.

Вы инстинктивно знаете, что если на улице идет дождь, то вам потребуется больше времени, чтобы доехать до дома. Но машине нужны данные и статистика.

Давайте теперь посмотрим, как вы можете разработать контролируемую модель обучения этого примера, которая поможет пользователю определить время в пути. Первое, что вам нужно создать, — это набор данных тренировки. Этот тренировочный набор будет содержать общее время в пути и соответствующие факторы, такие как погода, время и т. Д. На основе этого тренировочного набора ваша машина может видеть прямую зависимость между количеством дождя и временем, которое вы потратите, чтобы добраться домой.

Таким образом, выясняется, что чем больше идет дождь, тем дольше вы будете ехать, чтобы вернуться в свой дом. Также может быть видна связь между временем, когда вы уходите с работы, и временем, когда вы будете в дороге.

Чем ближе вы к 6 вечера, тем дольше вы добираетесь домой. Ваша машина может найти некоторые связи с вашими помеченными данными.

Это начало вашей модели данных. Это начинает влиять на то, как дождь влияет на то, как люди ездят. Это также начинает видеть, что больше людей путешествует в течение определенного времени дня.

Как работает обучение без учителя?

Давайте возьмем случай ребенка и ее семейной собаки.

Она знает и идентифицирует эту собаку. Через несколько недель друг семьи берет с собой собаку и пытается поиграть с ребенком.

Малыш не видел эту собаку ранее. Но он признает, что многие черты (2 уха, глаза, ходьба на 4 ногах) похожи на ее собаку. Она идентифицирует новое животное, как собака. Это неконтролируемое обучение, когда вас не учат, но вы учитесь на основе данных (в данном случае данных о собаке). Если бы это было обучение под наблюдением, друг семьи сказал бы ребенку, что это собака.

Типы контролируемых методов машинного обучения

Регресс:

Техника регрессии предсказывает одно выходное значение, используя данные обучения.

Пример: вы можете использовать регрессию, чтобы предсказать цену дома по данным обучения. Входными переменными будут местность, размер дома и т. Д.

Классификация:

Классификация означает группирование вывода внутри класса. Если алгоритм пытается пометить входные данные в двух разных классах, это называется двоичной классификацией. Выбор между более чем двумя классами называется мультиклассовой классификацией.

Пример : определение того, будет ли кто-либо неплательщиком кредита.

Сильные стороны : выходы всегда имеют вероятностную интерпретацию, и алгоритм может быть упорядочен, чтобы избежать переобучения.

Слабые стороны : логистическая регрессия может быть неэффективной при наличии множественных или нелинейных границ принятия решений. Этот метод не гибкий, поэтому он не охватывает более сложные отношения.

Типы неконтролируемых методов машинного обучения

Необученные проблемы обучения далее сгруппированы в проблемы кластеризации и ассоциации.

Кластеризация

Кластеризация является важной концепцией, когда речь идет об обучении без учителя. В основном это касается поиска структуры или шаблона в коллекции некатегоризованных данных. Алгоритмы кластеризации будут обрабатывать ваши данные и находить естественные кластеры (группы), если они существуют в данных. Вы также можете изменить количество кластеров, которые должны идентифицировать ваши алгоритмы. Это позволяет настроить гранулярность этих групп.

ассоциация

Правила ассоциации позволяют устанавливать ассоциации между объектами данных в больших базах данных. Эта неконтролируемая техника предназначена для обнаружения захватывающих отношений между переменными в больших базах данных. Например, люди, которые покупают новый дом, чаще всего покупают новую мебель.

Другие примеры:

Подгруппа больных раком, сгруппированных по измерениям экспрессии генов
Группы покупателей, основанные на их истории просмотров и покупок
Фильм группы по рейтингу зрителей

Обучение под присмотром против обучения без присмотра

параметры	Контролируемая техника машинного обучения	Техника машинного обучения без присмотра
Обработать	В контролируемой модели обучения будут указаны входные и выходные переменные.	В модели обучения без учителя будут предоставляться только входные данные
Входные данные	Алгоритмы обучаются с использованием помеченных данных.	Алгоритмы используются против данных, которые не помечены
Используемые алгоритмы	Машина опорных векторов, нейронная сеть, линейная регрессия и логистика, случайный лес и деревья классификации.	Необслуживаемые алгоритмы можно разделить на разные категории: например, кластерные алгоритмы, K-средства, иерархическая кластеризация и т. Д.
Вычислительная сложность	Контролируемое обучение является более простым методом.	Неуправляемое обучение является вычислительно сложным
Использование данных	Модель контролируемого обучения использует данные обучения для изучения связи между входом и выходом.	Обучение без учителя не использует выходные данные.
Точность результатов	Высокоточный и заслуживающий доверия метод.	Менее точный и заслуживающий доверия метод.
Обучение в реальном времени	Метод обучения происходит в автономном режиме.	Метод обучения происходит в режиме реального времени.
Количество классов	Количество классов известно.	Количество классов не известно.
Главный недостаток	Классификация больших данных может быть реальной проблемой в контролируемом обучении.	Вы не можете получить точную информацию о сортировке данных, а выходные данные в виде данных, используемых в обучении без учителя, помечены и не известны.

Резюме

При обучении под наблюдением вы обучаете машину, используя данные, которые хорошо «помечены».
Обучение без учителя — это метод машинного обучения, при котором вам не нужно контролировать модель.
Контролируемое обучение позволяет собирать данные или производить вывод данных из предыдущего опыта.
Машинное обучение без присмотра помогает вам находить все виды неизвестных шаблонов в данных.
Например, вы сможете определить время, необходимое для возвращения назад, исходя из погодных условий, времени суток и праздников.
Например, Малыш может идентифицировать других собак на основе прошедшего контролируемого обучения.
Регрессия и классификация являются двумя типами контролируемых методов машинного обучения.
Кластеризация и ассоциация — это два типа обучения без учителя.
В модели обучения под наблюдением вводятся входные и выходные переменные, в то время как в модели обучения без присмотра предоставляются только входные данные.