Искусственный интеллект (ИИ) — это любой код, алгоритм или метод, который позволяет компьютеру имитировать когнитивное поведение или интеллект человека. Машинное обучение (ML) — это подмножество ИИ, в котором используются статистические методы, позволяющие машинам учиться и совершенствоваться с опытом. Глубокое обучение — это подмножество машинного обучения, которое делает возможным вычисление многослойных нейронных сетей. Машинное обучение рассматривается как поверхностное обучение, а глубокое обучение — как иерархическое обучение с абстракцией.
Машинное обучение имеет дело с широким спектром понятий. Концепции перечислены ниже —
- контролируемый
- бесконтрольный
- обучение подкреплению
- линейная регрессия
- функции стоимости
- переобучения
- под облегающим
- гиперпараметр и др.
При контролируемом обучении мы учимся прогнозировать значения на основе помеченных данных. Один метод ML, который помогает здесь, — это классификация, где целевые значения являются дискретными значениями; например, кошки и собаки. Другая техника в машинном обучении, которая может помочь, — это регрессия. Регрессия работает на целевых значениях. Целевые значения являются непрерывными значениями; например, данные фондового рынка могут быть проанализированы с использованием регрессии.
При неконтролируемом обучении мы делаем выводы из входных данных, которые не обозначены или не структурированы. Если у нас есть миллион медицинских карт, и мы должны разобраться в этом, найти основную структуру, выбросы или обнаружить аномалии, мы используем метод кластеризации для разделения данных на широкие кластеры.
Наборы данных делятся на обучающие наборы, наборы для тестирования, наборы для проверки и так далее.
Прорыв в 2012 году принес концепцию глубокого обучения в известность. Алгоритм успешно разделил 1 миллион изображений на 1000 категорий, используя 2 графических процессора и такие новейшие технологии, как Big Data.
Глубокое обучение и традиционное машинное обучение
Одной из основных проблем, с которыми сталкиваются в традиционных моделях машинного обучения, является процесс, называемый извлечением признаков. Программист должен быть конкретным и сообщать компьютеру о функциях, на которые нужно обратить внимание. Эти функции помогут в принятии решений.
Ввод необработанных данных в алгоритм редко работает, поэтому извлечение функций является важной частью традиционного рабочего процесса машинного обучения.
Это накладывает огромную ответственность на программиста, и эффективность алгоритма во многом зависит от того, насколько изобретателен программист. Для сложных проблем, таких как распознавание объектов или почерк, это огромная проблема.
Глубокое обучение с возможностью изучения нескольких уровней представления — это один из немногих методов, который помог нам с автоматическим извлечением признаков. Можно предположить, что нижние уровни выполняют автоматическое извлечение элементов, практически не требуя указания со стороны программиста.