3) Глубокое обучение Учебник

Что такое глубокое обучение?

Глубокое обучение — это компьютерная программа, которая имитирует сеть нейронов в мозге . Это подмножество машинного обучения и называется глубоким обучением, потому что оно использует глубокие нейронные сети.

Алгоритмы глубокого обучения строятся со связанными слоями.

Первый слой называется входным слоем
Последний слой называется выходным слоем
Все промежуточные слои называются скрытыми. Слово «глубокий» означает, что сеть объединяет нейроны в более чем двух слоях.

Каждый скрытый слой состоит из нейронов. Нейроны связаны друг с другом. Нейрон обработает и затем распространит входной сигнал, который он получает слой выше этого. Сила сигнала, передаваемого нейроном в следующем слое, зависит от веса, смещения и функции активации.

Сеть потребляет большое количество входных данных и управляет ими через несколько слоев; сеть может изучать все более сложные функции данных на каждом уровне.

На этом тренинге вы узнаете

Что такое глубокое обучение?
Процесс глубокого обучения
Классификация нейронных сетей
Типы сетей глубокого обучения
Прямые нейронные сети
Рекуррентные нейронные сети (РНН)
Сверточные нейронные сети (CNN)
Усиление обучения
Примеры приложений глубокого обучения
Почему важно глубокое обучение?
Ограничения глубокого обучения

Процесс глубокого обучения

Глубокая нейронная сеть обеспечивает современную точность во многих задачах, от обнаружения объектов до распознавания речи. Они могут учиться автоматически, без предопределенных знаний, явно закодированных программистами.

Чтобы понять идею глубокого обучения, представьте семью с ребенком и родителями. Малыш указывает пальцем на предметы и всегда произносит слово «кот». Поскольку его родители обеспокоены его образованием, они постоянно говорят ему: «Да, это не кошка» или «Нет, это не кошка». Младенец настойчиво указывает на предметы, но становится более точным с «кошками». Маленький ребенок в глубине души не знает, почему он может сказать, кот это или нет. Он только что научился упорядочивать сложные особенности, возникающие у кошки, глядя на питомца в целом и продолжая сосредотачиваться на деталях, таких как хвосты или нос, прежде чем принять решение.

Нейронная сеть работает точно так же. Каждый уровень представляет более глубокий уровень знаний, т. Е. Иерархию знаний. Нейронная сеть с четырьмя слоями изучит более сложную функцию, чем с двумя слоями.

Обучение происходит в два этапа.

Первый этап состоит из применения нелинейного преобразования входных данных и создания статистической модели в качестве выходных данных.
Второй этап направлен на улучшение модели с помощью математического метода, известного как производная.

Нейронная сеть повторяет эти две фазы от сотен до тысяч раз, пока не достигнет приемлемого уровня точности. Повторение этого двухфазного называется итерацией.

Чтобы привести пример, взгляните на движение ниже, модель пытается научиться танцевать. После 10 минут тренировки модель не умеет танцевать, и выглядит как каракули.

После 48 часов обучения компьютер осваивает искусство танца.

Классификация нейронных сетей

Неглубокая нейронная сеть : Неглубокая нейронная сеть имеет только один скрытый слой между входом и выходом.

Глубокая нейронная сеть : Глубокие нейронные сети имеют более одного слоя. Например, модель Google LeNet для распознавания изображений насчитывает 22 слоя.

В настоящее время глубокое обучение используется во многих отношениях, таких как автомобиль без водителя, мобильный телефон, поисковая система Google, обнаружение мошенничества, телевидение и так далее.

Типы сетей глубокого обучения

Прямые нейронные сети

Самый простой тип искусственной нейронной сети. При таком типе архитектуры информация передается только в одном направлении. Это означает, что потоки информации начинаются на входном слое, переходят на «скрытые» слои и заканчиваются на выходном слое. Сеть

не имеет петли. Информация останавливается на выходных слоях.

Рекуррентные нейронные сети (РНН)

RNN — это многоуровневая нейронная сеть, которая может хранить информацию в узлах контекста, позволяя ей изучать последовательности данных и выводить число или другую последовательность. Проще говоря, это искусственные нейронные сети, чьи связи между нейронами включают петли. RNN хорошо подходят для обработки последовательностей входных данных.

Пример, если задача состоит в том, чтобы предсказать следующее слово в предложении «Хотите ли вы …………?

Нейроны RNN получат сигнал, указывающий на начало предложения.
Сеть получает слово «Do» в качестве входных данных и выдает вектор числа. Этот вектор возвращается обратно в нейрон, чтобы обеспечить память для сети. Этот этап помогает сети запомнить, что он получил «Do», и он получил его в первой позиции.
Сеть аналогичным образом перейдет к следующим словам. Требуется слово «ты» и «хочешь». Состояние нейронов обновляется при получении каждого слова.
Завершающий этап наступает после получения слова «а». Нейронная сеть предоставит вероятность для каждого английского слова, которое может быть использовано для завершения предложения. Хорошо обученный RNN, вероятно, назначает высокую вероятность «кафе», «пить», «гамбургер» и т. Д.

Общее использование RNN

Помогите трейдерам ценных бумаг создавать аналитические отчеты
Выявить отклонения в договоре финансовой отчетности
Обнаружить мошенническую транзакцию по кредитной карте
Предоставить подпись к изображениям
Power Chatbots
Стандартное использование RNN происходит, когда практики работают с данными или последовательностями временных рядов (например, аудиозаписи или текст).

Сверточные нейронные сети (CNN)

CNN — это многослойная нейронная сеть с уникальной архитектурой, предназначенная для извлечения все более сложных функций данных на каждом уровне для определения выходных данных. CNN хорошо подходят для задач восприятия.

CNN в основном используется, когда существует неструктурированный набор данных (например, изображения), и практики должны извлечь из него информацию

Например, если задача состоит в том, чтобы предсказать заголовок изображения:

CNN получает изображение, скажем, кота, это изображение, в компьютерном плане, представляет собой набор пикселей. Как правило, один слой для изображения в оттенках серого и три слоя для цветного изображения.
Во время изучения функций (т. Е. Скрытых слоев) сеть идентифицирует уникальные функции, например, хвост кошки, ухо и т. Д.
Когда сеть полностью научилась распознавать картинку, она может предоставить вероятность для каждого изображения, которое она знает. Метка с наибольшей вероятностью станет предсказанием сети.

Усиление обучения

Усиленное обучение — это подполе машинного обучения, в котором системы обучаются путем получения виртуальных «наград» или «наказаний», по сути, обучения методом проб и ошибок. Google DeepMind использовал усиленное обучение, чтобы победить человека-чемпиона в играх на Го. Укрепление обучения также используется в видеоиграх, чтобы улучшить игровой опыт, предоставляя более умного бота.

Один из самых известных алгоритмов:

Q-обучения
Deep Q сеть
Государство-действие-вознаграждение-государство-действие (SARSA)
Глубокий детерминистический политический градиент (DDPG)

Примеры приложений глубокого обучения

ИИ в финансах: Сектор финансовых технологий уже начал использовать ИИ, чтобы сэкономить время, сократить расходы и повысить ценность. Глубокое обучение меняет индустрию кредитования, используя более надежный кредитный скоринг. Лица, принимающие решения по кредитам, могут использовать ИИ для создания надежных приложений кредитного кредитования для достижения более быстрой и точной оценки рисков, используя машинный интеллект для определения характера и возможностей претендентов.

Underwrite — компания Fintech, предоставляющая решение для искусственного интеллекта для компании кредиторов. underwrite.ai использует AI, чтобы определить, кто из кандидатов с большей вероятностью вернет кредит. Их подход радикально превосходит традиционные методы.

ИИ в HR: Компания спортивной одежды Under Armour производит революцию в сфере найма и совершенствует опыт кандидатов с помощью ИИ. Фактически Under Armour сокращает время найма для своих розничных магазинов на 35%. Under Armour столкнулся с растущей популярностью еще в 2012 году. В среднем у них было 30000 резюме в месяц. Чтение всех этих заявок и начало процесса отбора и собеседования заняло слишком много времени. Длительный процесс привлечения людей на работу и их влияние на работу Under Armour позволили полностью укомплектовать свои розничные магазины, обеспечить их готовность к работе и готовность к работе.

В то время в Under Armour использовались все необходимые технологии HR, такие как транзакционные решения для поиска, применения, отслеживания и адаптации, но эти инструменты не были достаточно полезными. Под защитой выберите HireVue , провайдера искусственного интеллекта для решения HR, как для интервью по требованию, так и для интервью в реальном времени. Результаты были блефом; им удалось сократить на 35% время заполнения. Взамен наемных сотрудников более высокого качества.

ИИ в маркетинге: ИИ является ценным инструментом для решения задач управления персоналом и персонализации. Улучшенное распознавание речи в управлении центрами обработки вызовов и маршрутизации вызовов в результате применения методов искусственного интеллекта позволяет клиентам работать более эффективно.

Например, углубленный анализ звука позволяет системам оценить эмоциональный тон клиента. Если клиент плохо реагирует на чат-робота ИИ, система может перенаправить разговор реальным людям-операторам, которые решают проблему.

Помимо трех приведенных выше примеров, ИИ широко используется в других секторах / отраслях.

Почему важно глубокое обучение?

Глубокое обучение — это мощный инструмент, позволяющий сделать прогноз действенным результатом. Глубокое обучение превосходит обнаружение паттернов (обучение без учителя) и прогнозирование на основе знаний. Большие данные — это топливо для глубокого обучения. Когда оба они объединены, организация может получить беспрецедентные результаты с точки зрения производительности, продаж, управления и инноваций.

Глубокое обучение может превзойти традиционный метод. Например, алгоритмы глубокого обучения на 41% точнее алгоритма машинного обучения при классификации изображений, на 27% точнее при распознавании лиц и 25% при распознавании голоса.

Ограничения глубокого обучения

Маркировка данных

Большинство современных моделей искусственного интеллекта обучаются через «контролируемое обучение». Это означает, что люди должны маркировать и классифицировать базовые данные, что может быть значительной и подверженной ошибкам работой. Например, компании, разрабатывающие технологии самостоятельного вождения автомобиля, нанимают сотни людей, чтобы вручную комментировать часы видеопотоков с прототипов транспортных средств, чтобы помочь в обучении этих систем.

Получить огромные тренировочные наборы данных

Было показано, что простые методы глубокого обучения, такие как CNN, могут в некоторых случаях имитировать знания специалистов в области медицины и других областях. Современная волна машинного обучения, однако, требует наборов обучающих данных, которые не только маркированы, но также достаточно широки и универсальны.

Методы глубокого обучения требовали тысяч наблюдений для того, чтобы модели стали относительно хорошими в задачах классификации, а в некоторых случаях миллионы для их выполнения на уровне людей. Не удивительно, что глубокое обучение известно в гигантских технологических компаниях; они используют большие данные для накопления петабайт данных. Это позволяет им создать впечатляющую и очень точную модель глубокого обучения.

Объяснить проблему

Большие и сложные модели трудно объяснить с точки зрения человека. Например, почему конкретное решение было получено. Это одна из причин того, что принятие некоторых инструментов ИИ происходит медленно в тех областях, где интерпретация полезна или действительно необходима.

Кроме того, по мере расширения применения ИИ нормативные требования могут также привести к необходимости более объяснимых моделей ИИ.

Резюме

Глубокое обучение — это новое состояние искусственного интеллекта. Архитектура глубокого обучения состоит из входного слоя, скрытых слоев и выходного слоя. Слово «глубокий» означает, что существует более двух полностью связанных слоев.

Существует огромное количество нейронных сетей, в которых каждая архитектура предназначена для выполнения определенной задачи. Например, CNN очень хорошо работает с изображениями, RNN обеспечивает впечатляющие результаты с помощью временных рядов и анализа текста.

Глубокое обучение в настоящее время активно в различных областях, от финансов до маркетинга, цепочки поставок и маркетинга. Крупные фирмы первыми используют глубокое обучение, потому что у них уже есть большой пул данных. Глубокое обучение требует наличия обширного учебного набора данных.