Статьи

Инфраструктура автоматического машинного обучения (AutoML) — облачная служба Oracle Data Science

В этой статье я расскажу об AutoML, одной из функций, поставляемых с Oracle Cloud Data Science Service, и надеюсь, что это будет полезная статья с точки зрения осведомленности.

Keras

Как известно и упоминалось в моих предыдущих статьях, Oracle недавно добавила новый сервис под названием Data Science в облачные сервисы. Эта услуга была предложена пользователям в качестве платформы, на которой многие библиотеки уже установлены. Эта платформа, которая включает в себя множество функций, таких как разработка прототипов, разработка проектов, управление моделями, производство серийных моделей, содержит много новых функций. Несомненно, одной из самых интересных и полезных функций является функция AutoML.

AutoML стремится автоматизировать важные шаги, которые мы предпринимаем при разработке проектов машинного обучения / искусственного интеллекта / науки о данных. На изображении ниже представлены этапы разработки проектов машинного обучения / искусственного интеллекта / науки о данных. 

С AutoML мы можем автоматизировать выбор алгоритмов, выбор функций и определение гиперпараметров алгоритмов. Таким образом, мы можем сократить время, затрачиваемое разработчиками на эти части. Кроме того, инфраструктура AutoML помогает разработчикам, которые не являются экспертами в разработке этих шагов, насколько это возможно.

Набор данных

Ссылка на изображение

AutoML состоит из трех разных модулей.

Автоматический выбор функций

Автоматический выбор функций

Ссылка на изображение

Выбор модели (алгоритма)

Выбор модели (алгоритма)

Ссылка на изображение

Оптимизация гиперпараметров

Оптимизация гиперпараметров

Ссылка на изображение

Помимо автоматизации определенных рабочих процессов, инфраструктура AutoML также позволяет повысить качество и производительность создаваемых моделей и позволяет всем этапам рабочего процесса выполняться и масштабироваться параллельно.

Мы можем успешно использовать инфраструктуру AutoML в задачах классификации и регрессии.

Давайте посмотрим, как работает инфраструктура и как она дает результаты на примере приложения.

Прежде всего, мы можем пока использовать эту инфраструктуру только в облачной службе Oracle Cloud Infrastructure Data Science . Поскольку для использования этой инфраструктуры нам необходимо импортировать пакет  ADS (Accelerated Data Science)  . Этот пакет устанавливается внутри службы OCI Data Science и не имеет внешней установки. ADS — это пакет, который Oracle предлагает в облачной службе, и включает методы, которые позволят нам реализовать все требования для рабочих нагрузок AI / ML / DS.

Набор данных, который я буду использовать в качестве примера, — это набор данных iris, который поставляется в Sklearn. Сначала мы импортируем необходимые библиотеки и загружаем набор данных.


питон