Статьи

5 способов начать с машинного обучения

Машинное обучение набирает обороты и делает это с яростью, привнося новые идеи в каждую отрасль. Если вы хотите быть востребованным, это умение, которое поставит вас на передовую. Как бы это ни показалось пугающим, на удивление легко, если подойти к нему правильно.

Машинное обучение (ML) является увлекательной практикой и областью изучения. Это то, что позволило внедрить автомобили с автоматическим управлением, роботов, которые могут убирать ваш дом, навигационную систему дронов всех видов, систему рекомендаций для YouTube и Netflix, системы распознавания лиц, распознавание рукописных текстов, игры и многое другое. ,

И из-за его невероятно высокой стоимости и несколько загадочного характера, это опыт в очень высоком спросе, который продолжает расширяться в различных областях — что всего пять лет назад казалось бы немыслимым. В этой статье мы увидим различные практические способы подойти к нему.

код машинного обучения

«Простите меня… но что такое машинное обучение?»

ОД является отраслью искусственного интеллекта (ИИ). Как сказал Артур Самуэль, один из пионеров в этой области, ML дает «компьютерам возможность учиться без явного программирования». То есть вместо того, чтобы программировать компьютер (или робот) для выполнения чего-либо, вы даете информацию и устанавливаете структуру, позволяющую самой программе системы работать.

Чертовски увлекательно? Да, но мы не будем вдаваться в подробности этой, казалось бы, невозможной вещи здесь, а вместо этого укажем вам правильные места, где вы сможете найти это для себя.

Прежде чем начать, слово предостережения

ML — это что-то вроде передовой практики, и вам нужно не только иметь некоторые основы в области компьютерных наук, но и иметь возможность кодировать хотя бы на одном языке программирования. Среди популярных языков программирования для ML — Python, R, Java, C и MATLAB.

1. Начните очень быстро … Как, правда, менее чем за десять минут

Иногда, а для некоторых людей лучше просто взять в руки что-то, чтобы иметь первый вкус и развить интуицию о том, что представляет собой это новое искусство или навык, а затем углубиться в некоторые особенности и детали.

Рецепты машинного обучения Google с Джошем Гордоном — это простой и практичный подход к ML. Используя библиотеки Python scikit-learn и TensorFlow , Джош проведет вас через очень практичные примеры и практические объяснения самих принципов ML.

Вот первое 7-минутное видео из этой серии, представляющее контролируемый алгоритм обучения в Python — всего за шесть строк кода! :

График публикации несколько нерегулярный, с видео, публикуемыми каждый месяц или второй месяц, охватывающими такие темы, как деревья решений, выбор функций, конвейеры, классификаторы: совсем неплохо для 6–8-минутных видео, которые любой, кто имеет небольшой опыт программирования может следовать.

2. Пройдите курс обучения в первоклассных университетах бесплатно

Если вы жаждете качественных знаний, возможно, вы уже слышали о Coursera , edX , Udacity и многих , многих других . Мы говорим о MOOC или массовых открытых онлайн-курсах .

Давайте разберемся быстро:

  • массивные : у них нет ограничений по вакансиям, и к ним могут обращаться столько людей, сколько пожелают.
  • открыто : любой может получить к ним доступ, независимо от возраста и предыдущих знаний по данной теме, а также независимо от того, смогут ли они заплатить за сертификацию или нет.
  • онлайн : все, что вам нужно, это устройство, подключенное к Интернету; подойдет даже мобильный телефон.
  • Конечно : это реальные курсы с материалами для чтения, практическими упражнениями и даже сроками.

Давайте посмотрим, какие курсы вы могли бы начать.

Эндрю Нг Стэнфордского машинного обучения

Стэнфордский профессор Нг является ведущим исследователем в области искусственного интеллекта и человеком, который в значительной степени запустил искру MOOC, которая позже превратится в огонь знаний, когда он впервые запустит онлайн-курс « Машинное обучение» . Реакция была ошеломляющей: многие тысячи людей со всего мира проходили курс и обсуждали эту тему. Позже он превратил этот курс в то, что сегодня — Coursera, ведущий поставщик MOOC.

Курс как сказочный, так и сложный. Я помню, что потратил около часа на то, чтобы прочитать 5-страничный объем заданий, прежде чем я смог его понять. Таким образом, в отличие от серии Джоша Гордона, это немного больше с академической точки зрения, но с большим количеством практических знаний и советов, которые будут очень полезны позже в вашей практике ML. Но это выполнимо, и количество отзывов на форумах действительно подавляющее. Имейте в виду, это был один из первых MOOC, которые я когда-либо принимал, и один из лучших.

Детали курса:

  • Прибл. продолжительность : 2–5 месяцев
  • Сложность : высокая
  • Рабочая нагрузка : от средней до тяжелой

Введение Себастьяна Труна в Искусственный интеллект

Себастьян также является основателем и исследователем искусственного интеллекта в Стэнфорде ( в области робототехники ), соучредителем Google X Lab («полусекретной» исследовательской компании, занимающейся разработкой автомобилей Google, среди прочих проектов ). мэра провайдера MOOC, Udacity. Вместе с Питером Норвигом (Peter Research), директором по исследованиям в Google, он составил удивительное введение в искусственный интеллект .

Это в значительной степени основа для всего ML. Это намного легче, чем курс Эндрю, с его содержимым, распределенным по большему количеству единиц, чтобы его было легче усваивать, хотя и длинным.

Детали курса:

  • Прибл. продолжительность : 4 месяца
  • Сложность : средняя
  • Рабочая нагрузка : свет

Яцер С. Абу-Мостафа из Caltec учится на данных

Профессор Язер — еще один из пионеров, которые разместили качественный учебный материал в Интернете, разместив на своем веб-сайте свой курс « Изучение из данных ML» со всеми его лекциями, учебными материалами и экзаменами, еще до того, как MOOC начали действовать. Позже он упакует эти материалы в MOOC, регулярно предлагаемый Caltech для edX .

Я тоже взял этот, и я могу сказать вам, что вам придется сделать здесь тяжелую работу. Но если вам понравился курс Эндрю и вы хотите получить больше средств, это кажется разумным следующим шагом.

Детали курса:

  • Прибл. продолжительность : 4 месяца
  • Сложность : очень высокая
  • Рабочая нагрузка : очень большая (10–20 часов в неделю)

Другие курсы Coursera, edX и Udacity

Существует очень обширное предложение курсов ML и AI, которые вы можете пройти бесплатно, не только в Coursera , edX и Udacity , но и в других провайдерах MOOC, таких как Data Camp — хотя наука о данных кажется чем-то вроде ниши для трех провайдеров мы обсуждали.

3. Получить сертифицированное образование, за часть цены

До сих пор мы говорили о бесплатных MOOC. Они потрясающие, и вам не нужно платить ни цента, чтобы зарегистрироваться в них и начать учиться. Вначале эти провайдеры предлагали бесплатные сертификаты или отчеты о достижениях , даже некоторые из них можно проверить в Интернете . Эти программы, однако, были прекращены, поэтому в большинстве случаев вы не получите сертификат или какой-либо вид удостоверения, который вы могли бы использовать, чтобы продемонстрировать свое образование потенциальному работодателю или даже другому вузу.

Это может не быть проблемой, если вы просто хотите учиться ради этого и даже использовать эти знания, чтобы использовать успешную карьеру в качестве фрилансера, как это делают многие профессионалы по всему миру. Но подача заявления на работу может быть другим делом, и дипломы и степени действительно облегчают процесс во многих случаях, поэтому давайте обсудим их.

Проверенные курсы

Проверенный курс может быть где-то между 40–200 долларами, в зависимости от курса и учреждения. В основном, вы платите премию за проверку вашей личности и назначений (именно так выглядит проверенный сертификат ). Вы можете узнать больше о сертификатах курса Coursera и проверенных сертификатах edX . Вы увидите, что у них обоих огромный выбор проверенных курсов по ML и науке о данных, как вы можете видеть в этом поиске edX .

Обратите внимание, что независимо от того, платите вы или нет, содержание и материалы курса абсолютно одинаковы. Получив оплату, вы получите сертификат, который вы фактически прошли и прошли курс.

Coursera Специализации

Coursera сделала концепцию проверенных курсов на шаг вперед, сгруппировав некоторые смежные курсы и добавив проект capstone, чтобы получить сертификат специализации .

Некоторые специализации, представляющие интерес для нас:

специализация курсы учреждение
Большое количество данных 6 UC Сан-Диего
Глубокое обучение 5 deeplearning.ai
Машинное обучение 4 Университет Вашингтона
Рекомендательные Системы 5 Университет Миннесоты
Введение в робототехнику 6 Пенсильванский университет
Вероятностные графические модели (МПГ) 3 Стэндфордский Университет

Степень магистра по курсу

Магистр компьютерных наук в области наук о данных (MCS-DS) компании Coursera — это официальная степень магистра, выданная аккредитованным университетом. Темы в программе тесно связаны с ОД и включают в себя:

  • визуализация данных
  • машинное обучение
  • сбор данных
  • облачные вычисления
  • статистика
  • информационная наука

Детали курса:

  • Учреждение : Университет Иллинойса в Урбана-Шампейн
  • Цена : 600 долларов США за один кредитный час за общую сумму 19 200 долларов США.
  • Продолжительность : 32 часа

edX XSeries и профессиональные сертификаты

В edX есть программа XSeries для курсов в рамках одной темы, почти так же, как в специализациях Coursera. Такие интересующие нас серии включают в себя:

серии курсы учреждение Стоимость
Microsoft Azure HDInsight Big Data Analyst 3 Microsoft 49–99 долларов за курс
Анализ данных геномики 3 Гарвардский университет $ 132,30
Анализ данных для наук о жизни 4 Гарвардский университет $ 221,40
Наука о данных и инженерия с Spark 3 Калифорнийский университет в Беркли 49–99 долларов за курс

У edX также есть профессиональные программы сертификации для «критических навыков», в том числе Data Science и Big Data , предлагаемые Microsoft.

edX MicroMasters и колледж кредит

У вас также есть курсы , имеющие право на получение кредита , которые не только проверены, но также могут послужить вам для подачи заявки на получение кредита на степень бакалавра или магистра. Естественно, в мелком шрифте много деталей, поэтому вам придется провести дополнительное исследование.

EDX MicroMasters именно в этом ключе. Вот некоторые интересные (стоимость здесь выше, так как вы также платите часы за обучение в степени):

программа курсы учреждение Стоимость
Искусственный интеллект 4 Колумбийский университет $ 1200
Большое количество данных 5 Университет Аделаиды $ 1215
Наука о данных 4 UC Сан-Диего $ 1 260
робототехника 4 Пенсильванский университет $ 1256

Узнайте больше, чтобы заработать университетский кредит на edX , и прочитайте отчет MOOCs for Credit от Class Central.

Нанодегриды Udacity

Нанодеграда — это нечто вроде степени, выданной Udacity. Хотя Udacity сама по себе не является аккредитованным учебным заведением, они изо всех сил старались сотрудничать с лидерами технологических отраслей, чтобы обеспечить максимально возможное образование, ориентированное на рынок, — другими словами, чтобы подготовить вас именно к тем навыкам, которых требует рынок труда. сейчас.

И мы действительно говорим громкие имена, здесь: Google, Amazon, IBM, Nvidia, Mercedes-Benz, DiDi, AT & T, среди многих других . А партнеры Udacity не только совместно разрабатывают учебные программы, но даже имеют соглашения о найме с Udacity!

Udacity и их партнеры даже заходят так далеко, что публикуют приблизительные данные по зарплате:

программа время расчетная зарплата
Искусственный интеллект 6 месяцев От 59,4 до 250 тысяч долларов
Глубокое обучение TBD TBD
Машинное обучение 6 месяцев От 38,7 тыс. До 212 тыс. Долларов
робототехника два 3-месячных срока От 42 до 156 тысяч долларов
Самостоятельный автомобиль 9 месяцев От 67,8 до 265 тысяч долларов

Получить работу или ваши деньги обратно!

Фактически, ML nanodegree является частью программы Nanodegree Plus , которая, вероятно, является одним из самых безрассудных нововведений в онлайн-обучении: вы учитесь и получаете высшее образование, а если вы не получаете высокооплачиваемую работу, Udacity возвращает ваше обучение! Невероятно.

4. Участвуйте в онлайн-соревнованиях: учитесь и выигрывайте деньги (если вы хорошо разбираетесь в этом)

Kaggle — это онлайн-платформа (теперь часть Google) для прогностического моделирования и аналитических конкурсов, где компании и исследователи со всего мира публикуют наборы данных и статистику, чтобы конкуренты могли найти модели, которые будут делать прогнозы и объяснять данные — чаще всего, чем нет. , используя ML.

Соревнования улучшили программное обеспечение для распознавания жестов для Microsoft Kinect , поиска бозона Хиггса в CERN , и даже сделали новаторские достижения в области биологии и медицины, среди других областей. И следует отметить, что многие из победителей не имели предварительных знаний по физике, химии или какой-либо из областей исследования соревнований, как вы прочтете в интервью победителей Kaggle.

И вы можете выиграть деньги! Фактически, большие деньги (подробности о цене в 3 миллиона долларов на конкурс Kaggle см. В разделе « Последний конкурс стимулов направлен на прогнозирование госпитализации путем использования запасных серых клеток »).

Индивидуально или в команде

Вы можете присоединиться бесплатно, выбрать язык программирования и алгоритмы по своему выбору, и сразу же начать участвовать в любом соревновании. Существуют очень активные форумы, на которых вы можете получить представление о том, что делают конкуренты в реальных соревнованиях по ОД, даже сотрудничать с ними и формировать команды, а также поделиться ценой, если ваша команда сможет выиграть соревнование.

Но даже если вы не выиграете соревнование, вы многому научитесь в процессе, подойдя к реальным наборам данных и обсудив входы и выходы моделирования данных для прогнозирования с другими практиками ML.

Следуйте за списком лидеров

Kaggle имеет очень крутой рейтинг в реальном времени для текущих соревнований , благодаря чему весь процесс ощущается как настоящее соревнование:

Лидеры

Но будьте осторожны! Рано или поздно вы узнаете, что создание модели, которая с такой точностью прогнозирует тестовые данные, может принести вам несколько очков в таблице лидеров, но убить вас позже, когда появятся новые данные ( переоснащение , привет!)

5. Подать заявку на работу!

Как и во всем, вы будете становиться лучше, чем больше будете испытывать себя и работать над этим. В одиночку или в составе организации, если вы можете ML, вы будете по требованию.

Как фрилансер

Работать на ML в качестве фрилансера вполне возможно, и со временем вы можете получить достойный доход, лишь экономно работая над проектами ML.

Такие сайты, как Freelancer , Upwork или Guru, могут стать отправной точкой для работы над малыми и средними проектами. Но будьте осторожны, это международная и очень конкурентная арена, и создание портфолио и ваших собственных сетевых клиентов с нуля, когда вы начинаете соло, может оказаться очень сложным в начале.

В стартапе

Мы живем в эпоху изобилия данных, и эта тенденция будет только усиливаться. Начинающие компании, часто работающие с технологиями, особенно стремятся к инженерам, которые могут управлять данными и получать из них ценную информацию.

После того, как вы создали прочную основу, ищите в местных советах по трудоустройству технические компании и подайте заявку, даже если они не ищут открыто ML-инженера, расскажите им, какую выгоду вы можете использовать для своего бизнеса с помощью анализа данных и аналитики. способности.

В обычной компании

Инженеры ML также пользуются большим спросом в таких отраслях, как финансы, медицина, химия и даже в неожиданных местах, таких как социальные науки, если доступны наборы данных больших данных.

Подача заявления не будет легкой, так как вам понадобятся не только некоторые учетные данные для ваших инженерных навыков, но также некоторые знания в любой отрасли, на которую вы претендуете. (Например, должность «аналитика по управлению рисками» в банке потребует не только навыков ML, но и степени бакалавра или магистра в области финансов или кредита.) Однако, если вы каким-то образом приобрели эти навыки, будьте уверены, вы стремиться к высокооплачиваемой работе.

Что делать дальше

Вы хотели начать с ML, и, к счастью, у вас есть выбор:

  • Хотите иметь быструю интуицию на ML? Смотрите видео Джоша Гордона и начинайте кодировать в считанные минуты.
  • Хотите быть в авангарде глубокого обучения? Пройдите специализированный курс и примените эти методы для решения конкретной задачи.
  • Хотите построить карьеру на ML? Получить некоторые полномочия и подать заявку на работу.
  • Заинтересованы в области на академическом уровне? Вам повезло, так как доступно много качественных материалов!

ML — одна из немногих дисциплин в IT, которую, как мы можем предсказать, все еще будут иметь тенденцию в будущем. Алгоритмы могут измениться, методы могут улучшиться, и могут быть введены новые библиотеки и подходы, но мы только начинаем позволять машинам учиться самостоятельно.