Учебники

32) R против Python

R и Python являются открытыми языками программирования с большим сообществом. Новые библиотеки или инструменты постоянно добавляются в соответствующий каталог. R в основном используется для статистического анализа, в то время как Python предоставляет более общий подход к науке о данных.

R и Python являются современными с точки зрения языка программирования, ориентированного на науку о данных. Изучение обоих из них, конечно, идеальное решение. R и Python требуют временных затрат, и такая роскошь доступна не каждому. Python – это язык общего назначения с читаемым синтаксисом. R, однако, построен статистиками и охватывает их конкретный язык.

В этом уроке вы узнаете

р

Академики и статистики разработали R в течение двух десятилетий. R обладает одной из самых богатых экосистем для анализа данных. В CRAN (хранилище с открытым исходным кодом) доступно около 12000 пакетов. Можно найти библиотеку для любого анализа, который вы хотите выполнить. Богатое разнообразие библиотек делает R лучшим выбором для статистического анализа, особенно для специализированной аналитической работы.

Разница между R и другими статистическими продуктами – это результат. У R есть фантастические инструменты для сообщения результатов. Rstudio поставляется с библиотекой knitr. Се Ихуэй написал этот пакет. Он делал репортажи тривиальными и элегантными. Сообщать результаты с презентацией или документом легко.

питон

Python в значительной степени может выполнять те же задачи, что и R: обработка данных, проектирование, выбор функций, поиск в сети, приложение и так далее. Python – это инструмент для развертывания и реализации машинного обучения в больших масштабах. Коды Python проще в обслуживании и надежнее, чем R. Лет назад; В Python не было много библиотек для анализа данных и машинного обучения. В последнее время Python догоняет и предоставляет передовые API для машинного обучения или искусственного интеллекта. Большая часть работы по науке данных может быть выполнена с пятью библиотеками Python: Numpy, Pandas, Scipy, Scikit-learn и Seaborn.

Python, с другой стороны, делает тиражируемость и доступность проще, чем R. На самом деле, если вам нужно использовать результаты вашего анализа в приложении или на веб-сайте, Python – лучший выбор.

Индекс популярности

Рейтинг IEEE Spectrum – это показатель, который количественно определяет популярность языка программирования. Левый столбец показывает рейтинг в 2017 году, а правый столбец – в 2016 году. В 2017 году Python занял первое место по сравнению с третьим рейтингом годом ранее. R находится на 6- м месте.

Вакансия

На рисунке ниже показано количество заданий, связанных с наукой о данных по языкам программирования. SQL далеко впереди, затем идут Python и Java. Р занимает 5- е место .

Вакансии R против Python

Если мы сосредоточимся на долгосрочной тенденции между Python (желтым) и R (синим), мы увидим, что Python чаще цитируется в описании работы, чем R.

Анализ сделан R и Python

Однако, если мы посмотрим на работы по анализу данных, R, безусловно, лучший инструмент.

Процент людей, переходящих

На рисунке ниже есть два ключевых момента.

  • Пользователи Python более лояльны, чем пользователи R
  • Процент пользователей R, переключающихся на Python, в два раза больше, чем Python на R.

Разница между R и Python

параметр р питон
Задача Анализ данных и статистика Развертывание и производство
Основные пользователи Ученый и R & D Программисты и разработчики
гибкость Простая в использовании доступная библиотека Легко создавать новые модели с нуля. Т.е. матричные вычисления и оптимизация
Кривая обучения Сложно в начале Линейный и гладкий
Популярность языка программирования. Процентное изменение 4,23% в 2018 году 21,69% в 2018 году
Средняя заработная плата $ 99,000 $ 100,000
интеграция Беги локально Хорошо интегрирован с приложением
задача Легко получить первичные результаты Хорошо развернуть алгоритм
Размер базы данных Ручка огромного размера Ручка огромного размера
IDE Rstudio Spyder, ноутбук Ipthon
Важные пакеты и библиотека Tydiverse, ggplot2, карета, зоопарк панды, сципи, скикит-учи, TensorFlow, карет
Недостатки Медленно высокая кривая обучения Зависимости между библиотеками Не так много библиотек, как R
преимущества
  • Графики сделаны для общения. R делает это красиво
  • Большой каталог для анализа данных
  • Интерфейс GitHub
  • RMarkdown
  • блестящий
  • Блокнот Jupyter: блокноты помогают обмениваться данными с коллегами
  • Математические вычисления
  • развертывание
  • Читаемость кода
  • скорость
  • Функция в Python

R или Python Использование

Python был разработан Гвидо ван Россумом, компьютерным парнем, примерно в 1991 году. В Python есть влиятельные библиотеки для математики, статистики и искусственного интеллекта. Вы можете думать о Python как о чистом игроке в машинном обучении. Тем не менее, Python не совсем зрел (пока) для эконометрики и коммуникации. Python – лучший инструмент для интеграции и развертывания машинного обучения, но не для бизнес-аналитики.

Хорошей новостью является то, что R разработан учеными и учеными. Он предназначен для решения статистических задач, машинного обучения и науки о данных. R является правильным инструментом для науки о данных из-за его мощных коммуникационных библиотек. Кроме того, R оснащен множеством пакетов для анализа временных рядов, панельных данных и анализа данных. Кроме того, нет лучших инструментов по сравнению с R.

По нашему мнению, если вы новичок в науке о данных и обладаете необходимой статистической базой, вам нужно задать себе два следующих вопроса:

  • Хочу ли я узнать, как работает алгоритм?
  • Хочу ли я развернуть модель?

Если вы ответите «да», вы, вероятно, начнете изучать Python в первую очередь. С одной стороны, Python включает в себя отличные библиотеки для манипулирования матрицей или кодирования алгоритмов. Начинающему может быть проще научиться создавать модель с нуля, а затем переключаться на функции из библиотек машинного обучения. С другой стороны, вы уже знаете алгоритм или хотите сразу приступить к анализу данных, тогда и R, и Python – это нормально. Одно преимущество для R, если вы собираетесь сосредоточиться на статистических методах.

Во-вторых, если вы хотите делать больше, чем статистика, скажем, развертывание и воспроизводимость, Python – лучший выбор. R больше подходит для вашей работы, если вам нужно написать отчет и создать панель управления.

Короче говоря, статистический разрыв между R и Python становится все ближе. Большая часть работы может выполняться на обоих языках. Вам лучше выбрать тот, который соответствует вашим потребностям, а также инструмент, который используют ваши коллеги. Лучше, когда вы все говорите на одном языке. После того, как вы знаете свой первый язык программирования, выучить второй проще.

Вывод

В конце концов, выбор между R или Python зависит от:

  • Цели вашей миссии: статистический анализ или развертывание
  • Количество времени, которое вы можете инвестировать
  • Ваша компания / отрасль наиболее используемый инструмент