R и Python являются открытыми языками программирования с большим сообществом. Новые библиотеки или инструменты постоянно добавляются в соответствующий каталог. R в основном используется для статистического анализа, в то время как Python предоставляет более общий подход к науке о данных.
R и Python являются современными с точки зрения языка программирования, ориентированного на науку о данных. Изучение обоих из них, конечно, идеальное решение. R и Python требуют временных затрат, и такая роскошь доступна не каждому. Python — это язык общего назначения с читаемым синтаксисом. R, однако, построен статистиками и охватывает их конкретный язык.
В этом уроке вы узнаете
- р
- питон
- Индекс популярности
- Вакансия
- Анализ сделан R и Python
- Процент людей, переходящих
- Разница между R и Python
- R или Python Использование
р
Академики и статистики разработали R в течение двух десятилетий. R обладает одной из самых богатых экосистем для анализа данных. В CRAN (хранилище с открытым исходным кодом) доступно около 12000 пакетов. Можно найти библиотеку для любого анализа, который вы хотите выполнить. Богатое разнообразие библиотек делает R лучшим выбором для статистического анализа, особенно для специализированной аналитической работы.
Разница между R и другими статистическими продуктами — это результат. У R есть фантастические инструменты для сообщения результатов. Rstudio поставляется с библиотекой knitr. Се Ихуэй написал этот пакет. Он делал репортажи тривиальными и элегантными. Сообщать результаты с презентацией или документом легко.
питон
Python в значительной степени может выполнять те же задачи, что и R: обработка данных, проектирование, выбор функций, поиск в сети, приложение и так далее. Python — это инструмент для развертывания и реализации машинного обучения в больших масштабах. Коды Python проще в обслуживании и надежнее, чем R. Лет назад; В Python не было много библиотек для анализа данных и машинного обучения. В последнее время Python догоняет и предоставляет передовые API для машинного обучения или искусственного интеллекта. Большая часть работы по науке данных может быть выполнена с пятью библиотеками Python: Numpy, Pandas, Scipy, Scikit-learn и Seaborn.
Python, с другой стороны, делает тиражируемость и доступность проще, чем R. На самом деле, если вам нужно использовать результаты вашего анализа в приложении или на веб-сайте, Python — лучший выбор.
Индекс популярности
Рейтинг IEEE Spectrum — это показатель, который количественно определяет популярность языка программирования. Левый столбец показывает рейтинг в 2017 году, а правый столбец — в 2016 году. В 2017 году Python занял первое место по сравнению с третьим рейтингом годом ранее. R находится на 6- м месте.
Вакансия
На рисунке ниже показано количество заданий, связанных с наукой о данных по языкам программирования. SQL далеко впереди, затем идут Python и Java. Р занимает 5- е место .
Если мы сосредоточимся на долгосрочной тенденции между Python (желтым) и R (синим), мы увидим, что Python чаще цитируется в описании работы, чем R.
Анализ сделан R и Python
Однако, если мы посмотрим на работы по анализу данных, R, безусловно, лучший инструмент.
Процент людей, переходящих
На рисунке ниже есть два ключевых момента.
- Пользователи Python более лояльны, чем пользователи R
- Процент пользователей R, переключающихся на Python, в два раза больше, чем Python на R.
Разница между R и Python
параметр | р | питон |
---|---|---|
Задача | Анализ данных и статистика | Развертывание и производство |
Основные пользователи | Ученый и R & D | Программисты и разработчики |
гибкость | Простая в использовании доступная библиотека | Легко создавать новые модели с нуля. Т.е. матричные вычисления и оптимизация |
Кривая обучения | Сложно в начале | Линейный и гладкий |
Популярность языка программирования. Процентное изменение | 4,23% в 2018 году | 21,69% в 2018 году |
Средняя заработная плата | $ 99,000 | $ 100,000 |
интеграция | Беги локально | Хорошо интегрирован с приложением |
задача | Легко получить первичные результаты | Хорошо развернуть алгоритм |
Размер базы данных | Ручка огромного размера | Ручка огромного размера |
IDE | Rstudio | Spyder, ноутбук Ipthon |
Важные пакеты и библиотека | Tydiverse, ggplot2, карета, зоопарк | панды, сципи, скикит-учи, TensorFlow, карет |
Недостатки | Медленно высокая кривая обучения Зависимости между библиотеками | Не так много библиотек, как R |
преимущества |
|
|
R или Python Использование
Python был разработан Гвидо ван Россумом, компьютерным парнем, примерно в 1991 году. В Python есть влиятельные библиотеки для математики, статистики и искусственного интеллекта. Вы можете думать о Python как о чистом игроке в машинном обучении. Тем не менее, Python не совсем зрел (пока) для эконометрики и коммуникации. Python — лучший инструмент для интеграции и развертывания машинного обучения, но не для бизнес-аналитики.
Хорошей новостью является то, что R разработан учеными и учеными. Он предназначен для решения статистических задач, машинного обучения и науки о данных. R является правильным инструментом для науки о данных из-за его мощных коммуникационных библиотек. Кроме того, R оснащен множеством пакетов для анализа временных рядов, панельных данных и анализа данных. Кроме того, нет лучших инструментов по сравнению с R.
По нашему мнению, если вы новичок в науке о данных и обладаете необходимой статистической базой, вам нужно задать себе два следующих вопроса:
- Хочу ли я узнать, как работает алгоритм?
- Хочу ли я развернуть модель?
Если вы ответите «да», вы, вероятно, начнете изучать Python в первую очередь. С одной стороны, Python включает в себя отличные библиотеки для манипулирования матрицей или кодирования алгоритмов. Начинающему может быть проще научиться создавать модель с нуля, а затем переключаться на функции из библиотек машинного обучения. С другой стороны, вы уже знаете алгоритм или хотите сразу приступить к анализу данных, тогда и R, и Python — это нормально. Одно преимущество для R, если вы собираетесь сосредоточиться на статистических методах.
Во-вторых, если вы хотите делать больше, чем статистика, скажем, развертывание и воспроизводимость, Python — лучший выбор. R больше подходит для вашей работы, если вам нужно написать отчет и создать панель управления.
Короче говоря, статистический разрыв между R и Python становится все ближе. Большая часть работы может выполняться на обоих языках. Вам лучше выбрать тот, который соответствует вашим потребностям, а также инструмент, который используют ваши коллеги. Лучше, когда вы все говорите на одном языке. После того, как вы знаете свой первый язык программирования, выучить второй проще.
Вывод
В конце концов, выбор между R или Python зависит от:
- Цели вашей миссии: статистический анализ или развертывание
- Количество времени, которое вы можете инвестировать
- Ваша компания / отрасль наиболее используемый инструмент