Если вы работаете с большими сетевыми наборами данных, вам, вероятно, следует использовать NetCDF , форму общих данных сети из Unidata:
NetCDF — это набор программных библиотек и самоописываемых, машинно-независимых форматов данных, которые поддерживают создание, доступ и совместное использование научных данных, ориентированных на массивы.
Для поддержки NetCDF может быть создано большое количество высококлассного программного обеспечения для анализа, и оно незаменимо для работы с сетевыми наборами данных, которые весят десятки гигабайт или более. В этом кратком сообщении описывается самый простой способ установки библиотек NetCDF и пакета R ‘ncdf’ на наши любимые системы: CentOS, Ubuntu и Mac OSX.
CentOS 6.x
CentOS — это операционная система, если вам нужен бесплатный, надежный сервер с открытым исходным кодом для размещения вашего научного анализа. В основном это не брендированный клон Red Hat Enterprise Linux. Следующие инструкции работают на CentOS 6.2.
Установка системных библиотек
Сначала перейдите по адресу http://fedoraproject.org/wiki/EPEL и проверьте наличие последней версии расширенных пакетов для корпоративного Linux (которая содержит NetCDF, HDF и многие другие полезные пакеты). Последняя версия должна быть указана на этой странице . Чтобы загрузить локальную копию EPEL и установить с нее NetCDF, просто выполните следующие команды:
sudo wget http://mirror.metrocast.net/fedora/epel/6/i386/epel-release-6-8.noarch.rpm sudo rpm -Uvh epel-release-6-8.noarch.rpm sudo yum --assumeyes install netcdf sudo yum --assumeyes install netcdf-devel
Обратите внимание, что добавление EPEL в качестве архива пакетов во второй строке не приводит к автоматической установке всех пакетов в EPEL. Нам пришлось вручную установить netcdf и netcdf-dev. Список других доступных пакетов приведен на вики EPEL, указанной выше.
Установка пакета R ‘ncdf’
С библиотеками на месте, теперь мы можем установить ncdf пакет для нашего любимого статистического пакета — R .
sudo wget http://cran.r-project.org/src/contrib/ncdf_1.6.6.tar.gz sudo R CMD INSTALL --configure-args="--with-netcdf-include=/usr/include --with-netcdf-lib=/usr/lib" ncdf_1.6.6.tar.gz
Ubuntu 12.04
Ubuntu прост в установке и имеет отличный пользовательский интерфейс для систем Linux. Ubuntu 12.0.4 — это самая последняя долгосрочная стабильная версия.
Установка системных библиотек
Следующие инструкции работали на Ubuntu 12.04 LTS. Чтобы установить библиотеки NetCDF, позволяющие читать, писать и манипулировать, используйте apt-get, а не загружайте исходные файлы и устанавливайте их самостоятельно. Для установки откройте терминал и введите:
sudo apt-get install netcdf
Установка пакета R ‘ncdf’
Базовая версия R на Ubuntu 12.04 slt — 2.14.1. К сожалению, нажатие кнопки установки в RStudio и ввод ncdf будут работать только на уровне пользователя. Пакет будет установлен не для всех пользователей и даже не будет отображаться во всех ваших проектах RStudio. Чтобы установить инструменты ncdf в глобальной библиотеке, вы должны запустить R от имени пользователя root и использовать следующую команду:
install.packages(repos=c('http://cran.fhcrc.org/'),pkgs=c('ncdf'),lib="/usr/lib/R/site-library/")
«http://cran.fhcrc.org/» следует заменить на
любое зеркало CRAN, которое вам ближе.
OSX 10.8.4
Mac работают под управлением OSX, которая основана на Unix. Следующие инструкции работали на OSX 10.8.4 — Mountain Lion.
Установка системных библиотек
Самый простой способ установить NetCDF на Mac — Macports . Macports — это программный пакет, разработанный для упрощения установки и компиляции программного обеспечения. Macports .pkg и инструкции по установке доступны здесь .
После установки Macports сборка и установка библиотек NetCDF — это одно действие.
sudo port install netcdf
Более подробная информация и инструкции по установке Fortran и Python API доступны
здесь .
Установка пакета R ‘ncdf’
Наличие инструментов командной строки NetCDF не обязательно для использования пакета ncdf R. Просто загрузите пакет из CRAN ( ссылка ) или нажмите кнопку «Установить пакеты» в RStudio. Этот пакет позволяет читать, записывать и манипулировать существующими файлами .nc.
Однако способность пакета просматривать содержимое файлов nc перед загрузкой их в рабочую область R ограничена. По этой причине установка инструментов NetCDF, описанных в первом разделе этого сообщения, чрезвычайно важна. Инструменты командной строки, такие как «ncdump», имеют решающее значение для эффективной работы с файлами NetCDF.