Статьи

Установка NetCDF и R ‘ncdf’

Если вы работаете с большими сетевыми наборами данных, вам, вероятно, следует использовать NetCDF , форму общих данных сети из Unidata:

NetCDF — это набор программных библиотек и самоописываемых, машинно-независимых форматов данных, которые поддерживают создание, доступ и совместное использование научных данных, ориентированных на массивы.

Для поддержки NetCDF может быть создано большое количество высококлассного программного обеспечения для анализа, и оно незаменимо для работы с сетевыми наборами данных, которые весят десятки гигабайт или более. В этом кратком сообщении описывается самый простой способ установки библиотек NetCDF и пакета R ‘ncdf’ на наши любимые системы: CentOS, Ubuntu и Mac OSX.

CentOS 6.x

CentOS — это операционная система, если вам нужен бесплатный, надежный сервер с открытым исходным кодом для размещения вашего научного анализа. В основном это не брендированный клон Red Hat Enterprise Linux. Следующие инструкции работают на CentOS 6.2.

Установка системных библиотек

Сначала перейдите по  адресу http://fedoraproject.org/wiki/EPEL  и проверьте наличие последней версии расширенных пакетов для корпоративного Linux (которая содержит NetCDF, HDF и многие другие полезные пакеты). Последняя версия должна быть указана на  этой странице . Чтобы загрузить локальную копию EPEL и установить с нее NetCDF, просто выполните следующие команды:

sudo wget http://mirror.metrocast.net/fedora/epel/6/i386/epel-release-6-8.noarch.rpm
sudo rpm -Uvh epel-release-6-8.noarch.rpm
sudo yum --assumeyes install netcdf
sudo yum --assumeyes install netcdf-devel

Обратите внимание, что добавление EPEL в качестве архива пакетов во второй строке не приводит к автоматической установке всех пакетов в EPEL. Нам пришлось вручную установить netcdf и netcdf-dev. Список других доступных пакетов приведен на вики EPEL, указанной выше.

Установка пакета R ‘ncdf’

С библиотеками на месте, теперь мы можем установить  ncdf  пакет для нашего любимого статистического пакета — R .

sudo wget http://cran.r-project.org/src/contrib/ncdf_1.6.6.tar.gz
sudo R CMD INSTALL --configure-args="--with-netcdf-include=/usr/include --with-netcdf-lib=/usr/lib" ncdf_1.6.6.tar.gz

Ubuntu 12.04

Ubuntu прост в установке и имеет отличный пользовательский интерфейс для систем Linux. Ubuntu 12.0.4 — это самая последняя долгосрочная стабильная версия.

Установка системных библиотек

Следующие инструкции работали на Ubuntu 12.04 LTS. Чтобы установить библиотеки NetCDF, позволяющие читать, писать и манипулировать, используйте apt-get, а не загружайте исходные файлы и устанавливайте их самостоятельно. Для установки откройте терминал и введите:

sudo apt-get install netcdf

Установка пакета R ‘ncdf’

Базовая версия R на Ubuntu 12.04 slt — 2.14.1. К сожалению, нажатие кнопки установки в RStudio и ввод ncdf будут работать только на уровне пользователя. Пакет будет установлен не для всех пользователей и даже не будет отображаться во всех ваших проектах RStudio. Чтобы установить инструменты ncdf в глобальной библиотеке, вы должны запустить R от имени пользователя root и использовать следующую команду:

install.packages(repos=c('http://cran.fhcrc.org/'),pkgs=c('ncdf'),lib="/usr/lib/R/site-library/")

«http://cran.fhcrc.org/» следует заменить на 
любое зеркало CRAN,  которое вам ближе.

OSX 10.8.4

Mac работают под управлением OSX, которая основана на Unix. Следующие инструкции работали на OSX 10.8.4 — Mountain Lion.

Установка системных библиотек

Самый простой способ установить NetCDF на Mac —  Macports . Macports — это программный пакет, разработанный для упрощения установки и компиляции программного обеспечения. Macports .pkg и инструкции по установке доступны  здесь .

После установки Macports сборка и установка библиотек NetCDF — это одно действие.

sudo port install netcdf

Более подробная информация и инструкции по установке Fortran и Python API доступны 
здесь .

Установка пакета R ‘ncdf’

Наличие инструментов командной строки NetCDF не обязательно для использования пакета ncdf R. Просто загрузите пакет из CRAN ( ссылка ) или нажмите кнопку «Установить пакеты» в RStudio. Этот пакет позволяет читать, записывать и манипулировать существующими файлами .nc.

Однако способность пакета просматривать содержимое файлов nc перед загрузкой их в рабочую область R ограничена. По этой причине установка инструментов NetCDF, описанных в первом разделе этого сообщения, чрезвычайно важна. Инструменты командной строки, такие как «ncdump», имеют решающее значение для эффективной работы с файлами NetCDF.