Учебники

R — файл Excel

Microsoft Excel является наиболее широко используемой программой для работы с электронными таблицами, которая хранит данные в формате .xls или .xlsx. R может читать напрямую из этих файлов, используя некоторые специальные пакеты Excel. Мало таких пакетов — XLConnect, xlsx, gdata и т. Д. Мы будем использовать пакет xlsx. R также может записать в файл Excel, используя этот пакет.

Установить пакет xlsx

Вы можете использовать следующую команду в консоли R для установки пакета «xlsx». Может потребоваться установить некоторые дополнительные пакеты, от которых зависит этот пакет. Для установки дополнительных пакетов выполните ту же команду с требуемым именем пакета.

install.packages("xlsx")

Проверьте и загрузите пакет «xlsx»

Используйте следующую команду для проверки и загрузки пакета «xlsx».

# Verify the package is installed.
any(grepl("xlsx",installed.packages()))

# Load the library into R workspace.
library("xlsx")

Когда скрипт запускается, мы получаем следующий вывод.

[1] TRUE
Loading required package: rJava
Loading required package: methods
Loading required package: xlsxjars

Ввод как файл xlsx

Откройте Microsoft Excel. Скопируйте и вставьте следующие данные в рабочий лист с именем sheet1.

id	name      salary    start_date	dept
1	Rick	    623.3	  1/1/2012	   IT
2	Dan       515.2     9/23/2013    Operations
3	Michelle  611	     11/15/2014	IT
4	Ryan	    729	     5/11/2014	   HR
5	Gary	    43.25     3/27/2015  	Finance
6	Nina	    578       5/21/2013	   IT
7	Simon	    632.8	  7/30/2013	   Operations
8	Guru	    722.5	  6/17/2014	   Finance

Также скопируйте и вставьте следующие данные в другой лист и переименуйте этот лист в «город».

name	    city
Rick	    Seattle
Dan       Tampa
Michelle  Chicago
Ryan	    Seattle
Gary	    Houston
Nina	    Boston
Simon	    Mumbai
Guru	    Dallas

Сохраните файл Excel как «input.xlsx». Вы должны сохранить его в текущем рабочем каталоге рабочей области R.

Чтение файла Excel

Input.xlsx читается с использованием функции read.xlsx (), как показано ниже. Результат сохраняется в виде фрейма данных в среде R.

# Read the first worksheet in the file input.xlsx.
data <- read.xlsx("input.xlsx", sheetIndex = 1)
print(data)

Когда мы выполняем приведенный выше код, он дает следующий результат —