Данные реляционных баз данных хранятся в нормализованном формате. Итак, для проведения статистических вычислений нам понадобятся очень сложные и сложные запросы SQL. Но R может легко подключаться ко многим реляционным базам данных, таким как MySql, Oracle, Sql-сервер и т. Д., И извлекать из них записи в виде фрейма данных. Как только данные становятся доступны в среде R, они становятся обычным набором данных R и могут обрабатываться или анализироваться с использованием всех мощных пакетов и функций.
В этом уроке мы будем использовать MySql в качестве справочной базы данных для подключения к R.
Пакет RMySQL
R имеет встроенный пакет с именем «RMySQL», который обеспечивает встроенную связь между базой данных MySql. Вы можете установить этот пакет в среде R, используя следующую команду.
install.packages("RMySQL")
Подключение R к MySql
После установки пакета мы создаем объект подключения в R для подключения к базе данных. Он принимает имя пользователя, пароль, имя базы данных и имя хоста в качестве входных данных.
# Create a connection Object to MySQL database. # We will connect to the sampel database named "sakila" that comes with MySql installation. mysqlconnection = dbConnect(MySQL(), user = 'root', password = '', dbname = 'sakila', host = 'localhost') # List the tables available in this database. dbListTables(mysqlconnection)
Когда мы выполняем приведенный выше код, он дает следующий результат —
[1] "actor" "actor_info" [3] "address" "category" [5] "city" "country" [7] "customer" "customer_list" [9] "film" "film_actor" [11] "film_category" "film_list" [13] "film_text" "inventory" [15] "language" "nicer_but_slower_film_list" [17] "payment" "rental" [19] "sales_by_film_category" "sales_by_store" [21] "staff" "staff_list" [23] "store"
Опрос таблиц
Мы можем запросить таблицы базы данных в MySql, используя функцию dbSendQuery () . Запрос выполняется в MySql, а набор результатов возвращается с помощью функции R fetch () . Наконец, он сохраняется как фрейм данных в R.
# Query the "actor" tables to get all the rows. result = dbSendQuery(mysqlconnection, "select * from actor") # Store the result in a R data frame object. n = 5 is used to fetch first 5 rows. data.frame = fetch(result, n = 5) print(data.fame)
Когда мы выполняем приведенный выше код, он дает следующий результат —
actor_id first_name last_name last_update 1 1 PENELOPE GUINESS 2006-02-15 04:34:33 2 2 NICK WAHLBERG 2006-02-15 04:34:33 3 3 ED CHASE 2006-02-15 04:34:33 4 4 JENNIFER DAVIS 2006-02-15 04:34:33 5 5 JOHNNY LOLLOBRIGIDA 2006-02-15 04:34:33
Запрос с предложением фильтра
Мы можем передать любой действительный запрос на выборку, чтобы получить результат.
result = dbSendQuery(mysqlconnection, "select * from actor where last_name = 'TORN'") # Fetch all the records(with n = -1) and store it as a data frame. data.frame = fetch(result, n = -1) print(data)
Когда мы выполняем приведенный выше код, он дает следующий результат —
actor_id first_name last_name last_update 1 18 DAN TORN 2006-02-15 04:34:33 2 94 KENNETH TORN 2006-02-15 04:34:33 3 102 WALTER TORN 2006-02-15 04:34:33
Обновление строк в таблицах
Мы можем обновить строки в таблице Mysql, передав запрос на обновление в функцию dbSendQuery ().
dbSendQuery(mysqlconnection, "update mtcars set disp = 168.5 where hp = 110")
После выполнения приведенного выше кода мы видим, что таблица обновлена в среде MySql.
Вставка данных в таблицы
dbSendQuery(mysqlconnection, "insert into mtcars(row_names, mpg, cyl, disp, hp, drat, wt, qsec, vs, am, gear, carb) values('New Mazda RX4 Wag', 21, 6, 168.5, 110, 3.9, 2.875, 17.02, 0, 1, 4, 4)" )
После выполнения приведенного выше кода мы видим строку, вставленную в таблицу в среде MySql.
Создание таблиц в MySql
Мы можем создавать таблицы в MySql, используя функцию dbWriteTable () . Он перезаписывает таблицу, если она уже существует, и принимает фрейм данных в качестве входных данных.
# Create the connection object to the database where we want to create the table. mysqlconnection = dbConnect(MySQL(), user = 'root', password = '', dbname = 'sakila', host = 'localhost') # Use the R data frame "mtcars" to create the table in MySql. # All the rows of mtcars are taken inot MySql. dbWriteTable(mysqlconnection, "mtcars", mtcars[, ], overwrite = TRUE)
После выполнения приведенного выше кода мы можем увидеть таблицу, созданную в среде MySql.
Отбрасывание таблиц в MySql
Мы можем отбрасывать таблицы в базе данных MySql, передавая оператор отбрасывания таблиц в dbSendQuery () так же, как мы использовали его для запроса данных из таблиц.
dbSendQuery(mysqlconnection, 'drop table if exists mtcars')
После выполнения приведенного выше кода мы видим, что таблица отброшена в среде MySql.