Статьи

Подключение автономного хранилища данных с Python

Огромный склад с очень высокими потолками

В этой статье я подключусь к базе данных Oracle, работающей в облаке (Oracle Автономное хранилище данных), и создам простое регрессионное приложение в среде Python с образцами данных, взятыми отсюда.

Прежде всего, я сделаю это приложение в автономном хранилище данных (БД), которое предлагается в качестве сервиса в Oracle Cloud. Все, что мне нужно, это учетная запись Oracle Cloud. Вы можете бесплатно получить услугу «Автономное хранилище данных», которая является одной из услуг Always Free (Oracle Free Tier) , и вы можете предоставить и использовать ее в облаке за считанные минуты без какой-либо установки. Вы можете перейти по ссылке для получения подробной информации.

Вы можете запустить службу автономного хранилища данных через облачную инфраструктуру Oracle, как показано на видео ниже.

Второй компонент, который мне нужен, это установить пакет cx_oracle в python для подключения к базе данных Oracle в облаке из моей локальной среды. Следующим шагом является установка Oracle Client на моем компьютере.

Вам также могут понравиться:  Хранилища данных: прошлое, настоящее и будущее

Вы можете сделать вышеуказанные установки, перейдя по ссылке .

Мне нужен набор данных и проблема для его реализации. Я выбираю цены на жилье в Бостоне как проблему. Чтобы решить эту проблему, я построю регрессионную модель. Я получаю набор данных из Kaggle ( Boston Housing ).

Давайте сначала рассмотрим набор данных BOSTON_HOUSING.

Имя столбца Описание Тип данных
CRIM уровень преступности на душу населения по городам. номер
гп доля жилой земли зонирована под участки более 25 000 кв. футов. номер
промышл доля неторговых площадей на город. номер
Чес Фиктивная переменная реки Чарльз (= 1, если тракт ограничивает реку; 0 в противном случае). номер
NOx концентрация оксидов азота (частей на 10 миллионов). номер
комната среднее количество комнат в доме. номер
возраст доля домовладельцев, построенных до 1940 года. номер
дис средневзвешенное расстояние до пяти бостонских центров занятости. номер
радиан индекс доступности к радиальным магистралям. номер
налог ставка налога на имущество на полную стоимость за 10 000 долларов США. номер
ptratio соотношение ученик-учитель по городу. номер
черный 1000 (Bk – 0,63) ^ 2, где Bk – доля черных в городе. номер
lstat более низкий статус населения (в процентах). номер
MEDV средняя стоимость домов, занимаемых владельцами, в 1000 долларов.

номер

Теперь, когда мы проверили детали с нашим набором данных, давайте загрузим BOSTON_HOUSING, который мы загрузили, в нашу базу данных Oracle.

Сначала создайте таблицу Oracle, в которую мы будем загружать загруженный набор данных (train.csv).



SQL