Табличные операции, такие как создание, изменение и удаление таблиц в Hive, можно наблюдать в этом руководстве.
На приведенном ниже снимке экрана мы создаем таблицу со столбцами и изменяем имя таблицы.
1. Создание таблицы guru_sample с двумя именами столбцов, такими как «empid» и «empname»
2. Отображение таблиц, присутствующих в базе данных guru99
3. Отображение Guru_sample под таблицами
4. Изменение таблицы «guru_sample» как «guru_sampleNew»
5. Снова, когда вы выполните команду «show», она отобразит новое имя Guru_sampleNew.
Dropping table guru_sampleNew:
Типы таблиц и их использование:
Переход к таблицам — это то же самое, что мы создаем в традиционных реляционных базах данных. Такие функции, как фильтрация, объединения могут быть выполнены на столах.
Hive имеет дело с двумя типами табличных структур, такими как Внутренние и Внешние таблицы, в зависимости от загрузки и дизайна схемы в Hive.
Внутренние таблицы
- Внутренняя таблица тесно связана по своей природе. В этом типе таблицы сначала необходимо создать таблицу и загрузить данные.
- Мы можем назвать это как данные на схеме .
- При удалении этой таблицы и данные, и схема будут удалены.
- Хранимое расположение этой таблицы будет в / user / hive / warehouse.
Когда выбрать внутреннюю таблицу:
- Если обработка данных доступна в локальной файловой системе
- Если мы хотим, чтобы Hive управлял полным жизненным циклом данных, включая удаление
Пример кода Фрагмент для внутренней таблицы
1. Создать внутреннюю таблицу
Hive>CREATE TABLE guruhive_internaltable (id INT,Name STRING); Row format delimited Fields terminated by '\t';
2. Загрузите данные во внутреннюю таблицу
Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO table guruhive_internaltable;
3. Показать содержимое таблицы
Hive>select * from guruhive_internaltable;
4. Сбросить внутренний стол
Hive>DROP TABLE guruhive_internaltable;
Если вы удалили guruhive_internaltable, включая его метаданные и данные, они будут удалены из Hive.
На следующем скриншоте мы можем наблюдать результат
В приведенном выше коде и на снимке экрана мы делаем следующие вещи,
- Создать внутреннюю таблицу
- Загрузить данные во внутреннюю таблицу
- Показать содержимое таблицы
- Сбросить внутренний стол
Внешние столы
- Внешний стол слабо связан по своей природе. Данные будут доступны в HDFS. Таблица будет создана на основе данных HDFS.
- Другими словами, мы можем сказать, как создание схемы для данных .
- Во время удаления таблицы удаляется только схема, данные будут по-прежнему доступны в HDFS, как и раньше.
- Внешние таблицы предоставляют возможность создавать несколько схем для данных, хранящихся в HDFS, вместо удаления данных каждый раз при обновлении схемы
Когда выбрать внешнюю таблицу:
- Если обработка данных доступна в HDFS
- Полезно, когда файлы используются за пределами Hive
Пример кода Фрагмент для внешнего стола
1. Создать внешнюю таблицу
Hive>CREATE EXTERNAL TABLE guruhive_external(id INT,Name STRING) Row format delimited Fields terminated by '\t' LOCATION '/user/guru99hive/guruhive_external;
2. Если мы не указываем местоположение во время создания таблицы, мы можем загрузить данные вручную
Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO TABLE guruhive_external;
3. Показать содержимое таблицы
Hive>select * from guruhive_external;
4. Сбросить внутренний стол
Hive>DROP TABLE guruhive_external;
На следующем снимке экрана мы можем наблюдать результат
В приведенном выше коде мы делаем следующие вещи
- Создать внешнюю таблицу
- Загрузить данные во внешнюю таблицу
- Показать содержимое таблицы
- Отбрасывание внешнего стола
Разница между внутренними и внешними таблицами
Характерная черта | внутренний | внешний |
схема | Данные по схеме | Схема по данным |
Место хранения | / USR / улей / склад | Расположение HDFS |
Доступность данных | Внутри локальной файловой системы | В HDFS |