Учебники

5) Создание, изменение и удаление таблицы

Табличные операции, такие как создание, изменение и удаление таблиц в Hive, можно наблюдать в этом руководстве.

На приведенном ниже снимке экрана мы создаем таблицу со столбцами и изменяем имя таблицы.

1. Создание таблицы guru_sample с двумя именами столбцов, такими как «empid» и «empname»

2. Отображение таблиц, присутствующих в базе данных guru99

3. Отображение Guru_sample под таблицами

4. Изменение таблицы «guru_sample» как «guru_sampleNew»

5. Снова, когда вы выполните команду «show», она отобразит новое имя Guru_sampleNew.

Операции с данными в Hive

Dropping table guru_sampleNew:

Операции с данными в Hive

Типы таблиц и их использование:

Переход к таблицам — это то же самое, что мы создаем в традиционных реляционных базах данных. Такие функции, как фильтрация, объединения могут быть выполнены на столах.

Hive имеет дело с двумя типами табличных структур, такими как Внутренние и Внешние таблицы, в зависимости от загрузки и дизайна схемы в Hive.

Внутренние таблицы

  • Внутренняя таблица тесно связана по своей природе. В этом типе таблицы сначала необходимо создать таблицу и загрузить данные.
  • Мы можем назвать это как данные на схеме .
  • При удалении этой таблицы и данные, и схема будут удалены.
  • Хранимое расположение этой таблицы будет в / user / hive / warehouse.

Когда выбрать внутреннюю таблицу:

  • Если обработка данных доступна в локальной файловой системе
  • Если мы хотим, чтобы Hive управлял полным жизненным циклом данных, включая удаление

Пример кода Фрагмент для внутренней таблицы

1. Создать внутреннюю таблицу

 Hive>CREATE TABLE guruhive_internaltable (id INT,Name STRING);
	 Row format delimited 
	 Fields terminated by '\t';

2. Загрузите данные во внутреннюю таблицу

    Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO table guruhive_internaltable;

3. Показать содержимое таблицы

    Hive>select * from guruhive_internaltable;

4. Сбросить внутренний стол

    Hive>DROP TABLE guruhive_internaltable;

Если вы удалили guruhive_internaltable, включая его метаданные и данные, они будут удалены из Hive.

На следующем скриншоте мы можем наблюдать результат

Операции с данными в Hive

В приведенном выше коде и на снимке экрана мы делаем следующие вещи,

  • Создать внутреннюю таблицу
  • Загрузить данные во внутреннюю таблицу
  • Показать содержимое таблицы
  • Сбросить внутренний стол

Внешние столы

  • Внешний стол слабо связан по своей природе. Данные будут доступны в HDFS. Таблица будет создана на основе данных HDFS.
  • Другими словами, мы можем сказать, как создание схемы для данных .
  • Во время удаления таблицы удаляется только схема, данные будут по-прежнему доступны в HDFS, как и раньше.
  • Внешние таблицы предоставляют возможность создавать несколько схем для данных, хранящихся в HDFS, вместо удаления данных каждый раз при обновлении схемы

Когда выбрать внешнюю таблицу:

  • Если обработка данных доступна в HDFS
  • Полезно, когда файлы используются за пределами Hive

Пример кода Фрагмент для внешнего стола

1. Создать внешнюю таблицу

Hive>CREATE EXTERNAL TABLE guruhive_external(id INT,Name STRING)
	 Row format delimited
	 Fields terminated by '\t'
	 LOCATION '/user/guru99hive/guruhive_external;

2. Если мы не указываем местоположение во время создания таблицы, мы можем загрузить данные вручную

    Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO TABLE guruhive_external;

3. Показать содержимое таблицы

  Hive>select * from guruhive_external;

4. Сбросить внутренний стол

  Hive>DROP TABLE guruhive_external;

На следующем снимке экрана мы можем наблюдать результат

Операции с данными в Hive

В приведенном выше коде мы делаем следующие вещи

  • Создать внешнюю таблицу
  • Загрузить данные во внешнюю таблицу
  • Показать содержимое таблицы
  • Отбрасывание внешнего стола

Разница между внутренними и внешними таблицами

Характерная черта внутренний внешний
схема Данные по схеме Схема по данным
Место хранения / USR / улей / склад Расположение HDFS
Доступность данных Внутри локальной файловой системы В HDFS