Учебники

4) Операции с данными в Hive

Типы данных в Hive

Типы данных являются очень важными элементами языка запросов Hive и моделирования данных. Для определения типов столбцов таблицы мы должны знать о типах данных и их использовании.

Ниже приводится краткий обзор некоторых типов данных, представленных в Hive:

Эти

  • Числовые Типы
  • Типы строк
  • Типы даты / времени
  • Сложные типы

Числовые типы:

Тип Выделение памяти
TINY INT 1-байтовое целое число со знаком (от -128 до 127)
МАЛЫЙ ИНТ 2-байтовое целое число со знаком (от -32768 до 32767)
INT 4-байтовое целое число со знаком (от 2 147 484 648 до 2 147 484 647)
БОЛЬШОЙ ИНТ 8-байтовое целое число со знаком
FLOAT 4-байтовое число с плавающей запятой одинарной точности
DOUBLE 8-байтовое число с плавающей запятой двойной точности
ДЕСЯТИЧНЫЙ Мы можем определить точность и масштаб в этом типе

Типы строк:

Тип длина
CHAR 255
VARCHAR 1 до 65355
STRING Мы можем определить длину здесь (без ограничений)

Типы даты / времени:

Тип Применение
Отметка Поддерживает традиционную временную метку Unix с дополнительной точностью наносекунды
Свидание
  • Это в формате ГГГГ-ММ-ДД.
  • Диапазон значений, поддерживаемых для типа Date, может быть от 0000-01-01 до 9999-12-31, в зависимости от поддержки примитивного типа даты Java.

Сложные типы:

Тип Применение
Массивы ARRAY <data_type> Отрицательные значения и непостоянные выражения недопустимы
Карты MAP <primitive_type, data_type> Отрицательные значения и непостоянные выражения не допускаются
Структуры STRUCT <col_name: datat_type,… ..>
союз UNIONTYPE <тип_данных, тип_данных, ……>

Создание и удаление базы данных в Hive:

Создать базу данных:

Для создания базы данных в оболочке Hive, мы должны использовать команду, как показано в синтаксисе ниже: —

Синтаксис:

Создать базу данных <DatabaseName>

Пример: -Создание базы данных «guru99»

Операции с данными в Hive

Из приведенного выше снимка экрана мы делаем две вещи

  • Создание базы данных «guru99» в Hive
  • Отображение существующих баз данных с помощью команды show
  • На том же экране имя базы данных «guru99» отображается в конце, когда мы выполняем команду show. Это означает, что база данных «guru99» успешно создана.

Удалить базу данных:

Для удаления базы данных в оболочке Hive мы должны использовать команду «drop», как показано в синтаксисе ниже:

Синтаксис:

Удалить базу данных <DatabaseName>

Пример:-

Удалить базу данных гуру99

Операции с данными в Hive

На скриншоте выше мы делаем две вещи

  • Мы сбрасываем базу данных ‘guru99’ из Hive
  • Перекрестная проверка то же самое с командой «show»
  • На этом же экране после проверки баз данных с помощью команды show база данных «guru99» не появляется внутри Hive.
  • Теперь мы можем подтвердить, что база данных «guru99» удалена