Учебники

Sqoop — Работа

В этой главе описывается, как создавать и поддерживать задания Sqoop. Задание Sqoop создает и сохраняет команды импорта и экспорта. Он определяет параметры для идентификации и вызова сохраненной работы. Этот повторный вызов или повторное выполнение используется в добавочном импорте, который может импортировать обновленные строки из таблицы RDBMS в HDFS.

Синтаксис

Ниже приведен синтаксис для создания задания Sqoop.

$ sqoop job (generic-args) (job-args)
   [-- [subtool-name] (subtool-args)]

$ sqoop-job (generic-args) (job-args)
   [-- [subtool-name] (subtool-args)]

Создать работу (—создать)

Здесь мы создаем задание с именем myjob , которое может импортировать данные таблицы из таблицы RDBMS в HDFS. Следующая команда используется для создания задания, которое импортирует данные из таблицы employee в базе данных db в файл HDFS.

$ sqoop job --create myjob \
-- import \
--connect jdbc:mysql://localhost/db \
--username root \
--table employee --m 1

Подтвердить работу (—list)

Аргумент —list используется для проверки сохраненных заданий. Следующая команда используется для проверки списка сохраненных заданий Sqoop.

$ sqoop job --list

Показывает список сохраненных заданий.

Available jobs: 
   myjob

Осмотреть работу (—show)

Аргумент —show используется для проверки или проверки конкретных заданий и их данных. Следующая команда и пример выходных данных используются для проверки задания myjob .

$ sqoop job --show myjob

Он показывает инструменты и их параметры, которые используются в myjob .

Job: myjob 
 Tool: import Options:
 ---------------------------- 
 direct.import = true
 codegen.input.delimiters.record = 0
 hdfs.append.dir = false 
 db.table = employee
 ...
 incremental.last.value = 1206
 ...

Выполнить задание (—exec)

Параметр —exec используется для выполнения сохраненного задания. Следующая команда используется для выполнения сохраненного задания под названием myjob .

$ sqoop job --exec myjob

Он показывает вам следующий вывод.