В этой главе описывается, как создавать и поддерживать задания Sqoop. Задание Sqoop создает и сохраняет команды импорта и экспорта. Он определяет параметры для идентификации и вызова сохраненной работы. Этот повторный вызов или повторное выполнение используется в добавочном импорте, который может импортировать обновленные строки из таблицы RDBMS в HDFS.
Синтаксис
Ниже приведен синтаксис для создания задания Sqoop.
$ sqoop job (generic-args) (job-args) [-- [subtool-name] (subtool-args)] $ sqoop-job (generic-args) (job-args) [-- [subtool-name] (subtool-args)]
Создать работу (—создать)
Здесь мы создаем задание с именем myjob , которое может импортировать данные таблицы из таблицы RDBMS в HDFS. Следующая команда используется для создания задания, которое импортирует данные из таблицы employee в базе данных db в файл HDFS.
$ sqoop job --create myjob \ -- import \ --connect jdbc:mysql://localhost/db \ --username root \ --table employee --m 1
Подтвердить работу (—list)
Аргумент —list используется для проверки сохраненных заданий. Следующая команда используется для проверки списка сохраненных заданий Sqoop.
$ sqoop job --list
Показывает список сохраненных заданий.
Available jobs: myjob
Осмотреть работу (—show)
Аргумент —show используется для проверки или проверки конкретных заданий и их данных. Следующая команда и пример выходных данных используются для проверки задания myjob .
$ sqoop job --show myjob
Он показывает инструменты и их параметры, которые используются в myjob .
Job: myjob Tool: import Options: ---------------------------- direct.import = true codegen.input.delimiters.record = 0 hdfs.append.dir = false db.table = employee ... incremental.last.value = 1206 ...
Выполнить задание (—exec)
Параметр —exec используется для выполнения сохраненного задания. Следующая команда используется для выполнения сохраненного задания под названием myjob .
$ sqoop job --exec myjob
Он показывает вам следующий вывод.