Администрирование служб данных включает создание заданий в реальном времени и пакетных заданий, планирование заданий, встроенный поток данных, переменные и параметры, механизм восстановления, профилирование данных, настройку производительности и т. Д.
Работа в реальном времени
Вы можете создавать задания в реальном времени для обработки сообщений в реальном времени в конструкторе служб данных. Как пакетное задание, задание в реальном времени извлекает данные, преобразует и загружает их.
Каждое задание в реальном времени может извлекать данные из одного сообщения. Вы также можете извлечь данные из других источников, таких как таблицы или файлы.
Задания в реальном времени не выполняются с помощью триггеров в отличие от пакетных заданий. Они выполняются администраторами в режиме реального времени. Службы реального времени ждут сообщений от сервера доступа. Сервер доступа получает это сообщение и передает его службам реального времени, которые настроены на обработку типа сообщения. Службы реального времени выполняют сообщение, возвращают результат и продолжают обрабатывать сообщения, пока не получат инструкцию прекратить выполнение.
Real Time vs Batch Jobs
Преобразования, такие как ветви и логика управления, чаще используются в работе в реальном времени, что не относится к пакетным заданиям в конструкторе.
Задания в реальном времени не выполняются в ответ на расписание или внутренний триггер в отличие от пакетных заданий.
Создание рабочих мест в реальном времени
Задания в реальном времени могут быть созданы с использованием таких же объектов, как потоки данных, рабочие потоки, циклы, условные выражения, сценарии и т. Д.
Вы можете использовать следующие модели данных для создания рабочих мест в реальном времени —
- Модель единого потока данных
- Модель с несколькими потоками данных
Модель единого потока данных
Вы можете создать задание в реальном времени с одним потоком данных в его цикле обработки в реальном времени, которое включает в себя один источник сообщения и одну цель сообщения.
Создание работы в реальном времени с использованием единой модели данных —
Чтобы создать работу в реальном времени с использованием единой модели данных, выполните указанные шаги.
Шаг 1 — Перейдите в Дизайнер служб данных → Проект новый → Проект → Введите имя проекта
Шаг 2 — Щелкните правой кнопкой мыши пустое пространство в области проекта → Новая работа в реальном времени.
Рабочая область показывает две составляющие работы в реальном времени —
- RT_Process_begins
- Step_ends
Он показывает начало и конец работы в реальном времени.
Шаг 3 — Чтобы создать задание в реальном времени с одним потоком данных, выберите поток данных из палитры инструментов на правой панели и перетащите его в рабочее пространство.
Щелкните внутри цикла, вы можете использовать один источник сообщения и одну цель сообщения в цикле обработки в реальном времени. Подключите начальную и конечную метки к потоку данных.
Шаг 4 — Добавьте необходимые объекты конфигурации в поток данных и сохраните задание.
Модель с несколькими потоками данных
Это позволяет создавать задания в реальном времени с несколькими потоками данных в цикле обработки в реальном времени. Также необходимо убедиться, что данные в каждой модели данных полностью обработаны, прежде чем они перейдут к следующему сообщению.
Тестирование в реальном времени
Вы можете проверить работу в реальном времени, передав образец сообщения в виде исходного сообщения из файла. Вы можете проверить, генерируют ли службы данных ожидаемое целевое сообщение.
Чтобы ваша работа дала ожидаемый результат, вы можете выполнить ее в режиме просмотра данных. Используя этот режим, вы можете захватывать выходные данные, чтобы убедиться, что ваша работа в реальном времени работает нормально.
Встроенные потоки данных
Встроенный поток данных известен как потоки данных, которые вызываются из другого потока данных в проекте. Внедренный поток данных может содержать несколько номеров источника и целей, но только один входной или выходной поток данных в основной поток данных.
Можно использовать следующие типы встроенных потоков данных:
-
Один вход — встроенный поток данных добавляется в конце потока данных.
-
Один выход — встроенный поток данных добавляется в начале потока данных.
-
Нет ввода или вывода — репликация существующего потока данных.
Один вход — встроенный поток данных добавляется в конце потока данных.
Один выход — встроенный поток данных добавляется в начале потока данных.
Нет ввода или вывода — репликация существующего потока данных.
Встроенный поток данных может использоваться для следующих целей —
Для упрощения отображения потока данных.
Если вы хотите сохранить логику потока и повторно использовать ее в других потоках данных.
Для отладки, при которой вы создаете разделы потока данных как встроенный поток данных и выполняете их отдельно.