Учебники

2) Informatica Architecture

Инструмент Informatica ETL состоит из следующих сервисов и компонентов

  1. Служба репозитория — отвечает за ведение метаданных Informatica и предоставление доступа к ним другим службам.
  2. Служба интеграции — отвечает за перемещение данных от источников к целям
  3. Служба отчетов — позволяет создавать отчеты
  4. Узлы — вычислительная платформа, на которой выполняются вышеперечисленные услуги
  1. Informatica Designer — используется для создания отображений между источником и целью
  2. Workflow Manager — используется для создания рабочих процессов и других задач и их выполнения
  3. Workflow Monitor — используется для мониторинга выполнения рабочих процессов
  4. Диспетчер репозитория — используется для управления объектами в репозитории

Informatica Архитектура Учебник

В этом уроке вы узнаете

Домен Informatica

Общая архитектура Informatica — это сервис-ориентированная архитектура (SOA).

  • Informatica Domain является основной административной единицей в инструменте Informatica.
  • Это набор узлов и сервисов. Кроме того, эти узлы и службы могут быть разделены на папки и подпапки в зависимости от требований администрирования.

Например, на приведенном ниже снимке экрана вы можете увидеть под окном домена папку «Domain_Rajesh», в которой мы создали имя узла «node01_rajesh» и сервисы как «сервисы интеграции guru99».

Informatica Архитектура Учебник

Узел является логическим представлением машины внутри домена. Узел требуется для запуска служб и процессов для Informatica.

Вы можете иметь несколько узлов в домене. В домене вы также найдете узел шлюза.

Узел шлюза отвечает за получение запросов от различных клиентских инструментов и маршрутизацию этих запросов к различным узлам и службам.

В Домене есть два типа услуг

  • Диспетчер служб. Диспетчер служб управляет операциями в домене, такими как проверка подлинности, авторизация и ведение журнала. Он также запускает службы приложений на узлах, а также управляет пользователями и группами.
  • Службы приложений. Служба приложений представляет собой специальные службы сервера, такие как служба интеграции, служба хранилища и служба отчетов. Эти службы работают на разных узлах в зависимости от конфигурации.

PowerCenter Repository

Хранилище PowerCenter является реляционной базой данных, такой как Oracle, Sybase, SQL- сервер, и управляется службой хранилища. Он состоит из таблиц базы данных, в которых хранятся метаданные.

В Informatica Powercenter доступны три клиентских инструмента Informatica. Они информатики

  • дизайнер
  • Монитор рабочего процесса
  • Диспетчер рабочего процесса

Эти клиенты могут получить доступ к хранилищу только через службу хранилища.

Для управления репозиторием существует служба Informatica, которая называется Repository Service. Один сервис репозитория обрабатывает только один репозиторий. Кроме того, служба репозитория может выполняться на нескольких узлах для повышения производительности.

Службы репозитория используют блокировки для объектов, поэтому несколько пользователей не могут изменять один и тот же объект одновременно.

Вы можете включить контроль версий в репозитории. С помощью функции контроля версий вы можете поддерживать разные версии одного и того же объекта.

Объекты, созданные в хранилище, могут иметь следующие три состояния

  • Действительный : действительными объектами являются те объекты, синтаксис которых является правильным согласно Informatica. Эти объекты могут быть использованы при выполнении рабочих процессов.
  • Invalid : недействительными объектами являются те, кто не придерживается указанного стандарта или правил. Когда какой-либо объект сохраняется в Informatica, проверяется, являются ли его синтаксис и свойства действительными или нет, и объект соответствующим образом помечается статусом.
  • Затронутые : Затронутые объекты — это те, чьи дочерние объекты недопустимы. Например, в сопоставлении, если вы используете повторно используемое преобразование, и этот объект преобразования становится недействительным, сопоставление будет помечено как измененное.

Конфигурация домена

Как упоминалось ранее, домен является основным административным контролем в Informatica. Это родительский объект, который состоит из других сервисов, таких как сервис интеграции, сервис репозитория и различные узлы.

Конфигурирование домена может быть выполнено с помощью консоли администратора Informatica. Консоль можно запустить с помощью веб-браузера.

Informatica Архитектура Учебник

После открытия в веб-браузере он запрашивает учетную запись администратора. Пароль устанавливается во время установки Informatica.

Informatica Архитектура Учебник

После входа в домен Informatica домашняя страница выглядит примерно так.

Informatica Архитектура Учебник

На левой панели отображаются существующие узлы, службы репозитория, службы интеграции в домене.

В главном окне отображается состояние этих служб, независимо от того, включены они или нет.

Свойства домена

Нажмите на меню свойств на странице администратора, чтобы просмотреть свойства домена.

Informatica Архитектура Учебник

Ключевые свойства домена

Тайм-аут устойчивости — Если какой-либо из сервисов интеграции или сервисов репозитория выходит из строя, то тайм-аут устойчивости — это количество секунд, в течение которого сервис приложений пытается подключиться к этим сервисам.

Период перезапуска — это максимальное количество секунд, которое домен тратит на перезапуск службы.

Режим отправки — это политика, используемая балансировщиком нагрузки для отправки задач различным узлам.

Тип базы данных — тип базы данных, на которой настроен домен.

Хост базы данных — имя хоста компьютера, на котором настроен домен.

Порт и имя базы данных — это порт базы данных и имя экземпляра базы данных для домена.

Эти свойства могут быть изменены в зависимости от требований.

Клиент Powercenter и подключение к серверу

Инструменты клиента PowerCenter — это инструменты разработки, которые устанавливаются на клиентские машины. Дизайнер Powercenter, менеджер рабочего процесса, менеджер хранилища и монитор рабочего процесса являются основными инструментами клиента.

Отображения и объекты, которые мы создаем в этих клиентских инструментах, сохраняются в репозитории Informatica, который находится на сервере Informatica. Поэтому клиентские инструменты должны иметь сетевое подключение к серверу.

С другой стороны, клиент PowerCenter подключается к источникам и целям для импорта метаданных и определений структуры источника / цели. Таким образом, он также должен иметь подключение к исходным / целевым системам.

  • Для подключения к службе интеграции и службе хранилища клиент PowerCenter использует протоколы TCP / IP и
  • Для подключения к источникам / целям клиент PowerCenter использует драйверы ODBC.

Репозиторий Сервис

Служба хранилища поддерживает подключения клиентов Powercenter к хранилищу PowerCenter. Это отдельный многопоточный процесс, который извлекает, вставляет и обновляет метаданные внутри хранилища. Он также отвечает за поддержание согласованности внутри метаданных репозитория.

Informatica Архитектура Учебник

Служба интеграции

Служба интеграции — это движок для Informatica, другими словами, это объект, который выполняет задачи, которые мы создаем в Informatica. Вот как это работает

  • Пользователь выполняет рабочий процесс
  • Informatica дает указание службе интеграции выполнить рабочий процесс
  • Служба интеграции считывает подробности рабочего процесса из хранилища
  • Служба интеграции запускает выполнение задач внутри рабочего процесса
  • По завершении выполнения состояние задачи обновляется, т. Е. Не выполнено, успешно выполнено или прервано.
  • После завершения выполнения создается журнал сеанса и журнал рабочего процесса.
  • Этот сервис отвечает за загрузку данных в целевые системы
  • Сервис интеграции также объединяет данные из разных источников

Например, он может объединять данные из таблицы оракула и источника плоских файлов.

Итак, в общем, сервис интеграции Informatica — это процесс, находящийся на сервере Informatica, ожидающий назначения задач для выполнения. Когда мы выполняем рабочий процесс, сервис интеграции получает уведомление о выполнении рабочего процесса. Затем сервис интеграции считывает рабочий процесс, чтобы узнать детали, например, какие задачи он должен выполнять, как сопоставления, и в какие моменты времени. Затем служба считывает детали задачи из хранилища и приступает к выполнению.

Источники и цели

Informatica, являясь инструментом интеграции ETL и данных, вы всегда будете обрабатывать и преобразовывать некоторые формы данных. Вклад в наши отображения в Informatica называется исходной системой. Мы импортируем определения источника из источника и затем подключаемся к нему для извлечения данных источника в наших отображениях. Там могут быть разные типы источников и могут быть расположены в нескольких местах. В зависимости от ваших требований целевой системой может быть реляционная или плоская файловая система. Целевые плоские файлы создаются на компьютере-сервере Informatica, который может быть передан позже с помощью ftp.

Реляционные — эти типы источников являются системными таблицами базы данных. Эти системы баз данных обычно принадлежат другим приложениям, которые создают и поддерживают эти данные. Это может быть база данных управления взаимоотношениями с клиентами, база данных человеческих ресурсов и т. Д. Для использования таких источников в Informatica мы либо получим копию этих наборов данных, либо получим привилегии выбора в этих системах.

Плоские файлы. Плоские файлы являются наиболее распространенными источниками данных после реляционных баз данных в Informatica. Плоский файл может быть файлом, разделенным запятыми, файлом с разделителями табуляции или файлом фиксированной ширины. Informatica поддерживает любые кодовые страницы, такие как ascii или Unicode. Чтобы использовать плоский файл в Informatica, его определения должны быть импортированы аналогично тому, как мы это делаем для реляционных таблиц.