Учебники

DW – Типы

Существует четыре типа систем хранения данных.

  • Data Mart
  • Аналитическая обработка онлайн (OLAP)
  • Оперативная обработка онлайн (OLTP)
  • Прогнозный анализ (РА)

Data Mart

Data Mart известен как простейшая форма системы хранилища данных и обычно состоит из одной функциональной области в организации, такой как продажи, финансы или маркетинг и т. Д.

Data Mart в организации и создается и управляется одним отделом. Поскольку он принадлежит одному отделу, отдел обычно получает данные только из нескольких или одного типа источников / приложений. Этот источник может быть внутренней операционной системой, хранилищем данных или внешней системой.

Аналитическая обработка онлайн

В системе OLAP количество транзакций меньше, чем в транзакционной системе. Выполненные запросы имеют сложный характер и включают в себя агрегацию данных.

Что такое агрегация?

Мы сохраняем таблицы с агрегированными данными, такими как годовой (1 строка), квартальный (4 строки), ежемесячный (12 строк) или около того. Если кто-то должен делать сравнение из года в год, будет обрабатываться только одна строка. Однако в неагрегированной таблице будут сравниваться все строки.

SELECT SUM(salary)
FROM employee
WHERE title = 'Programmer';

Эффективные меры в системе OLAP

Время отклика известно как одна из наиболее эффективных и ключевых мер в системе OLAP . Агрегированные хранимые данные поддерживаются в многомерных схемах, таких как схемы типа «звезда» (когда данные сгруппированы в иерархические группы, часто называемые измерениями, в факты и агрегированные факты, это называется схемами).

Задержка системы OLAP составляет несколько часов по сравнению с витринами данных, где задержка ожидается ближе к дню.

Обработка транзакций онлайн

В системе OLTP существует большое количество коротких онлайн-транзакций, таких как INSERT, UPDATE и DELETE.

В системе OLTP эффективным показателем является время обработки коротких транзакций и оно очень мало. Он контролирует целостность данных в средах с множественным доступом. Для системы OLTP количество транзакций в секунду измеряет эффективность . Система хранилища данных OLTP содержит текущие и подробные данные и поддерживается в схемах в модели объекта (3NF).

пример

Система ежедневных транзакций в розничном магазине, где записи клиентов ежедневно вставляются, обновляются и удаляются. Это обеспечивает очень быструю обработку запросов. Базы данных OLTP содержат подробные и актуальные данные. Схема, используемая для хранения базы данных OLTP, является моделью сущностей.

Различия между OLTP и OLAP

На следующих рисунках показаны основные различия между OLTP и системой OLAP .

OLTP и OLAP

  • Индексы – в системе OLTP имеется всего несколько индексов, в то время как в системе OLAP есть много индексов для оптимизации производительности.

  • Объединения. В системе OLTP большое количество объединений и данных нормализуется. Однако в системе OLAP меньше соединений и они не нормализованы.

  • Агрегация. В системе OLTP данные не агрегируются, тогда как в базе данных OLAP используется больше агрегаций.

Индексы – в системе OLTP имеется всего несколько индексов, в то время как в системе OLAP есть много индексов для оптимизации производительности.

Объединения. В системе OLTP большое количество объединений и данных нормализуется. Однако в системе OLAP меньше соединений и они не нормализованы.

Агрегация. В системе OLTP данные не агрегируются, тогда как в базе данных OLAP используется больше агрегаций.

Прогнозный анализ

Прогнозный анализ известен как поиск скрытых закономерностей в данных, хранящихся в системе DW, с использованием различных математических функций для прогнозирования будущих результатов.

Система прогнозного анализа отличается от системы OLAP с точки зрения ее использования. Он используется, чтобы сосредоточиться на будущих результатах. Система OALP ориентирована на текущую и историческую обработку данных для аналитической отчетности.