Учебники

7) Что такое OLAP?

Что такое OLAP?

Оперативная аналитическая обработка (OLAP) — это категория программного обеспечения, которая позволяет пользователям одновременно анализировать информацию из нескольких систем баз данных. Это технология, которая позволяет аналитикам извлекать и просматривать бизнес-данные с разных точек зрения.

Аналитики часто должны группировать, объединять и объединять данные. Эти операции в реляционных базах данных являются ресурсоемкими. Данные OLAP могут быть предварительно рассчитаны и агрегированы, что ускоряет анализ.

Базы данных OLAP делятся на один или несколько кубов. Кубы разработаны таким образом, что создание и просмотр отчетов становится проще. OLAP означает онлайн-аналитическую обработку.

В этом уроке вы узнаете

OLAP-куб:

В основе концепции OLAP лежит куб OLAP. OLAP-куб — это структура данных, оптимизированная для очень быстрого анализа данных.

Куб OLAP состоит из числовых фактов, называемых мерами, которые классифицируются по измерениям. OLAP Cube также называют гиперкубом .

Обычно операции с данными и анализ выполняются с использованием простой электронной таблицы, где значения данных располагаются в формате строк и столбцов. Это идеально подходит для двумерных данных. Однако OLAP содержит многомерные данные, причем данные обычно получают из другого и несвязанного источника. Использование электронной таблицы не является оптимальным вариантом. Куб может хранить и анализировать многомерные данные в логической и упорядоченной форме.

Как это работает?

Хранилище данных будет извлекать информацию из нескольких источников данных и форматов, таких как текстовые файлы, таблицы Excel, мультимедийные файлы и т. Д.

Извлеченные данные очищаются и преобразуются. Данные загружаются на сервер OLAP (или куб OLAP), где информация предварительно рассчитывается заранее для дальнейшего анализа.

Основные аналитические операции OLAP

Четыре типа аналитических операций в OLAP:

  1. Свернуть
  2. Дрель-вниз
  3. Ломтик и кости
  4. Поворот (поворот)

1) Свернуть:

Свертывание также известно как «консолидация» или «агрегация». Операция свертки может быть выполнена двумя способами

  1. Уменьшение размеров
  2. Восхождение на концепцию иерархии. Иерархия понятий — это система группировки вещей в зависимости от их порядка или уровня.

Рассмотрим следующую диаграмму

  • В этом примере города Нью-Джерси и Потерянные Ангелы свернуты в страну США.
  • Показатели продаж в Нью-Джерси и Лос-Анджелесе составляют 440 и 1560 соответственно. Они становятся 2000 после свертывания
  • В этом процессе агрегирования данные перемещаются вверх по иерархии от города к стране.
  • В процессе свертки необходимо удалить хотя бы одно или несколько измерений. В этом примере измерение Quater удалено.

2) Развертка

При детализации данные разбиты на более мелкие части. Это противоположность процесса накопления. Это можно сделать через

  • Двигаясь вниз по иерархии понятий
  • Увеличение размера

Рассмотрим схему выше

  • Квартал Q1 пробурен до месяцев января, февраля и марта. Соответствующие продажи также являются регистрами.
  • В этом примере добавляются месяцы измерений.

3) Срез:

Здесь выбрано одно измерение и создан новый вложенный куб.

Следующая диаграмма объясняет, как выполнялась операция среза:

  • Время измерения нарезается с Q1 в качестве фильтра.
  • Новый куб создан в целом.

Игральная кость:

Эта операция похожа на срез. Разница в кости заключается в том, что вы выбираете 2 или более измерений, которые приводят к созданию вложенного куба.

4) Пивот

В Pivot вы вращаете оси данных, чтобы обеспечить альтернативное представление данных.

В следующем примере сводка основана на типах элементов.

Типы систем OLAP

OLAP Иерархическая структура

Тип OLAP объяснение
Реляционный OLAP (ROLAP): ROLAP — это расширенная СУБД вместе с многомерным отображением данных для выполнения стандартной реляционной операции.
Многомерный OLAP (MOLAP) MOLAP Реализует работу в многомерных данных.
Гибридная онлайн-аналитическая обработка (HOLAP) В подходе HOLAP агрегированные итоги хранятся в многомерной базе данных, а подробные данные хранятся в реляционной базе данных. Это обеспечивает как эффективность данных модели ROLAP, так и производительность модели MOLAP.
Настольный OLAP (DOLAP) В Desktop OLAP пользователь загружает часть данных из базы данных локально или со своего рабочего стола и анализирует их.

DOLAP относительно дешевле в развертывании, поскольку предлагает очень мало функций по сравнению с другими системами OLAP.

Веб OLAP (WOLAP) Web OLAP — система OLAP, доступная через веб-браузер. WOLAP — это трехуровневая архитектура. Он состоит из трех компонентов: клиент, промежуточное программное обеспечение и сервер базы данных.
Мобильный OLAP: Мобильный OLAP помогает пользователям получать доступ и анализировать данные OLAP с помощью своих мобильных устройств.
Пространственный OLAP: SOLAP создан для облегчения управления как пространственными, так и непространственными данными в географической информационной системе (ГИС)

ROLAP

ROLAP работает с данными, которые существуют в реляционной базе данных. Таблицы фактов и измерений хранятся в виде реляционных таблиц. Он также позволяет проводить многомерный анализ данных и является самым быстрорастущим OLAP.

Преимущества модели ROLAP:

  • Высокая эффективность данных. Он обеспечивает высокую эффективность данных, поскольку производительность запросов и язык доступа оптимизированы, в частности, для многомерного анализа данных.
  • Масштабируемость. Этот тип системы OLAP предлагает масштабируемость для управления большими объемами данных, даже когда данные постоянно увеличиваются.

Недостатки модели ROLAP:

  • Спрос на более высокие ресурсы: ROLAP требует высокого использования человеческих, программных и аппаратных ресурсов.
  • Совокупные ограничения данных. Инструменты ROLAP используют SQL для всех вычислений совокупных данных. Однако нет никаких ограничений для обработки вычислений.
  • Низкая производительность запросов. Производительность запросов в этой модели низкая по сравнению с MOLAP

MOLAP

MOLAP использует многомерные механизмы хранения на основе массива для отображения многомерных представлений данных. В основном они используют куб OLAP.

Узнайте больше об OLAP здесь

Гибридный OLAP

Гибридный OLAP представляет собой смесь как ROLAP, так и MOLAP. Он предлагает быстрое вычисление MOLAP и более высокую масштабируемость ROLAP. HOLAP использует две базы данных.

  1. Агрегированные или вычисленные данные хранятся в многомерном кубе OLAP
  2. Подробная информация хранится в реляционной базе данных.

Преимущества гибридного OLAP:

  • Этот тип OLAP помогает экономить дисковое пространство, а также остается компактным, что помогает избежать проблем, связанных со скоростью и удобством доступа.
  • В Hybrid HOLAP используется технология кубов, которая обеспечивает более высокую производительность для всех типов данных.
  • ROLAP мгновенно обновляются, и пользователи HOLAP имеют доступ к этим мгновенно обновляемым данным в реальном времени. MOLAP обеспечивает очистку и преобразование данных, тем самым улучшая актуальность данных. Это приносит лучшее из обоих миров.

Недостатки гибридного OLAP:

  • Повышенный уровень сложности . Главный недостаток систем HOLAP заключается в том, что они поддерживают как инструменты, так и приложения ROLAP и MOLAP. Таким образом, это очень сложно.
  • Потенциальные совпадения : есть большие шансы перекрытия, особенно в их функциональности.

Преимущества OLAP

  • OLAP — это платформа для всех видов бизнеса, включая планирование, составление бюджета, отчетность и анализ.
  • Информация и расчеты согласованы в кубе OLAP. Это решающее преимущество.
  • Быстро создавать и анализировать сценарии «Что если»
  • Простой поиск в базе данных OLAP по широким или конкретным терминам.
  • OLAP предоставляет строительные блоки для инструментов бизнес-моделирования, инструментов интеллектуального анализа данных, инструментов отчетности о производительности.
  • Позволяет пользователям делать данные куба срезов и кубиков по различным измерениям, мерам и фильтрам.
  • Это хорошо для анализа временных рядов.
  • Найти некоторые кластеры и выбросы легко с OLAP.
  • Это мощная система онлайн-аналитики для визуализации, которая обеспечивает более быстрое время отклика

Недостатки OLAP

  • OLAP требует организации данных в схеме звезды или снежинки. Эти схемы сложны в реализации и администрировании.
  • Вы не можете иметь большое количество измерений в одном кубе OLAP
  • Транзакционные данные не могут быть доступны с помощью системы OLAP.
  • Любая модификация в кубе OLAP требует полного обновления куба. Это трудоемкий процесс

Резюме:

  • OLAP — это технология, которая позволяет аналитикам извлекать и просматривать бизнес-данные с разных точек зрения.
  • В основе концепции OLAP лежит куб OLAP.
  • Различные бизнес-приложения и другие операции с данными требуют использования OLAP Cube.
  • В OLAP есть пять основных видов аналитических операций: 1) свертывание 2) развертывание 3) срез 4) игральные кости и 5) опора
  • Три типа широко используемых систем OLAP — это MOLAP, ROLAP и Hybrid OLAP.
  • OLAP для настольных компьютеров, Web OLAP и Mobile OLAP — это некоторые другие типы систем OLAP.