Что такое OLAP?
Оперативная аналитическая обработка (OLAP) — это категория программного обеспечения, которая позволяет пользователям одновременно анализировать информацию из нескольких систем баз данных. Это технология, которая позволяет аналитикам извлекать и просматривать бизнес-данные с разных точек зрения.
Аналитики часто должны группировать, объединять и объединять данные. Эти операции в реляционных базах данных являются ресурсоемкими. Данные OLAP могут быть предварительно рассчитаны и агрегированы, что ускоряет анализ.
Базы данных OLAP делятся на один или несколько кубов. Кубы разработаны таким образом, что создание и просмотр отчетов становится проще. OLAP означает онлайн-аналитическую обработку.
В этом уроке вы узнаете
- OLAP куб
- Основные аналитические операции OLAP
- Типы систем OLAP
- ROLAP
- MOLAP
- Гибридный OLAP
- Преимущества OLAP
- Недостатки OLAP
OLAP-куб:
В основе концепции OLAP лежит куб OLAP. OLAP-куб — это структура данных, оптимизированная для очень быстрого анализа данных.
Куб OLAP состоит из числовых фактов, называемых мерами, которые классифицируются по измерениям. OLAP Cube также называют гиперкубом .
Обычно операции с данными и анализ выполняются с использованием простой электронной таблицы, где значения данных располагаются в формате строк и столбцов. Это идеально подходит для двумерных данных. Однако OLAP содержит многомерные данные, причем данные обычно получают из другого и несвязанного источника. Использование электронной таблицы не является оптимальным вариантом. Куб может хранить и анализировать многомерные данные в логической и упорядоченной форме.
Как это работает?
Хранилище данных будет извлекать информацию из нескольких источников данных и форматов, таких как текстовые файлы, таблицы Excel, мультимедийные файлы и т. Д.
Извлеченные данные очищаются и преобразуются. Данные загружаются на сервер OLAP (или куб OLAP), где информация предварительно рассчитывается заранее для дальнейшего анализа.
Основные аналитические операции OLAP
Четыре типа аналитических операций в OLAP:
- Свернуть
- Дрель-вниз
- Ломтик и кости
- Поворот (поворот)
1) Свернуть:
Свертывание также известно как «консолидация» или «агрегация». Операция свертки может быть выполнена двумя способами
- Уменьшение размеров
- Восхождение на концепцию иерархии. Иерархия понятий — это система группировки вещей в зависимости от их порядка или уровня.
Рассмотрим следующую диаграмму
- В этом примере города Нью-Джерси и Потерянные Ангелы свернуты в страну США.
- Показатели продаж в Нью-Джерси и Лос-Анджелесе составляют 440 и 1560 соответственно. Они становятся 2000 после свертывания
- В этом процессе агрегирования данные перемещаются вверх по иерархии от города к стране.
- В процессе свертки необходимо удалить хотя бы одно или несколько измерений. В этом примере измерение Quater удалено.
2) Развертка
При детализации данные разбиты на более мелкие части. Это противоположность процесса накопления. Это можно сделать через
- Двигаясь вниз по иерархии понятий
- Увеличение размера
Рассмотрим схему выше
- Квартал Q1 пробурен до месяцев января, февраля и марта. Соответствующие продажи также являются регистрами.
- В этом примере добавляются месяцы измерений.
3) Срез:
Здесь выбрано одно измерение и создан новый вложенный куб.
Следующая диаграмма объясняет, как выполнялась операция среза:
- Время измерения нарезается с Q1 в качестве фильтра.
- Новый куб создан в целом.
Игральная кость:
Эта операция похожа на срез. Разница в кости заключается в том, что вы выбираете 2 или более измерений, которые приводят к созданию вложенного куба.
4) Пивот
В Pivot вы вращаете оси данных, чтобы обеспечить альтернативное представление данных.
В следующем примере сводка основана на типах элементов.
Типы систем OLAP
OLAP Иерархическая структура
Тип OLAP | объяснение |
Реляционный OLAP (ROLAP): | ROLAP — это расширенная СУБД вместе с многомерным отображением данных для выполнения стандартной реляционной операции. |
Многомерный OLAP (MOLAP) | MOLAP Реализует работу в многомерных данных. |
Гибридная онлайн-аналитическая обработка (HOLAP) | В подходе HOLAP агрегированные итоги хранятся в многомерной базе данных, а подробные данные хранятся в реляционной базе данных. Это обеспечивает как эффективность данных модели ROLAP, так и производительность модели MOLAP. |
Настольный OLAP (DOLAP) | В Desktop OLAP пользователь загружает часть данных из базы данных локально или со своего рабочего стола и анализирует их.
DOLAP относительно дешевле в развертывании, поскольку предлагает очень мало функций по сравнению с другими системами OLAP. |
Веб OLAP (WOLAP) | Web OLAP — система OLAP, доступная через веб-браузер. WOLAP — это трехуровневая архитектура. Он состоит из трех компонентов: клиент, промежуточное программное обеспечение и сервер базы данных. |
Мобильный OLAP: | Мобильный OLAP помогает пользователям получать доступ и анализировать данные OLAP с помощью своих мобильных устройств. |
Пространственный OLAP: | SOLAP создан для облегчения управления как пространственными, так и непространственными данными в географической информационной системе (ГИС) |
ROLAP
ROLAP работает с данными, которые существуют в реляционной базе данных. Таблицы фактов и измерений хранятся в виде реляционных таблиц. Он также позволяет проводить многомерный анализ данных и является самым быстрорастущим OLAP.
Преимущества модели ROLAP:
- Высокая эффективность данных. Он обеспечивает высокую эффективность данных, поскольку производительность запросов и язык доступа оптимизированы, в частности, для многомерного анализа данных.
- Масштабируемость. Этот тип системы OLAP предлагает масштабируемость для управления большими объемами данных, даже когда данные постоянно увеличиваются.
Недостатки модели ROLAP:
- Спрос на более высокие ресурсы: ROLAP требует высокого использования человеческих, программных и аппаратных ресурсов.
- Совокупные ограничения данных. Инструменты ROLAP используют SQL для всех вычислений совокупных данных. Однако нет никаких ограничений для обработки вычислений.
- Низкая производительность запросов. Производительность запросов в этой модели низкая по сравнению с MOLAP
MOLAP
MOLAP использует многомерные механизмы хранения на основе массива для отображения многомерных представлений данных. В основном они используют куб OLAP.
Узнайте больше об OLAP здесь
Гибридный OLAP
Гибридный OLAP представляет собой смесь как ROLAP, так и MOLAP. Он предлагает быстрое вычисление MOLAP и более высокую масштабируемость ROLAP. HOLAP использует две базы данных.
- Агрегированные или вычисленные данные хранятся в многомерном кубе OLAP
- Подробная информация хранится в реляционной базе данных.
Преимущества гибридного OLAP:
- Этот тип OLAP помогает экономить дисковое пространство, а также остается компактным, что помогает избежать проблем, связанных со скоростью и удобством доступа.
- В Hybrid HOLAP используется технология кубов, которая обеспечивает более высокую производительность для всех типов данных.
- ROLAP мгновенно обновляются, и пользователи HOLAP имеют доступ к этим мгновенно обновляемым данным в реальном времени. MOLAP обеспечивает очистку и преобразование данных, тем самым улучшая актуальность данных. Это приносит лучшее из обоих миров.
Недостатки гибридного OLAP:
- Повышенный уровень сложности . Главный недостаток систем HOLAP заключается в том, что они поддерживают как инструменты, так и приложения ROLAP и MOLAP. Таким образом, это очень сложно.
- Потенциальные совпадения : есть большие шансы перекрытия, особенно в их функциональности.
Преимущества OLAP
- OLAP — это платформа для всех видов бизнеса, включая планирование, составление бюджета, отчетность и анализ.
- Информация и расчеты согласованы в кубе OLAP. Это решающее преимущество.
- Быстро создавать и анализировать сценарии «Что если»
- Простой поиск в базе данных OLAP по широким или конкретным терминам.
- OLAP предоставляет строительные блоки для инструментов бизнес-моделирования, инструментов интеллектуального анализа данных, инструментов отчетности о производительности.
- Позволяет пользователям делать данные куба срезов и кубиков по различным измерениям, мерам и фильтрам.
- Это хорошо для анализа временных рядов.
- Найти некоторые кластеры и выбросы легко с OLAP.
- Это мощная система онлайн-аналитики для визуализации, которая обеспечивает более быстрое время отклика
Недостатки OLAP
- OLAP требует организации данных в схеме звезды или снежинки. Эти схемы сложны в реализации и администрировании.
- Вы не можете иметь большое количество измерений в одном кубе OLAP
- Транзакционные данные не могут быть доступны с помощью системы OLAP.
- Любая модификация в кубе OLAP требует полного обновления куба. Это трудоемкий процесс
Резюме:
- OLAP — это технология, которая позволяет аналитикам извлекать и просматривать бизнес-данные с разных точек зрения.
- В основе концепции OLAP лежит куб OLAP.
- Различные бизнес-приложения и другие операции с данными требуют использования OLAP Cube.
- В OLAP есть пять основных видов аналитических операций: 1) свертывание 2) развертывание 3) срез 4) игральные кости и 5) опора
- Три типа широко используемых систем OLAP — это MOLAP, ROLAP и Hybrid OLAP.
- OLAP для настольных компьютеров, Web OLAP и Mobile OLAP — это некоторые другие типы систем OLAP.