Учебники

12) Схема звезд и снежинок

Что такое многомерная схема?

Многомерная схема специально разработана для моделирования систем хранилищ данных. Схемы предназначены для удовлетворения уникальных потребностей очень больших баз данных, разработанных для аналитических целей (OLAP).

Типы схем хранилища данных:

Ниже приведены 3 основных типа многомерных схем, каждая из которых имеет свои уникальные преимущества.

  • Схема звезды
  • Снежинка Схема
  • Галактика Схема

В этом уроке вы узнаете больше о

Что такое схема звезды?

В схеме STAR центр звезды может иметь одну таблицу фактов и несколько связанных таблиц измерений. Это известно как схема звезды, поскольку ее структура напоминает звезду. Схема «звезда» — это самый простой тип схемы хранилища данных. Он также известен как схема соединения звездой и оптимизирован для запросов больших наборов данных.

В следующем примере таблица фактов находится в центре, которая содержит ключи для каждой таблицы измерений, такие как Dealer_ID, ID модели, Date_ID, Product_ID, Branch_ID и другие атрибуты, такие как проданные единицы и доход.

Пример схемы звезды
Пример схемы звезды

Характеристики схемы звезды:

  • Каждое измерение в звездообразной схеме представлено единственной одномерной таблицей.
  • Таблица измерений должна содержать набор атрибутов.
  • Таблица измерений присоединяется к таблице фактов с помощью внешнего ключа
  • Таблица измерений не соединена друг с другом
  • Таблица фактов будет содержать ключ и меру
  • Схема Star проста для понимания и обеспечивает оптимальное использование диска.
  • Таблицы измерений не нормализованы . Например, на приведенном выше рисунке Country_ID не имеет таблицы поиска Country, как было бы в проекте OLTP.
  • Схема широко поддерживается BI Tools

Что такое схема снежинка?

SCHEMA SNOWFLAKE — это логическое расположение таблиц в многомерной базе данных, так что диаграмма ER напоминает форму снежинки. Схема «Снежинка» является расширением схемы «Звезда» и добавляет дополнительные измерения. Таблицы измерений нормализуются, что разбивает данные на дополнительные таблицы.

В следующем примере Страна далее нормализуется в отдельную таблицу.

Пример схемы снежинки
Пример схемы снежинки

Характеристики схемы «Снежинка»:

  • Основное преимущество схемы «снежинка» — использование меньшего дискового пространства.
  • Проще реализовать измерение добавляется в схему
  • Из-за нескольких таблиц производительность запросов снижается
  • Основная проблема, с которой вы столкнетесь при использовании схемы «снежинка», заключается в том, что вам нужно выполнять больше усилий по обслуживанию из-за большего количества таблиц поиска.

Схема «звезда против снежинки»: основные отличия

Схема звезды Схема снежных хлопьев
Иерархии для измерений хранятся в таблице измерений. Иерархии разделены на отдельные таблицы.
Он содержит таблицу фактов, окруженную таблицами измерений. Одна таблица фактов, окруженная таблицей измерений, которая в свою очередь окружена таблицей измерений
В схеме типа «звезда» только одно соединение создает связь между таблицей фактов и любыми таблицами измерений. Схема снежинки требует много соединений для извлечения данных.
Простой дизайн БД. Очень сложный дизайн БД.
Денормализованная структура данных и запрос также выполняются быстрее. Нормализованная структура данных.
Высокий уровень избыточности данных Очень низкоуровневая избыточность данных
Таблица одного измерения содержит агрегированные данные. Данные разбиты на разные таблицы измерений.
Обработка куба происходит быстрее. Обработка куба может быть медленной из-за сложного соединения.
Предлагает более эффективные запросы, используя Star Join Query Optimization. Таблицы могут быть связаны с несколькими измерениями. Схема снежных хлопьев представлена ​​централизованной таблицей фактов, которая вряд ли связана с несколькими измерениями.

Пример галактической схемы
Пример галактической схемы

Как вы можете видеть в приведенном выше примере, есть две таблицы фактов

  1. доходов
  2. Товар.

В общих схемах Galaxy размеры измерений называются Conformed Dimensions.

Характеристики галактической схемы:

  • Измерения в этой схеме разделены на отдельные измерения на основе различных уровней иерархии.
  • Например, если география имеет четыре уровня иерархии, таких как регион, страна, штат и город, то схема Galaxy должна иметь четыре измерения.
  • Более того, можно построить схему такого типа, разбив схему с одной звездой на несколько схем типа Star.
  • Размеры в этой схеме велики, что необходимо для построения на основе уровней иерархии.
  • Эта схема полезна для объединения таблиц фактов для лучшего понимания.

Что такое схема звездного кластера?

Схема снежинки содержит полностью расширенные иерархии. Однако это может усложнить схему и потребует дополнительных объединений. С другой стороны, схема «звезда» содержит полностью свернутые иерархии, что может привести к избыточности. Таким образом, лучшим решением может быть баланс между этими двумя схемами, который представляет собой проект STAR CLUSTER SCHEMA .

Пример схемы звездного скопления
Пример схемы звездного скопления

Перекрывающиеся измерения могут быть найдены в виде вилок в иерархиях. Разветвление происходит, когда сущность выступает в качестве родителя в двух разных иерархиях измерений. Объекты-вилки затем идентифицируются как классификация с отношениями один-ко-многим.

Резюме:

  • Многомерная схема специально разработана для моделирования систем хранилищ данных
  • Схема «звезда» — это самый простой тип схемы хранилища данных. Это известно как схема звезды, поскольку ее структура напоминает звезду.
  • Схема «Снежинка» является расширением схемы «Звезда» и добавляет дополнительные измерения. Это называется снежинка, потому что ее схема напоминает снежинку.
  • В звездообразной схеме только одно соединение определяет связь между таблицей фактов и любыми таблицами измерений.
  • Звездная схема содержит таблицу фактов, окруженную таблицами измерений.
  • Схема снежных хлопьев окружена таблицей измерений, которые в свою очередь окружены таблицей измерений
  • Схема снежинки требует много соединений для извлечения данных.
  • Схема галактики содержит две таблицы фактов, которые совместно используют таблицы измерений. Это также называется Схема Созвездия Фактов.
  • Схема звездного кластера содержит атрибуты схемы запуска и медленной схемы.