Учебники

Хранилище данных — схемы

Схема определяется как логическое описание базы данных, в которой таблицы фактов и измерений логически объединены. Хранилище данных поддерживается в форме схемы «Звезда», «Снежинки» и «Созвездие фактов».

Схема звезды

Схема Star содержит таблицу фактов и несколько таблиц измерений. Каждое измерение представлено только одномерной таблицей, и они не нормированы. Таблица измерений содержит набор атрибутов.

Характеристики

  • В схеме Star есть только одна таблица фактов и несколько таблиц измерений.
  • В схеме «звезда» каждое измерение представлено одноразмерной таблицей.
  • Таблицы измерений не нормализуются в схеме Star.
  • Каждая таблица измерений объединяется с ключом в таблице фактов.

На следующем рисунке показаны данные о продажах компании по четырем измерениям, а именно: время, позиция, филиал и местоположение.

Схема звезды

В центре находится таблица фактов. Он содержит ключи к каждому из четырех измерений. Таблица фактов также содержит атрибуты, а именно проданные доллары и проданные единицы.

Примечание. Каждое измерение имеет только таблицу с одним измерением, и каждая таблица содержит набор атрибутов. Например, таблица измерения местоположения содержит атрибут set {location_key, street, city, провинция_or_state, страна}. Это ограничение может привести к избыточности данных.

Например — «Ванкувер» и «Виктория» оба города находятся в канадской провинции Британская Колумбия. Записи для таких городов могут вызвать избыточность данных вдоль атрибутов провинция_или_стата и страна.

Схема снежинок

Некоторые таблицы измерений в схеме Snowflake нормализованы. Нормализация разбивает данные на дополнительные таблицы, как показано на следующем рисунке.

Схема снежинок

В отличие от схемы Star, таблица измерений в схеме снежинки нормализована.

Например — Таблица измерений элементов в схеме типа звезда нормализована и разделена на две таблицы измерений, а именно таблицу элементов и поставщиков. Теперь таблица измерений элемента содержит атрибуты item_key, item_name, type, brand и supplier-key.

Ключ поставщика связан с таблицей измерений поставщика. Таблица измерений поставщика содержит атрибуты supplier_key и supplier_type.

Примечание. Из-за нормализации в схеме «Снежинка» избыточность уменьшается и, следовательно, становится проще в обслуживании и экономит место для хранения.

Схема Созвездия Фактов (Галактическая Схема)

Созвездие фактов имеет несколько таблиц фактов. Это также известно как Схема Галактики.

На следующем рисунке показаны две таблицы фактов, а именно Продажи и Доставка —

Галактика Схема

Таблица фактов продаж такая же, как в схеме «звезда». Таблица фактов доставки имеет пять измерений: item_key, time_key, shipper_key, from_location, to_location. Таблица фактов отгрузки также содержит две меры: проданные доллары и проданные единицы. Также возможно разделить таблицы измерений между таблицами фактов.

Например , таблицы измерений времени, позиции и местоположения совместно используются таблицей фактов продаж и отгрузки.