Учебники

Хранилище данных — Концепции

Хранилище данных — это процесс создания и использования хранилища данных. Хранилище данных создается путем интеграции данных из нескольких разнородных источников, которые поддерживают аналитическую отчетность, структурированные и / или специальные запросы и принятие решений. Хранилище данных включает в себя очистку данных, интеграцию данных и консолидацию данных.

Использование информации о хранилище данных

Существуют технологии поддержки принятия решений, которые помогают использовать данные, доступные в хранилище данных. Эти технологии помогают руководителям быстро и эффективно использовать склад. Они могут собирать данные, анализировать их и принимать решения на основе информации, представленной на складе. Собранную на складе информацию можно использовать в любом из следующих доменов:

  • Настройка производственных стратегийСтратегии продуктов можно хорошо настроить, переставив продукты и управляя портфелями продуктов, сравнивая продажи ежеквартально или ежегодно.

  • Анализ клиента — анализ клиента выполняется путем анализа покупательских предпочтений, времени покупки, бюджетных циклов и т. Д.

  • Анализ операций — хранилище данных также помогает в управлении взаимоотношениями с клиентами и внесении исправлений в окружающую среду. Информация также позволяет нам анализировать бизнес-операции.

Настройка производственных стратегийСтратегии продуктов можно хорошо настроить, переставив продукты и управляя портфелями продуктов, сравнивая продажи ежеквартально или ежегодно.

Анализ клиента — анализ клиента выполняется путем анализа покупательских предпочтений, времени покупки, бюджетных циклов и т. Д.

Анализ операций — хранилище данных также помогает в управлении взаимоотношениями с клиентами и внесении исправлений в окружающую среду. Информация также позволяет нам анализировать бизнес-операции.

Интеграция гетерогенных баз данных

Для интеграции разнородных баз данных у нас есть два подхода —

  • Подход, основанный на запросах
  • Обновленный подход

Query-Driven подход

Это традиционный подход к интеграции разнородных баз данных. Этот подход использовался для создания оболочек и интеграторов поверх множества разнородных баз данных. Эти интеграторы также известны как посредники.

Процесс Query-Driven подход

  • Когда запрос выдается на стороне клиента, словарь метаданных преобразует запрос в соответствующую форму для отдельных разнородных сайтов.

  • Теперь эти запросы отображаются и отправляются локальному обработчику запросов.

  • Результаты из разнородных сайтов интегрированы в глобальный набор ответов.

Когда запрос выдается на стороне клиента, словарь метаданных преобразует запрос в соответствующую форму для отдельных разнородных сайтов.

Теперь эти запросы отображаются и отправляются локальному обработчику запросов.

Результаты из разнородных сайтов интегрированы в глобальный набор ответов.

Недостатки

  • Подход, основанный на запросах, требует сложных процессов интеграции и фильтрации.

  • Этот подход очень неэффективен.

  • Это очень дорого для частых запросов.

  • Этот подход также очень дорог для запросов, которые требуют агрегирования.

Подход, основанный на запросах, требует сложных процессов интеграции и фильтрации.

Этот подход очень неэффективен.

Это очень дорого для частых запросов.

Этот подход также очень дорог для запросов, которые требуют агрегирования.

Обновленный подход

Это альтернатива традиционному подходу. Современные системы хранения данных следуют подходу, основанному на обновлениях, а не традиционному подходу, который обсуждался ранее. В подходе на основе обновлений информация из нескольких разнородных источников заранее интегрируется и хранится на складе. Эта информация доступна для прямого запроса и анализа.

преимущества

Этот подход имеет следующие преимущества —

  • Такой подход обеспечивает высокую производительность.

  • Данные копируются, обрабатываются, интегрируются, аннотируются, суммируются и реструктурируются в хранилище семантических данных заранее.

  • Обработка запросов не требует интерфейса для обработки данных в локальных источниках.

Такой подход обеспечивает высокую производительность.

Данные копируются, обрабатываются, интегрируются, аннотируются, суммируются и реструктурируются в хранилище семантических данных заранее.

Обработка запросов не требует интерфейса для обработки данных в локальных источниках.

Функции инструментов и утилит хранилища данных

Ниже приведены функции инструментов и утилит хранилища данных —

  • Извлечение данных — включает сбор данных из нескольких разнородных источников.

  • Очистка данных — включает поиск и исправление ошибок в данных.

  • Преобразование данных — включает преобразование данных из прежнего формата в формат хранилища.

  • Загрузка данных — включает в себя сортировку, суммирование, консолидацию, проверку целостности и создание индексов и разделов.

  • Обновление — включает обновление из источников данных в хранилище.

Извлечение данных — включает сбор данных из нескольких разнородных источников.

Очистка данных — включает поиск и исправление ошибок в данных.

Преобразование данных — включает преобразование данных из прежнего формата в формат хранилища.

Загрузка данных — включает в себя сортировку, суммирование, консолидацию, проверку целостности и создание индексов и разделов.

Обновление — включает обновление из источников данных в хранилище.

Примечание. Очистка данных и преобразование данных являются важными шагами в улучшении качества данных и результатов анализа данных.