Учебники

Хранилище данных — Обзор

Термин «Хранилище данных» был впервые введен Биллом Инмоном в 1990 году. По словам Инмона, хранилище данных представляет собой предметно-ориентированный, интегрированный, изменяющийся во времени и энергонезависимый сбор данных. Эти данные помогают аналитикам принимать обоснованные решения в организации.

Операционная база данных ежедневно подвергается частым изменениям из-за проводимых транзакций. Предположим, что руководитель бизнеса хочет проанализировать предыдущие отзывы о любых данных, таких как продукт, поставщик или любые данные о потребителе, тогда у руководителя не будет данных, доступных для анализа, поскольку предыдущие данные были обновлены в результате транзакций.

Хранилища данных предоставляют нам обобщенные и консолидированные данные в многомерном представлении. Наряду с обобщенным и консолидированным представлением данных хранилища данных также предоставляют нам инструменты онлайн-аналитической обработки (OLAP). Эти инструменты помогают нам в интерактивном и эффективном анализе данных в многомерном пространстве. Этот анализ приводит к обобщению данных и интеллектуальному анализу данных.

Функции интеллектуального анализа данных, такие как сопоставление, кластеризация, классификация, прогнозирование, могут быть интегрированы с операциями OLAP для улучшения интерактивного интеллектуального анализа знаний на нескольких уровнях абстракции. Вот почему хранилище данных стало важной платформой для анализа данных и аналитической обработки в Интернете.

Понимание хранилища данных

  • Хранилище данных — это база данных, которая хранится отдельно от оперативной базы данных организации.

  • В хранилище данных нет частых обновлений.

  • Он обладает консолидированными историческими данными, которые помогают организации анализировать свой бизнес.

  • Хранилище данных помогает руководителям организовывать, понимать и использовать свои данные для принятия стратегических решений.

  • Системы хранилища данных помогают в интеграции разнообразных прикладных систем.

  • Система хранилища данных помогает в консолидированном анализе исторических данных.

Хранилище данных — это база данных, которая хранится отдельно от оперативной базы данных организации.

В хранилище данных нет частых обновлений.

Он обладает консолидированными историческими данными, которые помогают организации анализировать свой бизнес.

Хранилище данных помогает руководителям организовывать, понимать и использовать свои данные для принятия стратегических решений.

Системы хранилища данных помогают в интеграции разнообразных прикладных систем.

Система хранилища данных помогает в консолидированном анализе исторических данных.

Почему хранилище данных отделено от оперативных баз данных

Хранилища данных хранятся отдельно от операционных баз данных по следующим причинам:

  • Оперативная база данных создается для хорошо известных задач и рабочих нагрузок, таких как поиск определенных записей, индексация и т. Д. В контрактах запросы к хранилищу данных часто являются сложными и представляют общую форму данных.

  • Операционные базы данных поддерживают одновременную обработку нескольких транзакций. Механизмы контроля и восстановления параллелизма требуются для действующих баз данных, чтобы обеспечить надежность и согласованность базы данных.

  • Оперативный запрос к базе данных позволяет читать и изменять операции, тогда как для запроса OLAP требуется только доступ только для чтения к сохраненным данным.

  • Оперативная база данных поддерживает текущие данные. С другой стороны, хранилище данных поддерживает исторические данные.

Оперативная база данных создается для хорошо известных задач и рабочих нагрузок, таких как поиск определенных записей, индексация и т. Д. В контрактах запросы к хранилищу данных часто являются сложными и представляют общую форму данных.

Операционные базы данных поддерживают одновременную обработку нескольких транзакций. Механизмы контроля и восстановления параллелизма требуются для действующих баз данных, чтобы обеспечить надежность и согласованность базы данных.

Оперативный запрос к базе данных позволяет читать и изменять операции, тогда как для запроса OLAP требуется только доступ только для чтения к сохраненным данным.

Оперативная база данных поддерживает текущие данные. С другой стороны, хранилище данных поддерживает исторические данные.

Особенности хранилища данных

Ключевые особенности хранилища данных обсуждаются ниже —

  • Предметно-ориентированный. Хранилище данных является предметно-ориентированным, поскольку предоставляет информацию по предмету, а не по текущим операциям организации. Такими субъектами могут быть продукт, клиенты, поставщики, продажи, выручка и т. Д. Хранилище данных не ориентировано на текущие операции, а сосредоточено на моделировании и анализе данных для принятия решений.

  • Интегрированный. Хранилище данных создается путем интеграции данных из разнородных источников, таких как реляционные базы данных, плоские файлы и т. Д. Эта интеграция повышает эффективность анализа данных.

  • Вариант времени — данные, собранные в хранилище данных, идентифицируются с определенным периодом времени. Данные в хранилище данных предоставляют информацию с исторической точки зрения.

  • Энергонезависимый — энергонезависимый означает, что предыдущие данные не удаляются при добавлении новых данных. Хранилище данных хранится отдельно от оперативной базы данных, и поэтому частые изменения в оперативной базе данных не отражаются в хранилище данных.

Предметно-ориентированный. Хранилище данных является предметно-ориентированным, поскольку предоставляет информацию по предмету, а не по текущим операциям организации. Такими субъектами могут быть продукт, клиенты, поставщики, продажи, выручка и т. Д. Хранилище данных не ориентировано на текущие операции, а сосредоточено на моделировании и анализе данных для принятия решений.

Интегрированный. Хранилище данных создается путем интеграции данных из разнородных источников, таких как реляционные базы данных, плоские файлы и т. Д. Эта интеграция повышает эффективность анализа данных.

Вариант времени — данные, собранные в хранилище данных, идентифицируются с определенным периодом времени. Данные в хранилище данных предоставляют информацию с исторической точки зрения.

Энергонезависимый — энергонезависимый означает, что предыдущие данные не удаляются при добавлении новых данных. Хранилище данных хранится отдельно от оперативной базы данных, и поэтому частые изменения в оперативной базе данных не отражаются в хранилище данных.

Примечание. Хранилище данных не требует обработки транзакций, восстановления и управления параллелизмом, поскольку оно физически хранится и отделено от операционной базы данных.

Приложения хранилища данных

Как обсуждалось ранее, хранилище данных помогает руководителям предприятий организовывать, анализировать и использовать свои данные для принятия решений. Хранилище данных служит единственной частью системы обратной связи «план-выполнение-оценка» для управления предприятием. Хранилища данных широко используются в следующих областях —

  • Финансовые услуги
  • Банковские услуги
  • Потребительские товары
  • Розничные секторы
  • Контролируемое производство

Типы хранилищ данных

Обработка информации, аналитическая обработка и извлечение данных — это три типа приложений хранилища данных, которые обсуждаются ниже:

Обработка информации — хранилище данных позволяет обрабатывать хранящиеся в нем данные. Данные могут быть обработаны с помощью запросов, базового статистического анализа, отчетности с использованием кросс-таблиц, таблиц, диаграмм или графиков.

Аналитическая обработка — хранилище данных поддерживает аналитическую обработку информации, хранящейся в нем. Данные можно анализировать с помощью базовых операций OLAP, включая срезы и детали, детализацию, детализацию и поворот.

Интеллектуальный анализ данных. Интеллектуальный анализ данных поддерживает обнаружение знаний путем поиска скрытых закономерностей и ассоциаций, построения аналитических моделей, выполнения классификации и прогнозирования. Эти результаты добычи могут быть представлены с использованием инструментов визуализации.