Учебники

6) Что такое моделирование данных?

Что такое моделирование данных?

Моделирование данных (моделирование данных) — это процесс создания модели данных для хранения данных в базе данных. Эта модель данных представляет собой концептуальное представление объектов данных, связей между различными объектами данных и правилами. Моделирование данных помогает визуально представлять данные и обеспечивает соблюдение бизнес-правил, нормативных требований и государственных политик в отношении данных. Модели данных обеспечивают согласованность в соглашениях об именах, значениях по умолчанию, семантике, безопасности при обеспечении качества данных.

Модель данных подчеркивает, какие данные необходимы и как они должны быть организованы, а не какие операции должны выполняться с данными. Модель данных похожа на план здания архитектора, который помогает построить концептуальную модель и установить отношения между элементами данных.

Два типа методов моделей данных:

  1. Модель отношений сущностей (ER)
  2. UML (унифицированный язык моделирования)

Мы обсудим их подробно позже.

В этом уроке вы узнаете больше о

Зачем использовать модель данных?

Основная цель использования модели данных:

  • Обеспечивает точное представление всех объектов данных, необходимых для базы данных. Пропуск данных приведет к созданию ошибочных отчетов и даст неправильные результаты.
  • Модель данных помогает проектировать базу данных на концептуальном, физическом и логическом уровнях.
  • Структура модели данных помогает определить реляционные таблицы, первичные и внешние ключи и хранимые процедуры.
  • Он обеспечивает четкое представление о базовых данных и может использоваться разработчиками базы данных для создания физической базы данных.
  • Также полезно определить отсутствующие и избыточные данные.
  • Несмотря на то, что первоначальное создание модели данных является трудоемким и длительным, в конечном итоге это делает обновление и обслуживание ИТ-инфраструктуры дешевле и быстрее.

Типы моделей данных

Существует в основном три различных типа моделей данных:

  1. Концептуальный: эта модель данных определяет ЧТО система содержит. Эта модель обычно создается заинтересованными сторонами и архитекторами данных. Цель состоит в том, чтобы организовать, охватить и определить бизнес-концепции и правила.
  2. Логический: определяет, КАК система должна быть реализована независимо от СУБД. Эта модель обычно создается архитекторами данных и бизнес-аналитиками. Целью является разработка технической карты правил и структур данных.
  3. Физические : Эта модель данных описывает КАК система будет реализована с использованием конкретной системы СУБД. Эта модель обычно создается администратором базы данных и разработчиками. Цель — фактическая реализация базы данных.

Концептуальная модель

Основная цель этой модели — установить сущности, их атрибуты и их взаимосвязи. На этом уровне моделирования данных едва ли есть какая-либо подробная информация о фактической структуре базы данных.

3 основных арендатора модели данных

Entity : реальная вещь

Атрибут : характеристики или свойства объекта

Отношения : Зависимость или связь между двумя объектами

Например:

  • Клиент и Продукт — это две сущности. Номер и имя клиента являются атрибутами объекта «Клиент»
  • Название продукта и цена являются атрибутами объекта продукта
  • Продажа — это отношения между клиентом и продуктом

Характеристики концептуальной модели данных

  • Предлагает общеорганизационный охват бизнес-концепций.
  • Этот тип моделей данных предназначен для бизнес-аудитории.
  • Концептуальная модель разрабатывается независимо от технических характеристик оборудования, таких как емкость хранилища данных, расположение или спецификации программного обеспечения, таких как поставщик СУБД и технологии. Цель состоит в том, чтобы представлять данные так, как их увидит пользователь в «реальном мире».

Концептуальные модели данных, известные как доменные модели, создают общий словарь для всех заинтересованных сторон, устанавливая основные понятия и объем.

Логическая модель данных

Логические модели данных добавляют дополнительную информацию к элементам концептуальной модели. Он определяет структуру элементов данных и устанавливает отношения между ними.

Преимущество логической модели данных состоит в том, чтобы обеспечить основу для формирования физической модели. Тем не менее, структура моделирования остается общей.

На этом уровне моделирования данных первичный или вторичный ключ не определен. На этом уровне моделирования данных необходимо проверить и настроить детали соединителя, которые были установлены ранее для отношений.

Характеристики логической модели данных

  • Описывает потребности в данных для одного проекта, но может интегрироваться с другими логическими моделями данных в зависимости от объема проекта.
  • Разработан и разработан независимо от СУБД.
  • Атрибуты данных будут иметь типы данных с точной точностью и длиной.
  • Процесс нормализации к модели применяется обычно до 3NF.

Физическая модель данных

Физическая модель данных описывает специфическую для базы данных реализацию модели данных. Он предлагает абстракцию базы данных и помогает создавать схемы. Это связано с богатством метаданных, предлагаемых физической моделью данных.

Этот тип модели данных также помогает визуализировать структуру базы данных. Это помогает моделировать ключи столбцов базы данных, ограничения, индексы, триггеры и другие функции РСУБД.

Характеристики физической модели данных:

  • Физическая модель данных описывает потребность в данных для одного проекта или приложения, хотя она может быть интегрирована с другими физическими моделями данных на основе объема проекта.
  • Модель данных содержит отношения между таблицами, которые обращаются к количеству и обнуляемости отношений.
  • Разработано для конкретной версии СУБД, местоположения, хранилища данных или технологии, которая будет использоваться в проекте.
  • Столбцы должны иметь точные типы данных, назначенные длины и значения по умолчанию.
  • Определены первичные и внешние ключи, представления, индексы, профили доступа, авторизации и т. Д.

Преимущества и недостатки модели данных:

Преимущества модели данных:

  • Основная цель разработки модели данных — обеспечить точное представление объектов данных, предлагаемых функциональной группой.
  • Модель данных должна быть достаточно подробной, чтобы ее можно было использовать для построения физической базы данных.
  • Информация в модели данных может использоваться для определения отношений между таблицами, первичным и внешним ключами и хранимыми процедурами.
  • Модель данных помогает бизнесу общаться внутри и между организациями.
  • Модель данных помогает документировать отображения данных в процессе ETL
  • Help to recognize correct sources of data to populate the model

Disadvantages of Data model:

  • To develop Data model one should know physical data stored characteristics.
  • This is a navigational system produces complex application development, management. Thus, it requires a knowledge of the biographical truth.
  • Even smaller change made in structure require modification in the entire application.
  • There is no set data manipulation language in DBMS.

Conclusion

  • Data modeling is the process of developing data model for the data to be stored in a Database.
  • Data Models ensure consistency in naming conventions, default values, semantics, security while ensuring quality of the data.
  • Data Model structure helps to define the relational tables, primary and foreign keys and stored procedures.
  • There are three types of conceptual, logical, and physical.
  • The main aim of conceptual model is to establish the entities, their attributes, and their relationships.
  • Logical data model defines the structure of the data elements and set the relationships between them.
  • A Physical Data Model describes the database specific implementation of the data model.
  • The main goal of a designing data model is to make certain that data objects offered by the functional team are represented accurately.
  • The biggest drawback is that even smaller change made in structure require modification in the entire application.