Учебники

Моделирование данных с помощью DAX – Основные понятия

Бизнес-аналитика (BI) приобретает все большее значение в нескольких областях и организациях. Принятие решений и прогнозирование на основе исторических данных стали критически важными в постоянно растущем конкурентном мире. Существует огромный объем данных, доступных как изнутри, так и извне из разнообразных источников для любого типа анализа данных.

Однако задача состоит в том, чтобы извлечь соответствующие данные из доступных больших данных в соответствии с текущими требованиями и сохранить их так, чтобы это было удобно для проецирования различных данных из данных. Модель данных, полученная таким образом с использованием ключевых бизнес-терминов, является ценным средством коммуникации. Модель данных также должна обеспечивать быстрый способ создания отчетов по мере необходимости.

Моделирование данных для систем бизнес-аналитики позволяет решать многие проблемы с данными.

Предпосылки для модели данных для BI

Модель данных для BI должна соответствовать требованиям бизнеса, для которого проводится анализ данных. Ниже приведены минимальные основы, которым должна соответствовать любая модель данных:

Модель данных должна быть специфичной для бизнеса

Модель данных, которая подходит для одной сферы деятельности, может не подходить для другой сферы деятельности. Следовательно, модель данных должна быть разработана на основе конкретного бизнеса, используемых бизнес-терминов, типов данных и их взаимосвязей. Он должен основываться на целях и типах решений, принятых в организации.

Модель данных должна иметь встроенный интеллект

Модель данных должна включать встроенные аналитические данные с помощью метаданных, иерархий и наследований, которые облегчают эффективный и эффективный процесс бизнес-аналитики. Благодаря этому вы сможете предоставить общую платформу для разных пользователей, исключая повторение процесса.

Модель данных должна быть надежной

Модель данных должна точно представлять данные, специфичные для бизнеса. Это должно обеспечить эффективное хранение дисков и памяти, чтобы облегчить быструю обработку и создание отчетов.

Модель данных должна быть масштабируемой

Модель данных должна быть способна быстро и эффективно приспосабливаться к изменяющимся бизнес-сценариям. Новые данные или новые типы данных, возможно, должны быть включены. Обновления данных, возможно, придется эффективно обрабатывать.

Моделирование данных для BI

Моделирование данных для BI состоит из следующих этапов –

  • Формирование данных
  • Загрузка данных
  • Определение отношений между таблицами
  • Определение типов данных
  • Создание новых данных

Формирование данных

Данные, необходимые для построения модели данных, могут быть из разных источников и могут быть в разных форматах. Вам необходимо определить, какая часть данных из каждого из этих источников данных требуется для конкретного анализа данных. Это называется формирование данных.

Например, если вы извлекаете данные о всех сотрудниках организации, вам необходимо решить, какие сведения о каждом сотруднике соответствуют текущему контексту. Другими словами, вам необходимо определить, какие столбцы таблицы сотрудников необходимо импортировать. Это связано с тем, что чем меньше число столбцов в таблице в модели данных, тем быстрее будут выполняться вычисления в таблице.

Загрузка данных

Вам необходимо загрузить идентифицированные данные – таблицы данных с выбранными столбцами в каждой из таблиц.

Определение отношений между таблицами

Далее необходимо определить логические отношения между различными таблицами, которые облегчают объединение данных из этих таблиц, т. Е. Если у вас есть таблица – Продукты – содержащая данные о продуктах, и таблица – Продажи – с различными транзакциями продаж продуктов, Определяя отношения между двумя таблицами, вы можете суммировать продажи в зависимости от продукта.

Определение типов данных

Определение соответствующих типов данных для данных в модели данных имеет решающее значение для точности расчетов. Для каждого столбца в каждой таблице, которую вы импортировали, вам нужно определить тип данных. Например, текстовый тип данных, тип данных действительного числа, целочисленный тип данных и т. Д.

Создание новых данных Insights

Это важный шаг в моделировании дат для BI. Построенную модель данных, возможно, придется передавать нескольким людям, которым необходимо понимать тенденции данных и принимать необходимые решения в очень короткие сроки. Следовательно, создание новых данных данных из исходных данных будет эффективным, избегая переделки анализа.

Новые данные могут быть представлены в виде метаданных, которые могут быть легко поняты и использованы конкретными деловыми людьми.

Анализ данных

Как только модель данных будет готова, данные могут быть проанализированы в соответствии с требованиями. Представление результатов анализа также является важным шагом, потому что решения будут приниматься на основе отчетов.