Учебники

Data Mining — Терминология

Интеллектуальный анализ данных определяется как извлечение информации из огромного набора данных. Другими словами, мы можем сказать, что интеллектуальный анализ данных извлекает знания из данных. Эта информация может использоваться для любого из следующих приложений —

  • Анализ рынка
  • Обнаружение мошенничества
  • Удержание клиентов
  • Контроль производства
  • Наука Разведка

Data Mining Engine

Механизм интеллектуального анализа данных очень важен для системы интеллектуального анализа данных. Он состоит из набора функциональных модулей, которые выполняют следующие функции —

  • характеристика
  • Ассоциативный и корреляционный анализ
  • классификация
  • прогнозирование
  • Кластерный анализ
  • Анализ выбросов
  • Эволюционный анализ

База знаний

Это область знаний. Эти знания используются, чтобы вести поиск или оценивать интересность полученных шаблонов.

Открытие знаний

Некоторые люди рассматривают интеллектуальный анализ данных так же, как обнаружение знаний, в то время как другие рассматривают интеллектуальный анализ данных как важный шаг в процессе обнаружения знаний. Вот список шагов, вовлеченных в процесс обнаружения знаний —

  • Очистка данных
  • Интеграция данных
  • Выбор данных
  • Преобразование данных
  • Сбор данных
  • Оценка шаблона
  • Презентация знаний

Пользовательский интерфейс

Пользовательский интерфейс — это модуль системы интеллектуального анализа данных, который помогает в коммуникации между пользователями и системой интеллектуального анализа данных. Пользовательский интерфейс позволяет следующие функции —

  • Взаимодействуйте с системой, указав задачу запроса данных.
  • Предоставление информации, чтобы помочь сосредоточиться на поиске.
  • Майнинг основан на промежуточных результатах интеллектуального анализа данных.
  • Просмотрите базы данных и схемы хранилища данных или структуры данных.
  • Оценить добытые образцы.
  • Визуализируйте шаблоны в разных формах.

Интеграция данных

Интеграция данных — это метод предварительной обработки данных, который объединяет данные из нескольких разнородных источников данных в единое хранилище данных. Интеграция данных может включать противоречивые данные и, следовательно, требует очистки данных.

Очистка данных

Очистка данных — это метод, который применяется для удаления зашумленных данных и исправления несоответствий в данных. Очистка данных включает в себя преобразования для исправления неправильных данных. Очистка данных выполняется как этап предварительной обработки данных при подготовке данных для хранилища данных.

Выбор данных

Выбор данных — это процесс, в котором данные, относящиеся к задаче анализа, извлекаются из базы данных. Иногда преобразование и консолидация данных выполняются до процесса выбора данных.

Кластеры

Кластер относится к группе объектов подобного типа. Кластерный анализ относится к формированию группы объектов, которые очень похожи друг на друга, но сильно отличаются от объектов в других кластерах.

Преобразование данных

На этом этапе данные преобразуются или объединяются в формы, подходящие для майнинга, путем выполнения операций суммирования или агрегирования.