Учебники

Data Mining — приложения и тенденции

Интеллектуальный анализ данных широко используется в различных областях. На сегодняшний день существует ряд коммерческих систем сбора данных, но в этой области существует множество проблем. В этом уроке мы обсудим приложения и тенденции интеллектуального анализа данных.

Приложения для интеллектуального анализа данных

Вот список областей, где широко используется интеллектуальный анализ данных —

  • Анализ финансовых данных
  • Розничной торговли
  • Телекоммуникационная индустрия
  • Анализ биологических данных
  • Другие научные приложения
  • Обнаружения вторжений

Анализ финансовых данных

Финансовые данные в банковской и финансовой индустрии, как правило, надежны и имеют высокое качество, что облегчает систематический анализ данных и их анализ. Некоторые из типичных случаев следующие:

  • Проектирование и строительство хранилищ данных для многомерного анализа данных и интеллектуального анализа данных.

  • Прогноз платежей по кредитам и анализ кредитной политики клиентов.

  • Классификация и кластеризация клиентов для целевого маркетинга.

  • Выявление отмывания денег и других финансовых преступлений.

Проектирование и строительство хранилищ данных для многомерного анализа данных и интеллектуального анализа данных.

Прогноз платежей по кредитам и анализ кредитной политики клиентов.

Классификация и кластеризация клиентов для целевого маркетинга.

Выявление отмывания денег и других финансовых преступлений.

Розничной торговли

Data Mining имеет большое применение в розничной торговле, поскольку собирает большой объем данных о продажах, истории покупок клиентов, транспортировке товаров, потреблении и услугах. Естественно, что количество собираемых данных будет продолжать быстро расти из-за возрастающей легкости, доступности и популярности сети.

Интеллектуальный анализ данных в розничной торговле помогает выявить модели и тенденции покупок, которые ведут к повышению качества обслуживания клиентов, а также к их удержанию и удовлетворению. Вот список примеров интеллектуального анализа данных в розничной торговле —

  • Проектирование и строительство хранилищ данных на основе преимуществ интеллектуального анализа данных.

  • Многомерный анализ продаж, клиентов, продуктов, времени и региона.

  • Анализ эффективности рекламных кампаний.

  • Удержание клиентов.

  • Рекомендация продукта и перекрестные ссылки на товары.

Проектирование и строительство хранилищ данных на основе преимуществ интеллектуального анализа данных.

Многомерный анализ продаж, клиентов, продуктов, времени и региона.

Анализ эффективности рекламных кампаний.

Удержание клиентов.

Рекомендация продукта и перекрестные ссылки на товары.

Телекоммуникационная индустрия

Сегодня телекоммуникационная отрасль является одной из наиболее развивающихся отраслей, предоставляющих различные услуги, такие как факс, пейджер, сотовый телефон, интернет-мессенджер, изображения, электронная почта, передача веб-данных и т. Д. В связи с развитием новых компьютерных и коммуникационных технологий, телекоммуникационная отрасль стремительно расширяется. Это причина, почему интеллектуальный анализ данных становится очень важным, чтобы помочь и понять бизнес.

Интеллектуальный анализ данных в телекоммуникационной отрасли помогает выявлять модели электросвязи, выявлять мошеннические действия, более эффективно использовать ресурсы и улучшать качество обслуживания. Вот список примеров, для которых интеллектуальный анализ данных улучшает телекоммуникационные услуги —

  • Многомерный анализ телекоммуникационных данных.

  • Анализ мошеннических паттернов.

  • Выявление необычных узоров.

  • Многомерная ассоциация и анализ последовательных паттернов.

  • Услуги мобильной связи.

  • Использование инструментов визуализации в анализе телекоммуникационных данных.

Многомерный анализ телекоммуникационных данных.

Анализ мошеннических паттернов.

Выявление необычных узоров.

Многомерная ассоциация и анализ последовательных паттернов.

Услуги мобильной связи.

Использование инструментов визуализации в анализе телекоммуникационных данных.

Анализ биологических данных

В последнее время мы наблюдаем огромный рост в области биологии, такой как геномика, протеомика, функциональная геномика и биомедицинские исследования. Сбор биологических данных является очень важной частью биоинформатики. Ниже приведены аспекты, в которых интеллектуальный анализ данных способствует анализу биологических данных.

  • Семантическая интеграция гетерогенных, распределенных геномных и протеомных баз данных.

  • Выравнивание, индексация, поиск сходства и сравнительный анализ множественных нуклеотидных последовательностей.

  • Открытие структурных структур и анализ генетических сетей и белковых путей.

  • Ассоциация и анализ пути.

  • Инструменты визуализации в анализе генетических данных.

Семантическая интеграция гетерогенных, распределенных геномных и протеомных баз данных.

Выравнивание, индексация, поиск сходства и сравнительный анализ множественных нуклеотидных последовательностей.

Открытие структурных структур и анализ генетических сетей и белковых путей.

Ассоциация и анализ пути.

Инструменты визуализации в анализе генетических данных.

Другие научные приложения

Обсуждаемые выше приложения имеют тенденцию обрабатывать относительно небольшие и однородные наборы данных, для которых подходят статистические методы. Огромное количество данных было собрано из научных областей, таких как геонауки, астрономия и т. Д. Из-за быстрого численного моделирования в различных областях, таких как моделирование климата и экосистемы, химическая инженерия, гидродинамика и т. Д., Создается большое количество наборов данных. Ниже приведены приложения интеллектуального анализа данных в области научных приложений —

  • Хранилища данных и предварительная обработка данных.
  • График на основе майнинга.
  • Визуализация и знание предметной области.

Обнаружения вторжений

Вторжение означает любое действие, которое угрожает целостности, конфиденциальности или доступности сетевых ресурсов. В этом мире связи безопасность стала главной проблемой. С ростом использования Интернета и доступности инструментов и приемов для вторжения и атаки на сеть, обнаружение вторжений стало критически важным компонентом сетевого администрирования. Вот список областей, в которых технология интеллектуального анализа данных может применяться для обнаружения вторжений —

  • Разработка алгоритма интеллектуального анализа данных для обнаружения вторжений.

  • Анализ ассоциации и корреляции, агрегация, чтобы помочь выбрать и построить различающие атрибуты.

  • Анализ данных потока.

  • Распределенный анализ данных.

  • Инструменты визуализации и запросов.

Разработка алгоритма интеллектуального анализа данных для обнаружения вторжений.

Анализ ассоциации и корреляции, агрегация, чтобы помочь выбрать и построить различающие атрибуты.

Анализ данных потока.

Распределенный анализ данных.

Инструменты визуализации и запросов.

Продукты Data Mining System

Существует множество продуктов для систем интеллектуального анализа данных и приложений для анализа данных в конкретных областях. Новые системы и приложения для интеллектуального анализа данных добавляются в предыдущие системы. Также предпринимаются усилия для стандартизации языков интеллектуального анализа данных.

Выбор системы интеллектуального анализа данных

Выбор системы интеллектуального анализа данных зависит от следующих функций:

  • Типы данных. Система интеллектуального анализа данных может обрабатывать форматированный текст, данные на основе записей и реляционные данные. Данные также могут быть в виде текста ASCII, данных реляционной базы данных или данных хранилища данных. Поэтому мы должны проверить, какой именно формат может обрабатывать система интеллектуального анализа данных.

  • Системные проблемы — Мы должны рассмотреть совместимость системы интеллектуального анализа данных с различными операционными системами. Одна система интеллектуального анализа данных может работать только в одной операционной системе или в нескольких. Существуют также системы интеллектуального анализа данных, которые предоставляют веб-интерфейсы пользователя и позволяют вводить данные XML.

  • Источники данныхИсточники данных относятся к форматам данных, в которых будет работать система интеллектуального анализа данных. Некоторые системы интеллектуального анализа данных могут работать только с текстовыми файлами ASCII, а другие — с несколькими реляционными источниками. Система интеллектуального анализа данных также должна поддерживать соединения ODBC или OLE DB для соединений ODBC.

  • Функции и методологии интеллектуального анализа данных. Существуют некоторые системы интеллектуального анализа данных, которые предоставляют только одну функцию интеллектуального анализа данных, например классификацию, в то время как некоторые предоставляют несколько функций интеллектуального анализа данных, таких как описание концепции, анализ OLAP на основе обнаружения, интеллектуальный анализ ассоциаций, анализ связей, статистический анализ, классификация. прогнозирование, кластеризация, анализ выбросов, поиск сходства и т. д.

  • Сопоставление интеллектуального анализа данных с базами данных или системами хранилища данных. Системы интеллектуального анализа данных должны сочетаться с базой данных или системой хранилища данных. Связанные компоненты интегрированы в единую среду обработки информации. Вот типы сцепления, перечисленные ниже —

    • Нет связи
    • Слабая связь
    • Полугерметичная муфта
    • Тесная связь
  • Масштабируемость. Есть две проблемы масштабируемости в интеллектуальном анализе данных.

    • Масштабируемость строк (размер базы данных). Система интеллектуального анализа данных считается масштабируемой строкой, когда число или строки увеличиваются в 10 раз. Выполнение запроса занимает не более 10 раз.

    • Возможность использования столбцов (измерений). Система интеллектуального анализа данных считается масштабируемой по столбцам, если время выполнения запроса интеллектуального анализа увеличивается линейно с числом столбцов.

  • Инструменты визуализации — Визуализация в интеллектуальном анализе данных может быть классифицирована следующим образом —

    • Визуализация данных
    • Визуализация результатов майнинга
    • Визуализация горного процесса
    • Визуальный анализ данных
  • Язык запросов Data Mining и графический пользовательский интерфейс . Простой в использовании графический пользовательский интерфейс важен для продвижения интерактивного интеллектуального анализа данных. В отличие от систем реляционных баз данных, системы интеллектуального анализа данных не используют общий язык запросов для интеллектуального анализа данных.

Типы данных. Система интеллектуального анализа данных может обрабатывать форматированный текст, данные на основе записей и реляционные данные. Данные также могут быть в виде текста ASCII, данных реляционной базы данных или данных хранилища данных. Поэтому мы должны проверить, какой именно формат может обрабатывать система интеллектуального анализа данных.

Системные проблемы — Мы должны рассмотреть совместимость системы интеллектуального анализа данных с различными операционными системами. Одна система интеллектуального анализа данных может работать только в одной операционной системе или в нескольких. Существуют также системы интеллектуального анализа данных, которые предоставляют веб-интерфейсы пользователя и позволяют вводить данные XML.

Источники данныхИсточники данных относятся к форматам данных, в которых будет работать система интеллектуального анализа данных. Некоторые системы интеллектуального анализа данных могут работать только с текстовыми файлами ASCII, а другие — с несколькими реляционными источниками. Система интеллектуального анализа данных также должна поддерживать соединения ODBC или OLE DB для соединений ODBC.

Функции и методологии интеллектуального анализа данных. Существуют некоторые системы интеллектуального анализа данных, которые предоставляют только одну функцию интеллектуального анализа данных, например классификацию, в то время как некоторые предоставляют несколько функций интеллектуального анализа данных, таких как описание концепции, анализ OLAP на основе обнаружения, интеллектуальный анализ ассоциаций, анализ связей, статистический анализ, классификация. прогнозирование, кластеризация, анализ выбросов, поиск сходства и т. д.

Сопоставление интеллектуального анализа данных с базами данных или системами хранилища данных. Системы интеллектуального анализа данных должны сочетаться с базой данных или системой хранилища данных. Связанные компоненты интегрированы в единую среду обработки информации. Вот типы сцепления, перечисленные ниже —

Масштабируемость. Есть две проблемы масштабируемости в интеллектуальном анализе данных.

Масштабируемость строк (размер базы данных). Система интеллектуального анализа данных считается масштабируемой строкой, когда число или строки увеличиваются в 10 раз. Выполнение запроса занимает не более 10 раз.

Возможность использования столбцов (измерений). Система интеллектуального анализа данных считается масштабируемой по столбцам, если время выполнения запроса интеллектуального анализа увеличивается линейно с числом столбцов.

Инструменты визуализации — Визуализация в интеллектуальном анализе данных может быть классифицирована следующим образом —

Язык запросов Data Mining и графический пользовательский интерфейс . Простой в использовании графический пользовательский интерфейс важен для продвижения интерактивного интеллектуального анализа данных. В отличие от систем реляционных баз данных, системы интеллектуального анализа данных не используют общий язык запросов для интеллектуального анализа данных.

Тенденции в Data Mining

Концепции интеллектуального анализа данных все еще развиваются, и вот последние тенденции, которые мы можем увидеть в этой области:

Исследование приложения.

Масштабируемые и интерактивные методы анализа данных.

Интеграция интеллектуального анализа данных с системами баз данных, системами хранилищ данных и системами веб-баз данных.

Стандарт стандартизации языка запросов интеллектуального анализа данных.

Визуальный анализ данных.

Новые методы добычи сложных типов данных.

Добыча биологических данных.

Интеллектуальный анализ данных и разработка программного обеспечения.

Веб майнинг.

Распределенный анализ данных.

Интеллектуальный анализ данных в реальном времени.

Мульти баз данных интеллектуального анализа.

Защита конфиденциальности и защита информации при добыче данных.