Анализ данных — это процесс проверки, очистки, преобразования и моделирования данных с целью обнаружения полезной информации, предложения выводов и поддержки принятия решений.
,
Типы анализа данных
Существует несколько методов анализа данных, охватывающих различные области, такие как бизнес, наука, общественные науки и т. Д. С различными названиями. Основные подходы к анализу данных:
- Сбор данных
- Бизнес-аналитика
- Статистический анализ
- Прогнозная аналитика
- Текстовая аналитика
Сбор данных
Data Mining — это анализ больших объемов данных для извлечения ранее неизвестных, интересных моделей данных, необычных данных и зависимостей. Обратите внимание, что целью является извлечение шаблонов и знаний из больших объемов данных, а не извлечение самих данных.
Анализ данных включает в себя методы информатики на стыке систем искусственного интеллекта, машинного обучения, статистики и баз данных.
Шаблоны, полученные из интеллектуального анализа данных, могут рассматриваться как сводка входных данных, которые могут использоваться в дальнейшем анализе или для получения более точных результатов прогнозирования системой поддержки принятия решений.
Бизнес-аналитика
Методы и инструменты бизнес-аналитики предназначены для сбора и преобразования больших объемов неструктурированных бизнес-данных, чтобы помочь в выявлении, разработке и создании новых стратегических бизнес-возможностей.
Целью бизнес-аналитики является упрощение интерпретации больших объемов данных для выявления новых возможностей. Это помогает в реализации эффективной стратегии, основанной на идеях, которые могут предоставить предприятиям конкурентное преимущество на рынке и долгосрочную стабильность.
Статистический анализ
Статистика — это изучение сбора, анализа, интерпретации, представления и организации данных.
В анализе данных используются две основные статистические методологии —
-
Описательная статистика — В описательной статистике данные от всей совокупности или выборки суммируются с помощью числовых дескрипторов, таких как —
-
Среднее значение, стандартное отклонение для непрерывных данных
-
Частота, процент для категориальных данных
-
-
Статистическая статистика — использует образцы в выборочных данных, чтобы сделать выводы о представленной совокупности или учесть случайность. Эти выводы могут быть —
-
отвечая на вопросы да / нет о данных (проверка гипотез)
-
оценка числовых характеристик данных (оценка)
-
описание связей в данных (корреляция)
-
моделирование отношений в данных (например, регрессионный анализ)
-
Описательная статистика — В описательной статистике данные от всей совокупности или выборки суммируются с помощью числовых дескрипторов, таких как —
Среднее значение, стандартное отклонение для непрерывных данных
Частота, процент для категориальных данных
Статистическая статистика — использует образцы в выборочных данных, чтобы сделать выводы о представленной совокупности или учесть случайность. Эти выводы могут быть —
отвечая на вопросы да / нет о данных (проверка гипотез)
оценка числовых характеристик данных (оценка)
описание связей в данных (корреляция)
моделирование отношений в данных (например, регрессионный анализ)
Прогнозная аналитика
Predictive Analytics использует статистические модели для анализа текущих и исторических данных для прогнозирования (прогнозов) будущих или иных неизвестных событий. В бизнесе прогнозирующая аналитика используется для выявления рисков и возможностей, которые помогают в принятии решений.
Текстовая аналитика
Text Analytics, также называемый Text Mining или Text Data Mining, представляет собой процесс получения высококачественной информации из текста. Анализ текста обычно включает в себя процесс структурирования входного текста, извлечения шаблонов из структурированных данных с использованием таких средств, как изучение статистических шаблонов и, наконец, оценка и интерпретация выходных данных.
Процесс анализа данных
Анализ данных определен статистиком Джоном Тьюки в 1961 году как «Процедуры анализа данных, методы интерпретации результатов таких процедур, способы планирования сбора данных, чтобы сделать его анализ более простым, более точным или более точным, и все механизмы». и результаты (математической) статистики, которые применяются для анализа данных ».
Таким образом, анализ данных — это процесс получения больших неструктурированных данных из различных источников и преобразования их в информацию, полезную для:
- Отвечая на вопросы
- Проверка гипотез
- Принятие решения
- Опровергая теории
Анализ данных с помощью Excel
Microsoft Excel предоставляет несколько средств и способов для анализа и интерпретации данных. Данные могут быть из разных источников. Данные могут быть преобразованы и отформатированы несколькими способами. Его можно анализировать с помощью соответствующих команд, функций и инструментов Excel, включая условное форматирование, диапазоны, таблицы, текстовые функции, функции даты, функции времени, финансовые функции, промежуточные итоги, быстрый анализ, аудит формул, инструмент Inquire, анализ «что если», Решатели, модель данных, PowerPivot, PowerView, PowerMap и т. Д.
Вы будете изучать эти методы анализа данных с помощью Excel как часть двух частей —