Корреляция относится к некоторым статистическим отношениям, включающим зависимость между двумя наборами данных. Простые примеры зависимых явлений включают корреляцию между внешним видом родителей и их потомков, а также корреляцию между ценой на продукт и его поставляемым количеством.
Мы возьмем пример набора данных iris, доступных в библиотеке seaborn python. В нем мы пытаемся установить соотношение между длиной и шириной чашелистика и лепестков трех видов цветка ириса. На основе найденной корреляции может быть создана сильная модель, которая легко отличает один вид от другого.
import matplotlib.pyplot as plt import seaborn as sns df = sns.load_dataset('iris') #without regression sns.pairplot(df, kind="scatter") plt.show()
Его вывод выглядит следующим образом —