Учебники

Seaborn – оценки плотности ядра

Оценка плотности ядра (KDE) – это способ оценки функции плотности вероятности непрерывной случайной величины. Используется для непараметрического анализа.

Установка значения флага флага в False в distplot даст график оценки плотности ядра.

пример

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.distplot(df['petal_length'],hist=False)
plt.show()

Выход

график

Фиттинг Параметрическое Распределение

distplot () используется для визуализации параметрического распределения набора данных.

пример

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.distplot(df['petal_length'])
plt.show()

Выход

гистограмма

Построение двумерного распределения

Двустороннее распределение используется для определения связи между двумя переменными. Это в основном касается отношений между двумя переменными и того, как одна переменная ведет себя по отношению к другой.

Лучший способ проанализировать двумерное распределение в морской среде – использовать функцию jointplot () .

Jointplot создает многопанельную фигуру, которая проецирует двумерные отношения между двумя переменными, а также одномерное распределение каждой переменной по отдельным осям.

Scatter Plot

Диаграмма рассеяния является наиболее удобным способом визуализации распределения, в котором каждое наблюдение представлено в двухмерном графике через оси x и y.

пример

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df)
plt.show()

Выход

полоса и гистограмма

На приведенном выше рисунке показана взаимосвязь между petal_length и petal_width в данных Iris. Тенденция на графике говорит о том, что между изучаемыми переменными существует положительная корреляция.

Hexbin Plot

Гексагональное объединение используется в двумерном анализе данных, когда данные имеют небольшую плотность, т.е. когда данные очень разбросаны и их трудно анализировать с помощью диаграмм рассеяния.

Дополнительный параметр с именем ‘kind’ и значением ‘hex’ строит график гексбина.

пример

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex')
plt.show()

HExagon и брус

Оценка плотности ядра

Оценка плотности ядра – это непараметрический способ оценки распределения переменной. В seaborn мы можем построить kde с помощью jointplot ().

Передайте значение ‘kde’ параметру вида для построения графика ядра.