Полезный подход для изучения данных среднего размера — рисование нескольких экземпляров одного и того же графика в разных подмножествах вашего набора данных.
Этот метод обычно называют «решетчатым», или «решетчатым» построением, и он связан с идеей «малых кратных».
Чтобы использовать эти функции, ваши данные должны быть в Pandas DataFrame.
Построение небольших кратных наборов данных
В предыдущей главе мы видели пример FacetGrid, в котором класс FacetGrid помогает визуализировать распределение одной переменной, а также взаимосвязь между несколькими переменными по отдельности в подмножествах вашего набора данных с использованием нескольких панелей.
Сетка FacetGrid может быть нарисована с тремя измерениями — строка, столбец и оттенок. Первые два имеют очевидное соответствие с результирующим массивом осей; Подумайте о переменной оттенка как о третьем измерении вдоль оси глубины, где разные уровни изображены разными цветами.
Объект FacetGrid принимает в качестве входных данных фрейм данных и имена переменных, которые будут формировать размеры строки, столбца или оттенка сетки.
Переменные должны быть категориальными, и данные на каждом уровне переменной будут использоваться для фасета по этой оси.
пример
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt df = sb.load_dataset('tips') g = sb.FacetGrid(df, col = "time") plt.show()
Выход
В приведенном выше примере мы только что инициализировали объект facetgrid, который на них ничего не рисует.
Основным подходом для визуализации данных в этой сетке является метод FacetGrid.map () . Давайте посмотрим на распределение подсказок в каждом из этих подмножеств, используя гистограмму.
пример
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt df = sb.load_dataset('tips') g = sb.FacetGrid(df, col = "time") g.map(plt.hist, "tip") plt.show()
Выход
Количество графиков больше одного из-за параметра col. Мы обсуждали параметр col в наших предыдущих главах.
Чтобы создать реляционный график, передайте несколько имен переменных.