Учебники

Статистика — Scatterplots

Диаграмма рассеяния — это графический способ отображения взаимосвязи между двумя количественными переменными выборки. Он состоит из оси X, оси Y и серии точек, где каждая точка представляет одно наблюдение из набора данных. Положение точки относится к ее значениям X и Y.

диаграммы рассеяния

Паттерны данных на диаграммах рассеяния

Диаграммы рассеяния используются для анализа закономерностей, которые обычно варьируются в зависимости от линейности, наклона и силы.

Линейность — шаблон данных является линейным / прямым или нелинейным / изогнутым.

Наклон — направление изменения переменной Y относительно увеличения значения переменной X. Если Y увеличивается с увеличением X, наклон положительный, иначе наклон отрицательный.

Сила — Степень распространенности разброса по сюжету. Если точки широко рассеяны, отношения считаются слабыми. Если точка очерчена вокруг линии, то связь считается сильной.