Диаграммы рассеяния показывают много точек, нанесенных на декартовой плоскости. Каждая точка представляет значения двух переменных. Одна переменная выбрана на горизонтальной оси, а другая на вертикальной оси.
Простая диаграмма рассеяния создается с помощью функции plot () .
Синтаксис
Основной синтаксис для создания диаграммы рассеяния в R —
plot(x, y, main, xlab, ylab, xlim, ylim, axes)
Ниже приведено описание используемых параметров:
-
х — это набор данных, значения которого являются горизонтальными координатами.
-
y — это набор данных, значения которого являются вертикальными координатами.
-
Основным является плитка графика.
-
xlab — это метка на горизонтальной оси.
-
ylab — это метка на вертикальной оси.
-
xlim — пределы значений x, используемых для построения графика.
-
ylim — пределы значений y, используемых для построения графика.
-
Оси указывает, следует ли рисовать обе оси на графике.
х — это набор данных, значения которого являются горизонтальными координатами.
y — это набор данных, значения которого являются вертикальными координатами.
Основным является плитка графика.
xlab — это метка на горизонтальной оси.
ylab — это метка на вертикальной оси.
xlim — пределы значений x, используемых для построения графика.
ylim — пределы значений y, используемых для построения графика.
Оси указывает, следует ли рисовать обе оси на графике.
пример
Мы используем набор данных «mtcars», доступный в среде R, чтобы создать базовую диаграмму рассеяния. Давайте используем столбцы «wt» и «mpg» в mtcars.
input <- mtcars[,c('wt','mpg')] print(head(input))
Когда мы выполняем приведенный выше код, он дает следующий результат —
wt mpg Mazda RX4 2.620 21.0 Mazda RX4 Wag 2.875 21.0 Datsun 710 2.320 22.8 Hornet 4 Drive 3.215 21.4 Hornet Sportabout 3.440 18.7 Valiant 3.460 18.1
Создание Scatterplot
Приведенный ниже скрипт создаст график диаграммы рассеяния для соотношения между весом (вес) и милю на галлон (миль на галлон).
# Get the input values. input <- mtcars[,c('wt','mpg')] # Give the chart file a name. png(file = "scatterplot.png") # Plot the chart for cars with weight between 2.5 to 5 and mileage between 15 and 30. plot(x = input$wt,y = input$mpg, xlab = "Weight", ylab = "Milage", xlim = c(2.5,5), ylim = c(15,30), main = "Weight vs Milage" ) # Save the file. dev.off()
Когда мы выполняем приведенный выше код, он дает следующий результат —
Матрицы рассеяния
Когда у нас более двух переменных и мы хотим найти корреляцию между одной переменной и остальными, мы используем матрицу рассеяния. Мы используем функцию pair () для создания матриц рассеяния.
Синтаксис
Основной синтаксис для создания матриц рассеяния в R это —
pairs(formula, data)
Ниже приведено описание используемых параметров:
-
формула представляет ряд переменных, используемых в парах.
-
Данные представляют собой набор данных, из которого будут взяты переменные.
формула представляет ряд переменных, используемых в парах.
Данные представляют собой набор данных, из которого будут взяты переменные.
пример
Каждая переменная связана с каждой из оставшихся переменных. Диаграмма рассеяния строится для каждой пары.
# Give the chart file a name. png(file = "scatterplot_matrices.png") # Plot the matrices between 4 variables giving 12 plots. # One variable with 3 others and total 4 variables. pairs(~wt+mpg+disp+cyl,data = mtcars, main = "Scatterplot Matrix") # Save the file. dev.off()
Когда приведенный выше код выполняется, мы получаем следующий вывод.