Учебники

R — Scatterplots

Диаграммы рассеяния показывают много точек, нанесенных на декартовой плоскости. Каждая точка представляет значения двух переменных. Одна переменная выбрана на горизонтальной оси, а другая на вертикальной оси.

Простая диаграмма рассеяния создается с помощью функции plot () .

Синтаксис

Основной синтаксис для создания диаграммы рассеяния в R —

plot(x, y, main, xlab, ylab, xlim, ylim, axes)

Ниже приведено описание используемых параметров:

  • х — это набор данных, значения которого являются горизонтальными координатами.

  • y — это набор данных, значения которого являются вертикальными координатами.

  • Основным является плитка графика.

  • xlab — это метка на горизонтальной оси.

  • ylab — это метка на вертикальной оси.

  • xlim — пределы значений x, используемых для построения графика.

  • ylim — пределы значений y, используемых для построения графика.

  • Оси указывает, следует ли рисовать обе оси на графике.

х — это набор данных, значения которого являются горизонтальными координатами.

y — это набор данных, значения которого являются вертикальными координатами.

Основным является плитка графика.

xlab — это метка на горизонтальной оси.

ylab — это метка на вертикальной оси.

xlim — пределы значений x, используемых для построения графика.

ylim — пределы значений y, используемых для построения графика.

Оси указывает, следует ли рисовать обе оси на графике.

пример

Мы используем набор данных «mtcars», доступный в среде R, чтобы создать базовую диаграмму рассеяния. Давайте используем столбцы «wt» и «mpg» в mtcars.

Live Demo

input <- mtcars[,c('wt','mpg')]
print(head(input))

Когда мы выполняем приведенный выше код, он дает следующий результат —

                    wt      mpg
Mazda RX4           2.620   21.0
Mazda RX4 Wag       2.875   21.0
Datsun 710          2.320   22.8
Hornet 4 Drive      3.215   21.4
Hornet Sportabout   3.440   18.7
Valiant             3.460   18.1

Создание Scatterplot

Приведенный ниже скрипт создаст график диаграммы рассеяния для соотношения между весом (вес) и милю на галлон (миль на галлон).

Live Demo

# Get the input values.
input <- mtcars[,c('wt','mpg')]

# Give the chart file a name.
png(file = "scatterplot.png")

# Plot the chart for cars with weight between 2.5 to 5 and mileage between 15 and 30.
plot(x = input$wt,y = input$mpg,
   xlab = "Weight",
   ylab = "Milage",
   xlim = c(2.5,5),
   ylim = c(15,30),		 
   main = "Weight vs Milage"
)
	 
# Save the file.
dev.off()

Когда мы выполняем приведенный выше код, он дает следующий результат —

Scatter Plot с использованием R

Матрицы рассеяния

Когда у нас более двух переменных и мы хотим найти корреляцию между одной переменной и остальными, мы используем матрицу рассеяния. Мы используем функцию pair () для создания матриц рассеяния.

Синтаксис

Основной синтаксис для создания матриц рассеяния в R это —

pairs(formula, data)

Ниже приведено описание используемых параметров:

  • формула представляет ряд переменных, используемых в парах.

  • Данные представляют собой набор данных, из которого будут взяты переменные.

формула представляет ряд переменных, используемых в парах.

Данные представляют собой набор данных, из которого будут взяты переменные.

пример

Каждая переменная связана с каждой из оставшихся переменных. Диаграмма рассеяния строится для каждой пары.

Live Demo

# Give the chart file a name.
png(file = "scatterplot_matrices.png")

# Plot the matrices between 4 variables giving 12 plots.

# One variable with 3 others and total 4 variables.

pairs(~wt+mpg+disp+cyl,data = mtcars,
   main = "Scatterplot Matrix")

# Save the file.
dev.off()

Когда приведенный выше код выполняется, мы получаем следующий вывод.