Учебники

R — Струны

Любое значение, записанное в паре одинарных или двойных кавычек в R, рассматривается как строка. Внутри R каждая строка хранится в двойных кавычках, даже если вы создаете их в одинарных кавычках.

Правила, применяемые в строках строк

  • Кавычки в начале и конце строки должны быть как двойными, так и одинарными. Они не могут быть смешаны.

  • Двойные кавычки могут быть вставлены в строку, начинающуюся и заканчивающуюся одинарной кавычкой.

  • Одиночная кавычка может быть вставлена ​​в строку, начинающуюся и заканчивающуюся двойными кавычками.

  • Двойные кавычки не могут быть вставлены в строку, начинающуюся и заканчивающуюся двойными кавычками.

  • Одиночная кавычка не может быть вставлена ​​в строку, начинающуюся и заканчивающуюся одинарной кавычкой.

Кавычки в начале и конце строки должны быть как двойными, так и одинарными. Они не могут быть смешаны.

Двойные кавычки могут быть вставлены в строку, начинающуюся и заканчивающуюся одинарной кавычкой.

Одиночная кавычка может быть вставлена ​​в строку, начинающуюся и заканчивающуюся двойными кавычками.

Двойные кавычки не могут быть вставлены в строку, начинающуюся и заканчивающуюся двойными кавычками.

Одиночная кавычка не может быть вставлена ​​в строку, начинающуюся и заканчивающуюся одинарной кавычкой.

Примеры допустимых строк

Следующие примеры поясняют правила создания строки в R.

Live Demo

a <- 'Start and end with single quote'
print(a)

b <- "Start and end with double quotes"
print(b)

c <- "single quote ' in between double quotes"
print(c)

d <- 'Double quotes " in between single quote'
print(d)

Когда приведенный выше код выполняется, мы получаем следующий вывод:

[1] "Start and end with single quote"
[1] "Start and end with double quotes"
[1] "single quote ' in between double quote"
[1] "Double quote \" in between single quote"

Примеры неверных строк

Live Demo

e <- 'Mixed quotes" 
print(e)

f <- 'Single quote ' inside single quote'
print(f)

g <- "Double quotes " inside double quotes"
print(g)

Когда мы запускаем скрипт, он не дает результатов ниже.

Error: unexpected symbol in:
"print(e)
f <- 'Single"
Execution halted

Манипуляция строк

Конкатенация строк — функция вставки ()

Многие строки в R объединяются с использованием функции paste () . Может потребоваться любое количество аргументов для объединения.

Синтаксис

Основной синтаксис для функции вставки —

paste(..., sep = " ", collapse = NULL)

Ниже приведено описание используемых параметров:

  • представляет любое количество аргументов для объединения.

  • sep представляет любой разделитель между аргументами. Это необязательно.

  • Свернуть используется для устранения пробела между двумя строками. Но не пробел в двух словах одной строки.

представляет любое количество аргументов для объединения.

sep представляет любой разделитель между аргументами. Это необязательно.

Свернуть используется для устранения пробела между двумя строками. Но не пробел в двух словах одной строки.

пример

Live Demo

a <- "Hello"
b <- 'How'
c <- "are you? "

print(paste(a,b,c))

print(paste(a,b,c, sep = "-"))

print(paste(a,b,c, sep = "", collapse = ""))

Когда мы выполняем приведенный выше код, он дает следующий результат —

[1] "Hello How are you? "
[1] "Hello-How-are you? "
[1] "HelloHoware you? "

Форматирование чисел и строк — функция format ()

Числа и строки могут быть отформатированы в определенный стиль с помощью функции format () .

Синтаксис

Основной синтаксис для функции форматирования —

format(x, digits, nsmall, scientific, width, justify = c("left", "right", "centre", "none")) 

Ниже приведено описание используемых параметров:

  • х является векторным входом.

  • цифры — это общее количество отображаемых цифр.

  • nsmall — это минимальное количество цифр справа от десятичной точки.

  • Scientific установлен в TRUE для отображения научной записи.

  • ширина указывает минимальную ширину, которая должна отображаться при добавлении пробелов в начале.

  • justify — отображение строки слева, справа или по центру.

х является векторным входом.

цифры — это общее количество отображаемых цифр.

nsmall — это минимальное количество цифр справа от десятичной точки.

Scientific установлен в TRUE для отображения научной записи.

ширина указывает минимальную ширину, которая должна отображаться при добавлении пробелов в начале.

justify — отображение строки слева, справа или по центру.

пример

Live Demo

# Total number of digits displayed. Last digit rounded off.
result <- format(23.123456789, digits = 9)
print(result)

# Display numbers in scientific notation.
result <- format(c(6, 13.14521), scientific = TRUE)
print(result)

# The minimum number of digits to the right of the decimal point.
result <- format(23.47, nsmall = 5)
print(result)

# Format treats everything as a string.
result <- format(6)
print(result)

# Numbers are padded with blank in the beginning for width.
result <- format(13.7, width = 6)
print(result)

# Left justify strings.
result <- format("Hello", width = 8, justify = "l")
print(result)

# Justfy string with center.
result <- format("Hello", width = 8, justify = "c")
print(result)

Когда мы выполняем приведенный выше код, он дает следующий результат —

[1] "23.1234568"
[1] "6.000000e+00" "1.314521e+01"
[1] "23.47000"
[1] "6"
[1] "  13.7"
[1] "Hello   "
[1] " Hello  "

Подсчет количества символов в строке — функция nchar ()

Эта функция считает количество символов, включая пробелы в строке.

Синтаксис

Основной синтаксис для функции nchar () —

nchar(x)

Ниже приведено описание используемых параметров:

  • х является векторным входом.

х является векторным входом.

пример

Live Demo

result <- nchar("Count the number of characters")
print(result)

Когда мы выполняем приведенный выше код, он дает следующий результат —

[1] 30

Изменение регистра — функции toupper () и tolower ()

Эти функции изменяют регистр символов строки.

Синтаксис

Основной синтаксис функции toupper () и tolower () —

toupper(x)
tolower(x)

Ниже приведено описание используемых параметров:

  • х является векторным входом.

х является векторным входом.

пример

Live Demo

# Changing to Upper case.
result <- toupper("Changing To Upper")
print(result)

# Changing to lower case.
result <- tolower("Changing To Lower")
print(result)

Когда мы выполняем приведенный выше код, он дает следующий результат —

[1] "CHANGING TO UPPER"
[1] "changing to lower"

Извлечение частей строки — функция substring ()

Эта функция извлекает части строки.

Синтаксис

Основной синтаксис для функции substring () —

substring(x,first,last)

Ниже приведено описание используемых параметров:

  • х — символьный вектор ввода.

  • first — позиция первого символа для извлечения.

  • last — позиция последнего извлекаемого символа

х — символьный вектор ввода.

first — позиция первого символа для извлечения.

last — позиция последнего извлекаемого символа

пример

Live Demo

# Extract characters from 5th to 7th position.
result <- substring("Extract", 5, 7)
print(result)

Когда мы выполняем приведенный выше код, он дает следующий результат —