Java - регулярные выражения

Java предоставляет пакет java.util.regex для сопоставления с шаблоном с регулярными выражениями. Регулярные выражения Java очень похожи на язык программирования Perl и очень просты в освоении.

Регулярное выражение — это специальная последовательность символов, которая помогает вам сопоставлять или находить другие строки или наборы строк, используя специальный синтаксис, содержащийся в шаблоне. Их можно использовать для поиска, редактирования или манипулирования текстом и данными.

Пакет java.util.regex в основном состоит из следующих трех классов:

Класс Pattern — Объект Pattern представляет собой скомпилированное представление регулярного выражения. Класс Pattern не предоставляет общедоступных конструкторов. Чтобы создать шаблон, вы должны сначала вызвать один из его открытых статических методов compile () , который затем вернет объект Pattern. Эти методы принимают регулярное выражение в качестве первого аргумента.
Класс Matcher — объект Matcher — это механизм, который интерпретирует шаблон и выполняет операции сопоставления с входной строкой. Как и класс Pattern, Matcher не определяет общедоступных конструкторов. Вы получаете объект Matcher, вызывая метод matcher () для объекта Pattern.
PatternSyntaxException — Объект PatternSyntaxException является непроверенным исключением, которое указывает на синтаксическую ошибку в образце регулярного выражения.

Класс Pattern — Объект Pattern представляет собой скомпилированное представление регулярного выражения. Класс Pattern не предоставляет общедоступных конструкторов. Чтобы создать шаблон, вы должны сначала вызвать один из его открытых статических методов compile () , который затем вернет объект Pattern. Эти методы принимают регулярное выражение в качестве первого аргумента.

Класс Matcher — объект Matcher — это механизм, который интерпретирует шаблон и выполняет операции сопоставления с входной строкой. Как и класс Pattern, Matcher не определяет общедоступных конструкторов. Вы получаете объект Matcher, вызывая метод matcher () для объекта Pattern.

PatternSyntaxException — Объект PatternSyntaxException является непроверенным исключением, которое указывает на синтаксическую ошибку в образце регулярного выражения.

Захват групп

Захват групп — это способ рассматривать несколько символов как единое целое. Они создаются путем помещения символов, которые будут сгруппированы, в набор скобок. Например, регулярное выражение (собака) создает одну группу, содержащую буквы «d», «o» и «g».

Захватывающие группы нумеруются путем подсчета открывающих скобок слева направо. В выражении ((A) (B (C))), например, есть четыре такие группы —

((А) (В (С)))
(А)
(ДО НАШЕЙ ЭРЫ))
(С)

Чтобы узнать, сколько групп присутствует в выражении, вызовите метод groupCount для объекта соответствия. Метод groupCount возвращает int, показывающий количество групп захвата, присутствующих в шаблоне сопоставителя.

Существует также специальная группа, группа 0, которая всегда представляет все выражение. Эта группа не включена в общее количество, сообщенное groupCount.

пример

В следующем примере показано, как найти строку цифр из заданной буквенно-цифровой строки:

Подвыражение	Матчи
^	Соответствует началу строки.
$	Соответствует концу строки.
,	Соответствует любому отдельному символу, кроме новой строки. Использование опции m позволяет ему соответствовать и новой строке.
[…]	Соответствует любому отдельному символу в скобках.
[^ …]	Соответствует любому отдельному символу не в скобках.
\ A	Начало всей строки.
\ г	Конец всей строки.
\ Z	Конец всей строки, кроме допустимого конечного конца строки.
ре *	Соответствует 0 или более вхождений предыдущего выражения.
ре +	Соответствует 1 или более из предыдущей вещи.
повторно?	Соответствует 0 или 1 вхождению предыдущего выражения.
re {n}	Совпадает ровно с числом вхождений предыдущего выражения.
re {n,}	Соответствует n или более вхождений предыдущего выражения.
re {n, m}	Соответствует не менее n и не более m вхождений предыдущего выражения.
\| б	Соответствует либо a, либо b.
(Ре)	Группирует регулярные выражения и запоминает сопоставленный текст.
(?: re)	Группирует регулярные выражения без запоминания сопоставленного текста.
(?> re)	Соответствует независимому образцу без возврата.
\ ш	Соответствует слову символов.
\ W	Соответствует несловесным символам.
\ s	Соответствует пробелу. Эквивалентно [\ t \ n \ r \ f].
\ S	Соответствует непробельному пространству.
\ d	Соответствует цифрам. Эквивалентно [0-9].
\ D	Совпадает с нецифрами.
\ A	Соответствует началу строки.
\ Z	Соответствует концу строки. Если новая строка существует, она совпадает непосредственно перед новой строкой.
\ г	Соответствует концу строки.
\Г	Соответствует точке, где закончился последний матч.
\ п	Обратная ссылка для захвата номера группы «n».
\ б	Соответствует границам слов вне скобок. Соответствует возврату (0x08) внутри скобок.
\ B	Соответствует границам без слов.
\ n, \ t и т. д.	Сопоставляет переводы строк, возврат каретки, вкладки и т. Д.
\ Q	Побег (цитата) всех символов до \ E.
\ E	Завершает цитирование, начинающееся с \ Q.

Sr.No.	Метод и описание
1	public int start () Возвращает начальный индекс предыдущего матча.
2	public int start (группа int) Возвращает начальный индекс подпоследовательности, захваченной данной группой во время предыдущей операции сопоставления.
3	public int end () Возвращает смещение после совпадения последнего символа.
4	public int end (int group) Возвращает смещение после последнего символа подпоследовательности, захваченной данной группой во время предыдущей операции сопоставления.

Sr.No.	Метод и описание
1	public boolean LookingAt () Пытается сопоставить входную последовательность, начиная с начала региона, с шаблоном.
2	public boolean find () Пытается найти следующую подпоследовательность входной последовательности, которая соответствует шаблону.
3	публичная логическая находка (int start) Сбрасывает это сопоставление и затем пытается найти следующую подпоследовательность входной последовательности, которая соответствует шаблону, начиная с указанного индекса.
4	публичные логические совпадения () Попытки сопоставить весь регион с шаблоном.

Sr.No.	Метод и описание
1	public Matcher appendReplacement (StringBuffer sb, String replace) Реализует нетерминальный шаг добавления и замены.
2	public StringBuffer appendTail (StringBuffer sb) Реализует шаг добавления и замены терминала.
3	public String replaceAll (замена строки) Заменяет каждую подпоследовательность входной последовательности, которая соответствует шаблону с данной строкой замены.
4	public String replaceFirst (замена строки) Заменяет первую подпоследовательность входной последовательности, которая соответствует шаблону с данной строкой замены.
5	public static String quoteReplacement (String s) Возвращает буквенную замещающую строку для указанной строки. Этот метод создает строку, которая будет работать в качестве литеральной замены в методе appendReplacement класса Matcher.

Java — регулярные выражения

Захват групп

Синтаксис регулярных выражений

Методы класса Matcher

Методы индекса

Методы обучения

Методы замены

Методы начала и конца

Спички и методы поиска

Заменить первый и заменить все методы

Методы appendReplace и appendTail

Методы класса PatternSyntaxException

Популярные уроки и статьи

Инициализаторы экземпляра в Java объяснены

AJAX - Краткое руководство

TempDB для производительности