std::regex_constants::syntax_option_type

Эта страница была переведена автоматически с английской версии вики используя Переводчик Google. Перевод может содержать ошибки и странные формулировки.

Наведите курсор на текст, чтобы увидеть оригинал. Щёлкните здесь, чтобы увидеть английскую версию этой страницы.

(Вы можете помочь в исправлении ошибок и улучшении перевода. Для инструкций перейдите по ссылке.)

Определено в заголовочном файле `<regex>`
typedef/unspecified/ syntax_option_type; staticconstexpr syntax_option_type icase =/unspecified/; staticconstexpr syntax_option_type nosubs =/unspecified/; staticconstexpr syntax_option_type optimize =/unspecified/; staticconstexpr syntax_option_type collate =/unspecified/; staticconstexpr syntax_option_type ECMAScript =/unspecified/; staticconstexpr syntax_option_type basic =/unspecified/; staticconstexpr syntax_option_type extended =/unspecified/; staticconstexpr syntax_option_type awk =/unspecified/; staticconstexpr syntax_option_type grep =/unspecified/; staticconstexpr syntax_option_type egrep =/unspecified/;

syntax_option_type является BitmaskType, который содержит опции, которые управляют тем, как ведут себя регулярные выражения.

Возможные значения для этого типа (icase, optimize и т.д.) дублируются в std::basic_regex.

Содержание

[править]Константы


Значение	Эффект(ы)
`icase`	Сопоставление символов должно выполняться без учёта регистра.
`nosubs`	При выполнении сопоставлений все отмеченные подвыражения `(expr)` обрабатываются как немаркирующие подвыражения `(?:expr)`. В предоставленной структуре std::regex_match нет совпадений, а mark_count() равно нулю.
`optimize`	Даёт указание обработчику регулярных выражений ускорить сопоставление с потенциальными затратами на замедление построения. Например, это может означать преобразование недетерминированного FSA в детерминированное FSA.
`collate`	Диапазоны символов в форме "[a-b]" будут чувствительны к локали.
`multiline`(C++17)	Указывает, что `^` должен соответствовать началу строки, а `$` должен соответствовать концу строки, если выбран механизм ECMAScript.
`ECMAScript`	Используется Модифицированная грамматика регулярных выражений ECMAScript
`basic`	Используется базовая грамматика регулярных выражений POSIX (документация по грамматике).
`extended`	Используется расширенная грамматика регулярных выражений POSIX (документация по грамматике).
`awk`	Используется грамматика регулярных выражений, используемая утилитой awk в POSIX (документация по грамматике)
`grep`	Используется грамматика регулярных выражений, используемая утилитой grep в POSIX. Фактически это то же самое, что и опция `basic` с добавлением новой строки '\n' в качестве разделителя чередования.
`egrep`	Используется грамматика регулярных выражений, используемая утилитой grep в POSIX с параметром -E. Фактически это то же самое, что и опция `extended` с добавлением новой строки '\n' в качестве разделителя чередования в дополнение к '\|'.

Необходимо выбрать не более одного варианта грамматики из ECMAScript, basic, extended, awk, grep, egrep. Если грамматика не выбрана, предполагается, что выбрана ECMAScript. Другие параметры служат модификаторами, например std::regex("meow", std::regex::icase) эквивалентно std::regex("meow", std::regex::ECMAScript|std::regex::icase)

[править]Заметки

Потому что POSIX использует "левые длинный" правило соответствия (самая длинная соответствие последовательность совпадает, и если есть несколько таких последовательностей, первый из которых соответствует), он не подходит, например, для разбора языков разметки: POSIX регулярных выражений, таких как "<tag[^>]*>.*</tag>" будет соответствовать всем с первого "<tag" до последнего "</tag>", в том числе каждый "</tag>" и "<tag>" между ними. С другой стороны, ECMAScript поддерживает не жадный матчей, и ECMAScript регулярных выражений "<tag[^>]*>.*?</tag>" будет соответствовать только до первого закрывающего тега.

[править]Пример

Иллюстрирует разницу в алгоритме сопоставления между ECMAScript и POSIX регулярных выражений

Запустить этот код

#include <iostream>#include <string>#include <regex>   int main(){std::string str ="zzxayyzz";std::regex re1(".*(a|xayy)");// ECMAstd::regex re2(".*(a|xayy)", std::regex::extended);// POSIX   std::cout<<"Searching for .*(a|xayy) in zzxayyzz:\n";std::smatch m;std::regex_search(str, m, re1);std::cout<<" ECMA (depth first search) match: "<< m[0]<<'\n';std::regex_search(str, m, re2);std::cout<<" POSIX (leftmost longest) match: "<< m[0]<<'\n';}

Вывод:

Searching for .*(a|xayy) in zzxayyzz: ECMA (depth first search) match: zzxa POSIX (leftmost longest) match: zzxayy

[править]См. также

basic_regex

(C++11)

объект регулярного выражения
(шаблон класса)[править]

Поддержка компилятором
Автономные и размещённые реализации
Язык
Стандартная библиотека
Заголовки стандартной библиотеки
Требования к именованию
Макросы тестирования функциональности (C++20)
Поддержка языка
Библиотека концептов(C++20)
Библиотека метапрограммирования(C++11)
Библиотека диагностики
Библиотека общих утилит
Библиотека строк
Библиотека контейнеров
Библиотека итераторов
Библиотека диапазонов(C++20)
Библиотека алгоритмов
Библиотека численных данных
Библиотека ввода/вывода
Библиотека локализаций
Регулярные выражения(C++11)
Атомарные операции(C++11)
Библиотека поддержки конкуренции(C++11)
Библиотека файловой системы(C++17)
Технические спецификации
Указатель символов
Внешние библиотеки

Классы
basic_regex (C++11)
sub_match (C++11)
match_results (C++11)
Алгоритмы
regex_match (C++11)
regex_search (C++11)
regex_replace (C++11)
Итераторы
regex_iterator (C++11)
regex_token_iterator (C++11)
Исключения
regex_error (C++11)
Типы
regex_traits (C++11)
Константы
syntax_option_type (C++11)
match_flag_type (C++11)
error_type (C++11)
Грамматика регулярных выражений
Модифицированный ECMAScript-262 (C++11)

cppreference.com

Пространства имён

Варианты

Просмотры

Действия