std::regex_traits<CharT>::lookup_classname
template<class ForwardIt > char_class_type lookup_classname( ForwardIt first, | ||
文字シーケンス [first, last)
が現在設定されているロケールにおいて有効な文字クラス名を表している場合、その文字クラスを表す処理系定義の値を返します。 そうでなければ、ゼロを返します。 文字クラス名は正規表現内の [:
と :]
の間の文字列です。
引数 icase
が true であれば、文字クラスは大文字小文字を無視します。 例えば std::regex_constants::icase 付きの正規表現 [:lower:]
は文字列 "lower" を表す [first, last)
および icase ==true を渡して regex_traits<>::lookup_classname()
に対する呼び出しを生成します。 この呼び出しは icase ==false の場合の正規表現 [:alpha:]
によって生成される呼び出しと同じビットマスクを返します。
以下の文字クラスは、ナロー文字形式とワイド文字形式の両方で必ず認識され、返される分類 (icase ==false の場合) は設定されているロケールの std::ctype ファセットから取得した同じ分類に対応します。
文字クラス | std::ctype の分類 |
"alnum" | std::ctype_base::alnum |
"alpha" | std::ctype_base::alpha |
"blank" | std::ctype_base::blank |
"cntrl" | std::ctype_base::cntrl |
"digit" | std::ctype_base::digit |
"graph" | std::ctype_base::graph |
"lower" | std::ctype_base::lower |
"print" | std::ctype_base::print |
"punct" | std::ctype_base::punct |
"space" | std::ctype_base::space |
"upper" | std::ctype_base::upper |
"xdigit" | std::ctype_base::xdigit |
"d" | std::ctype_base::digit |
"s" | std::ctype_base::space |
"w" | std::ctype_base::alnum にオプションで '_' を加えたもの |
文字列 "w" に対して返される分類は "alnum" とまったく同じかもしれません (その場合 isctype() は '_' を明示的に追加します)。
システム供給のロケールによって "jdigit" や "jkanji" といった追加の分類が提供されるかもしれません (その場合 std::wctype を通してこれらにアクセス可能です)。
目次 |
[編集]引数
first, last | - | 文字クラスの名前を表す文字シーケンスを表す一組のイテレータ |
icase | - | true の場合、文字分類で大文字小文字の区別を無視します |
型の要件 | ||
-ForwardIt は LegacyForwardIterator の要件を満たさなければなりません。 |
[編集]戻り値
指定された文字クラスが表す文字分類を表すビットマスク、またはクラスが不明な場合は char_class_type()
。
[編集]例
lookup_classname/isctype のカスタム regex_traits 実装をデモンストレーションします
#include <iostream>#include <locale>#include <regex>#include <cwctype> // This custom regex traits uses wctype/iswctype to implement lookup_classname/isctypestruct wctype_traits :std::regex_traits<wchar_t>{using char_class_type = std::wctype_t;template<class It> char_class_type lookup_classname(It first, It last, bool=false)const{returnstd::wctype(std::string(first, last).c_str());}bool isctype(wchar_t c, char_class_type f)const{returnstd::iswctype(c, f);}}; int main(){ std::locale::global(std::locale("ja_JP.utf8"));std::wcout.sync_with_stdio(false);std::wcout.imbue(std::locale()); std::wsmatch m;std::wstring in = L"風の谷のナウシカ";// matches all characters (they are classified as alnum)std::regex_search(in, m, std::wregex(L"([[:alnum:]]+)"));std::wcout<<"alnums: "<< m[1]<<'\n';// prints "風の谷のナウシカ"// matches only the katakanastd::regex_search(in, m, std::basic_regex<wchar_t, wctype_traits>(L"([[:jkata:]]+)"));std::wcout<<"katakana: "<< m[1]<<'\n';// prints "ナウシカ"}
出力:
alnums: 風の谷のナウシカ katakana: ナウシカ
[編集]関連項目
indicates membership in a character class (パブリックメンバ関数) | |
現在の C のロケールで文字分類カテゴリを検索します (関数) |