std::mbrlen
来自cppreference.com
在标头 <cwchar> 定义 | ||
std::size_t mbrlen(constchar* s, std::size_t n, std::mbstate_t* ps); | ||
给定当前转换状态 ps,确定首字节为 s 所指向的多字节字符的剩余字节大小。
此函数等价于对于某 std::mbstate_t 类型的隐藏对象 internal 的调用 std::mbrtowc(nullptr, s, n, ps ? ps :&internal),但它只求值表达式 ps 一次。
目录 |
[编辑]参数
s | - | 指向多字节字符串元素的指针 |
n | - | s 中能检验的字节数限制 |
ps | - | 指向保有转换状态的对象的指针 |
[编辑]返回值
- 若下 n 个或更少字节完成空字符则为 0。
- 完成合法多字节字符的字节数(1 与 n 之间)。
- 若发生编码错误则为 std::size_t(-1)。
- 若下 n 个字节为可能合法,而在检验全部 n 个字节后仍不完整的多字节字符的一部分,则为 std::size_t(-2)。
[编辑]示例
运行此代码
#include <clocale>#include <cwchar>#include <iostream>#include <string> int main(){// 允许 mbrlen() 以 UTF-8 多字节编码工作std::setlocale(LC_ALL, "en_US.utf8");// UTF-8 窄多字节编码std::string str ="水";// 或 u8"\u6c34" 或 "\xe6\xb0\xb4"std::mbstate_t mb =std::mbstate_t(); // 简单用法:完整多字节字符的长度conststd::size_t len = std::mbrlen(&str[0], str.size(), &mb);std::cout<<"The length of "<< str <<" is "<< len <<" bytes\n"; // 高级用法:从多字节字符的中间重新计数conststd::size_t len1 = std::mbrlen(&str[0], 1, &mb);if(len1 ==std::size_t(-2))std::cout<< str <<"的第一个字节是不完整的多字节字符 (mbrlen 返回 -2)\n"; conststd::size_t len2 = std::mbrlen(&str[1], str.size()-1, &mb);std::cout<< str <<" 的剩余 "<< str.size()-1<<" 个字节"<<"持有多字节字符的 "<< len2 <<" 个字节\n"; // 错误情况:std::cout<<"尝试在初始转换状态中在 "<< str <<" 的中间调用 mbrlen() 返回 "<<(int)mbrlen(&str[1], str.size(), &mb)<<'\n';}
输出:
水 的长度是 3 个字节。 水 的第一个字节是不完整的多字节字符 (mbrlen 返回 -2) 水 的剩余 2 个字节持有多字节字符的 2 个字节 尝试在初始转换状态中在 水 的中间调用 mbrlen() 返回 -1
[编辑]参阅
给定状态,转换下个多字节字符为宽字符 (函数) | |
返回下一个多字节字符中的字节数 (函数) | |
[虚] | 计算转换成给定的 InternT 缓冲区会消耗的 ExternT 字符串长度 ( std::codecvt<InternT,ExternT,StateT> 的虚受保护成员函数) |
mbrlen 的 C 文档 |