std::mbtowc
來自 cppreference.com
定義於標頭檔案 <cstdlib> |
||
int mbtowc( wchar_t* pwc, const char* s, std::size_t n ); |
||
將指向 s 的首位元組的多位元組字元轉換成寬字元,如果 pwc 非空則寫入 *pwc。
如果 s 是空指標,則重置全域性轉換狀態並確定是否使用移位序列。
目錄 |
[編輯] 引數
s | - | 指向多位元組字元的指標 |
n | - | s 中可檢查的位元組數的限制 |
pwc | - | 輸出寬字元的指標 |
[編輯] 返回值
如果 s 不是空指標,返回多位元組字元所包含的位元組數,如果 s 指向的首位元組不構成有效的多位元組字元則返回 -1,如果 s 指向空字元 '\0' 則返回 0。
如果 s 是空指標,重置其內部轉換狀態以表示初始移位狀態,如果當前多位元組編碼不依賴於狀態(不使用移位序列)則返回 0,如果當前多位元組編碼依賴於狀態(使用移位序列)則返回非零值。
[編輯] 注意
每次對 mbtowc
的呼叫都會更新內部全域性轉換狀態(型別為 std::mbstate_t 的靜態物件,僅此函式可見)。如果多位元組編碼使用移位狀態,必須小心避免回溯或多次掃描。在任何情況下,多個執行緒不應在沒有同步的情況下呼叫 mbtowc
:可以使用 std::mbrtowc 代替。
[編輯] 示例
執行此程式碼
#include <clocale> #include <cstdlib> #include <cstring> #include <iostream> int print_mb(const char* ptr) { std::mbtowc(nullptr, 0, 0); // reset the conversion state const char* end = ptr + std::strlen(ptr); int ret{}; for (wchar_t wc; (ret = std::mbtowc(&wc, ptr, end - ptr)) > 0; ptr += ret) std::wcout << wc; std::wcout << '\n'; return ret; } int main() { std::setlocale(LC_ALL, "en_US.utf8"); // UTF-8 narrow multibyte encoding const char* str = "z\u00df\u6c34\U0001d10b"; // or "zß水𝄋" // or "\x7a\xc3\x9f\xe6\xb0\xb4\xf0\x9d\x84\x8b"; print_mb(str); }
輸出
zß水𝄋
[編輯] 參閱
將下一個多位元組字元轉換為寬字元,給定狀態 (函式) | |
返回下一個多位元組字元的位元組數 (函式) | |
[虛擬] |
將字串從 ExternT 轉換為 InternT ,例如從檔案讀取時( std::codecvt<InternT,ExternT,StateT> 的虛擬保護成員函式) |