std::c16rtomb
定義於標頭檔案 <cuchar> |
||
std::size_t c16rtomb( char* s, char16_t c16, std::mbstate_t* ps ); |
(C++11 起) | |
將單個程式碼點從可變長度16位字元表示(通常是UTF-16)轉換為窄多位元組字元表示。
如果 s 不是空指標,並且 c16 是程式碼點有效可變長度編碼中的最後一個16位程式碼單元,則函式確定儲存該程式碼點的多位元組字元表示所需的位元組數(包括任何移位序列,並考慮當前多位元組轉換狀態 *ps),並將多位元組字元表示儲存在以 s 指向的第一個元素的字元陣列中,並根據需要更新 *ps。此函式最多可寫入 MB_CUR_MAX 個位元組。
如果 s 是空指標,則此呼叫等效於 std::c16rtomb(buf, u'\0', ps),其中 buf
是某個內部緩衝區。
如果 c16 不是寬字元16位表示中的最終程式碼單元,它不會寫入 s 指向的陣列,僅更新 *ps。
如果 c16 是空寬字元 u'\0',則儲存一個空位元組,前面是恢復初始移位狀態所需的任何移位序列,並且轉換狀態引數 *ps 更新為表示初始移位狀態。
此函式使用的多位元組編碼由當前活動的 C 語言環境指定。
目錄 |
[編輯] 引數
s | - | 指向窄字元陣列的指標,多位元組字元將儲存在此處 |
c16 | - | 要轉換的16位字元 |
ps | - | 指向轉換狀態物件的指標,用於解釋多位元組字串 |
[編輯] 返回值
成功時,返回寫入到以 s 指向的第一個元素的字元陣列的位元組數(包括任何移位序列)。此值可能為 0,例如在處理代理對中的第一個 char16_t 時。
失敗時(如果 c16 不是有效的16位字元),返回 -1,將 EILSEQ 儲存在 errno 中,並使 *ps 處於未指定狀態。
[編輯] 注意
C++ 標準將此函式的語義交由 C 標準。在已釋出的 C11 中,與 std::mbrtoc16 不同,後者將可變寬度多位元組(如 UTF-8)轉換為可變寬度16位(如 UTF-16)編碼,此函式只能轉換單單元16位編碼,這意味著它無法將 UTF-16 轉換為 UTF-8,儘管這是此函式的最初意圖。這已透過 C11 之後的缺陷報告 DR488 進行了修正。
[編輯] 示例
此示例假定已應用 缺陷報告 488 的修復。
#include <climits> #include <clocale> #include <cuchar> #include <iomanip> #include <iostream> #include <string_view> int main() { std::setlocale(LC_ALL, "en_US.utf8"); std::u16string_view strv = u"zß水🍌"; // or z\u00df\u6c34\U0001F34C std::cout << "Processing " << strv.size() << " UTF-16 code units: [ "; for (char16_t c : strv) std::cout << std::showbase << std::hex << static_cast<int>(c) << ' '; std::cout << "]\n"; std::mbstate_t state{}; char out[MB_LEN_MAX]{}; for (char16_t c : strv) { std::size_t rc = std::c16rtomb(out, c, &state); std::cout << static_cast<int>(c) << " converted to [ "; if (rc != (std::size_t) - 1) for (unsigned char c8 : std::string_view{out, rc}) std::cout << +c8 << ' '; std::cout << "]\n"; } }
輸出
Processing 5 UTF-16 code units: [ 0x7a 0xdf 0x6c34 0xd83c 0xdf4c ] 0x7a converted to [ 0x7a ] 0xdf converted to [ 0xc3 0x9f ] 0x6c34 converted to [ 0xe6 0xb0 0xb4 ] 0xd83c converted to [ ] 0xdf4c converted to [ 0xf0 0x9f 0x8d 0x8c ]
[編輯] 另請參閱
(C++11) |
將窄多位元組字元轉換為 UTF-16 編碼 (function) |
(C++20) |
將 UTF-8 字串轉換為窄多位元組編碼 (function) |
[virtual] |
將字串從 InternT 轉換為 ExternT ,例如寫入檔案時( std::codecvt<InternT,ExternT,StateT> 的虛保護成員函式) |
C 文件,關於 c16rtomb
|