名稱空間
變體
操作

std::c16rtomb

來自 cppreference.com
< cpp‎ | string‎ | multibyte
定義於標頭檔案 <cuchar>
std::size_t c16rtomb( char* s, char16_t c16, std::mbstate_t* ps );
(C++11 起)

將單個程式碼點從可變長度16位字元表示(通常是UTF-16)轉換為窄多位元組字元表示。

如果 s 不是空指標,並且 c16 是程式碼點有效可變長度編碼中的最後一個16位程式碼單元,則函式確定儲存該程式碼點的多位元組字元表示所需的位元組數(包括任何移位序列,並考慮當前多位元組轉換狀態 *ps),並將多位元組字元表示儲存在以 s 指向的第一個元素的字元陣列中,並根據需要更新 *ps。此函式最多可寫入 MB_CUR_MAX 個位元組。

如果 s 是空指標,則此呼叫等效於 std::c16rtomb(buf, u'\0', ps),其中 buf 是某個內部緩衝區。

如果 c16 不是寬字元16位表示中的最終程式碼單元,它不會寫入 s 指向的陣列,僅更新 *ps

如果 c16 是空寬字元 u'\0',則儲存一個空位元組,前面是恢復初始移位狀態所需的任何移位序列,並且轉換狀態引數 *ps 更新為表示初始移位狀態。

此函式使用的多位元組編碼由當前活動的 C 語言環境指定。

目錄

[編輯] 引數

s - 指向窄字元陣列的指標,多位元組字元將儲存在此處
c16 - 要轉換的16位字元
ps - 指向轉換狀態物件的指標,用於解釋多位元組字串

[編輯] 返回值

成功時,返回寫入到以 s 指向的第一個元素的字元陣列的位元組數(包括任何移位序列)。此值可能為 0,例如在處理代理對中的第一個 char16_t 時。

失敗時(如果 c16 不是有效的16位字元),返回 -1,將 EILSEQ 儲存在 errno 中,並使 *ps 處於未指定狀態。

[編輯] 注意

C++ 標準將此函式的語義交由 C 標準。在已釋出的 C11 中,與 std::mbrtoc16 不同,後者將可變寬度多位元組(如 UTF-8)轉換為可變寬度16位(如 UTF-16)編碼,此函式只能轉換單單元16位編碼,這意味著它無法將 UTF-16 轉換為 UTF-8,儘管這是此函式的最初意圖。這已透過 C11 之後的缺陷報告 DR488 進行了修正。

[編輯] 示例

此示例假定已應用 缺陷報告 488 的修復。

#include <climits>
#include <clocale>
#include <cuchar>
#include <iomanip>
#include <iostream>
#include <string_view>
 
int main()
{
    std::setlocale(LC_ALL, "en_US.utf8");
    std::u16string_view strv = u"zß水🍌"; // or z\u00df\u6c34\U0001F34C
    std::cout << "Processing " << strv.size() << " UTF-16 code units: [ ";
    for (char16_t c : strv)
        std::cout << std::showbase << std::hex << static_cast<int>(c) << ' ';
    std::cout << "]\n";
 
    std::mbstate_t state{};
    char out[MB_LEN_MAX]{};
    for (char16_t c : strv)
    {
        std::size_t rc = std::c16rtomb(out, c, &state);
        std::cout << static_cast<int>(c) << " converted to [ ";
        if (rc != (std::size_t) - 1)
            for (unsigned char c8 : std::string_view{out, rc})
                std::cout << +c8 << ' ';
        std::cout << "]\n";
    }
}

輸出

Processing 5 UTF-16 code units: [ 0x7a 0xdf 0x6c34 0xd83c 0xdf4c ]
0x7a converted to [ 0x7a ]
0xdf converted to [ 0xc3 0x9f ]
0x6c34 converted to [ 0xe6 0xb0 0xb4 ]
0xd83c converted to [ ]
0xdf4c converted to [ 0xf0 0x9f 0x8d 0x8c ]

[編輯] 另請參閱

(C++11)
將窄多位元組字元轉換為 UTF-16 編碼
(function) [編輯]
(C++20)
將 UTF-8 字串轉換為窄多位元組編碼
(function) [編輯]
[virtual]
將字串從 InternT 轉換為 ExternT,例如寫入檔案時
(std::codecvt<InternT,ExternT,StateT> 的虛保護成員函式) [編輯]
C 文件,關於 c16rtomb