Karakter Multibyte dan Lebar
Karakter multibyte adalah karakter yang terdiri dari urutan satu atau lebih byte. Setiap urutan byte mewakili satu karakter dalam kumpulan karakter yang diperluas. Karakter multibyte digunakan dalam kumpulan karakter seperti Kanji.
Karakter lebar adalah kode karakter multibahasa yang selalu lebarnya 16 bit. Jenis untuk konstanta karakter adalah char
; untuk karakter lebar, jenisnya adalah wchar_t
. Karena karakter lebar selalu berukuran tetap, menggunakan karakter lebar menyederhanakan pemrograman dengan set karakter internasional.
Literal string karakter lebar L"hello"
menjadi array enam bilangan bulat bertipe wchar_t
.
{L'h', L'e', L'l', L'l', L'o', 0}
Spesifikasi Unicode adalah spesifikasi untuk karakter luas. Rutinitas perpustakaan run-time untuk menerjemahkan antara multibyte dan karakter lebar mencakup mbstowcs
, mbtowc
, wcstombs
, dan wctomb
.