Bagikan melalui


Unicode dan MBCS

Pustaka Microsoft Foundation Classes (MFC), pustaka run-time C untuk Visual C++, dan lingkungan pengembangan Visual C++ diaktifkan untuk membantu pemrograman internasional Anda. Mereka menyediakan:

  • Dukungan untuk standar Unicode pada Windows. Unicode adalah standar saat ini dan harus digunakan jika memungkinkan.

    Unicode adalah pengodean karakter 16-bit, menyediakan pengodean yang cukup untuk semua bahasa. Semua karakter ASCII disertakan dalam Unicode sebagai karakter yang diperlebar.

  • Dukungan untuk bentuk set karakter multibyte (MBCS) yang disebut double-byte character set (DBCS) di semua platform.

    Karakter DBCS terdiri dari 1 atau 2 byte. Beberapa rentang byte disisihkan untuk digunakan sebagai byte prospek. Byte prospek menentukan bahwa byte tersebut dan byte jejak berikut terdiri dari satu karakter 2-byte-wide. Anda harus melacak byte mana yang merupakan byte prospek. Dalam set karakter multibyte tertentu, byte prospek berada dalam rentang tertentu, seperti halnya byte jejak. Ketika rentang ini tumpang tindih, mungkin perlu untuk mengevaluasi konteks untuk menentukan apakah byte tertentu berfungsi sebagai byte prospek atau byte jejak.

  • Dukungan untuk alat yang menyederhanakan pemrograman aplikasi MBCS yang ditulis untuk pasar internasional.

    Saat dijalankan pada versi sistem operasi Windows yang didukung MBCS, sistem pengembangan Visual C++ — termasuk editor kode sumber terintegrasi, debugger, dan alat baris perintah — sepenuhnya diaktifkan MBCS. Untuk informasi selengkapnya, lihat Dukungan MBCS di Visual C++.

Catatan

Dalam dokumentasi ini, MBCS digunakan untuk menjelaskan semua dukungan non-Unicode untuk karakter multibyte. Di Visual C++, MBCS selalu berarti DBCS. Set karakter yang lebih lebar dari 2 byte tidak didukung.

Menurut definisi, kumpulan karakter ASCII adalah subset dari semua set karakter multibyte. Dalam banyak set karakter multibyte, setiap karakter dalam rentang 0x00 - 0x7F identik dengan karakter yang memiliki nilai yang sama dalam kumpulan karakter ASCII. Misalnya, dalam string karakter ASCII dan MBCS, karakter NULL 1-byte ('\0') memiliki nilai 0x00 dan menunjukkan karakter null yang mengakhiri.

Baca juga

Teks dan String
Pengaktifan Internasional