Unicode dan MBCS

Pustaka Microsoft Foundation Classes (MFC), pustaka run-time C untuk Visual C++, dan lingkungan pengembangan Visual C++ diaktifkan untuk membantu pemrograman internasional Anda. Mereka menyediakan:

  • Dukungan untuk standar Unicode pada Windows. Unicode adalah standar saat ini dan harus digunakan jika memungkinkan.

    Unicode adalah pengodean karakter 16-bit, menyediakan pengodean yang cukup untuk semua bahasa. Semua karakter ASCII disertakan dalam Unicode sebagai karakter yang diperlebar.

  • Dukungan untuk jenis multibyte character set (MBCS) yang disebut double-byte character set (DBCS) di semua platform.

    Karakter DBCS terdiri dari 1 atau 2 byte. Beberapa rentang byte disisihkan untuk digunakan sebagai byte awalan. Byte utama menentukan bahwa byte tersebut dan byte jejak berikutnya terdiri dari satu karakter berukuran 2 byte. Anda harus melacak mana saja byte yang merupakan byte awal. Dalam set karakter multibyte tertentu, byte awalan berada dalam rentang tertentu, begitu juga byte akhiran. Ketika rentang ini tumpang tindih, mungkin perlu untuk mengevaluasi konteks untuk menentukan apakah byte tertentu berfungsi sebagai byte awal atau byte akhir.

  • Dukungan untuk alat yang menyederhanakan pemrograman aplikasi MBCS yang ditulis untuk pasar internasional.

    Saat dijalankan pada versi sistem operasi Windows yang didukung MBCS, sistem pengembangan Visual C++ — termasuk editor kode sumber terintegrasi, debugger, dan alat baris perintah — sepenuhnya diaktifkan MBCS. Untuk informasi selengkapnya, lihat Dukungan MBCS di Visual C++.

Catatan

Dalam dokumentasi ini, MBCS digunakan untuk menjelaskan semua dukungan non-Unicode untuk karakter multibyte. Di Visual C++, MBCS selalu berarti DBCS. Set karakter yang lebih lebar dari 2 byte tidak didukung.

Menurut definisi, kumpulan karakter ASCII adalah subset dari semua set karakter multibyte. Dalam banyak set karakter multibyte, setiap karakter dalam rentang 0x00 - 0x7F identik dengan karakter yang memiliki nilai yang sama dalam kumpulan karakter ASCII. Misalnya, dalam string karakter ASCII dan MBCS, karakter NULL 1-byte ('\0') memiliki nilai 0x00 dan menunjukkan karakter null yang mengakhiri.

Lihat juga

Teks dan String
Pengaktifan Internasional