Kumpulan karakter

"set karakter" adalah pemetaan karakter untuk mengidentifikasi nilai kode mereka. Kumpulan karakter yang paling umum digunakan dalam komputer saat ini adalah Unicode, standar global untuk pengodean karakter. Secara internal, aplikasi Windows menggunakan implementasi UTF-16 Unicode. Dalam UTF-16, sebagian besar karakter diidentifikasi oleh kode dua byte. Karakter tambahan yang kurang umum digunakan masing-masing diwakili oleh pasangan pengganti, yang merupakan sepasang kode dua byte. Untuk informasi selengkapnya, lihat Pengganti dan Karakter Tambahan.

Beberapa aplikasi Windows harus bekerja dengan set karakter lama yang berasal dari Windows Me/98/95. Halaman kode Windows memungkinkan aplikasi Anda bekerja dengan set karakter ini. Set karakter ini dapat dibagi menjadi:

  • Kumpulan karakter byte tunggal (SBCS). Dalam SBCS, setiap karakter diidentifikasi dengan nilai satu byte lebar.
  • Set karakter multibyte, khususnya kumpulan karakter byte ganda (DBCS). Set karakter multibyte menyediakan sarana untuk mewakili sejumlah besar karakter dalam banyak bahasa Asia.

Untuk informasi selengkapnya, lihat topik berikut:

Tentang Unicode dan Set Karakter