Kumpulan karakter
"set karakter" adalah pemetaan karakter untuk mengidentifikasi nilai kode mereka. Kumpulan karakter yang paling umum digunakan dalam komputer saat ini adalah Unicode, standar global untuk pengodean karakter. Secara internal, aplikasi Windows menggunakan implementasi UTF-16 Unicode. Dalam UTF-16, sebagian besar karakter diidentifikasi oleh kode dua byte. Karakter tambahan yang kurang umum digunakan masing-masing diwakili oleh pasangan pengganti, yang merupakan sepasang kode dua byte. Untuk informasi selengkapnya, lihat Pengganti dan Karakter Tambahan.
Beberapa aplikasi Windows harus bekerja dengan set karakter lama yang berasal dari Windows Me/98/95. Halaman kode Windows memungkinkan aplikasi Anda bekerja dengan set karakter ini. Set karakter ini dapat dibagi menjadi:
- Kumpulan karakter byte tunggal (SBCS). Dalam SBCS, setiap karakter diidentifikasi dengan nilai satu byte lebar.
- Set karakter multibyte, khususnya kumpulan karakter byte ganda (DBCS). Set karakter multibyte menyediakan sarana untuk mewakili sejumlah besar karakter dalam banyak bahasa Asia.
Untuk informasi selengkapnya, lihat topik berikut:
- Halaman Kode
- Kumpulan Karakter Byte Ganda
- Kumpulan Karakter Byte Tunggal
- Pengganti dan Karakter Tambahan
- Unicode
Topik terkait
Saran dan Komentar
https://aka.ms/ContentUserFeedback.
Segera hadir: Sepanjang tahun 2024 kami akan menghentikan penggunaan GitHub Issues sebagai mekanisme umpan balik untuk konten dan menggantinya dengan sistem umpan balik baru. Untuk mengetahui informasi selengkapnya, lihat:Kirim dan lihat umpan balik untuk