Set Karakter yang Digunakan oleh Font

Semua font menggunakan set karakter. Kumpulan karakter berisi tanda baca, angka, huruf besar dan huruf kecil, dan semua karakter lain yang dapat dicetak. Setiap elemen set karakter diidentifikasi oleh angka.

Sebagian besar set karakter yang digunakan adalah superset dari kumpulan karakter ASCII AS, yang mendefinisikan karakter untuk 96 nilai numerik dari 32 hingga 127. Ada lima grup utama set karakter:

  • Windows
  • Unicode
  • OEM (produsen peralatan asli)
  • Simbol
  • Khusus vendor

Set Karakter Windows

Set karakter Windows adalah kumpulan karakter yang paling umum digunakan. Ini pada dasarnya setara dengan set karakter ANSI. Karakter kosong adalah karakter pertama dalam set karakter Windows. Ini memiliki nilai heksadesimal 0x20 (desimal 32). Karakter terakhir dalam set karakter Windows memiliki nilai heksadesimal 0xFF (desimal 255).

Banyak font menentukan karakter default. Setiap kali permintaan dibuat untuk karakter yang tidak ada dalam font, sistem menyediakan karakter default ini. Banyak font yang menggunakan set karakter Windows menentukan titik (.) sebagai karakter default. Font TrueType dan OpenType biasanya menggunakan kotak terbuka sebagai karakter default.

Font menggunakan karakter pemisah yang disebut quad untuk memisahkan kata dan membenarkan teks. Sebagian besar font menggunakan set karakter Windows menentukan bahwa karakter kosong akan berfungsi sebagai karakter pemisah.

Set Karakter Unicode

Set karakter Windows menggunakan 8 bit untuk mewakili setiap karakter; oleh karena itu, jumlah maksimum karakter yang dapat diekspresikan menggunakan 8 bit adalah 256 (2^8). Ini biasanya cukup untuk bahasa Barat, termasuk tanda diakritik yang digunakan dalam bahasa Prancis, Jerman, Spanyol, dan bahasa lainnya. Namun, bahasa Timur menggunakan ribuan karakter terpisah, yang tidak dapat dikodekan dengan menggunakan skema pengodean byte tunggal. Dengan menjamurnya perdagangan komputer, skema pengodean byte ganda dikembangkan sehingga karakter dapat diwakili dalam urutan 8-bit, 16-bit, 24-bit, atau 32-bit. Ini membutuhkan algoritma passing yang rumit; meskipun demikian, menggunakan set kode yang berbeda dapat menghasilkan hasil yang sama sekali berbeda pada dua komputer yang berbeda.

Untuk mengatasi masalah beberapa skema pengkodean, standar Unicode untuk representasi data dikembangkan. Skema pengodean karakter 16-bit, Unicode dapat mewakili 65.536 (2^16) karakter, yang cukup untuk menyertakan semua bahasa dalam perdagangan komputer saat ini, serta tanda baca, simbol matematika, dan ruang untuk ekspansi. Unicode menetapkan kode unik untuk setiap karakter untuk memastikan bahwa terjemahan karakter selalu akurat.

Set Karakter OEM

Set karakter OEM biasanya digunakan dalam sesi MS-DOS layar penuh untuk tampilan layar. Karakter 32 hingga 127 biasanya sama dalam kumpulan karakter OEM, ASCII AS, dan Windows. Karakter lain dalam set karakter OEM (0 hingga 31 dan 128 hingga 255) sesuai dengan karakter yang dapat ditampilkan dalam sesi MS-DOS layar penuh. Karakter ini umumnya berbeda dari karakter Windows.

Kumpulan Karakter Simbol

Kumpulan karakter Simbol berisi karakter khusus yang biasanya digunakan untuk mewakili rumus matematika dan ilmiah.

Set Karakter Khusus Vendor

Banyak printer dan perangkat output lainnya menyediakan font berdasarkan set karakter yang berbeda dari set Windows dan OEMuntuk contohnya, set karakter Extended Binary Coded Decimal Interchange Code (EBCDIC). Untuk menggunakan salah satu set karakter ini, driver printer diterjemahkan dari karakter Windows yang diatur ke set karakter khusus vendor.