Character Sets
Un "set di caratteri" è un mapping di caratteri ai relativi valori di codice di identificazione. Il set di caratteri più comunemente usato nei computer è attualmente Unicode, uno standard globale per la codifica dei caratteri. Internamente, le applicazioni Windows usano l'implementazione UTF-16 di Unicode. In UTF-16 la maggior parte dei caratteri è identificata da codici a due byte. I caratteri supplementari meno usati sono rappresentati da una coppia di surrogati, ovvero una coppia di codici a due byte. Per altre informazioni, vedere Surrogati e caratteri supplementari.
Alcune applicazioni Windows devono funzionare con i set di caratteri meno recenti nativi di Windows Me/98/95. Le tabelle codici di Windows consentono all'applicazione di usare questi set di caratteri. Questi set di caratteri possono essere suddivisi in:
- Set di caratteri a byte singolo (SBCS). In un SBCS ogni carattere è identificato da un valore largo di un byte.
- Set di caratteri multibyte, in particolare i set di caratteri a byte doppio (DBCS). I set di caratteri multibyte forniscono un mezzo per rappresentare il numero elevato di caratteri in molte lingue asiatiche.
Per altre informazioni, vedere gli argomenti seguenti:
- Tabelle codici
- Set di caratteri a byte doppio
- Set di caratteri a byte singolo
- Surrogati e caratteri supplementari
- Unicode
Argomenti correlati