Conjuntos de caracteres
Um "conjunto de caracteres" é um mapeamento de caracteres para seus valores de código de identificação. O conjunto de caracteres mais comumente usado em computadores atualmente é Unicode, um padrão global para codificação de caracteres. Internamente, os aplicativos do Windows usam a implementação UTF-16 do Unicode. Em UTF-16, a maioria dos caracteres é identificada por códigos de dois bytes. Os caracteres suplementares menos comumente usados são representados por um par substituto, que é um par de códigos de dois bytes. Para obter mais informações, consulte Substitutos e caracteres suplementares.
Alguns aplicativos do Windows devem funcionar com os conjuntos de caracteres mais antigos nativos do Windows Me/98/95. As páginas de código do Windows permitem que seu aplicativo funcione com esses conjuntos de caracteres. Esses conjuntos de caracteres podem ser divididos em:
- Conjuntos de caracteres de byte único (SBCS). Em um SBCS, cada caractere é identificado por um valor de um byte de largura.
- Conjuntos de caracteres multibyte, em particular os DBCS ( conjuntos de caracteres de byte duplo ). Os conjuntos de caracteres multibyte fornecem um meio para representar o grande número de caracteres em muitos idiomas asiáticos.
Para obter mais informações, consulte estes tópicos:
- Páginas de código
- Conjuntos de caracteres de dois bytes
- Conjuntos de caracteres de byte único
- Caracteres substitutos e suplementares
- Unicode
Tópicos relacionados