Conjuntos de Caracteres

Artigo
12/03/2025

Um "conjunto de caracteres" é um mapeamento de caracteres para seus valores de código de identificação. O conjunto de caracteres mais comumente usado em computadores hoje é Unicode, um padrão global para codificação de caracteres. Internamente, os aplicativos do Windows usam a implementação UTF-16 do Unicode. Em UTF-16, a maioria dos caracteres são identificados por códigos de dois bytes. Os caracteres suplementares menos usados são cada um representado por um par substituto, que é um par de códigos de dois bytes. Para obter mais informações, consulte Substitutos e Caracteres Suplementares.

Alguns aplicativos do Windows devem funcionar com os conjuntos de caracteres mais antigos nativos do Windows Me/98/95. páginas de código do Windows permitir que seu aplicativo trabalhe com esses conjuntos de caracteres. Estes conjuntos de caracteres podem ser divididos em:

Conjuntos de caracteres de byte único (SBCS). Em um SBCS, cada caractere é identificado por um valor de um byte de largura.
Conjuntos de caracteres multibyte, em particular o conjuntos de caracteres de byte duplo (DBCS). Conjuntos de caracteres multibyte fornecem um meio de representar o grande número de caracteres em muitos idiomas asiáticos.

Para obter mais informações, consulte os seguintes tópicos:

Sobre Unicode e conjuntos de caracteres

O futuro é seu

Partilhar via

Conjuntos de Caracteres

Comentários

Recursos adicionais

O futuro é seu

Partilhar via

Conjuntos de Caracteres

Tópicos relacionados

Comentários

Recursos adicionais