Partilhar via


Conjuntos de caracteres de byte único e multibyte

O conjunto de caracteres ASCII define caracteres no intervalo 0x00 - 0x7F. Existem outros conjuntos de caracteres, principalmente europeus, que definem os caracteres dentro do intervalo 0x00 - 0x7F de forma idêntica ao conjunto de caracteres ASCII e também definem um conjunto de caracteres estendido de 0x80 - 0xFF. Assim, um conjunto de caracteres de byte único (SBCS) de 8 bits é suficiente para representar o conjunto de caracteres ASCII e os conjuntos de caracteres para muitos idiomas europeus. No entanto, alguns conjuntos de caracteres não europeus, como o Kanji japonês, incluem muito mais caracteres do que um esquema de codificação de byte único pode representar e, portanto, exigem codificação MBCS (conjunto de caracteres multibyte).

Observação

Muitas rotinas SBCS da biblioteca de tempo de execução da Microsoft lidam com bytes, caracteres e cadeias de caracteres de vários bytes, conforme apropriado. Muitos conjuntos de caracteres multibyte definem o conjunto de caracteres ASCII como um subconjunto. Em muitos conjuntos de caracteres multibyte, cada caractere no intervalo 0x00 - 0x7F é idêntico ao caractere que tem o mesmo valor no conjunto de caracteres ASCII. Por exemplo, em cadeias de caracteres ASCII e MBCS, o caractere nulo de um byte ('\0') tem valor 0x00 e indica o caractere nulo de terminação.

Um conjunto de caracteres multibyte pode consistir em caracteres de 1 byte e 2 bytes. Uma cadeia de caracteres multibyte pode conter uma mistura de caracteres de byte único e byte duplo. Um caractere multibyte de dois bytes tem um byte de início e um byte de fim. Num determinado conjunto de caracteres multibyte, os bytes de início estão dentro de um determinado intervalo, tal como os bytes de seguimento. Quando esses intervalos se sobrepõem, pode ser necessário avaliar o contexto para determinar se um determinado byte está atuando como um byte principal ou um byte de continuação.

Ver também

Internacionalização
Rotinas de tempo de execução Universal C por categoria