Juegos de caracteres de un solo byte y de varios bytes

El juego de caracteres ASCII define los caracteres que están en el intervalo de 0x00 a 0x7F. Hay muchos otros juegos de caracteres, principalmente europeos, que definen los caracteres dentro del intervalo 0x00 - 0x7F idénticamente al juego de caracteres ASCII y también definen un juego de caracteres extendido de 0x80 - 0xFF. Un juego de caracteres de un solo byte (SBCS) de 8 bits es suficiente para representar el juego de caracteres ASCII y los juegos de caracteres para muchos idiomas europeos. En cambio, algunos juegos de caracteres no europeos, como los caracteres Kanji del japonés, incluyen muchos más caracteres de los que se pueden representar en un esquema de codificación de byte único y, por consiguiente, requieren una codificación de juego de caracteres multibyte (MBCS).

Nota:

Muchas rutinas de SBCS de la biblioteca en tiempo de ejecución de Microsoft controlan bytes, caracteres y cadenas multibyte según corresponda. Muchos juegos de caracteres de varios bytes definen el juego de caracteres ASCII como un subconjunto. En muchos juegos de caracteres de varios bytes, cada uno de los caracteres que está en el intervalo de 0x00 a 0x7F es idéntico al carácter que tiene el mismo valor en el juego de caracteres ASCII. Por ejemplo, en las cadenas de caracteres ASCII y MBCS, el carácter nulo de un byte ("\0") tiene el valor 0x00 e indica el carácter nulo final.

Un juego de caracteres multibyte puede constar de caracteres de 1 byte y 2 bytes. Una cadena de caracteres multibyte puede contener una mezcla de caracteres de un solo byte y de doble byte. Un carácter multibyte de dos bytes tiene un byte inicial y un byte final. En un juego de caracteres multibyte específico, los bytes iniciales quedan dentro de un intervalo determinado, al igual que los bytes finales. Si estos intervalos se superponen, puede que sea necesario evaluar el contexto para determinar si un byte específico funciona como byte inicial o como byte final.

Consulte también

Internacionalización
Rutinas en tiempo de ejecución Universal C por categoría