Codificaciones de archivos
Actualización: noviembre 2007
Las codificaciones de archivos, también conocidas como codificaciones de caracteres, especifican cómo representar los caracteres cuando se procesa texto. Una codificación puede ser preferible sobre otra por lo que se refiere a los caracteres del lenguaje que puede o no controlar, aunque normalmente se prefiere Unicode.
Cuando se leen o escriben archivos, la correspondencia incorrecta de las codificaciones de archivo puede producir excepciones o resultados incorrectos.
Tipos de codificaciones
Unicode es la codificación preferida al trabajar con archivos. Unicode es un estándar mundial de codificación de caracteres que utiliza valores de código de 16 bits para representar todos los caracteres que se utilizan en la informática moderna, e incluye símbolos técnicos y caracteres especiales que se utilizan en publicaciones.
Los estándares de codificación de caracteres anteriores constaban de conjuntos de caracteres tradicionales, como el conjunto de caracteres ANSI de Windows que utiliza valores de código de 8 bits, o combinaciones de valores de 8 bits, para representar los caracteres que se utilizan en un idioma o región geográfica específicos.
Clase Encoding
La clase Encoding representa una codificación de caracteres. En esta tabla se muestra el tipo de codificaciones disponibles y se describe cada uno.
Nombre |
Descripción |
---|---|
Representa una codificación de caracteres ASCII de caracteres Unicode. |
|
Representa una codificación UTF-16 de caracteres Unicode. |
|
Representa una codificación UTF-32 de caracteres Unicode. |
|
Representa una codificación UTF-7 de caracteres Unicode. |
|
Representa una codificación UTF-8 de caracteres Unicode. |