Codificação de suporte para páginas de código
O uso do Unicode no .NET estrutura simplifica o desenvolvimento de aplicativos preparados para o mundo, pois os aplicativos não precisam mais fazer referência a uma página de código.Uma página de código é uma lista de códigos de caractere selecionados (representados sistema autônomo pontos de código de caractere) em uma determinada ordem.Normalmente, as páginas de código são definidas para oferecer suporte a idiomas específicos ou grupos de idiomas que compartilham sistemas de escrita comuns.
Páginas de código do Windows contêm 256 pontos de código e são baseadas em zero.Na maioria das páginas de código, os pontos de código 0 a 127 representam os mesmos caracteres, permitindo a continuidade e código herdado.Os pontos de código 128 a 255 diferem consideravelmente entre páginas de código.Por exemplo, a página de código 1253 fornece códigos de caractere que são necessários no sistema de escrita grego.Página de código 1252 fornece os caracteres para Latina escrever sistemas, incluindo inglês, alemão e francês.Os últimos 128 pontos de código na página de código 1253 contêm caracteres gregos e os últimos 128 pontos de código na página de código 1252 contenham os caracteres de ênfase.Não sistema autônomo resultado, seu aplicativo pode armazenar grego e alemão no mesmo fluxo de código, a menos que ele inclui um identificador que indica a página de código referenciado.
O esquema de caractere de dois byte DBCS (conjunto de dois byte) foi desenvolvido para linguagens, sistema autônomo chinês, japonês e coreano, que contêm mais de 256 caractere.Um DBCS, um emparelhar de pontos de código (dois byte) representa cada caractere.Quando um aplicativo manipula dados DBCS, o primeiro byte de um caractere DBCS (o byte inicial) não é processado por si só.Ela é processada em combinação com o byte final que segue imediatamente após.Esse esquema ainda não permite a combinação de dois idiomas, sistema autônomo japonês e chinês no mesmo fluxo de dados.O motivo disso é que um emparelhar de pontos de código de byte duplo pode representar caracteres diferentes, dependendo da página de código.
O .NET estrutura oferece suporte para caracteres codificados usando páginas de código.O aplicativo pode usar o GetEncoding método para criar um objeto de codificação de destino para uma página de código especificada. O exemplo de código a seguir cria uma codificação para a página de código 1252.
Encoding enc = Encoding.GetEncoding(1252)
Encoding enc = Encoding.GetEncoding(1252);
Depois que o seu aplicativo cria um Encoding objeto que corresponde a uma página de código especificada, o aplicativo pode usar o objeto para executar outras operações com suporte a Encoding classe. Para obter um exemplo do uso dessa classe, consulte o subtópico "Usando a classe de codificação" dasUsando a codificação Unicode tópico.