Encoding.GetChars Metoda
Definice
Důležité
Některé informace platí pro předběžně vydaný produkt, který se může zásadně změnit, než ho výrobce nebo autor vydá. Microsoft neposkytuje žádné záruky, výslovné ani předpokládané, týkající se zde uváděných informací.
Při přepsání v odvozené třídě dekóduje posloupnost bajtů do sady znaků.
Přetížení
| Name | Description |
|---|---|
| GetChars(Byte[], Int32, Int32, Char[], Int32) |
Při přepsání v odvozené třídě dekóduje posloupnost bajtů ze zadané pole bajtů do zadané pole znaků. |
| GetChars(Byte*, Int32, Char*, Int32) |
Při přepsání v odvozené třídě dekóduje posloupnost bajtů počínaje zadaným bajtovým ukazatelem na sadu znaků, které jsou uloženy počínaje zadaným znakovým ukazatelem. |
| GetChars(ReadOnlySpan<Byte>, Span<Char>) |
Při přepsání v odvozené třídě dekóduje všechny bajty v zadaném bajtu jen pro čtení do rozsahu znaků. |
| GetChars(Byte[]) |
Při přepsání v odvozené třídě dekóduje všechny bajty v zadané bajtové matici do sady znaků. |
| GetChars(Byte[], Int32, Int32) |
Při přepsání v odvozené třídě dekóduje posloupnost bajtů ze zadaného bajtového pole do sady znaků. |
GetChars(Byte[], Int32, Int32, Char[], Int32)
Při přepsání v odvozené třídě dekóduje posloupnost bajtů ze zadané pole bajtů do zadané pole znaků.
public:
abstract int GetChars(cli::array <System::Byte> ^ bytes, int byteIndex, int byteCount, cli::array <char> ^ chars, int charIndex);
public abstract int GetChars(byte[] bytes, int byteIndex, int byteCount, char[] chars, int charIndex);
abstract member GetChars : byte[] * int * int * char[] * int -> int
Public MustOverride Function GetChars (bytes As Byte(), byteIndex As Integer, byteCount As Integer, chars As Char(), charIndex As Integer) As Integer
Parametry
- bytes
- Byte[]
Bajtové pole obsahující posloupnost bajtů k dekódování.
- byteIndex
- Int32
Index prvního bajtu pro dekódování.
- byteCount
- Int32
Počet bajtů, které se mají dekódovat.
- chars
- Char[]
Pole znaků, které bude obsahovat výslednou sadu znaků.
- charIndex
- Int32
Index, na kterém chcete začít psát výslednou sadu znaků.
Návraty
Skutečný počet znaků zapsaných do chars.
Výjimky
byteIndex nebo byteCountcharIndex je menší než nula.
nebo
byteIndex a byteCount neoznamujte platný rozsah v bytes.
nebo
charIndex není platný index v charssouboru .
chars nemá dostatečnou kapacitu od charIndex konce pole, aby vyhovoval výsledným znakům.
Došlo k záložnímu použití (další informace najdete v tématu Kódování znaků v .NET).
a
DecoderFallback je nastaveno na DecoderExceptionFallback.
Příklady
Následující příklad převede řetězec z jednoho kódování na jiný.
using System;
using System.Text;
class Example
{
static void Main()
{
string unicodeString = "This string contains the unicode character Pi (\u03a0)";
// Create two different encodings.
Encoding ascii = Encoding.ASCII;
Encoding unicode = Encoding.Unicode;
// Convert the string into a byte array.
byte[] unicodeBytes = unicode.GetBytes(unicodeString);
// Perform the conversion from one encoding to the other.
byte[] asciiBytes = Encoding.Convert(unicode, ascii, unicodeBytes);
// Convert the new byte[] into a char[] and then into a string.
char[] asciiChars = new char[ascii.GetCharCount(asciiBytes, 0, asciiBytes.Length)];
ascii.GetChars(asciiBytes, 0, asciiBytes.Length, asciiChars, 0);
string asciiString = new string(asciiChars);
// Display the strings created before and after the conversion.
Console.WriteLine("Original string: {0}", unicodeString);
Console.WriteLine("Ascii converted string: {0}", asciiString);
}
}
// The example displays the following output:
// Original string: This string contains the unicode character Pi (Π)
// Ascii converted string: This string contains the unicode character Pi (?)
Imports System.Text
Class Example
Shared Sub Main()
Dim unicodeString As String = "This string contains the unicode character Pi (" & ChrW(&H03A0) & ")"
' Create two different encodings.
Dim ascii As Encoding = Encoding.ASCII
Dim unicode As Encoding = Encoding.Unicode
' Convert the string into a byte array.
Dim unicodeBytes As Byte() = unicode.GetBytes(unicodeString)
' Perform the conversion from one encoding to the other.
Dim asciiBytes As Byte() = Encoding.Convert(unicode, ascii, unicodeBytes)
' Convert the new byte array into a char array and then into a string.
Dim asciiChars(ascii.GetCharCount(asciiBytes, 0, asciiBytes.Length)-1) As Char
ascii.GetChars(asciiBytes, 0, asciiBytes.Length, asciiChars, 0)
Dim asciiString As New String(asciiChars)
' Display the strings created before and after the conversion.
Console.WriteLine("Original string: {0}", unicodeString)
Console.WriteLine("Ascii converted string: {0}", asciiString)
End Sub
End Class
' The example displays the following output:
' Original string: This string contains the unicode character Pi (Π)
' Ascii converted string: This string contains the unicode character Pi (?)
Následující příklad zakóduje řetězec do pole bajtů a potom dekóduje rozsah bajtů do pole znaků.
using System;
using System.Text;
public class SamplesEncoding {
public static void Main() {
// Create two instances of UTF32Encoding: one with little-endian byte order and one with big-endian byte order.
Encoding u32LE = Encoding.GetEncoding( "utf-32" );
Encoding u32BE = Encoding.GetEncoding( "utf-32BE" );
// Use a string containing the following characters:
// Latin Small Letter Z (U+007A)
// Latin Small Letter A (U+0061)
// Combining Breve (U+0306)
// Latin Small Letter AE With Acute (U+01FD)
// Greek Small Letter Beta (U+03B2)
String myStr = "za\u0306\u01FD\u03B2";
// Encode the string using the big-endian byte order.
byte[] barrBE = new byte[u32BE.GetByteCount( myStr )];
u32BE.GetBytes( myStr, 0, myStr.Length, barrBE, 0 );
// Encode the string using the little-endian byte order.
byte[] barrLE = new byte[u32LE.GetByteCount( myStr )];
u32LE.GetBytes( myStr, 0, myStr.Length, barrLE, 0 );
// Get the char counts, decode eight bytes starting at index 0,
// and print out the counts and the resulting bytes.
Console.Write( "BE array with BE encoding : " );
PrintCountsAndChars( barrBE, 0, 8, u32BE );
Console.Write( "LE array with LE encoding : " );
PrintCountsAndChars( barrLE, 0, 8, u32LE );
}
public static void PrintCountsAndChars( byte[] bytes, int index, int count, Encoding enc ) {
// Display the name of the encoding used.
Console.Write( "{0,-25} :", enc.ToString() );
// Display the exact character count.
int iCC = enc.GetCharCount( bytes, index, count );
Console.Write( " {0,-3}", iCC );
// Display the maximum character count.
int iMCC = enc.GetMaxCharCount( count );
Console.Write( " {0,-3} :", iMCC );
// Decode the bytes and display the characters.
char[] chars = enc.GetChars( bytes, index, count );
// The following is an alternative way to decode the bytes:
// char[] chars = new char[iCC];
// enc.GetChars( bytes, index, count, chars, 0 );
Console.WriteLine( chars );
}
}
/*
This code produces the following output. The question marks take the place of characters that cannot be displayed at the console.
BE array with BE encoding : System.Text.UTF32Encoding : 2 6 :za
LE array with LE encoding : System.Text.UTF32Encoding : 2 6 :za
*/
Imports System.Text
Public Class SamplesEncoding
Public Shared Sub Main()
' Create two instances of UTF32Encoding: one with little-endian byte order and one with big-endian byte order.
Dim u32LE As Encoding = Encoding.GetEncoding("utf-32")
Dim u32BE As Encoding = Encoding.GetEncoding("utf-32BE")
' Use a string containing the following characters:
' Latin Small Letter Z (U+007A)
' Latin Small Letter A (U+0061)
' Combining Breve (U+0306)
' Latin Small Letter AE With Acute (U+01FD)
' Greek Small Letter Beta (U+03B2)
Dim myStr As String = "za" & ChrW(&H0306) & ChrW(&H01FD) & ChrW(&H03B2)
' Encode the string using the big-endian byte order.
' NOTE: In VB.NET, arrays contain one extra element by default.
' The following line creates barrBE with the exact number of elements required.
Dim barrBE(u32BE.GetByteCount(myStr) - 1) As Byte
u32BE.GetBytes(myStr, 0, myStr.Length, barrBE, 0)
' Encode the string using the little-endian byte order.
' NOTE: In VB.NET, arrays contain one extra element by default.
' The following line creates barrLE with the exact number of elements required.
Dim barrLE(u32LE.GetByteCount(myStr) - 1) As Byte
u32LE.GetBytes(myStr, 0, myStr.Length, barrLE, 0)
' Get the char counts, decode eight bytes starting at index 0,
' and print out the counts and the resulting bytes.
Console.Write("BE array with BE encoding : ")
PrintCountsAndChars(barrBE, 0, 8, u32BE)
Console.Write("LE array with LE encoding : ")
PrintCountsAndChars(barrLE, 0, 8, u32LE)
End Sub
Public Shared Sub PrintCountsAndChars(bytes() As Byte, index As Integer, count As Integer, enc As Encoding)
' Display the name of the encoding used.
Console.Write("{0,-25} :", enc.ToString())
' Display the exact character count.
Dim iCC As Integer = enc.GetCharCount(bytes, index, count)
Console.Write(" {0,-3}", iCC)
' Display the maximum character count.
Dim iMCC As Integer = enc.GetMaxCharCount(count)
Console.Write(" {0,-3} :", iMCC)
' Decode the bytes.
Dim chars As Char() = enc.GetChars(bytes, index, count)
' The following is an alternative way to decode the bytes:
' NOTE: In VB.NET, arrays contain one extra element by default.
' The following line creates the array with the exact number of elements required.
' Dim chars(iCC - 1) As Char
' enc.GetChars( bytes, index, count, chars, 0 )
' Display the characters.
Console.WriteLine(chars)
End Sub
End Class
'This code produces the following output. The question marks take the place of characters that cannot be displayed at the console.
'
'BE array with BE encoding : System.Text.UTF32Encoding : 2 6 :za
'LE array with LE encoding : System.Text.UTF32Encoding : 2 6 :za
Poznámky
K výpočtu přesné velikosti pole požadované GetChars k uložení výsledných znaků byste měli použít metodu GetCharCount . K výpočtu maximální velikosti pole použijte metodu GetMaxCharCount . Metoda GetCharCount obecně umožňuje přidělení menší paměti, zatímco GetMaxCharCount metoda obvykle provádí rychleji.
GetChars(Byte[], Int32, Int32, Char[], Int32) získá znaky ze vstupní sekvence bajtů. Encoding.GetChars je jiná než Decoder.GetChars proto, že Encoding očekává diskrétní převody, zatímco Decoder je navržena pro více průchodů v jednom vstupním datovém proudu.
Pokud jsou data, která se mají převést, k dispozici pouze v sekvenčních blocích (jako jsou data načtená z datového proudu) nebo pokud je množství dat tak velké, že je potřeba je rozdělit na menší bloky, měli byste použít metodu Decoder nebo metodu Encoder poskytovanou metodou GetDecoder nebo GetEncoder v odvozené třídě.
Note
Tato metoda je určena pro práci se znaky Unicode, ne s libovolnými binárními daty, jako jsou pole bajtů. Pokud potřebujete kódovat libovolná binární data do textu, měli byste použít protokol, jako je uuencode, který je implementován metodami, jako Convert.ToBase64CharArrayje .
Metoda GetCharCount určuje, kolik znaků má za následek dekódování posloupnosti bajtů a GetChars metoda provádí skutečné dekódování. Metoda Encoding.GetChars očekává diskrétní převody na rozdíl od Decoder.GetChars metody, která zpracovává více průchodů v jednom vstupním datovém proudu.
Podporuje se několik verzí GetCharCount a GetChars je podporováno. Tady je několik aspektů programování pro použití těchto metod:
Aplikace může potřebovat dekódovat více vstupních bajtů ze znakové stránky a zpracovávat bajty pomocí více volání. V tomto případě pravděpodobně budete muset udržovat stav mezi voláními, protože sekvence bajtů mohou být přerušeny při zpracování v dávkách. (Například část sekvence posunu ISO-2022 může ukončit jedno GetChars volání a pokračovat na začátku dalšího GetChars volání. Encoding.GetChars bude volat náhradní pro tyto neúplné sekvence, ale Decoder bude si pamatovat tyto sekvence pro další volání.)
Pokud vaše aplikace zpracovává výstupy řetězců, doporučuje se GetString tato metoda. Vzhledem k tomu, že tato metoda musí zkontrolovat délku řetězce a přidělit vyrovnávací paměť, je mírně pomalejší, ale výsledný String typ je upřednostňovaný.
Bajtová GetChars(Byte*, Int32, Char*, Int32) verze umožňuje některé rychlé techniky, zejména při několika voláních velkých vyrovnávacích pamětí. Mějte však na paměti, že tato verze metody je někdy nebezpečná, protože jsou vyžadovány ukazatele.
Pokud vaše aplikace musí převést velké množství dat, měla by znovu použít výstupní vyrovnávací paměť. V tomto případě je nejlepší volbou verze, GetChars(Byte[], Int32, Int32, Char[], Int32) která podporuje vyrovnávací paměti výstupních znaků.
Zvažte použití Decoder.Convert metody místo GetCharCount. Metoda převodu převede co nejvíce dat a vyvolá výjimku, pokud je výstupní vyrovnávací paměť příliš malá. Pro průběžné dekódování datového proudu je tato metoda často nejlepší volbou.
Viz také
Platí pro
GetChars(Byte*, Int32, Char*, Int32)
Důležité
Toto rozhraní API neodpovídá specifikaci CLS.
Při přepsání v odvozené třídě dekóduje posloupnost bajtů počínaje zadaným bajtovým ukazatelem na sadu znaků, které jsou uloženy počínaje zadaným znakovým ukazatelem.
public:
virtual int GetChars(System::Byte* bytes, int byteCount, char* chars, int charCount);
[System.CLSCompliant(false)]
[System.Security.SecurityCritical]
public virtual int GetChars(byte* bytes, int byteCount, char* chars, int charCount);
[System.CLSCompliant(false)]
[System.Runtime.InteropServices.ComVisible(false)]
public virtual int GetChars(byte* bytes, int byteCount, char* chars, int charCount);
[System.CLSCompliant(false)]
[System.Security.SecurityCritical]
[System.Runtime.InteropServices.ComVisible(false)]
public virtual int GetChars(byte* bytes, int byteCount, char* chars, int charCount);
[System.CLSCompliant(false)]
public virtual int GetChars(byte* bytes, int byteCount, char* chars, int charCount);
[<System.CLSCompliant(false)>]
[<System.Security.SecurityCritical>]
abstract member GetChars : nativeptr<byte> * int * nativeptr<char> * int -> int
override this.GetChars : nativeptr<byte> * int * nativeptr<char> * int -> int
[<System.CLSCompliant(false)>]
[<System.Runtime.InteropServices.ComVisible(false)>]
abstract member GetChars : nativeptr<byte> * int * nativeptr<char> * int -> int
override this.GetChars : nativeptr<byte> * int * nativeptr<char> * int -> int
[<System.CLSCompliant(false)>]
[<System.Security.SecurityCritical>]
[<System.Runtime.InteropServices.ComVisible(false)>]
abstract member GetChars : nativeptr<byte> * int * nativeptr<char> * int -> int
override this.GetChars : nativeptr<byte> * int * nativeptr<char> * int -> int
[<System.CLSCompliant(false)>]
abstract member GetChars : nativeptr<byte> * int * nativeptr<char> * int -> int
override this.GetChars : nativeptr<byte> * int * nativeptr<char> * int -> int
Parametry
- bytes
- Byte*
Ukazatel na první bajt pro dekódování.
- byteCount
- Int32
Počet bajtů, které se mají dekódovat.
- chars
- Char*
Ukazatel na umístění, ve kterém chcete začít psát výslednou sadu znaků.
- charCount
- Int32
Maximální počet znaků k zápisu.
Návraty
Skutečný počet znaků zapsaných v umístění určeném parametrem chars .
- Atributy
Výjimky
byteCount nebo charCount je menší než nula.
charCount je menší než výsledný počet znaků.
Došlo k záložnímu použití (další informace najdete v tématu Kódování znaků v .NET).
a
DecoderFallback je nastaveno na DecoderExceptionFallback.
Poznámky
K výpočtu přesné velikosti pole, která GetChars vyžaduje uložení výsledných znaků, byste měli použít metodu GetCharCount . K výpočtu maximální velikosti pole použijte metodu GetMaxCharCount . Metoda GetCharCount obecně umožňuje přidělení menší paměti, zatímco GetMaxCharCount metoda obvykle provádí rychleji.
Encoding.GetChars získá znaky ze vstupní sekvence bajtů. Encoding.GetChars je jiná než Decoder.GetChars proto, že Encoding očekává diskrétní převody, zatímco Decoder je navržena pro více průchodů v jednom vstupním datovém proudu.
Pokud jsou data, která se mají převést, k dispozici pouze v sekvenčních blocích (jako jsou data načtená z datového proudu) nebo pokud je množství dat tak velké, že je potřeba je rozdělit na menší bloky, měli byste použít Decoder objekt poskytovaný EncoderGetDecoder metodou nebo GetEncoder metodou odvozené třídy.
Note
Tato metoda je určena pro práci se znaky Unicode, ne s libovolnými binárními daty, jako jsou pole bajtů. Pokud potřebujete kódovat libovolná binární data do textu, měli byste použít protokol, jako je uuencode, který je implementován metodami, jako Convert.ToBase64CharArrayje .
Metoda GetCharCount určuje, kolik znaků má za následek dekódování posloupnosti bajtů a GetChars metoda provádí skutečné dekódování. Metoda Encoding.GetChars očekává diskrétní převody na rozdíl od Decoder.GetChars metody, která zpracovává více průchodů v jednom vstupním datovém proudu.
Podporuje se několik verzí GetCharCount a GetChars je podporováno. Tady je několik aspektů programování pro použití těchto metod:
Aplikace může potřebovat dekódovat více vstupních bajtů ze znakové stránky a zpracovávat bajty pomocí více volání. V tomto případě pravděpodobně budete muset udržovat stav mezi voláními, protože sekvence bajtů mohou být přerušeny při zpracování v dávkách. (Například část sekvence posunu ISO-2022 může ukončit jedno GetChars volání a pokračovat na začátku dalšího GetChars volání. Encoding.GetChars bude volat náhradní pro tyto neúplné sekvence, ale Decoder bude si pamatovat tyto sekvence pro další volání.)
Pokud vaše aplikace zpracovává výstupy řetězců, doporučuje se GetString tato metoda. Vzhledem k tomu, že tato metoda musí zkontrolovat délku řetězce a přidělit vyrovnávací paměť, je mírně pomalejší, ale výsledný String typ je upřednostňovaný.
Bajtová GetChars(Byte*, Int32, Char*, Int32) verze umožňuje některé rychlé techniky, zejména při několika voláních velkých vyrovnávacích pamětí. Mějte však na paměti, že tato verze metody je někdy nebezpečná, protože jsou vyžadovány ukazatele.
Pokud vaše aplikace musí převést velké množství dat, měla by znovu použít výstupní vyrovnávací paměť. V tomto případě je nejlepší volbou verze, GetChars(Byte[], Int32, Int32, Char[], Int32) která podporuje vyrovnávací paměti výstupních znaků.
Zvažte použití Decoder.Convert metody místo GetCharCount. Metoda převodu převede co nejvíce dat a vyvolá výjimku, pokud je výstupní vyrovnávací paměť příliš malá. Pro průběžné dekódování datového proudu je tato metoda často nejlepší volbou.
Viz také
Platí pro
GetChars(ReadOnlySpan<Byte>, Span<Char>)
Při přepsání v odvozené třídě dekóduje všechny bajty v zadaném bajtu jen pro čtení do rozsahu znaků.
public:
virtual int GetChars(ReadOnlySpan<System::Byte> bytes, Span<char> chars);
public virtual int GetChars(ReadOnlySpan<byte> bytes, Span<char> chars);
abstract member GetChars : ReadOnlySpan<byte> * Span<char> -> int
override this.GetChars : ReadOnlySpan<byte> * Span<char> -> int
Public Overridable Function GetChars (bytes As ReadOnlySpan(Of Byte), chars As Span(Of Char)) As Integer
Parametry
- bytes
- ReadOnlySpan<Byte>
Rozsah jen pro čtení obsahující posloupnost bajtů pro dekódování.
Návraty
Skutečný počet znaků zapsaných v rozsahu určeném parametrem chars .
Poznámky
Encoding.GetChars získá znaky ze vstupního rozsahu bajtů. Encoding.GetChars je jiná než Decoder.GetChars proto, že Encoding očekává diskrétní převody, zatímco Decoder je navržena pro více průchodů v jednom vstupním datovém proudu.
Pokud jsou data, která se mají převést, k dispozici pouze v sekvenčních blocích (jako jsou data načtená z datového proudu) nebo pokud je množství dat tak velké, že je potřeba je rozdělit na menší bloky, měli byste použít metodu Decoder nebo metodu Encoder poskytovanou metodou GetDecoder nebo GetEncoder v odvozené třídě.
Metoda GetCharCount určuje, kolik znaků má za následek dekódování posloupnosti bajtů a GetChars metoda provádí skutečné dekódování. Metoda Encoding.GetChars očekává diskrétní převody na rozdíl od Decoder.GetChars metody, která zpracovává více průchodů v jednom vstupním datovém proudu.
Podporuje se několik verzí GetCharCount a GetChars je podporováno. Tady je několik aspektů programování pro použití těchto metod:
Aplikace může potřebovat dekódovat více vstupních bajtů ze znakové stránky a zpracovávat bajty pomocí více volání. V tomto případě pravděpodobně budete muset udržovat stav mezi voláními, protože sekvence bajtů mohou být přerušeny při zpracování v dávkách. (Například část sekvence posunu ISO-2022 může ukončit jedno GetChars volání a pokračovat na začátku dalšího GetChars volání. Encoding.GetChars bude volat náhradní pro tyto neúplné sekvence, ale Decoder bude si pamatovat tyto sekvence pro další volání.)
Pokud vaše aplikace zpracovává výstupy řetězců, doporučuje se použít metodu GetString . Vzhledem k tomu, že tato metoda musí zkontrolovat délku řetězce a přidělit vyrovnávací paměť, je mírně pomalejší, ale výsledný String typ je upřednostňovaný.
Bajtová GetChars(Byte*, Int32, Char*, Int32) verze umožňuje některé rychlé techniky, zejména při několika voláních velkých vyrovnávacích pamětí. Mějte však na paměti, že tato verze metody je někdy nebezpečná, protože jsou vyžadovány ukazatele.
Pokud vaše aplikace musí převést velké množství dat, měla by znovu použít výstupní vyrovnávací paměť. V tomto případě je nejlepší volbou verze, GetChars(Byte[], Int32, Int32, Char[], Int32) která podporuje vyrovnávací paměti výstupních znaků.
Zvažte použití Decoder.Convert metody místo GetCharCount. Metoda převodu převede co nejvíce dat a vyvolá výjimku, pokud je výstupní vyrovnávací paměť příliš malá. Pro průběžné dekódování datového proudu je tato metoda často nejlepší volbou.
Platí pro
GetChars(Byte[])
Při přepsání v odvozené třídě dekóduje všechny bajty v zadané bajtové matici do sady znaků.
public:
virtual cli::array <char> ^ GetChars(cli::array <System::Byte> ^ bytes);
public virtual char[] GetChars(byte[] bytes);
abstract member GetChars : byte[] -> char[]
override this.GetChars : byte[] -> char[]
Public Overridable Function GetChars (bytes As Byte()) As Char()
Parametry
- bytes
- Byte[]
Bajtové pole obsahující posloupnost bajtů k dekódování.
Návraty
Pole znaků obsahující výsledky dekódování zadané sekvence bajtů.
Výjimky
bytes je null.
Došlo k záložnímu použití (další informace najdete v tématu Kódování znaků v .NET).
a
DecoderFallback je nastaveno na DecoderExceptionFallback.
Příklady
Následující příklad zakóduje řetězec do pole bajtů a potom dekóduje bajty do pole znaků.
using System;
using System.Text;
public class SamplesEncoding {
public static void Main() {
// Create two instances of UTF32Encoding: one with little-endian byte order and one with big-endian byte order.
Encoding u32LE = Encoding.GetEncoding( "utf-32" );
Encoding u32BE = Encoding.GetEncoding( "utf-32BE" );
// Use a string containing the following characters:
// Latin Small Letter Z (U+007A)
// Latin Small Letter A (U+0061)
// Combining Breve (U+0306)
// Latin Small Letter AE With Acute (U+01FD)
// Greek Small Letter Beta (U+03B2)
String myStr = "za\u0306\u01FD\u03B2";
// Encode the string using the big-endian byte order.
byte[] barrBE = new byte[u32BE.GetByteCount( myStr )];
u32BE.GetBytes( myStr, 0, myStr.Length, barrBE, 0 );
// Encode the string using the little-endian byte order.
byte[] barrLE = new byte[u32LE.GetByteCount( myStr )];
u32LE.GetBytes( myStr, 0, myStr.Length, barrLE, 0 );
// Get the char counts, and decode the byte arrays.
Console.Write( "BE array with BE encoding : " );
PrintCountsAndChars( barrBE, u32BE );
Console.Write( "LE array with LE encoding : " );
PrintCountsAndChars( barrLE, u32LE );
}
public static void PrintCountsAndChars( byte[] bytes, Encoding enc ) {
// Display the name of the encoding used.
Console.Write( "{0,-25} :", enc.ToString() );
// Display the exact character count.
int iCC = enc.GetCharCount( bytes );
Console.Write( " {0,-3}", iCC );
// Display the maximum character count.
int iMCC = enc.GetMaxCharCount( bytes.Length );
Console.Write( " {0,-3} :", iMCC );
// Decode the bytes and display the characters.
char[] chars = enc.GetChars( bytes );
Console.WriteLine( chars );
}
}
/*
This code produces the following output. The question marks take the place of characters that cannot be displayed at the console.
BE array with BE encoding : System.Text.UTF32Encoding : 5 12 :zăǽβ
LE array with LE encoding : System.Text.UTF32Encoding : 5 12 :zăǽβ
*/
Imports System.Text
Public Class SamplesEncoding
Public Shared Sub Main()
' Create two instances of UTF32Encoding: one with little-endian byte order and one with big-endian byte order.
Dim u32LE As Encoding = Encoding.GetEncoding("utf-32")
Dim u32BE As Encoding = Encoding.GetEncoding("utf-32BE")
' Use a string containing the following characters:
' Latin Small Letter Z (U+007A)
' Latin Small Letter A (U+0061)
' Combining Breve (U+0306)
' Latin Small Letter AE With Acute (U+01FD)
' Greek Small Letter Beta (U+03B2)
Dim myStr As String = "za" & ChrW(&H0306) & ChrW(&H01FD) & ChrW(&H03B2)
' Encode the string using the big-endian byte order.
' NOTE: In VB.NET, arrays contain one extra element by default.
' The following line creates the array with the exact number of elements required.
Dim barrBE(u32BE.GetByteCount(myStr) - 1) As Byte
u32BE.GetBytes(myStr, 0, myStr.Length, barrBE, 0)
' Encode the string using the little-endian byte order.
' NOTE: In VB.NET, arrays contain one extra element by default.
' The following line creates the array with the exact number of elements required.
Dim barrLE(u32LE.GetByteCount(myStr) - 1) As Byte
u32LE.GetBytes(myStr, 0, myStr.Length, barrLE, 0)
' Get the char counts, and decode the byte arrays.
Console.Write("BE array with BE encoding : ")
PrintCountsAndChars(barrBE, u32BE)
Console.Write("LE array with LE encoding : ")
PrintCountsAndChars(barrLE, u32LE)
End Sub
Public Shared Sub PrintCountsAndChars(bytes() As Byte, enc As Encoding)
' Display the name of the encoding used.
Console.Write("{0,-25} :", enc.ToString())
' Display the exact character count.
Dim iCC As Integer = enc.GetCharCount(bytes)
Console.Write(" {0,-3}", iCC)
' Display the maximum character count.
Dim iMCC As Integer = enc.GetMaxCharCount(bytes.Length)
Console.Write(" {0,-3} :", iMCC)
' Decode the bytes and display the characters.
Dim chars As Char() = enc.GetChars(bytes)
Console.WriteLine(chars)
End Sub
End Class
'This code produces the following output. The question marks take the place of characters that cannot be displayed at the console.
'
'BE array with BE encoding : System.Text.UTF32Encoding : 5 12 :zăǽβ
'LE array with LE encoding : System.Text.UTF32Encoding : 5 12 :zăǽβ
Poznámky
Encoding.GetChars získá znaky ze vstupní sekvence bajtů. Encoding.GetChars je jiná než Decoder.GetChars proto, že Encoding očekává diskrétní převody, zatímco Decoder je navržena pro více průchodů v jednom vstupním datovém proudu.
Pokud jsou data, která se mají převést, k dispozici pouze v sekvenčních blocích (jako jsou data načtená z datového proudu) nebo pokud je množství dat tak velké, že je potřeba je rozdělit na menší bloky, měli byste použít metodu Decoder nebo metodu Encoder poskytovanou metodou GetDecoder nebo GetEncoder v odvozené třídě.
Note
Tato metoda je určena pro práci se znaky Unicode, ne s libovolnými binárními daty, jako jsou pole bajtů. Pokud potřebujete kódovat libovolná binární data do textu, měli byste použít protokol, jako je uuencode, který je implementován metodami, jako Convert.ToBase64CharArrayje .
Metoda GetCharCount určuje, kolik znaků má za následek dekódování posloupnosti bajtů a GetChars metoda provádí skutečné dekódování. Metoda Encoding.GetChars očekává diskrétní převody na rozdíl od Decoder.GetChars metody, která zpracovává více průchodů v jednom vstupním datovém proudu.
Podporuje se několik verzí GetCharCount a GetChars je podporováno. Tady je několik aspektů programování pro použití těchto metod:
Aplikace může potřebovat dekódovat více vstupních bajtů ze znakové stránky a zpracovávat bajty pomocí více volání. V tomto případě pravděpodobně budete muset udržovat stav mezi voláními, protože sekvence bajtů mohou být přerušeny při zpracování v dávkách. (Například část sekvence posunu ISO-2022 může ukončit jedno GetChars volání a pokračovat na začátku dalšího GetChars volání. Encoding.GetChars bude volat náhradní pro tyto neúplné sekvence, ale Decoder bude si pamatovat tyto sekvence pro další volání.)
Pokud vaše aplikace zpracovává výstupy řetězců, doporučuje se použít metodu GetString . Vzhledem k tomu, že tato metoda musí zkontrolovat délku řetězce a přidělit vyrovnávací paměť, je mírně pomalejší, ale výsledný String typ je upřednostňovaný.
Bajtová GetChars(Byte*, Int32, Char*, Int32) verze umožňuje některé rychlé techniky, zejména při několika voláních velkých vyrovnávacích pamětí. Mějte však na paměti, že tato verze metody je někdy nebezpečná, protože jsou vyžadovány ukazatele.
Pokud vaše aplikace musí převést velké množství dat, měla by znovu použít výstupní vyrovnávací paměť. V tomto případě je nejlepší volbou verze, GetChars(Byte[], Int32, Int32, Char[], Int32) která podporuje vyrovnávací paměti výstupních znaků.
Zvažte použití Decoder.Convert metody místo GetCharCount. Metoda převodu převede co nejvíce dat a vyvolá výjimku, pokud je výstupní vyrovnávací paměť příliš malá. Pro průběžné dekódování datového proudu je tato metoda často nejlepší volbou.
Viz také
Platí pro
GetChars(Byte[], Int32, Int32)
Při přepsání v odvozené třídě dekóduje posloupnost bajtů ze zadaného bajtového pole do sady znaků.
public:
virtual cli::array <char> ^ GetChars(cli::array <System::Byte> ^ bytes, int index, int count);
public virtual char[] GetChars(byte[] bytes, int index, int count);
abstract member GetChars : byte[] * int * int -> char[]
override this.GetChars : byte[] * int * int -> char[]
Public Overridable Function GetChars (bytes As Byte(), index As Integer, count As Integer) As Char()
Parametry
- bytes
- Byte[]
Bajtové pole obsahující posloupnost bajtů k dekódování.
- index
- Int32
Index prvního bajtu pro dekódování.
- count
- Int32
Počet bajtů, které se mají dekódovat.
Návraty
Pole znaků obsahující výsledky dekódování zadané sekvence bajtů.
Výjimky
bytes je null.
index nebo count je menší než nula.
nebo
index a count neoznamujte platný rozsah v bytes.
Došlo k záložnímu použití (další informace najdete v tématu Kódování znaků v .NET).
a
DecoderFallback je nastaveno na DecoderExceptionFallback.
Příklady
Následující příklad zakóduje řetězec do pole bajtů a potom dekóduje rozsah bajtů do pole znaků.
using System;
using System.Text;
public class SamplesEncoding {
public static void Main() {
// Create two instances of UTF32Encoding: one with little-endian byte order and one with big-endian byte order.
Encoding u32LE = Encoding.GetEncoding( "utf-32" );
Encoding u32BE = Encoding.GetEncoding( "utf-32BE" );
// Use a string containing the following characters:
// Latin Small Letter Z (U+007A)
// Latin Small Letter A (U+0061)
// Combining Breve (U+0306)
// Latin Small Letter AE With Acute (U+01FD)
// Greek Small Letter Beta (U+03B2)
String myStr = "za\u0306\u01FD\u03B2";
// Encode the string using the big-endian byte order.
byte[] barrBE = new byte[u32BE.GetByteCount( myStr )];
u32BE.GetBytes( myStr, 0, myStr.Length, barrBE, 0 );
// Encode the string using the little-endian byte order.
byte[] barrLE = new byte[u32LE.GetByteCount( myStr )];
u32LE.GetBytes( myStr, 0, myStr.Length, barrLE, 0 );
// Get the char counts, decode eight bytes starting at index 0,
// and print out the counts and the resulting bytes.
Console.Write( "BE array with BE encoding : " );
PrintCountsAndChars( barrBE, 0, 8, u32BE );
Console.Write( "LE array with LE encoding : " );
PrintCountsAndChars( barrLE, 0, 8, u32LE );
}
public static void PrintCountsAndChars( byte[] bytes, int index, int count, Encoding enc ) {
// Display the name of the encoding used.
Console.Write( "{0,-25} :", enc.ToString() );
// Display the exact character count.
int iCC = enc.GetCharCount( bytes, index, count );
Console.Write( " {0,-3}", iCC );
// Display the maximum character count.
int iMCC = enc.GetMaxCharCount( count );
Console.Write( " {0,-3} :", iMCC );
// Decode the bytes and display the characters.
char[] chars = enc.GetChars( bytes, index, count );
// The following is an alternative way to decode the bytes:
// char[] chars = new char[iCC];
// enc.GetChars( bytes, index, count, chars, 0 );
Console.WriteLine( chars );
}
}
/*
This code produces the following output. The question marks take the place of characters that cannot be displayed at the console.
BE array with BE encoding : System.Text.UTF32Encoding : 2 6 :za
LE array with LE encoding : System.Text.UTF32Encoding : 2 6 :za
*/
Imports System.Text
Public Class SamplesEncoding
Public Shared Sub Main()
' Create two instances of UTF32Encoding: one with little-endian byte order and one with big-endian byte order.
Dim u32LE As Encoding = Encoding.GetEncoding("utf-32")
Dim u32BE As Encoding = Encoding.GetEncoding("utf-32BE")
' Use a string containing the following characters:
' Latin Small Letter Z (U+007A)
' Latin Small Letter A (U+0061)
' Combining Breve (U+0306)
' Latin Small Letter AE With Acute (U+01FD)
' Greek Small Letter Beta (U+03B2)
Dim myStr As String = "za" & ChrW(&H0306) & ChrW(&H01FD) & ChrW(&H03B2)
' Encode the string using the big-endian byte order.
' NOTE: In VB.NET, arrays contain one extra element by default.
' The following line creates barrBE with the exact number of elements required.
Dim barrBE(u32BE.GetByteCount(myStr) - 1) As Byte
u32BE.GetBytes(myStr, 0, myStr.Length, barrBE, 0)
' Encode the string using the little-endian byte order.
' NOTE: In VB.NET, arrays contain one extra element by default.
' The following line creates barrLE with the exact number of elements required.
Dim barrLE(u32LE.GetByteCount(myStr) - 1) As Byte
u32LE.GetBytes(myStr, 0, myStr.Length, barrLE, 0)
' Get the char counts, decode eight bytes starting at index 0,
' and print out the counts and the resulting bytes.
Console.Write("BE array with BE encoding : ")
PrintCountsAndChars(barrBE, 0, 8, u32BE)
Console.Write("LE array with LE encoding : ")
PrintCountsAndChars(barrLE, 0, 8, u32LE)
End Sub
Public Shared Sub PrintCountsAndChars(bytes() As Byte, index As Integer, count As Integer, enc As Encoding)
' Display the name of the encoding used.
Console.Write("{0,-25} :", enc.ToString())
' Display the exact character count.
Dim iCC As Integer = enc.GetCharCount(bytes, index, count)
Console.Write(" {0,-3}", iCC)
' Display the maximum character count.
Dim iMCC As Integer = enc.GetMaxCharCount(count)
Console.Write(" {0,-3} :", iMCC)
' Decode the bytes.
Dim chars As Char() = enc.GetChars(bytes, index, count)
' The following is an alternative way to decode the bytes:
' NOTE: In VB.NET, arrays contain one extra element by default.
' The following line creates the array with the exact number of elements required.
' Dim chars(iCC - 1) As Char
' enc.GetChars( bytes, index, count, chars, 0 )
' Display the characters.
Console.WriteLine(chars)
End Sub
End Class
'This code produces the following output. The question marks take the place of characters that cannot be displayed at the console.
'
'BE array with BE encoding : System.Text.UTF32Encoding : 2 6 :za
'LE array with LE encoding : System.Text.UTF32Encoding : 2 6 :za
Poznámky
Encoding.GetChars získá znaky ze vstupní sekvence bajtů. Encoding.GetChars je jiná než Decoder.GetChars proto, že Encoding očekává diskrétní převody, zatímco Decoder je navržena pro více průchodů v jednom vstupním datovém proudu.
Pokud jsou data, která se mají převést, k dispozici pouze v sekvenčních blocích (jako jsou data načtená z datového proudu) nebo pokud je množství dat tak velké, že je potřeba je rozdělit na menší bloky, měli byste použít metodu Decoder nebo metodu Encoder poskytovanou metodou GetDecoder nebo GetEncoder v odvozené třídě.
Note
Tato metoda je určena pro práci se znaky Unicode, ne s libovolnými binárními daty, jako jsou pole bajtů. Pokud potřebujete kódovat libovolná binární data do textu, měli byste použít protokol, jako je uuencode, který je implementován metodami, jako Convert.ToBase64CharArrayje .
Metoda GetCharCount určuje, kolik znaků má za následek dekódování posloupnosti bajtů a GetChars metoda provádí skutečné dekódování. Metoda Encoding.GetChars očekává diskrétní převody na rozdíl od Decoder.GetChars metody, která zpracovává více průchodů v jednom vstupním datovém proudu.
Podporuje se několik verzí GetCharCount a GetChars je podporováno. Tady je několik aspektů programování pro použití těchto metod:
Aplikace může potřebovat dekódovat více vstupních bajtů ze znakové stránky a zpracovávat bajty pomocí více volání. V tomto případě pravděpodobně budete muset udržovat stav mezi voláními, protože sekvence bajtů mohou být přerušeny při zpracování v dávkách. (Například část sekvence posunu ISO-2022 může ukončit jedno GetChars volání a pokračovat na začátku dalšího GetChars volání. Encoding.GetChars bude volat náhradní pro tyto neúplné sekvence, ale Decoder bude si pamatovat tyto sekvence pro další volání.)
Pokud vaše aplikace zpracovává výstupy řetězců, doporučuje se použít metodu GetString . Vzhledem k tomu, že tato metoda musí zkontrolovat délku řetězce a přidělit vyrovnávací paměť, je mírně pomalejší, ale výsledný String typ je upřednostňovaný.
Bajtová GetChars(Byte*, Int32, Char*, Int32) verze umožňuje některé rychlé techniky, zejména při několika voláních velkých vyrovnávacích pamětí. Mějte však na paměti, že tato verze metody je někdy nebezpečná, protože jsou vyžadovány ukazatele.
Pokud vaše aplikace musí převést velké množství dat, měla by znovu použít výstupní vyrovnávací paměť. V tomto případě je nejlepší volbou verze, GetChars(Byte[], Int32, Int32, Char[], Int32) která podporuje vyrovnávací paměti výstupních znaků.
Zvažte použití Decoder.Convert metody místo GetCharCount. Metoda převodu převede co nejvíce dat a vyvolá výjimku, pokud je výstupní vyrovnávací paměť příliš malá. Pro průběžné dekódování datového proudu je tato metoda často nejlepší volbou.