Encoding.GetCharCount Metoda
Definice
Důležité
Některé informace platí pro předběžně vydaný produkt, který se může zásadně změnit, než ho výrobce nebo autor vydá. Microsoft neposkytuje žádné záruky, výslovné ani předpokládané, týkající se zde uváděných informací.
Při přepsání v odvozené třídě vypočítá počet znaků vytvořených dekódováním posloupnosti bajtů.
Přetížení
GetCharCount(Byte[]) |
Při přepsání v odvozené třídě vypočítá počet znaků vytvořených dekódováním všech bajtů v zadaném bajtovém poli. |
GetCharCount(ReadOnlySpan<Byte>) |
Při přepsání v odvozené třídě vypočítá počet znaků vytvořených dekódováním zadaného rozsahu bajtů jen pro čtení. |
GetCharCount(Byte*, Int32) |
Při přepsání v odvozené třídě vypočítá počet znaků produkovaných dekódováním posloupnosti bajtů počínaje zadaným ukazatelem bajtů. |
GetCharCount(Byte[], Int32, Int32) |
Při přepsání v odvozené třídě vypočítá počet znaků vytvořených dekódováním posloupnosti bajtů ze zadaného pole bajtů. |
GetCharCount(Byte[])
- Zdroj:
- Encoding.cs
- Zdroj:
- Encoding.cs
- Zdroj:
- Encoding.cs
Při přepsání v odvozené třídě vypočítá počet znaků vytvořených dekódováním všech bajtů v zadaném bajtovém poli.
public:
virtual int GetCharCount(cli::array <System::Byte> ^ bytes);
public virtual int GetCharCount (byte[] bytes);
abstract member GetCharCount : byte[] -> int
override this.GetCharCount : byte[] -> int
Public Overridable Function GetCharCount (bytes As Byte()) As Integer
Parametry
- bytes
- Byte[]
Pole bajtů obsahující posloupnost bajtů k dekódování.
Návraty
Počet znaků vytvořených dekódováním zadané posloupnosti bajtů.
Výjimky
bytes
je null
.
Došlo k náhradnímu použití (další informace najdete v tématu Kódování znaků v .NET)
-A-
DecoderFallback je nastavená na DecoderExceptionFallbackhodnotu .
Příklady
Následující příklad zakóduje řetězec do pole bajtů a poté dekóduje bajty do pole znaků.
using namespace System;
using namespace System::Text;
void PrintCountsAndChars( array<Byte>^bytes, Encoding^ enc );
int main()
{
// Create two instances of UTF32Encoding: one with little-endian byte order and one with big-endian byte order.
Encoding^ u32LE = Encoding::GetEncoding( "utf-32" );
Encoding^ u32BE = Encoding::GetEncoding( "utf-32BE" );
// Use a string containing the following characters:
// Latin Small Letter Z (U+007A)
// Latin Small Letter A (U+0061)
// Combining Breve (U+0306)
// Latin Small Letter AE With Acute (U+01FD)
// Greek Small Letter Beta (U+03B2)
String^ myStr = "za\u0306\u01FD\u03B2";
// Encode the string using the big-endian byte order.
array<Byte>^barrBE = gcnew array<Byte>(u32BE->GetByteCount( myStr ));
u32BE->GetBytes( myStr, 0, myStr->Length, barrBE, 0 );
// Encode the string using the little-endian byte order.
array<Byte>^barrLE = gcnew array<Byte>(u32LE->GetByteCount( myStr ));
u32LE->GetBytes( myStr, 0, myStr->Length, barrLE, 0 );
// Get the char counts, and decode the byte arrays.
Console::Write( "BE array with BE encoding : " );
PrintCountsAndChars( barrBE, u32BE );
Console::Write( "LE array with LE encoding : " );
PrintCountsAndChars( barrLE, u32LE );
}
void PrintCountsAndChars( array<Byte>^bytes, Encoding^ enc )
{
// Display the name of the encoding used.
Console::Write( "{0,-25} :", enc );
// Display the exact character count.
int iCC = enc->GetCharCount( bytes );
Console::Write( " {0,-3}", iCC );
// Display the maximum character count.
int iMCC = enc->GetMaxCharCount( bytes->Length );
Console::Write( " {0,-3} :", iMCC );
// Decode the bytes and display the characters.
array<Char>^chars = enc->GetChars( bytes );
Console::WriteLine( chars );
}
/*
This code produces the following output. The question marks take the place of characters that cannot be displayed at the console.
BE array with BE encoding : System.Text.UTF32Encoding : 5 12 :zăǽβ
LE array with LE encoding : System.Text.UTF32Encoding : 5 12 :zăǽβ
*/
using System;
using System.Text;
public class SamplesEncoding {
public static void Main() {
// Create two instances of UTF32Encoding: one with little-endian byte order and one with big-endian byte order.
Encoding u32LE = Encoding.GetEncoding( "utf-32" );
Encoding u32BE = Encoding.GetEncoding( "utf-32BE" );
// Use a string containing the following characters:
// Latin Small Letter Z (U+007A)
// Latin Small Letter A (U+0061)
// Combining Breve (U+0306)
// Latin Small Letter AE With Acute (U+01FD)
// Greek Small Letter Beta (U+03B2)
String myStr = "za\u0306\u01FD\u03B2";
// Encode the string using the big-endian byte order.
byte[] barrBE = new byte[u32BE.GetByteCount( myStr )];
u32BE.GetBytes( myStr, 0, myStr.Length, barrBE, 0 );
// Encode the string using the little-endian byte order.
byte[] barrLE = new byte[u32LE.GetByteCount( myStr )];
u32LE.GetBytes( myStr, 0, myStr.Length, barrLE, 0 );
// Get the char counts, and decode the byte arrays.
Console.Write( "BE array with BE encoding : " );
PrintCountsAndChars( barrBE, u32BE );
Console.Write( "LE array with LE encoding : " );
PrintCountsAndChars( barrLE, u32LE );
}
public static void PrintCountsAndChars( byte[] bytes, Encoding enc ) {
// Display the name of the encoding used.
Console.Write( "{0,-25} :", enc.ToString() );
// Display the exact character count.
int iCC = enc.GetCharCount( bytes );
Console.Write( " {0,-3}", iCC );
// Display the maximum character count.
int iMCC = enc.GetMaxCharCount( bytes.Length );
Console.Write( " {0,-3} :", iMCC );
// Decode the bytes and display the characters.
char[] chars = enc.GetChars( bytes );
Console.WriteLine( chars );
}
}
/*
This code produces the following output. The question marks take the place of characters that cannot be displayed at the console.
BE array with BE encoding : System.Text.UTF32Encoding : 5 12 :zăǽβ
LE array with LE encoding : System.Text.UTF32Encoding : 5 12 :zăǽβ
*/
Imports System.Text
Public Class SamplesEncoding
Public Shared Sub Main()
' Create two instances of UTF32Encoding: one with little-endian byte order and one with big-endian byte order.
Dim u32LE As Encoding = Encoding.GetEncoding("utf-32")
Dim u32BE As Encoding = Encoding.GetEncoding("utf-32BE")
' Use a string containing the following characters:
' Latin Small Letter Z (U+007A)
' Latin Small Letter A (U+0061)
' Combining Breve (U+0306)
' Latin Small Letter AE With Acute (U+01FD)
' Greek Small Letter Beta (U+03B2)
Dim myStr As String = "za" & ChrW(&H0306) & ChrW(&H01FD) & ChrW(&H03B2)
' Encode the string using the big-endian byte order.
' NOTE: In VB.NET, arrays contain one extra element by default.
' The following line creates the array with the exact number of elements required.
Dim barrBE(u32BE.GetByteCount(myStr) - 1) As Byte
u32BE.GetBytes(myStr, 0, myStr.Length, barrBE, 0)
' Encode the string using the little-endian byte order.
' NOTE: In VB.NET, arrays contain one extra element by default.
' The following line creates the array with the exact number of elements required.
Dim barrLE(u32LE.GetByteCount(myStr) - 1) As Byte
u32LE.GetBytes(myStr, 0, myStr.Length, barrLE, 0)
' Get the char counts, and decode the byte arrays.
Console.Write("BE array with BE encoding : ")
PrintCountsAndChars(barrBE, u32BE)
Console.Write("LE array with LE encoding : ")
PrintCountsAndChars(barrLE, u32LE)
End Sub
Public Shared Sub PrintCountsAndChars(bytes() As Byte, enc As Encoding)
' Display the name of the encoding used.
Console.Write("{0,-25} :", enc.ToString())
' Display the exact character count.
Dim iCC As Integer = enc.GetCharCount(bytes)
Console.Write(" {0,-3}", iCC)
' Display the maximum character count.
Dim iMCC As Integer = enc.GetMaxCharCount(bytes.Length)
Console.Write(" {0,-3} :", iMCC)
' Decode the bytes and display the characters.
Dim chars As Char() = enc.GetChars(bytes)
Console.WriteLine(chars)
End Sub
End Class
'This code produces the following output. The question marks take the place of characters that cannot be displayed at the console.
'
'BE array with BE encoding : System.Text.UTF32Encoding : 5 12 :zăǽβ
'LE array with LE encoding : System.Text.UTF32Encoding : 5 12 :zăǽβ
Poznámky
Pokud chcete vypočítat přesnou velikost pole, kterou vyžaduje GetChars(Byte[]) k uložení výsledných znaků, měli byste použít metodu GetCharCount(Byte[]) . K výpočtu maximální velikosti pole byste měli použít metodu GetMaxCharCount(Int32) . Metoda GetCharCount(Byte[]) obecně umožňuje přidělení menší paměti, zatímco GetMaxCharCount metoda se obecně spouští rychleji.
Metoda GetCharCount(Byte[]) určuje, kolik znaků má za následek dekódování posloupnosti bajtů, a GetChars(Byte[]) metoda provádí vlastní dekódování. Metoda Encoding.GetChars očekává diskrétní převody, na rozdíl od Decoder.GetChars metody, která zpracovává více průchodů v jednom vstupním streamu.
Podporuje se GetCharCount několik verzí a GetChars . Tady je několik aspektů programování pro použití těchto metod:
Aplikace může potřebovat dekódovat více vstupních bajtů ze znakové stránky a zpracovávat bajty pomocí více volání. V takovém případě budete pravděpodobně muset udržovat stav mezi voláními.
Pokud vaše aplikace zpracovává výstupy řetězců, měli byste použít metodu GetString . Vzhledem k tomu, že tato metoda musí zkontrolovat délku řetězce a přidělit vyrovnávací paměť, je o něco pomalejší, ale výsledný String typ je vhodnější.
Bajtová verze umožňuje GetChars(Byte*, Int32, Char*, Int32) některé rychlé techniky, zejména s několika voláními velkých vyrovnávacích pamětí. Mějte však na paměti, že tato verze metody je někdy nebezpečná, protože ukazatele jsou vyžadovány.
Pokud vaše aplikace musí převést velké množství dat, měla by znovu použít výstupní vyrovnávací paměť. V tomto případě je nejlepší volbou GetChars(Byte[], Int32, Int32, Char[], Int32) verze, která podporuje výstupní znakové vyrovnávací paměti.
Zvažte použití Decoder.Convert metody místo GetCharCountmetody . Metoda převodu převede co nejvíce dat a vyvolá výjimku, pokud je výstupní vyrovnávací paměť příliš malá. Pro průběžné dekódování datového proudu je tato metoda často nejlepší volbou.
Viz také
Platí pro
GetCharCount(ReadOnlySpan<Byte>)
- Zdroj:
- Encoding.cs
- Zdroj:
- Encoding.cs
- Zdroj:
- Encoding.cs
Při přepsání v odvozené třídě vypočítá počet znaků vytvořených dekódováním zadaného rozsahu bajtů jen pro čtení.
public:
virtual int GetCharCount(ReadOnlySpan<System::Byte> bytes);
public virtual int GetCharCount (ReadOnlySpan<byte> bytes);
abstract member GetCharCount : ReadOnlySpan<byte> -> int
override this.GetCharCount : ReadOnlySpan<byte> -> int
Public Overridable Function GetCharCount (bytes As ReadOnlySpan(Of Byte)) As Integer
Parametry
- bytes
- ReadOnlySpan<Byte>
Rozsah bajtů jen pro čtení pro dekódování
Návraty
Počet znaků vytvořených dekódováním rozsahu bajtů.
Poznámky
Pokud chcete vypočítat přesnou velikost pole, která GetChars je nutná k uložení výsledných znaků, měli byste použít metodu GetCharCount . K výpočtu maximální velikosti pole použijte metodu GetMaxCharCount . Metoda GetCharCount obecně umožňuje přidělení menší paměti, zatímco GetMaxCharCount metoda se obecně spouští rychleji.
Metoda GetCharCount určuje, kolik znaků má za následek dekódování posloupnosti bajtů, a GetChars metoda provádí vlastní dekódování. Metoda GetChars očekává diskrétní převody, na rozdíl od Decoder.GetChars metody, která zpracovává více průchodů v jednom vstupním streamu.
Podporuje se GetCharCount několik verzí a GetChars . Tady je několik aspektů programování pro použití těchto metod:
Aplikace může potřebovat dekódovat více vstupních bajtů ze znakové stránky a zpracovávat bajty pomocí více volání. V takovém případě budete pravděpodobně muset udržovat stav mezi voláními.
Pokud vaše aplikace zpracovává výstupy řetězců, doporučujeme použít metodu GetString . Vzhledem k tomu, že tato metoda musí zkontrolovat délku řetězce a přidělit vyrovnávací paměť, je o něco pomalejší, ale výsledný String typ je vhodnější.
Pokud vaše aplikace musí převést velké množství dat, měla by znovu použít výstupní vyrovnávací paměť. V tomto případě je nejlepší volbou GetChars(Byte[], Int32, Int32, Char[], Int32) verze, která podporuje výstupní znakové vyrovnávací paměti.
Zvažte použití Decoder.Convert metody místo GetCharCountmetody . Metoda převodu převede co nejvíce dat a vyvolá výjimku, pokud je výstupní vyrovnávací paměť příliš malá. Pro průběžné dekódování datového proudu je tato metoda často nejlepší volbou.
Platí pro
GetCharCount(Byte*, Int32)
- Zdroj:
- Encoding.cs
- Zdroj:
- Encoding.cs
- Zdroj:
- Encoding.cs
Důležité
Toto rozhraní API neodpovídá specifikaci CLS.
Při přepsání v odvozené třídě vypočítá počet znaků produkovaných dekódováním posloupnosti bajtů počínaje zadaným ukazatelem bajtů.
public:
virtual int GetCharCount(System::Byte* bytes, int count);
[System.CLSCompliant(false)]
[System.Security.SecurityCritical]
public virtual int GetCharCount (byte* bytes, int count);
[System.CLSCompliant(false)]
public virtual int GetCharCount (byte* bytes, int count);
[System.CLSCompliant(false)]
[System.Runtime.InteropServices.ComVisible(false)]
public virtual int GetCharCount (byte* bytes, int count);
[System.CLSCompliant(false)]
[System.Security.SecurityCritical]
[System.Runtime.InteropServices.ComVisible(false)]
public virtual int GetCharCount (byte* bytes, int count);
[<System.CLSCompliant(false)>]
[<System.Security.SecurityCritical>]
abstract member GetCharCount : nativeptr<byte> * int -> int
override this.GetCharCount : nativeptr<byte> * int -> int
[<System.CLSCompliant(false)>]
abstract member GetCharCount : nativeptr<byte> * int -> int
override this.GetCharCount : nativeptr<byte> * int -> int
[<System.CLSCompliant(false)>]
[<System.Runtime.InteropServices.ComVisible(false)>]
abstract member GetCharCount : nativeptr<byte> * int -> int
override this.GetCharCount : nativeptr<byte> * int -> int
[<System.CLSCompliant(false)>]
[<System.Security.SecurityCritical>]
[<System.Runtime.InteropServices.ComVisible(false)>]
abstract member GetCharCount : nativeptr<byte> * int -> int
override this.GetCharCount : nativeptr<byte> * int -> int
Parametry
- bytes
- Byte*
Ukazatel na první bajt k dekódování.
- count
- Int32
Počet bajtů k dekódování.
Návraty
Počet znaků vytvořených dekódováním zadané posloupnosti bajtů.
- Atributy
Výjimky
bytes
je null
.
Hodnota count
je menší než nula.
Došlo k náhradnímu použití (další informace najdete v tématu Kódování znaků v .NET)
-A-
DecoderFallback je nastavená na DecoderExceptionFallbackhodnotu .
Poznámky
Pokud chcete vypočítat přesnou velikost pole, která GetChars je nutná k uložení výsledných znaků, měli byste použít metodu GetCharCount . K výpočtu maximální velikosti pole použijte metodu GetMaxCharCount . Metoda GetCharCount obecně umožňuje přidělení menší paměti, zatímco GetMaxCharCount metoda se obecně spouští rychleji.
Metoda GetCharCount určuje, kolik znaků má za následek dekódování posloupnosti bajtů, a GetChars metoda provádí vlastní dekódování. Metoda GetChars očekává diskrétní převody, na rozdíl od Decoder.GetChars metody, která zpracovává více průchodů v jednom vstupním streamu.
Podporuje se GetCharCount několik verzí a GetChars . Tady je několik aspektů programování pro použití těchto metod:
Aplikace může potřebovat dekódovat více vstupních bajtů ze znakové stránky a zpracovávat bajty pomocí více volání. V takovém případě budete pravděpodobně muset udržovat stav mezi voláními.
Pokud vaše aplikace zpracovává výstupy řetězců, doporučujeme použít metodu GetString . Vzhledem k tomu, že tato metoda musí zkontrolovat délku řetězce a přidělit vyrovnávací paměť, je o něco pomalejší, ale výsledný String typ je vhodnější.
Bajtová verze umožňuje GetChars(Byte*, Int32, Char*, Int32) některé rychlé techniky, zejména s několika voláními velkých vyrovnávacích pamětí. Mějte však na paměti, že tato verze metody je někdy nebezpečná, protože ukazatele jsou vyžadovány.
Pokud vaše aplikace musí převést velké množství dat, měla by znovu použít výstupní vyrovnávací paměť. V tomto případě je nejlepší volbou GetChars(Byte[], Int32, Int32, Char[], Int32) verze, která podporuje výstupní znakové vyrovnávací paměti.
Zvažte použití Decoder.Convert metody místo GetCharCountmetody . Metoda převodu převede co nejvíce dat a vyvolá výjimku, pokud je výstupní vyrovnávací paměť příliš malá. Pro průběžné dekódování datového proudu je tato metoda často nejlepší volbou.
Viz také
Platí pro
GetCharCount(Byte[], Int32, Int32)
- Zdroj:
- Encoding.cs
- Zdroj:
- Encoding.cs
- Zdroj:
- Encoding.cs
Při přepsání v odvozené třídě vypočítá počet znaků vytvořených dekódováním posloupnosti bajtů ze zadaného pole bajtů.
public:
abstract int GetCharCount(cli::array <System::Byte> ^ bytes, int index, int count);
public abstract int GetCharCount (byte[] bytes, int index, int count);
abstract member GetCharCount : byte[] * int * int -> int
Public MustOverride Function GetCharCount (bytes As Byte(), index As Integer, count As Integer) As Integer
Parametry
- bytes
- Byte[]
Pole bajtů obsahující posloupnost bajtů k dekódování.
- index
- Int32
Index prvního bajtu k dekódování.
- count
- Int32
Počet bajtů k dekódování.
Návraty
Počet znaků vytvořených dekódováním zadané posloupnosti bajtů.
Výjimky
bytes
je null
.
index
nebo count
je menší než nula.
-nebo-
index
a count
neoznamují platnou oblast v bytes
souboru .
Došlo k náhradnímu použití (další informace najdete v tématu Kódování znaků v .NET)
-A-
DecoderFallback je nastavená na DecoderExceptionFallbackhodnotu .
Příklady
Následující příklad převede řetězec z jednoho kódování do jiného.
using namespace System;
using namespace System::Text;
int main()
{
String^ unicodeString = "This string contains the unicode character Pi (\u03a0)";
// Create two different encodings.
Encoding^ ascii = Encoding::ASCII;
Encoding^ unicode = Encoding::Unicode;
// Convert the string into a byte array.
array<Byte>^unicodeBytes = unicode->GetBytes( unicodeString );
// Perform the conversion from one encoding to the other.
array<Byte>^asciiBytes = Encoding::Convert( unicode, ascii, unicodeBytes );
// Convert the new Byte into[] a char and[] then into a string.
array<Char>^asciiChars = gcnew array<Char>(ascii->GetCharCount( asciiBytes, 0, asciiBytes->Length ));
ascii->GetChars( asciiBytes, 0, asciiBytes->Length, asciiChars, 0 );
String^ asciiString = gcnew String( asciiChars );
// Display the strings created before and after the conversion.
Console::WriteLine( "Original String*: {0}", unicodeString );
Console::WriteLine( "Ascii converted String*: {0}", asciiString );
}
// The example displays the following output:
// Original string: This string contains the unicode character Pi (Π)
// Ascii converted string: This string contains the unicode character Pi (?)
using System;
using System.Text;
class Example
{
static void Main()
{
string unicodeString = "This string contains the unicode character Pi (\u03a0)";
// Create two different encodings.
Encoding ascii = Encoding.ASCII;
Encoding unicode = Encoding.Unicode;
// Convert the string into a byte array.
byte[] unicodeBytes = unicode.GetBytes(unicodeString);
// Perform the conversion from one encoding to the other.
byte[] asciiBytes = Encoding.Convert(unicode, ascii, unicodeBytes);
// Convert the new byte[] into a char[] and then into a string.
char[] asciiChars = new char[ascii.GetCharCount(asciiBytes, 0, asciiBytes.Length)];
ascii.GetChars(asciiBytes, 0, asciiBytes.Length, asciiChars, 0);
string asciiString = new string(asciiChars);
// Display the strings created before and after the conversion.
Console.WriteLine("Original string: {0}", unicodeString);
Console.WriteLine("Ascii converted string: {0}", asciiString);
}
}
// The example displays the following output:
// Original string: This string contains the unicode character Pi (Π)
// Ascii converted string: This string contains the unicode character Pi (?)
Imports System.Text
Class Example
Shared Sub Main()
Dim unicodeString As String = "This string contains the unicode character Pi (" & ChrW(&H03A0) & ")"
' Create two different encodings.
Dim ascii As Encoding = Encoding.ASCII
Dim unicode As Encoding = Encoding.Unicode
' Convert the string into a byte array.
Dim unicodeBytes As Byte() = unicode.GetBytes(unicodeString)
' Perform the conversion from one encoding to the other.
Dim asciiBytes As Byte() = Encoding.Convert(unicode, ascii, unicodeBytes)
' Convert the new byte array into a char array and then into a string.
Dim asciiChars(ascii.GetCharCount(asciiBytes, 0, asciiBytes.Length)-1) As Char
ascii.GetChars(asciiBytes, 0, asciiBytes.Length, asciiChars, 0)
Dim asciiString As New String(asciiChars)
' Display the strings created before and after the conversion.
Console.WriteLine("Original string: {0}", unicodeString)
Console.WriteLine("Ascii converted string: {0}", asciiString)
End Sub
End Class
' The example displays the following output:
' Original string: This string contains the unicode character Pi (Π)
' Ascii converted string: This string contains the unicode character Pi (?)
Následující příklad zakóduje řetězec do pole bajtů a poté dekóduje rozsah bajtů do pole znaků.
using namespace System;
using namespace System::Text;
void PrintCountsAndChars( array<Byte>^bytes, int index, int count, Encoding^ enc );
int main()
{
// Create two instances of UTF32Encoding: one with little-endian byte order and one with big-endian byte order.
Encoding^ u32LE = Encoding::GetEncoding( "utf-32" );
Encoding^ u32BE = Encoding::GetEncoding( "utf-32BE" );
// Use a string containing the following characters:
// Latin Small Letter Z (U+007A)
// Latin Small Letter A (U+0061)
// Combining Breve (U+0306)
// Latin Small Letter AE With Acute (U+01FD)
// Greek Small Letter Beta (U+03B2)
String^ myStr = "za\u0306\u01FD\u03B2";
// Encode the string using the big-endian byte order.
array<Byte>^barrBE = gcnew array<Byte>(u32BE->GetByteCount( myStr ));
u32BE->GetBytes( myStr, 0, myStr->Length, barrBE, 0 );
// Encode the string using the little-endian byte order.
array<Byte>^barrLE = gcnew array<Byte>(u32LE->GetByteCount( myStr ));
u32LE->GetBytes( myStr, 0, myStr->Length, barrLE, 0 );
// Get the char counts, decode eight bytes starting at index 0,
// and print out the counts and the resulting bytes.
Console::Write( "BE array with BE encoding : " );
PrintCountsAndChars( barrBE, 0, 8, u32BE );
Console::Write( "LE array with LE encoding : " );
PrintCountsAndChars( barrLE, 0, 8, u32LE );
}
void PrintCountsAndChars( array<Byte>^bytes, int index, int count, Encoding^ enc )
{
// Display the name of the encoding used.
Console::Write( "{0,-25} :", enc );
// Display the exact character count.
int iCC = enc->GetCharCount( bytes, index, count );
Console::Write( " {0,-3}", iCC );
// Display the maximum character count.
int iMCC = enc->GetMaxCharCount( count );
Console::Write( " {0,-3} :", iMCC );
// Decode the bytes and display the characters.
array<Char>^chars = enc->GetChars( bytes, index, count );
// The following is an alternative way to decode the bytes:
// Char[] chars = new Char[iCC];
// enc->GetChars( bytes, index, count, chars, 0 );
Console::WriteLine( chars );
}
/*
This code produces the following output. The question marks take the place of characters that cannot be displayed at the console.
BE array with BE encoding : System.Text.UTF32Encoding : 2 6 :za
LE array with LE encoding : System.Text.UTF32Encoding : 2 6 :za
*/
using System;
using System.Text;
public class SamplesEncoding {
public static void Main() {
// Create two instances of UTF32Encoding: one with little-endian byte order and one with big-endian byte order.
Encoding u32LE = Encoding.GetEncoding( "utf-32" );
Encoding u32BE = Encoding.GetEncoding( "utf-32BE" );
// Use a string containing the following characters:
// Latin Small Letter Z (U+007A)
// Latin Small Letter A (U+0061)
// Combining Breve (U+0306)
// Latin Small Letter AE With Acute (U+01FD)
// Greek Small Letter Beta (U+03B2)
String myStr = "za\u0306\u01FD\u03B2";
// Encode the string using the big-endian byte order.
byte[] barrBE = new byte[u32BE.GetByteCount( myStr )];
u32BE.GetBytes( myStr, 0, myStr.Length, barrBE, 0 );
// Encode the string using the little-endian byte order.
byte[] barrLE = new byte[u32LE.GetByteCount( myStr )];
u32LE.GetBytes( myStr, 0, myStr.Length, barrLE, 0 );
// Get the char counts, decode eight bytes starting at index 0,
// and print out the counts and the resulting bytes.
Console.Write( "BE array with BE encoding : " );
PrintCountsAndChars( barrBE, 0, 8, u32BE );
Console.Write( "LE array with LE encoding : " );
PrintCountsAndChars( barrLE, 0, 8, u32LE );
}
public static void PrintCountsAndChars( byte[] bytes, int index, int count, Encoding enc ) {
// Display the name of the encoding used.
Console.Write( "{0,-25} :", enc.ToString() );
// Display the exact character count.
int iCC = enc.GetCharCount( bytes, index, count );
Console.Write( " {0,-3}", iCC );
// Display the maximum character count.
int iMCC = enc.GetMaxCharCount( count );
Console.Write( " {0,-3} :", iMCC );
// Decode the bytes and display the characters.
char[] chars = enc.GetChars( bytes, index, count );
// The following is an alternative way to decode the bytes:
// char[] chars = new char[iCC];
// enc.GetChars( bytes, index, count, chars, 0 );
Console.WriteLine( chars );
}
}
/*
This code produces the following output. The question marks take the place of characters that cannot be displayed at the console.
BE array with BE encoding : System.Text.UTF32Encoding : 2 6 :za
LE array with LE encoding : System.Text.UTF32Encoding : 2 6 :za
*/
Imports System.Text
Public Class SamplesEncoding
Public Shared Sub Main()
' Create two instances of UTF32Encoding: one with little-endian byte order and one with big-endian byte order.
Dim u32LE As Encoding = Encoding.GetEncoding("utf-32")
Dim u32BE As Encoding = Encoding.GetEncoding("utf-32BE")
' Use a string containing the following characters:
' Latin Small Letter Z (U+007A)
' Latin Small Letter A (U+0061)
' Combining Breve (U+0306)
' Latin Small Letter AE With Acute (U+01FD)
' Greek Small Letter Beta (U+03B2)
Dim myStr As String = "za" & ChrW(&H0306) & ChrW(&H01FD) & ChrW(&H03B2)
' Encode the string using the big-endian byte order.
' NOTE: In VB.NET, arrays contain one extra element by default.
' The following line creates barrBE with the exact number of elements required.
Dim barrBE(u32BE.GetByteCount(myStr) - 1) As Byte
u32BE.GetBytes(myStr, 0, myStr.Length, barrBE, 0)
' Encode the string using the little-endian byte order.
' NOTE: In VB.NET, arrays contain one extra element by default.
' The following line creates barrLE with the exact number of elements required.
Dim barrLE(u32LE.GetByteCount(myStr) - 1) As Byte
u32LE.GetBytes(myStr, 0, myStr.Length, barrLE, 0)
' Get the char counts, decode eight bytes starting at index 0,
' and print out the counts and the resulting bytes.
Console.Write("BE array with BE encoding : ")
PrintCountsAndChars(barrBE, 0, 8, u32BE)
Console.Write("LE array with LE encoding : ")
PrintCountsAndChars(barrLE, 0, 8, u32LE)
End Sub
Public Shared Sub PrintCountsAndChars(bytes() As Byte, index As Integer, count As Integer, enc As Encoding)
' Display the name of the encoding used.
Console.Write("{0,-25} :", enc.ToString())
' Display the exact character count.
Dim iCC As Integer = enc.GetCharCount(bytes, index, count)
Console.Write(" {0,-3}", iCC)
' Display the maximum character count.
Dim iMCC As Integer = enc.GetMaxCharCount(count)
Console.Write(" {0,-3} :", iMCC)
' Decode the bytes.
Dim chars As Char() = enc.GetChars(bytes, index, count)
' The following is an alternative way to decode the bytes:
' NOTE: In VB.NET, arrays contain one extra element by default.
' The following line creates the array with the exact number of elements required.
' Dim chars(iCC - 1) As Char
' enc.GetChars( bytes, index, count, chars, 0 )
' Display the characters.
Console.WriteLine(chars)
End Sub
End Class
'This code produces the following output. The question marks take the place of characters that cannot be displayed at the console.
'
'BE array with BE encoding : System.Text.UTF32Encoding : 2 6 :za
'LE array with LE encoding : System.Text.UTF32Encoding : 2 6 :za
Poznámky
Pokud chcete vypočítat přesnou velikost pole, kterou vyžaduje GetChars k uložení výsledných znaků, měli byste použít metodu GetCharCount . K výpočtu maximální velikosti pole použijte metodu GetMaxCharCount . Metoda GetCharCount obecně umožňuje přidělení menší paměti, zatímco GetMaxCharCount metoda obecně provádí rychleji.
Metoda GetCharCount určuje, kolik znaků má za následek dekódování posloupnosti bajtů, a GetChars metoda provede skutečné dekódování. Metoda GetChars očekává diskrétní převody, na rozdíl od Decoder.GetChars metody, která zpracovává více průchodů na jednom vstupním streamu.
Podporuje se GetCharCount několik verzí a GetChars . Tady jsou některé aspekty programování pro použití těchto metod:
Aplikace může potřebovat dekódovat více vstupních bajtů z znakové stránky a zpracovávat bajty pomocí více volání. V takovém případě pravděpodobně budete muset udržovat stav mezi voláními.
Pokud vaše aplikace zpracovává výstupy řetězců, doporučujeme použít metodu GetString . Vzhledem k tomu, že tato metoda musí zkontrolovat délku řetězce a přidělit vyrovnávací paměť, je o něco pomalejší, ale je třeba upřednostňovat výsledný String typ.
Bajtová verze nástroje GetChars(Byte*, Int32, Char*, Int32) umožňuje některé rychlé techniky, zejména s několika voláními velkých vyrovnávacích pamětí. Mějte však na paměti, že tato verze metody je někdy nebezpečná, protože jsou vyžadovány ukazatele.
Pokud vaše aplikace musí převést velké množství dat, měla by znovu použít výstupní vyrovnávací paměť. V tomto případě je nejlepší volbou GetChars(Byte[], Int32, Int32, Char[], Int32) verze, která podporuje výstupní vyrovnávací paměti znaků.
Zvažte použití Decoder.Convert metody místo GetCharCountmetody . Metoda převodu převede co nejvíce dat a vyvolá výjimku, pokud je výstupní vyrovnávací paměť příliš malá. Pro průběžné dekódování datového proudu je tato metoda často nejlepší volbou.