UTF8Encoding.GetEncoder Metódus
Definíció
Fontos
Egyes információk olyan, kiadás előtti termékekre vonatkoznak, amelyek a kiadásig még jelentősen módosulhatnak. A Microsoft nem vállal kifejezett vagy törvényi garanciát az itt megjelenő információért.
Beolvas egy kódolót, amely Unicode-karakterek sorozatát UTF-8 kódolású bájtok sorozatává alakítja.
public:
override System::Text::Encoder ^ GetEncoder();
public override System.Text.Encoder GetEncoder();
override this.GetEncoder : unit -> System.Text.Encoder
Public Overrides Function GetEncoder () As Encoder
Válaszok
A Encoder Unicode-karakterek sorozatát UTF-8 kódolású bájtok sorozatává alakítja.
Példák
Az alábbi példa egy GetEncoder kódoló lekérésével konvertálja a karaktersorozatot UTF-8 kódolású bájtok sorozatává.
using System;
using System.Text;
class UTF8EncodingExample {
public static void Main() {
Char[] chars = new Char[] {'a', 'b', 'c', '\u0300', '\ua0a0'};
Byte[] bytes;
Encoder utf8Encoder = Encoding.UTF8.GetEncoder();
int byteCount = utf8Encoder.GetByteCount(chars, 2, 3, true);
bytes = new Byte[byteCount];
int bytesEncodedCount = utf8Encoder.GetBytes(chars, 2, 3, bytes, 0, true);
Console.WriteLine(
"{0} bytes used to encode characters.", bytesEncodedCount
);
Console.Write("Encoded bytes: ");
foreach (Byte b in bytes) {
Console.Write("[{0}]", b);
}
Console.WriteLine();
}
}
Imports System.Text
Imports Microsoft.VisualBasic.Strings
Class UTF8EncodingExample
Public Shared Sub Main()
'Characters:
' ChrW(97) = a
' ChrW(98) = b
' ChrW(99) = c
' ChrW(768) = `
' ChrW(41120) = valid unicode code point, but not a character
Dim chars() As Char = {ChrW(97), ChrW(98), ChrW(99), ChrW(768), ChrW(41120)}
Dim bytes() As Byte
Dim utf8Encoder As Encoder = Encoding.UTF8.GetEncoder()
Dim byteCount As Integer = utf8Encoder.GetByteCount(chars, 2, 3, True)
bytes = New Byte(byteCount - 1) {}
Dim bytesEncodedCount As Integer = utf8Encoder.GetBytes( _
chars, 2, 3, bytes, 0, True _
)
Console.WriteLine("{0} bytes used to encode characters.", bytesEncodedCount)
Console.Write("Encoded bytes: ")
Dim b As Byte
For Each b In bytes
Console.Write("[{0}]", b)
Next b
Console.WriteLine()
End Sub
End Class
Megjegyzések
A Encoder.GetBytes metódus a szekvenciális karakterblokkokat bájtok szekvenciális blokkjaivá alakítja a metódushoz GetBytes hasonló módon. A Encoder hívások közötti állapotinformációkat azonban fenntartja, hogy megfelelően kódolhassa a blokkokra kiterjedő karaktersorozatokat. A Encoder záró karakterek az adatblokkok végén is megmaradnak, és a következő kódolási műveletben a záró karaktereket használják. Előfordulhat például, hogy egy adatblokk egy nem egyező magas helyettessel végződik, és a megfelelő alacsony helyettes a következő adatblokkban lesz. GetDecoder GetEncoder Ezért hasznos a hálózati átvitelhez és a fájlműveletekhez, mivel ezek a műveletek gyakran teljes adatfolyam helyett adatblokkokkal foglalkoznak.
Ha a hibaészlelés engedélyezve van, azaz a throwOnInvalidCharacters konstruktor paramétere a következőre truevan állítva, a hibaészlelés is engedélyezve van a Encoder metódus által visszaadott módon. Ha a hibaészlelés engedélyezve van, és érvénytelen sorozat jelenik meg, a kódoló állapota nincs meghatározva, és a feldolgozásnak le kell állnia.