UTF8Encoding.GetEncoder Metodo
Definizione
Importante
Alcune informazioni sono relative alla release non definitiva del prodotto, che potrebbe subire modifiche significative prima della release definitiva. Microsoft non riconosce alcuna garanzia, espressa o implicita, in merito alle informazioni qui fornite.
Ottiene un codificatore che converte una sequenza di caratteri Unicode in una sequenza di byte con codifica UTF-8.
public:
override System::Text::Encoder ^ GetEncoder();
public override System.Text.Encoder GetEncoder ();
override this.GetEncoder : unit -> System.Text.Encoder
Public Overrides Function GetEncoder () As Encoder
Restituisce
Oggetto Encoder che converte una sequenza di caratteri Unicode in una sequenza di byte con codifica UTF-8.
Esempio
Nell'esempio seguente viene utilizzato il GetEncoder metodo per ottenere un codificatore per convertire una sequenza di caratteri in una sequenza di byte con codifica UTF-8.
using namespace System;
using namespace System::Text;
using namespace System::Collections;
int main()
{
array<Char>^chars = {'a','b','c',L'\u0300',L'\ua0a0'};
array<Byte>^bytes;
Encoder^ utf8Encoder = Encoding::UTF8->GetEncoder();
int byteCount = utf8Encoder->GetByteCount( chars, 2, 3, true );
bytes = gcnew array<Byte>(byteCount);
int bytesEncodedCount = utf8Encoder->GetBytes( chars, 2, 3, bytes, 0, true );
Console::WriteLine( "{0} bytes used to encode characters.", bytesEncodedCount );
Console::Write( "Encoded bytes: " );
IEnumerator^ myEnum = bytes->GetEnumerator();
while ( myEnum->MoveNext() )
{
Byte b = safe_cast<Byte>(myEnum->Current);
Console::Write( "[{0}]", b );
}
Console::WriteLine();
}
using System;
using System.Text;
class UTF8EncodingExample {
public static void Main() {
Char[] chars = new Char[] {'a', 'b', 'c', '\u0300', '\ua0a0'};
Byte[] bytes;
Encoder utf8Encoder = Encoding.UTF8.GetEncoder();
int byteCount = utf8Encoder.GetByteCount(chars, 2, 3, true);
bytes = new Byte[byteCount];
int bytesEncodedCount = utf8Encoder.GetBytes(chars, 2, 3, bytes, 0, true);
Console.WriteLine(
"{0} bytes used to encode characters.", bytesEncodedCount
);
Console.Write("Encoded bytes: ");
foreach (Byte b in bytes) {
Console.Write("[{0}]", b);
}
Console.WriteLine();
}
}
Imports System.Text
Imports Microsoft.VisualBasic.Strings
Class UTF8EncodingExample
Public Shared Sub Main()
'Characters:
' ChrW(97) = a
' ChrW(98) = b
' ChrW(99) = c
' ChrW(768) = `
' ChrW(41120) = valid unicode code point, but not a character
Dim chars() As Char = {ChrW(97), ChrW(98), ChrW(99), ChrW(768), ChrW(41120)}
Dim bytes() As Byte
Dim utf8Encoder As Encoder = Encoding.UTF8.GetEncoder()
Dim byteCount As Integer = utf8Encoder.GetByteCount(chars, 2, 3, True)
bytes = New Byte(byteCount - 1) {}
Dim bytesEncodedCount As Integer = utf8Encoder.GetBytes( _
chars, 2, 3, bytes, 0, True _
)
Console.WriteLine("{0} bytes used to encode characters.", bytesEncodedCount)
Console.Write("Encoded bytes: ")
Dim b As Byte
For Each b In bytes
Console.Write("[{0}]", b)
Next b
Console.WriteLine()
End Sub
End Class
Commenti
Il Encoder.GetBytes metodo converte blocchi sequenziali di caratteri in blocchi sequenziali di byte, in modo simile al GetBytes metodo . Tuttavia, un oggetto Encoder mantiene le informazioni sullo stato tra le chiamate in modo che possa codificare correttamente sequenze di caratteri che si estendono su blocchi. EncoderConserva inoltre i caratteri finali alla fine dei blocchi di dati e utilizza i caratteri finali nella successiva operazione di codifica. Un blocco di dati, ad esempio, può terminare con un surrogato alto senza corrispondenza e il surrogato basso corrispondente potrebbe trovarsi nel blocco di dati successivo. Pertanto, GetDecoder e GetEncoder sono utili per le operazioni di trasmissione e file di rete, perché tali operazioni spesso gestiscono blocchi di dati anziché un flusso di dati completo.
Se il rilevamento degli errori è abilitato, ovvero il throwOnInvalidCharacters
parametro del costruttore è impostato su true
, il rilevamento degli errori viene abilitato anche nell'oggetto Encoder restituito da questo metodo. Se il rilevamento degli errori è abilitato e viene rilevata una sequenza non valida, lo stato del codificatore non è definito e l'elaborazione deve essere arrestata.