Encoding.GetChars Метод
Определение
Важно!
Некоторые сведения относятся к предварительной версии продукта, в которую до выпуска могут быть внесены существенные изменения. Майкрософт не предоставляет никаких гарантий, явных или подразумеваемых, относительно приведенных здесь сведений.
При переопределении в производном классе декодирует последовательность байтов в набор символов.
Перегрузки
GetChars(Byte[], Int32, Int32, Char[], Int32) |
При переопределении в производном классе декодирует последовательность байтов из указанного массива байтов в указанный массив символов. |
GetChars(Byte*, Int32, Char*, Int32) |
При переопределении в производном классе декодирует последовательность байтов, которая начинается с заданного указателя байта, в набор символов, которые сохраняются, начиная с заданного указателя символа. |
GetChars(Byte[], Int32, Int32) |
При переопределении в производном классе декодирует последовательность байтов из указанного массива байтов в набор символов. |
GetChars(ReadOnlySpan<Byte>, Span<Char>) |
При переопределении в производном классе декодирует все байты из диапазона байтов только для чтения в диапазон символов. |
GetChars(Byte[]) |
При переопределении в производном классе декодирует все байты из указанного массива байтов в набор символов. |
GetChars(Byte[], Int32, Int32, Char[], Int32)
- Исходный код:
- Encoding.cs
- Исходный код:
- Encoding.cs
- Исходный код:
- Encoding.cs
При переопределении в производном классе декодирует последовательность байтов из указанного массива байтов в указанный массив символов.
public:
abstract int GetChars(cli::array <System::Byte> ^ bytes, int byteIndex, int byteCount, cli::array <char> ^ chars, int charIndex);
public abstract int GetChars (byte[] bytes, int byteIndex, int byteCount, char[] chars, int charIndex);
abstract member GetChars : byte[] * int * int * char[] * int -> int
Public MustOverride Function GetChars (bytes As Byte(), byteIndex As Integer, byteCount As Integer, chars As Char(), charIndex As Integer) As Integer
Параметры
- bytes
- Byte[]
Массив байтов, содержащий последовательность байтов, которую требуется декодировать.
- byteIndex
- Int32
Индекс первого декодируемого байта.
- byteCount
- Int32
Число байтов для декодирования.
- chars
- Char[]
Массив символов, в который будет помещен результирующий набор символов.
- charIndex
- Int32
Индекс, с которого начинается запись результирующего набора символов.
Возвращаемое значение
Фактическое число символов, записанных в chars
.
Исключения
Значение параметра byteIndex
, byteCount
или charIndex
меньше нуля.
-или-
Параметрыbyteindex
и byteCount
не указывают допустимый диапазон в bytes
.
-или-
Значение параметра charIndex
не является допустимым индексом в chars
.
Недостаточно емкости chars
от charIndex
до конца массива для размещения полученных символов.
Произошел откат (см. сведения о кодировке символов в .NET)
- и -
Параметру DecoderFallback задается значение DecoderExceptionFallback.
Примеры
В следующем примере строка из одной кодировки преобразуется в другую.
using namespace System;
using namespace System::Text;
int main()
{
String^ unicodeString = "This string contains the unicode character Pi (\u03a0)";
// Create two different encodings.
Encoding^ ascii = Encoding::ASCII;
Encoding^ unicode = Encoding::Unicode;
// Convert the string into a byte array.
array<Byte>^unicodeBytes = unicode->GetBytes( unicodeString );
// Perform the conversion from one encoding to the other.
array<Byte>^asciiBytes = Encoding::Convert( unicode, ascii, unicodeBytes );
// Convert the new Byte into[] a char and[] then into a string.
array<Char>^asciiChars = gcnew array<Char>(ascii->GetCharCount( asciiBytes, 0, asciiBytes->Length ));
ascii->GetChars( asciiBytes, 0, asciiBytes->Length, asciiChars, 0 );
String^ asciiString = gcnew String( asciiChars );
// Display the strings created before and after the conversion.
Console::WriteLine( "Original String*: {0}", unicodeString );
Console::WriteLine( "Ascii converted String*: {0}", asciiString );
}
// The example displays the following output:
// Original string: This string contains the unicode character Pi (Π)
// Ascii converted string: This string contains the unicode character Pi (?)
using System;
using System.Text;
class Example
{
static void Main()
{
string unicodeString = "This string contains the unicode character Pi (\u03a0)";
// Create two different encodings.
Encoding ascii = Encoding.ASCII;
Encoding unicode = Encoding.Unicode;
// Convert the string into a byte array.
byte[] unicodeBytes = unicode.GetBytes(unicodeString);
// Perform the conversion from one encoding to the other.
byte[] asciiBytes = Encoding.Convert(unicode, ascii, unicodeBytes);
// Convert the new byte[] into a char[] and then into a string.
char[] asciiChars = new char[ascii.GetCharCount(asciiBytes, 0, asciiBytes.Length)];
ascii.GetChars(asciiBytes, 0, asciiBytes.Length, asciiChars, 0);
string asciiString = new string(asciiChars);
// Display the strings created before and after the conversion.
Console.WriteLine("Original string: {0}", unicodeString);
Console.WriteLine("Ascii converted string: {0}", asciiString);
}
}
// The example displays the following output:
// Original string: This string contains the unicode character Pi (Π)
// Ascii converted string: This string contains the unicode character Pi (?)
Imports System.Text
Class Example
Shared Sub Main()
Dim unicodeString As String = "This string contains the unicode character Pi (" & ChrW(&H03A0) & ")"
' Create two different encodings.
Dim ascii As Encoding = Encoding.ASCII
Dim unicode As Encoding = Encoding.Unicode
' Convert the string into a byte array.
Dim unicodeBytes As Byte() = unicode.GetBytes(unicodeString)
' Perform the conversion from one encoding to the other.
Dim asciiBytes As Byte() = Encoding.Convert(unicode, ascii, unicodeBytes)
' Convert the new byte array into a char array and then into a string.
Dim asciiChars(ascii.GetCharCount(asciiBytes, 0, asciiBytes.Length)-1) As Char
ascii.GetChars(asciiBytes, 0, asciiBytes.Length, asciiChars, 0)
Dim asciiString As New String(asciiChars)
' Display the strings created before and after the conversion.
Console.WriteLine("Original string: {0}", unicodeString)
Console.WriteLine("Ascii converted string: {0}", asciiString)
End Sub
End Class
' The example displays the following output:
' Original string: This string contains the unicode character Pi (Π)
' Ascii converted string: This string contains the unicode character Pi (?)
В следующем примере строка кодируется в массив байтов, а затем декодирует диапазон байтов в массив символов.
using namespace System;
using namespace System::Text;
void PrintCountsAndChars( array<Byte>^bytes, int index, int count, Encoding^ enc );
int main()
{
// Create two instances of UTF32Encoding: one with little-endian byte order and one with big-endian byte order.
Encoding^ u32LE = Encoding::GetEncoding( "utf-32" );
Encoding^ u32BE = Encoding::GetEncoding( "utf-32BE" );
// Use a string containing the following characters:
// Latin Small Letter Z (U+007A)
// Latin Small Letter A (U+0061)
// Combining Breve (U+0306)
// Latin Small Letter AE With Acute (U+01FD)
// Greek Small Letter Beta (U+03B2)
String^ myStr = "za\u0306\u01FD\u03B2";
// Encode the string using the big-endian byte order.
array<Byte>^barrBE = gcnew array<Byte>(u32BE->GetByteCount( myStr ));
u32BE->GetBytes( myStr, 0, myStr->Length, barrBE, 0 );
// Encode the string using the little-endian byte order.
array<Byte>^barrLE = gcnew array<Byte>(u32LE->GetByteCount( myStr ));
u32LE->GetBytes( myStr, 0, myStr->Length, barrLE, 0 );
// Get the char counts, decode eight bytes starting at index 0,
// and print out the counts and the resulting bytes.
Console::Write( "BE array with BE encoding : " );
PrintCountsAndChars( barrBE, 0, 8, u32BE );
Console::Write( "LE array with LE encoding : " );
PrintCountsAndChars( barrLE, 0, 8, u32LE );
}
void PrintCountsAndChars( array<Byte>^bytes, int index, int count, Encoding^ enc )
{
// Display the name of the encoding used.
Console::Write( "{0,-25} :", enc );
// Display the exact character count.
int iCC = enc->GetCharCount( bytes, index, count );
Console::Write( " {0,-3}", iCC );
// Display the maximum character count.
int iMCC = enc->GetMaxCharCount( count );
Console::Write( " {0,-3} :", iMCC );
// Decode the bytes and display the characters.
array<Char>^chars = enc->GetChars( bytes, index, count );
// The following is an alternative way to decode the bytes:
// Char[] chars = new Char[iCC];
// enc->GetChars( bytes, index, count, chars, 0 );
Console::WriteLine( chars );
}
/*
This code produces the following output. The question marks take the place of characters that cannot be displayed at the console.
BE array with BE encoding : System.Text.UTF32Encoding : 2 6 :za
LE array with LE encoding : System.Text.UTF32Encoding : 2 6 :za
*/
using System;
using System.Text;
public class SamplesEncoding {
public static void Main() {
// Create two instances of UTF32Encoding: one with little-endian byte order and one with big-endian byte order.
Encoding u32LE = Encoding.GetEncoding( "utf-32" );
Encoding u32BE = Encoding.GetEncoding( "utf-32BE" );
// Use a string containing the following characters:
// Latin Small Letter Z (U+007A)
// Latin Small Letter A (U+0061)
// Combining Breve (U+0306)
// Latin Small Letter AE With Acute (U+01FD)
// Greek Small Letter Beta (U+03B2)
String myStr = "za\u0306\u01FD\u03B2";
// Encode the string using the big-endian byte order.
byte[] barrBE = new byte[u32BE.GetByteCount( myStr )];
u32BE.GetBytes( myStr, 0, myStr.Length, barrBE, 0 );
// Encode the string using the little-endian byte order.
byte[] barrLE = new byte[u32LE.GetByteCount( myStr )];
u32LE.GetBytes( myStr, 0, myStr.Length, barrLE, 0 );
// Get the char counts, decode eight bytes starting at index 0,
// and print out the counts and the resulting bytes.
Console.Write( "BE array with BE encoding : " );
PrintCountsAndChars( barrBE, 0, 8, u32BE );
Console.Write( "LE array with LE encoding : " );
PrintCountsAndChars( barrLE, 0, 8, u32LE );
}
public static void PrintCountsAndChars( byte[] bytes, int index, int count, Encoding enc ) {
// Display the name of the encoding used.
Console.Write( "{0,-25} :", enc.ToString() );
// Display the exact character count.
int iCC = enc.GetCharCount( bytes, index, count );
Console.Write( " {0,-3}", iCC );
// Display the maximum character count.
int iMCC = enc.GetMaxCharCount( count );
Console.Write( " {0,-3} :", iMCC );
// Decode the bytes and display the characters.
char[] chars = enc.GetChars( bytes, index, count );
// The following is an alternative way to decode the bytes:
// char[] chars = new char[iCC];
// enc.GetChars( bytes, index, count, chars, 0 );
Console.WriteLine( chars );
}
}
/*
This code produces the following output. The question marks take the place of characters that cannot be displayed at the console.
BE array with BE encoding : System.Text.UTF32Encoding : 2 6 :za
LE array with LE encoding : System.Text.UTF32Encoding : 2 6 :za
*/
Imports System.Text
Public Class SamplesEncoding
Public Shared Sub Main()
' Create two instances of UTF32Encoding: one with little-endian byte order and one with big-endian byte order.
Dim u32LE As Encoding = Encoding.GetEncoding("utf-32")
Dim u32BE As Encoding = Encoding.GetEncoding("utf-32BE")
' Use a string containing the following characters:
' Latin Small Letter Z (U+007A)
' Latin Small Letter A (U+0061)
' Combining Breve (U+0306)
' Latin Small Letter AE With Acute (U+01FD)
' Greek Small Letter Beta (U+03B2)
Dim myStr As String = "za" & ChrW(&H0306) & ChrW(&H01FD) & ChrW(&H03B2)
' Encode the string using the big-endian byte order.
' NOTE: In VB.NET, arrays contain one extra element by default.
' The following line creates barrBE with the exact number of elements required.
Dim barrBE(u32BE.GetByteCount(myStr) - 1) As Byte
u32BE.GetBytes(myStr, 0, myStr.Length, barrBE, 0)
' Encode the string using the little-endian byte order.
' NOTE: In VB.NET, arrays contain one extra element by default.
' The following line creates barrLE with the exact number of elements required.
Dim barrLE(u32LE.GetByteCount(myStr) - 1) As Byte
u32LE.GetBytes(myStr, 0, myStr.Length, barrLE, 0)
' Get the char counts, decode eight bytes starting at index 0,
' and print out the counts and the resulting bytes.
Console.Write("BE array with BE encoding : ")
PrintCountsAndChars(barrBE, 0, 8, u32BE)
Console.Write("LE array with LE encoding : ")
PrintCountsAndChars(barrLE, 0, 8, u32LE)
End Sub
Public Shared Sub PrintCountsAndChars(bytes() As Byte, index As Integer, count As Integer, enc As Encoding)
' Display the name of the encoding used.
Console.Write("{0,-25} :", enc.ToString())
' Display the exact character count.
Dim iCC As Integer = enc.GetCharCount(bytes, index, count)
Console.Write(" {0,-3}", iCC)
' Display the maximum character count.
Dim iMCC As Integer = enc.GetMaxCharCount(count)
Console.Write(" {0,-3} :", iMCC)
' Decode the bytes.
Dim chars As Char() = enc.GetChars(bytes, index, count)
' The following is an alternative way to decode the bytes:
' NOTE: In VB.NET, arrays contain one extra element by default.
' The following line creates the array with the exact number of elements required.
' Dim chars(iCC - 1) As Char
' enc.GetChars( bytes, index, count, chars, 0 )
' Display the characters.
Console.WriteLine(chars)
End Sub
End Class
'This code produces the following output. The question marks take the place of characters that cannot be displayed at the console.
'
'BE array with BE encoding : System.Text.UTF32Encoding : 2 6 :za
'LE array with LE encoding : System.Text.UTF32Encoding : 2 6 :za
Комментарии
Чтобы вычислить точный размер массива GetChars , необходимый для хранения результирующих символов, следует использовать GetCharCount метод. Чтобы вычислить максимальный размер массива, используйте GetMaxCharCount метод. GetCharCountМетод обычно позволяет выделить меньше памяти, в то время GetMaxCharCount как метод обычно выполняется быстрее.
GetChars(Byte[], Int32, Int32, Char[], Int32)Получает символы из входной последовательности байтов. Encoding.GetCharsотличается от Decoder.GetChars , так как Encoding ожидает дискретные преобразования, в то время как Decoder предназначено для нескольких проходов по одному входному потоку.
Если данные для преобразования доступны только в последовательных блоках (например, чтение данных из потока) или если объем данных настолько велик, что необходимо разделить на меньшие блоки, следует использовать Decoder или, Encoder предоставленный GetDecoder методом или GetEncoder методом, соответственно, для производного класса.
Примечание
Этот метод предназначен для обработки символов Юникода, а не для произвольных двоичных данных, таких как байтовые массивы. Если необходимо закодировать произвольные двоичные данные в текст, следует использовать протокол, такой как uuencode, который реализуется такими методами, как Convert.ToBase64CharArray .
GetCharCountМетод определяет, сколько символов приводит к декодированию последовательности байтов, и GetChars метод выполняет фактическое декодирование. Encoding.GetCharsМетод принимает дискретные преобразования, в отличие от Decoder.GetChars метода, который обрабатывает несколько проходов по одному входному потоку.
GetCharCountПоддерживаются несколько версий и GetChars . Ниже приведены некоторые рекомендации по программированию для использования этих методов.
Приложению может потребоваться декодировать несколько входных байт из кодовой страницы и обработать байты, используя несколько вызовов. В этом случае, возможно, потребуется поддерживать состояние между вызовами, так как последовательности байтов могут быть прерваны при обработке в пакетах. (Например, часть последовательности сдвига ISO-2022 может завершить один GetChars вызов и продолжить в начале следующего GetChars вызова. Encoding.GetChars Вызовет резервную последовательность для этих неполных последовательностей, но Decoder запомнит эти последовательности для следующего вызова.)
Если приложение обрабатывает выходные данные строки, GetString рекомендуется использовать метод. Поскольку этот метод должен проверять длину строки и выделить буфер, он немного медленнее, но результирующий String тип является предпочтительным.
Версия Byte GetChars(Byte*, Int32, Char*, Int32) позволяет выполнять некоторые быстрые приемы, особенно с несколькими вызовами больших буферов. Однако следует помнить, что эта версия метода иногда является ненадежной, так как указатели являются обязательными.
Если приложение должно преобразовать большой объем данных, следует повторно использовать выходной буфер. В этом случае GetChars(Byte[], Int32, Int32, Char[], Int32) лучшим выбором будет версия, поддерживающая буферы выходных символов.
Рассмотрите возможность использования Decoder.Convert метода вместо GetCharCount . Метод преобразования преобразует как можно больше данных и создает исключение, если выходной буфер слишком мал. Для непрерывного декодирования потока этот метод часто является лучшим выбором.
См. также раздел
Применяется к
GetChars(Byte*, Int32, Char*, Int32)
- Исходный код:
- Encoding.cs
- Исходный код:
- Encoding.cs
- Исходный код:
- Encoding.cs
Важно!
Этот API несовместим с CLS.
При переопределении в производном классе декодирует последовательность байтов, которая начинается с заданного указателя байта, в набор символов, которые сохраняются, начиная с заданного указателя символа.
public:
virtual int GetChars(System::Byte* bytes, int byteCount, char* chars, int charCount);
[System.CLSCompliant(false)]
[System.Security.SecurityCritical]
public virtual int GetChars (byte* bytes, int byteCount, char* chars, int charCount);
[System.CLSCompliant(false)]
public virtual int GetChars (byte* bytes, int byteCount, char* chars, int charCount);
[System.CLSCompliant(false)]
[System.Runtime.InteropServices.ComVisible(false)]
public virtual int GetChars (byte* bytes, int byteCount, char* chars, int charCount);
[System.CLSCompliant(false)]
[System.Security.SecurityCritical]
[System.Runtime.InteropServices.ComVisible(false)]
public virtual int GetChars (byte* bytes, int byteCount, char* chars, int charCount);
[<System.CLSCompliant(false)>]
[<System.Security.SecurityCritical>]
abstract member GetChars : nativeptr<byte> * int * nativeptr<char> * int -> int
override this.GetChars : nativeptr<byte> * int * nativeptr<char> * int -> int
[<System.CLSCompliant(false)>]
abstract member GetChars : nativeptr<byte> * int * nativeptr<char> * int -> int
override this.GetChars : nativeptr<byte> * int * nativeptr<char> * int -> int
[<System.CLSCompliant(false)>]
[<System.Runtime.InteropServices.ComVisible(false)>]
abstract member GetChars : nativeptr<byte> * int * nativeptr<char> * int -> int
override this.GetChars : nativeptr<byte> * int * nativeptr<char> * int -> int
[<System.CLSCompliant(false)>]
[<System.Security.SecurityCritical>]
[<System.Runtime.InteropServices.ComVisible(false)>]
abstract member GetChars : nativeptr<byte> * int * nativeptr<char> * int -> int
override this.GetChars : nativeptr<byte> * int * nativeptr<char> * int -> int
Параметры
- bytes
- Byte*
Указатель на первый декодируемый байт.
- byteCount
- Int32
Число байтов для декодирования.
- chars
- Char*
Указатель на положение, с которого начинается запись результирующего набора символов.
- charCount
- Int32
Наибольшее количество символов для записи.
Возвращаемое значение
Фактическое число символов, записанных в местоположение, которое задано параметром chars
.
- Атрибуты
Исключения
Значение параметра byteCount
или charCount
меньше нуля.
charCount
меньше результирующего числа символов.
Произошел откат (см. сведения о кодировке символов в .NET)
- и -
Параметру DecoderFallback задается значение DecoderExceptionFallback.
Комментарии
Чтобы вычислить точный размер массива, GetChars для которого требуется сохранить полученные символы, следует использовать GetCharCount метод. Чтобы вычислить максимальный размер массива, используйте GetMaxCharCount метод. GetCharCountМетод обычно позволяет выделить меньше памяти, в то время GetMaxCharCount как метод обычно выполняется быстрее.
Encoding.GetCharsПолучает символы из входной последовательности байтов. Encoding.GetCharsотличается от Decoder.GetChars , так как Encoding ожидает дискретные преобразования, в то время как Decoder предназначено для нескольких проходов по одному входному потоку.
Если преобразование данных доступен только в последовательных блоках (например, данные, считанные из потока) или если объем данных настолько велик, что ему следует разделить на более мелкие блоки, следует использовать Decoder или Encoder объект, предоставляемый GetDecoderнастроек или GetEncoder метода, соответственно, производного класса.
Примечание
Этот метод предназначен для обработки символов Юникода, а не для произвольных двоичных данных, таких как байтовые массивы. Если необходимо закодировать произвольные двоичные данные в текст, следует использовать протокол, такой как uuencode, который реализуется такими методами, как Convert.ToBase64CharArray .
GetCharCountМетод определяет, сколько символов приводит к декодированию последовательности байтов, и GetChars метод выполняет фактическое декодирование. Encoding.GetCharsМетод принимает дискретные преобразования, в отличие от Decoder.GetChars метода, который обрабатывает несколько проходов по одному входному потоку.
GetCharCountПоддерживаются несколько версий и GetChars . Ниже приведены некоторые рекомендации по программированию для использования этих методов.
Приложению может потребоваться декодировать несколько входных байт из кодовой страницы и обработать байты, используя несколько вызовов. В этом случае, возможно, потребуется поддерживать состояние между вызовами, так как последовательности байтов могут быть прерваны при обработке в пакетах. (Например, часть последовательности сдвига ISO-2022 может завершить один GetChars вызов и продолжить в начале следующего GetChars вызова. Encoding.GetChars Вызовет резервную последовательность для этих неполных последовательностей, но Decoder запомнит эти последовательности для следующего вызова.)
Если приложение обрабатывает выходные данные строки, GetString рекомендуется использовать метод. Поскольку этот метод должен проверять длину строки и выделить буфер, он немного медленнее, но результирующий String тип является предпочтительным.
Версия Byte GetChars(Byte*, Int32, Char*, Int32) позволяет выполнять некоторые быстрые приемы, особенно с несколькими вызовами больших буферов. Однако следует помнить, что эта версия метода иногда является ненадежной, так как указатели являются обязательными.
Если приложение должно преобразовать большой объем данных, следует повторно использовать выходной буфер. В этом случае GetChars(Byte[], Int32, Int32, Char[], Int32) лучшим выбором будет версия, поддерживающая буферы выходных символов.
Рассмотрите возможность использования Decoder.Convert метода вместо GetCharCount . Метод преобразования преобразует как можно больше данных и создает исключение, если выходной буфер слишком мал. Для непрерывного декодирования потока этот метод часто является лучшим выбором.
См. также раздел
Применяется к
GetChars(Byte[], Int32, Int32)
- Исходный код:
- Encoding.cs
- Исходный код:
- Encoding.cs
- Исходный код:
- Encoding.cs
При переопределении в производном классе декодирует последовательность байтов из указанного массива байтов в набор символов.
public:
virtual cli::array <char> ^ GetChars(cli::array <System::Byte> ^ bytes, int index, int count);
public virtual char[] GetChars (byte[] bytes, int index, int count);
abstract member GetChars : byte[] * int * int -> char[]
override this.GetChars : byte[] * int * int -> char[]
Public Overridable Function GetChars (bytes As Byte(), index As Integer, count As Integer) As Char()
Параметры
- bytes
- Byte[]
Массив байтов, содержащий последовательность байтов, которую требуется декодировать.
- index
- Int32
Индекс первого декодируемого байта.
- count
- Int32
Число байтов для декодирования.
Возвращаемое значение
Массив символов, содержащий результаты декодирования указанной последовательности байтов.
Исключения
bytes
имеет значение null
.
Значение параметра index
или count
меньше нуля.
-или-
Параметры index
и count
не указывают допустимый диапазон в bytes
.
Произошел откат (см. сведения о кодировке символов в .NET)
- и -
Параметру DecoderFallback задается значение DecoderExceptionFallback.
Примеры
В следующем примере строка кодируется в массив байтов, а затем декодирует диапазон байтов в массив символов.
using namespace System;
using namespace System::Text;
void PrintCountsAndChars( array<Byte>^bytes, int index, int count, Encoding^ enc );
int main()
{
// Create two instances of UTF32Encoding: one with little-endian byte order and one with big-endian byte order.
Encoding^ u32LE = Encoding::GetEncoding( "utf-32" );
Encoding^ u32BE = Encoding::GetEncoding( "utf-32BE" );
// Use a string containing the following characters:
// Latin Small Letter Z (U+007A)
// Latin Small Letter A (U+0061)
// Combining Breve (U+0306)
// Latin Small Letter AE With Acute (U+01FD)
// Greek Small Letter Beta (U+03B2)
String^ myStr = "za\u0306\u01FD\u03B2";
// Encode the string using the big-endian byte order.
array<Byte>^barrBE = gcnew array<Byte>(u32BE->GetByteCount( myStr ));
u32BE->GetBytes( myStr, 0, myStr->Length, barrBE, 0 );
// Encode the string using the little-endian byte order.
array<Byte>^barrLE = gcnew array<Byte>(u32LE->GetByteCount( myStr ));
u32LE->GetBytes( myStr, 0, myStr->Length, barrLE, 0 );
// Get the char counts, decode eight bytes starting at index 0,
// and print out the counts and the resulting bytes.
Console::Write( "BE array with BE encoding : " );
PrintCountsAndChars( barrBE, 0, 8, u32BE );
Console::Write( "LE array with LE encoding : " );
PrintCountsAndChars( barrLE, 0, 8, u32LE );
}
void PrintCountsAndChars( array<Byte>^bytes, int index, int count, Encoding^ enc )
{
// Display the name of the encoding used.
Console::Write( "{0,-25} :", enc );
// Display the exact character count.
int iCC = enc->GetCharCount( bytes, index, count );
Console::Write( " {0,-3}", iCC );
// Display the maximum character count.
int iMCC = enc->GetMaxCharCount( count );
Console::Write( " {0,-3} :", iMCC );
// Decode the bytes and display the characters.
array<Char>^chars = enc->GetChars( bytes, index, count );
// The following is an alternative way to decode the bytes:
// Char[] chars = new Char[iCC];
// enc->GetChars( bytes, index, count, chars, 0 );
Console::WriteLine( chars );
}
/*
This code produces the following output. The question marks take the place of characters that cannot be displayed at the console.
BE array with BE encoding : System.Text.UTF32Encoding : 2 6 :za
LE array with LE encoding : System.Text.UTF32Encoding : 2 6 :za
*/
using System;
using System.Text;
public class SamplesEncoding {
public static void Main() {
// Create two instances of UTF32Encoding: one with little-endian byte order and one with big-endian byte order.
Encoding u32LE = Encoding.GetEncoding( "utf-32" );
Encoding u32BE = Encoding.GetEncoding( "utf-32BE" );
// Use a string containing the following characters:
// Latin Small Letter Z (U+007A)
// Latin Small Letter A (U+0061)
// Combining Breve (U+0306)
// Latin Small Letter AE With Acute (U+01FD)
// Greek Small Letter Beta (U+03B2)
String myStr = "za\u0306\u01FD\u03B2";
// Encode the string using the big-endian byte order.
byte[] barrBE = new byte[u32BE.GetByteCount( myStr )];
u32BE.GetBytes( myStr, 0, myStr.Length, barrBE, 0 );
// Encode the string using the little-endian byte order.
byte[] barrLE = new byte[u32LE.GetByteCount( myStr )];
u32LE.GetBytes( myStr, 0, myStr.Length, barrLE, 0 );
// Get the char counts, decode eight bytes starting at index 0,
// and print out the counts and the resulting bytes.
Console.Write( "BE array with BE encoding : " );
PrintCountsAndChars( barrBE, 0, 8, u32BE );
Console.Write( "LE array with LE encoding : " );
PrintCountsAndChars( barrLE, 0, 8, u32LE );
}
public static void PrintCountsAndChars( byte[] bytes, int index, int count, Encoding enc ) {
// Display the name of the encoding used.
Console.Write( "{0,-25} :", enc.ToString() );
// Display the exact character count.
int iCC = enc.GetCharCount( bytes, index, count );
Console.Write( " {0,-3}", iCC );
// Display the maximum character count.
int iMCC = enc.GetMaxCharCount( count );
Console.Write( " {0,-3} :", iMCC );
// Decode the bytes and display the characters.
char[] chars = enc.GetChars( bytes, index, count );
// The following is an alternative way to decode the bytes:
// char[] chars = new char[iCC];
// enc.GetChars( bytes, index, count, chars, 0 );
Console.WriteLine( chars );
}
}
/*
This code produces the following output. The question marks take the place of characters that cannot be displayed at the console.
BE array with BE encoding : System.Text.UTF32Encoding : 2 6 :za
LE array with LE encoding : System.Text.UTF32Encoding : 2 6 :za
*/
Imports System.Text
Public Class SamplesEncoding
Public Shared Sub Main()
' Create two instances of UTF32Encoding: one with little-endian byte order and one with big-endian byte order.
Dim u32LE As Encoding = Encoding.GetEncoding("utf-32")
Dim u32BE As Encoding = Encoding.GetEncoding("utf-32BE")
' Use a string containing the following characters:
' Latin Small Letter Z (U+007A)
' Latin Small Letter A (U+0061)
' Combining Breve (U+0306)
' Latin Small Letter AE With Acute (U+01FD)
' Greek Small Letter Beta (U+03B2)
Dim myStr As String = "za" & ChrW(&H0306) & ChrW(&H01FD) & ChrW(&H03B2)
' Encode the string using the big-endian byte order.
' NOTE: In VB.NET, arrays contain one extra element by default.
' The following line creates barrBE with the exact number of elements required.
Dim barrBE(u32BE.GetByteCount(myStr) - 1) As Byte
u32BE.GetBytes(myStr, 0, myStr.Length, barrBE, 0)
' Encode the string using the little-endian byte order.
' NOTE: In VB.NET, arrays contain one extra element by default.
' The following line creates barrLE with the exact number of elements required.
Dim barrLE(u32LE.GetByteCount(myStr) - 1) As Byte
u32LE.GetBytes(myStr, 0, myStr.Length, barrLE, 0)
' Get the char counts, decode eight bytes starting at index 0,
' and print out the counts and the resulting bytes.
Console.Write("BE array with BE encoding : ")
PrintCountsAndChars(barrBE, 0, 8, u32BE)
Console.Write("LE array with LE encoding : ")
PrintCountsAndChars(barrLE, 0, 8, u32LE)
End Sub
Public Shared Sub PrintCountsAndChars(bytes() As Byte, index As Integer, count As Integer, enc As Encoding)
' Display the name of the encoding used.
Console.Write("{0,-25} :", enc.ToString())
' Display the exact character count.
Dim iCC As Integer = enc.GetCharCount(bytes, index, count)
Console.Write(" {0,-3}", iCC)
' Display the maximum character count.
Dim iMCC As Integer = enc.GetMaxCharCount(count)
Console.Write(" {0,-3} :", iMCC)
' Decode the bytes.
Dim chars As Char() = enc.GetChars(bytes, index, count)
' The following is an alternative way to decode the bytes:
' NOTE: In VB.NET, arrays contain one extra element by default.
' The following line creates the array with the exact number of elements required.
' Dim chars(iCC - 1) As Char
' enc.GetChars( bytes, index, count, chars, 0 )
' Display the characters.
Console.WriteLine(chars)
End Sub
End Class
'This code produces the following output. The question marks take the place of characters that cannot be displayed at the console.
'
'BE array with BE encoding : System.Text.UTF32Encoding : 2 6 :za
'LE array with LE encoding : System.Text.UTF32Encoding : 2 6 :za
Комментарии
Encoding.GetCharsПолучает символы из входной последовательности байтов. Encoding.GetCharsотличается от Decoder.GetChars , так как Encoding ожидает дискретные преобразования, в то время как Decoder предназначено для нескольких проходов по одному входному потоку.
Если данные для преобразования доступны только в последовательных блоках (например, чтение данных из потока) или если объем данных настолько велик, что необходимо разделить на меньшие блоки, следует использовать Decoder или, Encoder предоставленный GetDecoder методом или GetEncoder методом, соответственно, для производного класса.
Примечание
Этот метод предназначен для обработки символов Юникода, а не для произвольных двоичных данных, таких как байтовые массивы. Если необходимо закодировать произвольные двоичные данные в текст, следует использовать протокол, такой как uuencode, который реализуется такими методами, как Convert.ToBase64CharArray .
GetCharCountМетод определяет, сколько символов приводит к декодированию последовательности байтов, и GetChars метод выполняет фактическое декодирование. Encoding.GetCharsМетод принимает дискретные преобразования, в отличие от Decoder.GetChars метода, который обрабатывает несколько проходов по одному входному потоку.
GetCharCountПоддерживаются несколько версий и GetChars . Ниже приведены некоторые рекомендации по программированию для использования этих методов.
Приложению может потребоваться декодировать несколько входных байт из кодовой страницы и обработать байты, используя несколько вызовов. В этом случае, возможно, потребуется поддерживать состояние между вызовами, так как последовательности байтов могут быть прерваны при обработке в пакетах. (Например, часть последовательности сдвига ISO-2022 может завершить один GetChars вызов и продолжить в начале следующего GetChars вызова. Encoding.GetChars Вызовет откат для этих неполных последовательностей, но Decoder запомнит эти последовательности для следующего вызова.)
Если приложение обрабатывает выходные данные строки, рекомендуется использовать GetString метод. Поскольку этот метод должен проверять длину строки и выделить буфер, он немного медленнее, но результирующий String тип является предпочтительным.
Версия Byte GetChars(Byte*, Int32, Char*, Int32) позволяет выполнять некоторые быстрые приемы, особенно с несколькими вызовами больших буферов. Однако следует помнить, что эта версия метода иногда является ненадежной, так как указатели являются обязательными.
Если приложение должно преобразовать большой объем данных, следует повторно использовать выходной буфер. В этом случае GetChars(Byte[], Int32, Int32, Char[], Int32) лучшим выбором будет версия, поддерживающая буферы выходных символов.
Рассмотрите возможность использования Decoder.Convert метода вместо GetCharCount . Метод преобразования преобразует как можно больше данных и создает исключение, если выходной буфер слишком мал. Для непрерывного декодирования потока этот метод часто является лучшим выбором.
См. также раздел
Применяется к
GetChars(ReadOnlySpan<Byte>, Span<Char>)
- Исходный код:
- Encoding.cs
- Исходный код:
- Encoding.cs
- Исходный код:
- Encoding.cs
При переопределении в производном классе декодирует все байты из диапазона байтов только для чтения в диапазон символов.
public:
virtual int GetChars(ReadOnlySpan<System::Byte> bytes, Span<char> chars);
public virtual int GetChars (ReadOnlySpan<byte> bytes, Span<char> chars);
abstract member GetChars : ReadOnlySpan<byte> * Span<char> -> int
override this.GetChars : ReadOnlySpan<byte> * Span<char> -> int
Public Overridable Function GetChars (bytes As ReadOnlySpan(Of Byte), chars As Span(Of Char)) As Integer
Параметры
- bytes
- ReadOnlySpan<Byte>
Диапазон только для чтения, содержащий последовательность байтов, которую требуется декодировать.
Возвращаемое значение
Фактическое число символов, записанных в диапазоне, который определен параметром chars
.
Комментарии
Encoding.GetCharsПолучает символы из входного диапазона байтов. Encoding.GetCharsотличается от Decoder.GetChars , так как Encoding ожидает дискретные преобразования, в то время как Decoder предназначено для нескольких проходов по одному входному потоку.
Если данные для преобразования доступны только в последовательных блоках (например, чтение данных из потока) или если объем данных настолько велик, что необходимо разделить на меньшие блоки, следует использовать Decoder или, Encoder предоставленный GetDecoder методом или GetEncoder методом, соответственно, для производного класса.
GetCharCountМетод определяет, сколько символов приводит к декодированию последовательности байтов, и GetChars метод выполняет фактическое декодирование. Encoding.GetCharsМетод принимает дискретные преобразования, в отличие от Decoder.GetChars метода, который обрабатывает несколько проходов по одному входному потоку.
GetCharCountПоддерживаются несколько версий и GetChars . Ниже приведены некоторые рекомендации по программированию для использования этих методов.
Приложению может потребоваться декодировать несколько входных байт из кодовой страницы и обработать байты, используя несколько вызовов. В этом случае, возможно, потребуется поддерживать состояние между вызовами, так как последовательности байтов могут быть прерваны при обработке в пакетах. (Например, часть последовательности сдвига ISO-2022 может завершить один GetChars вызов и продолжить в начале следующего GetChars вызова. Encoding.GetChars Вызовет откат для этих неполных последовательностей, но Decoder запомнит эти последовательности для следующего вызова.)
Если приложение обрабатывает выходные данные строки, рекомендуется использовать GetString метод. Поскольку этот метод должен проверять длину строки и выделить буфер, он немного медленнее, но результирующий String тип является предпочтительным.
Версия Byte GetChars(Byte*, Int32, Char*, Int32) позволяет выполнять некоторые быстрые приемы, особенно с несколькими вызовами больших буферов. Однако следует помнить, что эта версия метода иногда является ненадежной, так как указатели являются обязательными.
Если приложение должно преобразовать большой объем данных, следует повторно использовать выходной буфер. В этом случае GetChars(Byte[], Int32, Int32, Char[], Int32) лучшим выбором будет версия, поддерживающая буферы выходных символов.
Рассмотрите возможность использования Decoder.Convert метода вместо GetCharCount . Метод преобразования преобразует как можно больше данных и создает исключение, если выходной буфер слишком мал. Для непрерывного декодирования потока этот метод часто является лучшим выбором.
Применяется к
GetChars(Byte[])
- Исходный код:
- Encoding.cs
- Исходный код:
- Encoding.cs
- Исходный код:
- Encoding.cs
При переопределении в производном классе декодирует все байты из указанного массива байтов в набор символов.
public:
virtual cli::array <char> ^ GetChars(cli::array <System::Byte> ^ bytes);
public virtual char[] GetChars (byte[] bytes);
abstract member GetChars : byte[] -> char[]
override this.GetChars : byte[] -> char[]
Public Overridable Function GetChars (bytes As Byte()) As Char()
Параметры
- bytes
- Byte[]
Массив байтов, содержащий последовательность байтов, которую требуется декодировать.
Возвращаемое значение
Массив символов, содержащий результаты декодирования указанной последовательности байтов.
Исключения
bytes
имеет значение null
.
Произошел откат (см. сведения о кодировке символов в .NET)
- и -
Параметру DecoderFallback задается значение DecoderExceptionFallback.
Примеры
Следующий пример кодирует строку в массив байтов, а затем декодирует байты в массив символов.
using namespace System;
using namespace System::Text;
void PrintCountsAndChars( array<Byte>^bytes, Encoding^ enc );
int main()
{
// Create two instances of UTF32Encoding: one with little-endian byte order and one with big-endian byte order.
Encoding^ u32LE = Encoding::GetEncoding( "utf-32" );
Encoding^ u32BE = Encoding::GetEncoding( "utf-32BE" );
// Use a string containing the following characters:
// Latin Small Letter Z (U+007A)
// Latin Small Letter A (U+0061)
// Combining Breve (U+0306)
// Latin Small Letter AE With Acute (U+01FD)
// Greek Small Letter Beta (U+03B2)
String^ myStr = "za\u0306\u01FD\u03B2";
// Encode the string using the big-endian byte order.
array<Byte>^barrBE = gcnew array<Byte>(u32BE->GetByteCount( myStr ));
u32BE->GetBytes( myStr, 0, myStr->Length, barrBE, 0 );
// Encode the string using the little-endian byte order.
array<Byte>^barrLE = gcnew array<Byte>(u32LE->GetByteCount( myStr ));
u32LE->GetBytes( myStr, 0, myStr->Length, barrLE, 0 );
// Get the char counts, and decode the byte arrays.
Console::Write( "BE array with BE encoding : " );
PrintCountsAndChars( barrBE, u32BE );
Console::Write( "LE array with LE encoding : " );
PrintCountsAndChars( barrLE, u32LE );
}
void PrintCountsAndChars( array<Byte>^bytes, Encoding^ enc )
{
// Display the name of the encoding used.
Console::Write( "{0,-25} :", enc );
// Display the exact character count.
int iCC = enc->GetCharCount( bytes );
Console::Write( " {0,-3}", iCC );
// Display the maximum character count.
int iMCC = enc->GetMaxCharCount( bytes->Length );
Console::Write( " {0,-3} :", iMCC );
// Decode the bytes and display the characters.
array<Char>^chars = enc->GetChars( bytes );
Console::WriteLine( chars );
}
/*
This code produces the following output. The question marks take the place of characters that cannot be displayed at the console.
BE array with BE encoding : System.Text.UTF32Encoding : 5 12 :zăǽβ
LE array with LE encoding : System.Text.UTF32Encoding : 5 12 :zăǽβ
*/
using System;
using System.Text;
public class SamplesEncoding {
public static void Main() {
// Create two instances of UTF32Encoding: one with little-endian byte order and one with big-endian byte order.
Encoding u32LE = Encoding.GetEncoding( "utf-32" );
Encoding u32BE = Encoding.GetEncoding( "utf-32BE" );
// Use a string containing the following characters:
// Latin Small Letter Z (U+007A)
// Latin Small Letter A (U+0061)
// Combining Breve (U+0306)
// Latin Small Letter AE With Acute (U+01FD)
// Greek Small Letter Beta (U+03B2)
String myStr = "za\u0306\u01FD\u03B2";
// Encode the string using the big-endian byte order.
byte[] barrBE = new byte[u32BE.GetByteCount( myStr )];
u32BE.GetBytes( myStr, 0, myStr.Length, barrBE, 0 );
// Encode the string using the little-endian byte order.
byte[] barrLE = new byte[u32LE.GetByteCount( myStr )];
u32LE.GetBytes( myStr, 0, myStr.Length, barrLE, 0 );
// Get the char counts, and decode the byte arrays.
Console.Write( "BE array with BE encoding : " );
PrintCountsAndChars( barrBE, u32BE );
Console.Write( "LE array with LE encoding : " );
PrintCountsAndChars( barrLE, u32LE );
}
public static void PrintCountsAndChars( byte[] bytes, Encoding enc ) {
// Display the name of the encoding used.
Console.Write( "{0,-25} :", enc.ToString() );
// Display the exact character count.
int iCC = enc.GetCharCount( bytes );
Console.Write( " {0,-3}", iCC );
// Display the maximum character count.
int iMCC = enc.GetMaxCharCount( bytes.Length );
Console.Write( " {0,-3} :", iMCC );
// Decode the bytes and display the characters.
char[] chars = enc.GetChars( bytes );
Console.WriteLine( chars );
}
}
/*
This code produces the following output. The question marks take the place of characters that cannot be displayed at the console.
BE array with BE encoding : System.Text.UTF32Encoding : 5 12 :zăǽβ
LE array with LE encoding : System.Text.UTF32Encoding : 5 12 :zăǽβ
*/
Imports System.Text
Public Class SamplesEncoding
Public Shared Sub Main()
' Create two instances of UTF32Encoding: one with little-endian byte order and one with big-endian byte order.
Dim u32LE As Encoding = Encoding.GetEncoding("utf-32")
Dim u32BE As Encoding = Encoding.GetEncoding("utf-32BE")
' Use a string containing the following characters:
' Latin Small Letter Z (U+007A)
' Latin Small Letter A (U+0061)
' Combining Breve (U+0306)
' Latin Small Letter AE With Acute (U+01FD)
' Greek Small Letter Beta (U+03B2)
Dim myStr As String = "za" & ChrW(&H0306) & ChrW(&H01FD) & ChrW(&H03B2)
' Encode the string using the big-endian byte order.
' NOTE: In VB.NET, arrays contain one extra element by default.
' The following line creates the array with the exact number of elements required.
Dim barrBE(u32BE.GetByteCount(myStr) - 1) As Byte
u32BE.GetBytes(myStr, 0, myStr.Length, barrBE, 0)
' Encode the string using the little-endian byte order.
' NOTE: In VB.NET, arrays contain one extra element by default.
' The following line creates the array with the exact number of elements required.
Dim barrLE(u32LE.GetByteCount(myStr) - 1) As Byte
u32LE.GetBytes(myStr, 0, myStr.Length, barrLE, 0)
' Get the char counts, and decode the byte arrays.
Console.Write("BE array with BE encoding : ")
PrintCountsAndChars(barrBE, u32BE)
Console.Write("LE array with LE encoding : ")
PrintCountsAndChars(barrLE, u32LE)
End Sub
Public Shared Sub PrintCountsAndChars(bytes() As Byte, enc As Encoding)
' Display the name of the encoding used.
Console.Write("{0,-25} :", enc.ToString())
' Display the exact character count.
Dim iCC As Integer = enc.GetCharCount(bytes)
Console.Write(" {0,-3}", iCC)
' Display the maximum character count.
Dim iMCC As Integer = enc.GetMaxCharCount(bytes.Length)
Console.Write(" {0,-3} :", iMCC)
' Decode the bytes and display the characters.
Dim chars As Char() = enc.GetChars(bytes)
Console.WriteLine(chars)
End Sub
End Class
'This code produces the following output. The question marks take the place of characters that cannot be displayed at the console.
'
'BE array with BE encoding : System.Text.UTF32Encoding : 5 12 :zăǽβ
'LE array with LE encoding : System.Text.UTF32Encoding : 5 12 :zăǽβ
Комментарии
Encoding.GetCharsПолучает символы из входной последовательности байтов. Encoding.GetCharsотличается от Decoder.GetChars , так как Encoding ожидает дискретные преобразования, в то время как Decoder предназначено для нескольких проходов по одному входному потоку.
Если данные для преобразования доступны только в последовательных блоках (например, чтение данных из потока) или если объем данных настолько велик, что необходимо разделить на меньшие блоки, следует использовать Decoder или, Encoder предоставленный GetDecoder методом или GetEncoder методом, соответственно, для производного класса.
Примечание
Этот метод предназначен для обработки символов Юникода, а не для произвольных двоичных данных, таких как байтовые массивы. Если необходимо закодировать произвольные двоичные данные в текст, следует использовать протокол, такой как uuencode, который реализуется такими методами, как Convert.ToBase64CharArray .
GetCharCountМетод определяет, сколько символов приводит к декодированию последовательности байтов, и GetChars метод выполняет фактическое декодирование. Encoding.GetCharsМетод принимает дискретные преобразования, в отличие от Decoder.GetChars метода, который обрабатывает несколько проходов по одному входному потоку.
GetCharCountПоддерживаются несколько версий и GetChars . Ниже приведены некоторые рекомендации по программированию для использования этих методов.
Приложению может потребоваться декодировать несколько входных байт из кодовой страницы и обработать байты, используя несколько вызовов. В этом случае, возможно, потребуется поддерживать состояние между вызовами, так как последовательности байтов могут быть прерваны при обработке в пакетах. (Например, часть последовательности сдвига ISO-2022 может завершить один GetChars вызов и продолжить в начале следующего GetChars вызова. Encoding.GetChars Вызовет откат для этих неполных последовательностей, но Decoder запомнит эти последовательности для следующего вызова.)
Если приложение обрабатывает выходные данные строки, рекомендуется использовать GetString метод. Поскольку этот метод должен проверять длину строки и выделить буфер, он немного медленнее, но результирующий String тип является предпочтительным.
Версия Byte GetChars(Byte*, Int32, Char*, Int32) позволяет выполнять некоторые быстрые приемы, особенно с несколькими вызовами больших буферов. Однако следует помнить, что эта версия метода иногда является ненадежной, так как указатели являются обязательными.
Если приложение должно преобразовать большой объем данных, следует повторно использовать выходной буфер. В этом случае GetChars(Byte[], Int32, Int32, Char[], Int32) лучшим выбором будет версия, поддерживающая буферы выходных символов.
Рассмотрите возможность использования Decoder.Convert метода вместо GetCharCount . Метод преобразования преобразует как можно больше данных и создает исключение, если выходной буфер слишком мал. Для непрерывного декодирования потока этот метод часто является лучшим выбором.