Encoding.GetMaxByteCount(Int32) Metoda

Definice

Obor názvů:: System.Text

Sestavení:: mscorlib.dll, System.Text.Encoding.dll

Sestavení:: netstandard.dll, System.Runtime.dll

Sestavení:: System.Text.Encoding.dll

Sestavení:: System.Runtime.dll

Sestavení:: mscorlib.dll

Sestavení:: netstandard.dll

Zdroj:: Encoding.cs

Zdroj:: Encoding.cs

Zdroj:: Encoding.cs

Zdroj:: Encoding.cs

Důležité

Některé informace platí pro předběžně vydaný produkt, který se může zásadně změnit, než ho výrobce nebo autor vydá. Microsoft neposkytuje žádné záruky, výslovné ani předpokládané, týkající se zde uváděných informací.

Při přepsání v odvozené třídě vypočítá maximální počet bajtů produkovaných kódováním zadaného počtu znaků.

public:
 abstract int GetMaxByteCount(int charCount);

public abstract int GetMaxByteCount(int charCount);

abstract member GetMaxByteCount : int -> int

Public MustOverride Function GetMaxByteCount (charCount As Integer) As Integer

Parametry

charCount: Int32

Počet znaků, které mají být zakódovány.

Návraty

Int32

Maximální počet bajtů vytvořených kódováním zadaného počtu znaků.

Výjimky

ArgumentOutOfRangeException

Hodnota charCount je menší než nula.

EncoderFallbackException

Došlo k náhradnímu použití (další informace najdete v tématu Kódování znaků v .NET)

-A-

EncoderFallback je nastavená na EncoderExceptionFallbackhodnotu .

Příklady

Následující příklad určuje počet bajtů potřebných ke kódování pole znaků, zakóduje znaky a zobrazí výsledné bajty.

using System;
using System.Text;

public class SamplesEncoding  {

   public static void Main()  {

      // The characters to encode:
      //    Latin Small Letter Z (U+007A)
      //    Latin Small Letter A (U+0061)
      //    Combining Breve (U+0306)
      //    Latin Small Letter AE With Acute (U+01FD)
      //    Greek Small Letter Beta (U+03B2)
      //    a high-surrogate value (U+D8FF)
      //    a low-surrogate value (U+DCFF)
      char[] myChars = new char[] { 'z', 'a', '\u0306', '\u01FD', '\u03B2', '\uD8FF', '\uDCFF' };

      // Get different encodings.
      Encoding  u7    = Encoding.UTF7;
      Encoding  u8    = Encoding.UTF8;
      Encoding  u16LE = Encoding.Unicode;
      Encoding  u16BE = Encoding.BigEndianUnicode;
      Encoding  u32   = Encoding.UTF32;

      // Encode the entire array, and print out the counts and the resulting bytes.
      PrintCountsAndBytes( myChars, u7 );
      PrintCountsAndBytes( myChars, u8 );
      PrintCountsAndBytes( myChars, u16LE );
      PrintCountsAndBytes( myChars, u16BE );
      PrintCountsAndBytes( myChars, u32 );
   }

   public static void PrintCountsAndBytes( char[] chars, Encoding enc )  {

      // Display the name of the encoding used.
      Console.Write( "{0,-30} :", enc.ToString() );

      // Display the exact byte count.
      int iBC  = enc.GetByteCount( chars );
      Console.Write( " {0,-3}", iBC );

      // Display the maximum byte count.
      int iMBC = enc.GetMaxByteCount( chars.Length );
      Console.Write( " {0,-3} :", iMBC );

      // Encode the array of chars.
      byte[] bytes = enc.GetBytes( chars );

      // Display all the encoded bytes.
      PrintHexBytes( bytes );
   }

   public static void PrintHexBytes( byte[] bytes )  {

      if (( bytes == null ) || ( bytes.Length == 0 ))
        {
            Console.WriteLine( "<none>" );
        }
        else  {
         for ( int i = 0; i < bytes.Length; i++ )
            Console.Write( "{0:X2} ", bytes[i] );
         Console.WriteLine();
      }
   }
}


/* 
This code produces the following output.

System.Text.UTF7Encoding       : 18  23  :7A 61 2B 41 77 59 42 2F 51 4F 79 32 50 2F 63 2F 77 2D
System.Text.UTF8Encoding       : 12  24  :7A 61 CC 86 C7 BD CE B2 F1 8F B3 BF
System.Text.UnicodeEncoding    : 14  16  :7A 00 61 00 06 03 FD 01 B2 03 FF D8 FF DC
System.Text.UnicodeEncoding    : 14  16  :00 7A 00 61 03 06 01 FD 03 B2 D8 FF DC FF
System.Text.UTF32Encoding      : 24  32  :7A 00 00 00 61 00 00 00 06 03 00 00 FD 01 00 00 B2 03 00 00 FF FC 04 00

*/

Imports System.Text

Public Class SamplesEncoding   

   Public Shared Sub Main()

      ' The characters to encode:
      '    Latin Small Letter Z (U+007A)
      '    Latin Small Letter A (U+0061)
      '    Combining Breve (U+0306)
      '    Latin Small Letter AE With Acute (U+01FD)
      '    Greek Small Letter Beta (U+03B2)
      '    a high-surrogate value (U+D8FF)
      '    a low-surrogate value (U+DCFF)
      Dim myChars() As Char = {"z"c, "a"c, ChrW(&H0306), ChrW(&H01FD), ChrW(&H03B2), ChrW(&HD8FF), ChrW(&HDCFF)}
 

      ' Get different encodings.
      Dim u7 As Encoding = Encoding.UTF7
      Dim u8 As Encoding = Encoding.UTF8
      Dim u16LE As Encoding = Encoding.Unicode
      Dim u16BE As Encoding = Encoding.BigEndianUnicode
      Dim u32 As Encoding = Encoding.UTF32

      ' Encode the entire array, and print out the counts and the resulting bytes.
      PrintCountsAndBytes(myChars, u7)
      PrintCountsAndBytes(myChars, u8)
      PrintCountsAndBytes(myChars, u16LE)
      PrintCountsAndBytes(myChars, u16BE)
      PrintCountsAndBytes(myChars, u32)

   End Sub


   Public Shared Sub PrintCountsAndBytes(chars() As Char, enc As Encoding)

      ' Display the name of the encoding used.
      Console.Write("{0,-30} :", enc.ToString())

      ' Display the exact byte count.
      Dim iBC As Integer = enc.GetByteCount(chars)
      Console.Write(" {0,-3}", iBC)

      ' Display the maximum byte count.
      Dim iMBC As Integer = enc.GetMaxByteCount(chars.Length)
      Console.Write(" {0,-3} :", iMBC)

      ' Encode the array of chars.
      Dim bytes As Byte() = enc.GetBytes(chars)

      ' Display all the encoded bytes.
      PrintHexBytes(bytes)

   End Sub


   Public Shared Sub PrintHexBytes(bytes() As Byte)

      If bytes Is Nothing OrElse bytes.Length = 0 Then
         Console.WriteLine("<none>")
      Else
         Dim i As Integer
         For i = 0 To bytes.Length - 1
            Console.Write("{0:X2} ", bytes(i))
         Next i
         Console.WriteLine()
      End If

   End Sub

End Class


'This code produces the following output.
'
'System.Text.UTF7Encoding       : 18  23  :7A 61 2B 41 77 59 42 2F 51 4F 79 32 50 2F 63 2F 77 2D
'System.Text.UTF8Encoding       : 12  24  :7A 61 CC 86 C7 BD CE B2 F1 8F B3 BF
'System.Text.UnicodeEncoding    : 14  16  :7A 00 61 00 06 03 FD 01 B2 03 FF D8 FF DC
'System.Text.UnicodeEncoding    : 14  16  :00 7A 00 61 03 06 01 FD 03 B2 D8 FF DC FF
'System.Text.UTF32Encoding      : 24  32  :7A 00 00 00 61 00 00 00 06 03 00 00 FD 01 00 00 B2 03 00 00 FF FC 04 00

Poznámky

Parametr charCount ve skutečnosti určuje počet Char objektů, které představují znaky Unicode ke kódování, protože .NET interně používá UTF-16 k reprezentaci znaků Unicode. V důsledku toho může být většina znaků Unicode reprezentována jedním Char objektem, ale znak Unicode reprezentovaný náhradní dvojicí, například vyžaduje dva Char objekty.

Pokud chcete vypočítat přesnou velikost pole, kterou vyžaduje GetBytes k uložení výsledných bajtů, měli byste použít metodu GetByteCount . K výpočtu maximální velikosti pole použijte metodu GetMaxByteCount . Metoda GetByteCount obecně umožňuje přidělení menší paměti, zatímco GetMaxByteCount metoda se obecně spouští rychleji.

GetMaxByteCount Načte číslo nejhoršího případu, včetně nejhoršího případu pro aktuálně vybraný EncoderFallback. Pokud je náhradní řetězec vybrán s potenciálně velkým řetězcem, GetMaxByteCount načte velké hodnoty, zejména v případech, kdy nejhorším případem pro kódování je přepínání režimů pro každý znak. Může k tomu dojít například u ISO-2022-JP. Další informace najdete v blogovém příspěvku "Co je s Encoding.GetMaxByteCount() and Encoding.GetMaxCharCount()?.

Ve většině případů tato metoda načte přiměřené hodnoty pro malé řetězce. U velkých řetězců si možná budete muset vybrat mezi použitím velmi velkých vyrovnávacích pamětí a zachytáváním chyb ve výjimečných případech, kdy je rozumnější vyrovnávací paměť příliš malá. Můžete také zvážit jiný přístup pomocí nebo GetByteCount Encoder.Convert.

Při použití nástroje GetMaxByteCountbyste měli výstupní vyrovnávací paměť přidělit na základě maximální velikosti vstupní vyrovnávací paměti. Pokud je velikost výstupní vyrovnávací paměti omezená, můžete použít metodu Convert .

Všimněte si, že GetMaxByteCount bere v úvahu potenciální zbylé náhrady z předchozí operace dekodéru. Z důvodu dekodéru, předání hodnoty 1 do metody načte 2 pro jednobajtů kódování, jako je ASCII. Pokud jsou tyto informace nezbytné, měli byste použít IsSingleByte vlastnost .

Poznámka

GetMaxByteCount(N) není nutně stejná hodnota jako N* GetMaxByteCount(1).

Poznámky pro implementátory

Všechny Encoding implementace musí zaručit, že nedojde k žádným výjimkám přetečení vyrovnávací paměti, pokud jsou vyrovnávací paměti dimenzované podle výsledků výpočtů této metody.

Platí pro

Viz také

Váš názor

Byla tato stránka užitečná?