Encoding Classe
Définition
Important
Certaines informations portent sur la préversion du produit qui est susceptible d’être en grande partie modifiée avant sa publication. Microsoft exclut toute garantie, expresse ou implicite, concernant les informations fournies ici.
Représente un encodage de caractères.
public ref class Encoding abstract
public ref class Encoding abstract : ICloneable
public abstract class Encoding
public abstract class Encoding : ICloneable
[System.Serializable]
public abstract class Encoding
[System.Serializable]
[System.Runtime.InteropServices.ComVisible(true)]
public abstract class Encoding : ICloneable
type Encoding = class
type Encoding = class
interface ICloneable
[<System.Serializable>]
type Encoding = class
[<System.Serializable>]
[<System.Runtime.InteropServices.ComVisible(true)>]
type Encoding = class
interface ICloneable
Public MustInherit Class Encoding
Public MustInherit Class Encoding
Implements ICloneable
- Héritage
-
Encoding
- Dérivé
- Attributs
- Implémente
Exemples
L’exemple suivant convertit une chaîne d’un encodage à un autre.
Notes
Le byte[]
tableau est le seul type dans cet exemple qui contient les données encodées. Le .NET Char
et les String
types sont eux-mêmes Unicode, de sorte que l' GetChars appel décode les données au format Unicode.
using namespace System;
using namespace System::Text;
int main()
{
String^ unicodeString = "This string contains the unicode character Pi (\u03a0)";
// Create two different encodings.
Encoding^ ascii = Encoding::ASCII;
Encoding^ unicode = Encoding::Unicode;
// Convert the string into a byte array.
array<Byte>^unicodeBytes = unicode->GetBytes( unicodeString );
// Perform the conversion from one encoding to the other.
array<Byte>^asciiBytes = Encoding::Convert( unicode, ascii, unicodeBytes );
// Convert the new Byte into[] a char and[] then into a string.
array<Char>^asciiChars = gcnew array<Char>(ascii->GetCharCount( asciiBytes, 0, asciiBytes->Length ));
ascii->GetChars( asciiBytes, 0, asciiBytes->Length, asciiChars, 0 );
String^ asciiString = gcnew String( asciiChars );
// Display the strings created before and after the conversion.
Console::WriteLine( "Original String*: {0}", unicodeString );
Console::WriteLine( "Ascii converted String*: {0}", asciiString );
}
// The example displays the following output:
// Original string: This string contains the unicode character Pi (Π)
// Ascii converted string: This string contains the unicode character Pi (?)
using System;
using System.Text;
class Example
{
static void Main()
{
string unicodeString = "This string contains the unicode character Pi (\u03a0)";
// Create two different encodings.
Encoding ascii = Encoding.ASCII;
Encoding unicode = Encoding.Unicode;
// Convert the string into a byte array.
byte[] unicodeBytes = unicode.GetBytes(unicodeString);
// Perform the conversion from one encoding to the other.
byte[] asciiBytes = Encoding.Convert(unicode, ascii, unicodeBytes);
// Convert the new byte[] into a char[] and then into a string.
char[] asciiChars = new char[ascii.GetCharCount(asciiBytes, 0, asciiBytes.Length)];
ascii.GetChars(asciiBytes, 0, asciiBytes.Length, asciiChars, 0);
string asciiString = new string(asciiChars);
// Display the strings created before and after the conversion.
Console.WriteLine("Original string: {0}", unicodeString);
Console.WriteLine("Ascii converted string: {0}", asciiString);
}
}
// The example displays the following output:
// Original string: This string contains the unicode character Pi (Π)
// Ascii converted string: This string contains the unicode character Pi (?)
Imports System.Text
Class Example
Shared Sub Main()
Dim unicodeString As String = "This string contains the unicode character Pi (" & ChrW(&H03A0) & ")"
' Create two different encodings.
Dim ascii As Encoding = Encoding.ASCII
Dim unicode As Encoding = Encoding.Unicode
' Convert the string into a byte array.
Dim unicodeBytes As Byte() = unicode.GetBytes(unicodeString)
' Perform the conversion from one encoding to the other.
Dim asciiBytes As Byte() = Encoding.Convert(unicode, ascii, unicodeBytes)
' Convert the new byte array into a char array and then into a string.
Dim asciiChars(ascii.GetCharCount(asciiBytes, 0, asciiBytes.Length)-1) As Char
ascii.GetChars(asciiBytes, 0, asciiBytes.Length, asciiChars, 0)
Dim asciiString As New String(asciiChars)
' Display the strings created before and after the conversion.
Console.WriteLine("Original string: {0}", unicodeString)
Console.WriteLine("Ascii converted string: {0}", asciiString)
End Sub
End Class
' The example displays the following output:
' Original string: This string contains the unicode character Pi (Π)
' Ascii converted string: This string contains the unicode character Pi (?)
Remarques
L'encodage est le processus de transformation d'un jeu de caractères Unicode en une séquence d'octets. En revanche, le décodage est le processus de transformation d’une séquence d’octets encodés en un jeu de caractères Unicode. Pour plus d’informations sur les formats de transformation Unicode (UTFs) et d’autres encodages pris en charge par Encoding , consultez encodage de caractères dans .net.
Notez que Encoding est conçu pour fonctionner sur des caractères Unicode au lieu de données binaires arbitraires, telles que des tableaux d’octets. Si vous devez encoder des données binaires arbitraires en texte, vous devez utiliser un protocole tel qu’UUEncode, qui est implémenté par des méthodes telles que Convert.ToBase64CharArray .
.NET fournit les implémentations suivantes de la Encoding classe pour prendre en charge les encodages Unicode et autres encodages actuels :
ASCIIEncodingencode les caractères Unicode sous la forme de caractères ASCII 7 bits uniques. Cet encodage prend en charge uniquement les valeurs de caractères comprises entre U + 0000 et U + 007F. Page de codes 20127. Également disponible via la ASCII propriété.
UTF7Encodingencode les caractères Unicode à l’aide de l’encodage UTF-7. Cet encodage prend en charge toutes les valeurs de caractères Unicode. Page de codes 65000. Également disponible via la UTF7 propriété.
UTF8Encodingencode les caractères Unicode à l’aide de l’encodage UTF-8. Cet encodage prend en charge toutes les valeurs de caractères Unicode. Page de codes 65001. Également disponible via la UTF8 propriété.
UnicodeEncodingencode les caractères Unicode à l’aide de l’encodage UTF-16. Les ordres Little endian et Big endian sont pris en charge. Également disponible par le biais de la Unicode propriété et de la BigEndianUnicode propriété.
UTF32Encodingencode les caractères Unicode à l’aide de l’encodage UTF-32. Les ordres d’octet Little endian (page de codes 12000) et Big endian (page de codes 12001) sont pris en charge. Également disponible via la UTF32 propriété.
La Encoding classe est principalement destinée à effectuer des conversions entre différents encodages et Unicode. Souvent, l’une des classes Unicode dérivées est le choix approprié pour votre application.
Utilisez la GetEncoding méthode pour obtenir d’autres encodages et appelez la GetEncodings méthode pour obtenir la liste de tous les encodages.
Liste des encodages
Le tableau suivant répertorie les encodages pris en charge par .NET. Elle répertorie le numéro de la page de codes de l’encodage et les valeurs des propriétés et de l’encodage EncodingInfo.NameEncodingInfo.DisplayName . Une coche dans la colonne prise en charge du .NET Framework, prise en charge de .NET Core ou .NET 5 et versions ultérieures indique que la page de code est prise en charge en mode natif par cette implémentation .NET, quelle que soit la plateforme sous-jacente. Par .NET Framework, la disponibilité des autres encodages listés dans le tableau dépend du système d’exploitation. Pour .NET Core et .NET 5 et versions ultérieures, d’autres encodages sont disponibles à l’aide de la System.Text.CodePagesEncodingProvider classe ou en dérivant de la System.Text.EncodingProvider classe .
Notes
Les pages de codes dont la EncodingInfo.Name propriété correspond à une norme internationale ne sont pas nécessairement entièrement conformes à cette norme.
Page de codes | Name | Nom complet | Support .NET Framework | Support de .NET Core | Prise en charge de .NET 5 et versions ultérieures | |
---|---|---|---|---|---|---|
37 | IBM037 | IBM EBCDIC (États-Unis-Canada) | ||||
437 | IBM437 | États-Unis OEM | ||||
500 | IBM500 | IBM EBCDIC (international) | ||||
708 | ASMO-708 | Arabe (ASMO 708) | ||||
720 | DOS-720 | Arabe (DOS) | ||||
737 | ibm737 | Grec (DOS) | ||||
775 | ibm775 | Balte (DOS) | ||||
850 | ibm850 | Europe occidentale (DOS) | ||||
852 | ibm852 | Europe centrale (DOS) | ||||
855 | IBM855 | OEM cyrillique | ||||
857 | ibm857 | Turc (DOS) | ||||
858 | IBM00858 | Latin multilingue OEM I | ||||
860 | IBM860 | Portugais (DOS) | ||||
861 | ibm861 | Islandais (DOS) | ||||
862 | DOS-862 | Hébreu (DOS) | ||||
863 | IBM863 | Français canadien (DOS) | ||||
864 | IBM864 | Arabe (864) | ||||
865 | IBM865 | Nordique (DOS) | ||||
866 | cp866 | Cyrillique (DOS) | ||||
869 | ibm869 | Grec, moderne (DOS) | ||||
870 | IBM870 | IBM EBCDIC (multilingue Latin-2) | ||||
874 | Windows-874 | Thaï (Windows) | ||||
875 | cp875 | IBM EBCDIC (grec moderne) | ||||
932 | shift_jis | Japonais (Shift-JIS) | ||||
936 | GB2312 | Chinois simplifié (GB2312) | ✓ | |||
949 | ks_c_5601-1987 | Coréen | ||||
950 | Big5 | Chinois traditionnel (Big5) | ||||
1026 | IBM1026 | IBM EBCDIC (turc latin-5) | ||||
1047 | IBM01047 | IBM latin-1 | ||||
1140 | IBM01140 | IBM EBCDIC (États-Unis-Canada-Europe) | ||||
1141 | IBM01141 | IBM EBCDIC (Allemagne-Europe) | ||||
1142 | IBM01142 | IBM EBCDIC (Danemark-Norvège-euro) | ||||
1143 | IBM01143 | IBM EBCDIC (Finlande-Suède-Europe) | ||||
1144 | IBM01144 | IBM EBCDIC (Italie-Europe) | ||||
1145 | IBM01145 | IBM EBCDIC (Espagne-Europe) | ||||
1146 | IBM01146 | IBM EBCDIC (Royaume-Uni-Europe) | ||||
1147 | IBM01147 | IBM EBCDIC (France-Europe) | ||||
1148 | IBM01148 | IBM EBCDIC (International-Europe) | ||||
1149 | IBM01149 | IBM EBCDIC (islandais-euro) | ||||
1200 | UTF-16 | Unicode | ✓ | ✓ | ✓ | |
1201 | unicodeFFFE | Unicode (Big endian) | ✓ | ✓ | ✓ | |
1250 | Windows-1250 | Europe centrale (Windows) | ||||
1251 | Windows-1251 | Cyrillique (Windows) | ||||
1252 | Windows 1252 | Europe Ouest (Windows) | ✓ | |||
1253 | Windows-1253 | Grec (Windows) | ||||
1254 | Windows-1254 | Turc (Windows) | ||||
1 255 | Windows-1255 | Hébreu (Windows) | ||||
1256 | Windows-1256 | Arabe (Windows) | ||||
1257 | Windows-1257 | Balte (Windows) | ||||
1258 | Windows-1258 | Vietnamien (Windows) | ||||
1361 | Johab | Coréen (Johab) | ||||
10000 | ordinateurs | Europe occidentale (Mac) | ||||
10001 | x-Mac-japonais | Japonais (Mac) | ||||
10002 | x-Mac-chinesetrad | Chinois traditionnel (Mac) | ||||
10003 | x-Mac-coréen | Coréen (Mac) | ✓ | |||
10004 | x-Mac-arabe | Arabe (Mac) | ||||
10005 | x-Mac-Hébreu | Hébreu (Mac) | ||||
10006 | x-Mac-grec | Grec (Mac) | ||||
10007 | x-Mac-cyrillique | Cyrillique (Mac) | ||||
10008 | x-Mac-chinesesimp | Chinois simplifié (Mac) | ✓ | |||
10010 | x-Mac-roumain | Roumain (Mac) | ||||
10017 | x-Mac-ukrainien | Ukrainien (Mac) | ||||
10021 | x-Mac-thaï | Thaï (Mac) | ||||
10029 | x-Mac-ce | Europe centrale (Mac) | ||||
10079 | x-Mac-islandais | Islandais (Mac) | ||||
10081 | x-Mac-turc | Turc (Mac) | ||||
10082 | x-Mac-croate | Croate (Mac) | ||||
12 000 | UTF-32 | Unicode (UTF-32) | ✓ | ✓ | ✓ | |
12001 | UTF-32BE | Unicode (UTF-32 Big endian) | ✓ | ✓ | ✓ | |
20000 | x-chinois-CNS | Chinois traditionnel (CNS) | ||||
20001 | x-cp20001 | TCA Taïwan | ||||
20002 | x-chinois-eTEN | Chinois traditionnel (eten) | ||||
20003 | x-cp20003 | IBM5550 Taïwan | ||||
20004 | x-cp20004 | Teletext Taïwan | ||||
20005 | x-cp20005 | Taïwan Wang | ||||
20105 | x-IA5 | Europe occidentale (IA5) | ||||
20106 | x-IA5-allemand | Allemand (IA5) | ||||
20107 | x-IA5-suédois | Suédois (IA5) | ||||
20108 | x-IA5-norvégien | Norvégien (IA5) | ||||
20127 | US-ASCII | US-ASCII | ✓ | ✓ | ✓ | |
20261 | x-cp20261 | T. 61 | ||||
20269 | x-cp20269 | ISO-6937 | ||||
20273 | IBM273 | IBM EBCDIC (Allemagne) | ||||
20277 | IBM277 | IBM EBCDIC (Danemark-Norvège) | ||||
20278 | IBM278 | IBM EBCDIC (Finlande-Suède) | ||||
20280 | IBM280 | IBM EBCDIC (Italie) | ||||
20284 | IBM284 | IBM EBCDIC (Espagne) | ||||
20285 | IBM285 | IBM EBCDIC (ROYAUME-UNI) | ||||
20290 | IBM290 | IBM EBCDIC (japonais Katakana) | ||||
20297 | IBM297 | IBM EBCDIC (France) | ||||
20420 | IBM420 | IBM EBCDIC (arabe) | ||||
20423 | IBM423 | IBM EBCDIC (grec) | ||||
20424 | IBM424 | IBM EBCDIC (hébreu) | ||||
20833 | x-EBCDIC-KoreanExtended | IBM EBCDIC (coréen étendu) | ||||
20838 | IBM-thaï | IBM EBCDIC (thaï) | ||||
20866 | koi8-r | Cyrillique (KOI8-R) | ||||
20871 | IBM871 | IBM EBCDIC (islandais) | ||||
20880 | IBM880 | IBM EBCDIC (russe cyrillique) | ||||
20905 | IBM905 | IBM EBCDIC (turc) | ||||
20924 | IBM00924 | IBM latin-1 | ||||
20932 | EUC-JP | Japonais (JIS 0208-1990 et 0212-1990) | ||||
20936 | x-cp20936 | Chinois simplifié (GB2312-80) | ✓ | |||
20949 | x-cp20949 | Wansung coréen | ✓ | |||
21025 | cp1025 | IBM EBCDIC (serbe cyrillique-bulgare) | ||||
21866 | KOI8-u | Cyrillique (KOI8-U) | ||||
28591 | ISO-8859-1 | Europe occidentale (ISO) | ✓ | ✓ | ✓ | |
28592 | ISO-8859-2 | Europe centrale (ISO) | ||||
28593 | ISO-8859-3 | Latin 3 (ISO) | ||||
28594 | ISO-8859-4 | Balte (ISO) | ||||
28595 | ISO-8859-5 | Cyrillique (ISO) | ||||
28596 | ISO-8859-6 | Arabe (ISO) | ||||
28597 | ISO-8859-7 | Grec (ISO) | ||||
28598 | ISO-8859-8 | Hébreu (ISO-Visual) | ✓ | |||
28599 | ISO-8859-9 | Turc (ISO) | ||||
28603 | ISO-8859-13 | Estonien (ISO) | ||||
28605 | ISO-8859-15 | Latin 9 (ISO) | ||||
29001 | x-Europa | Europa | ||||
38598 | ISO-8859-8-i | Hébreu (ISO-Logical) | ✓ | |||
50220 | ISO-2022-JP | Japonais (JIS) | ✓ | |||
50221 | csISO2022JP | Japanese (JIS-autoriser les caractères Kana de 1 octet) | ✓ | |||
50222 | ISO-2022-JP | Japanese (JIS-autoriser les caractères Kana à 1 octet-SO/SI) | ✓ | |||
50225 | ISO-2022-KR | Coréen (ISO) | ✓ | |||
50227 | x-cp50227 | Chinois simplifié (ISO-2022) | ✓ | |||
51932 | EUC-JP | Japonais (EUC) | ✓ | |||
51936 | EUC-CN | Chinois simplifié (EUC) | ✓ | |||
51949 | EUC-KR | Coréen (EUC) | ✓ | |||
52936 | Hz-GB-2312 | Chinois simplifié (HZ) | ✓ | |||
54936 | GB18030 | Chinois simplifié (GB18030) | ✓ | |||
57002 | x-ISCII-de | ISCII DÉVANÂGARÎ | ✓ | |||
57003 | x-ISCII-est | Bengali ISCII | ✓ | |||
57004 | x-ISCII-ta | Tamoul ISCII | ✓ | |||
57005 | x-ISCII-te | Telugu ISCII | ✓ | |||
57006 | x-ISCII-As | ISCII assamais | ✓ | |||
57007 | x-ISCII-or | Odia ISCII | ✓ | |||
57008 | x-ISCII-ka | Kannada ISCII | ✓ | |||
57009 | x-ISCII-ma | Malayalam ISCII | ✓ | |||
57010 | x-ISCII-Gu | Gujarati ISCII | ✓ | |||
57011 | x-ISCII-PA | Pendjabi ISCII | ✓ | |||
65 000 | UTF-7 | Unicode (UTF-7) | ✓ | ✓ | ||
65 001 | utf-8 | Unicode (UTF-8) | ✓ | ✓ | ✓ |
L’exemple suivant appelle les GetEncoding(Int32)GetEncoding(String) méthodes et pour récupérer l’encodage de page de codes grec (Windows). Il compare les Encoding objets retournés par les appels de méthode pour montrer qu’ils sont égaux, puis Maps affiche le point de code Unicode et la valeur de page de codes correspondante pour chaque caractère de l’alphabet grec.
using System;
using System.Text;
public class Example
{
public static void Main()
{
Encoding enc = Encoding.GetEncoding(1253);
Encoding altEnc = Encoding.GetEncoding("windows-1253");
Console.WriteLine("{0} = Code Page {1}: {2}", enc.EncodingName,
altEnc.CodePage, enc.Equals(altEnc));
string greekAlphabet = "Α α Β β Γ γ Δ δ Ε ε Ζ ζ Η η " +
"Θ θ Ι ι Κ κ Λ λ Μ μ Ν ν Ξ ξ " +
"Ο ο Π π Ρ ρ Σ σ ς Τ τ Υ υ " +
"Φ φ Χ χ Ψ ψ Ω ω";
Console.OutputEncoding = Encoding.UTF8;
byte[] bytes = enc.GetBytes(greekAlphabet);
Console.WriteLine("{0,-12} {1,20} {2,20:X2}", "Character",
"Unicode Code Point", "Code Page 1253");
for (int ctr = 0; ctr < bytes.Length; ctr++) {
if (greekAlphabet[ctr].Equals(' '))
continue;
Console.WriteLine("{0,-12} {1,20} {2,20:X2}", greekAlphabet[ctr],
GetCodePoint(greekAlphabet[ctr]), bytes[ctr]);
}
}
private static string GetCodePoint(char ch)
{
string retVal = "u+";
byte[] bytes = Encoding.Unicode.GetBytes(ch.ToString());
for (int ctr = bytes.Length - 1; ctr >= 0; ctr--)
retVal += bytes[ctr].ToString("X2");
return retVal;
}
}
// The example displays the following output:
// Character Unicode Code Point Code Page 1253
// Α u+0391 C1
// α u+03B1 E1
// Β u+0392 C2
// β u+03B2 E2
// Γ u+0393 C3
// γ u+03B3 E3
// Δ u+0394 C4
// δ u+03B4 E4
// Ε u+0395 C5
// ε u+03B5 E5
// Ζ u+0396 C6
// ζ u+03B6 E6
// Η u+0397 C7
// η u+03B7 E7
// Θ u+0398 C8
// θ u+03B8 E8
// Ι u+0399 C9
// ι u+03B9 E9
// Κ u+039A CA
// κ u+03BA EA
// Λ u+039B CB
// λ u+03BB EB
// Μ u+039C CC
// μ u+03BC EC
// Ν u+039D CD
// ν u+03BD ED
// Ξ u+039E CE
// ξ u+03BE EE
// Ο u+039F CF
// ο u+03BF EF
// Π u+03A0 D0
// π u+03C0 F0
// Ρ u+03A1 D1
// ρ u+03C1 F1
// Σ u+03A3 D3
// σ u+03C3 F3
// ς u+03C2 F2
// Τ u+03A4 D4
// τ u+03C4 F4
// Υ u+03A5 D5
// υ u+03C5 F5
// Φ u+03A6 D6
// φ u+03C6 F6
// Χ u+03A7 D7
// χ u+03C7 F7
// Ψ u+03A8 D8
// ψ u+03C8 F8
// Ω u+03A9 D9
// ω u+03C9 F9
Imports System.Text
Module Example
Public Sub Main()
Dim enc As Encoding = Encoding.GetEncoding(1253)
Dim altEnc As Encoding = Encoding.GetEncoding("windows-1253")
Console.WriteLine("{0} = Code Page {1}: {2}", enc.EncodingName,
altEnc.CodePage, enc.Equals(altEnc))
Dim greekAlphabet As String = "Α α Β β Γ γ Δ δ Ε ε Ζ ζ Η η " +
"Θ θ Ι ι Κ κ Λ λ Μ μ Ν ν Ξ ξ " +
"Ο ο Π π Ρ ρ Σ σ ς Τ τ Υ υ " +
"Φ φ Χ χ Ψ ψ Ω ω"
Console.OutputEncoding = Encoding.UTF8
Dim bytes() As Byte = enc.GetBytes(greekAlphabet)
Console.WriteLine("{0,-12} {1,20} {2,20:X2}", "Character",
"Unicode Code Point", "Code Page 1253")
For ctr As Integer = 0 To bytes.Length - 1
If greekAlphabet(ctr).Equals(" "c) Then Continue For
Console.WriteLine("{0,-12} {1,20} {2,20:X2}", greekAlphabet(ctr),
GetCodePoint(greekAlphabet(ctr)), bytes(ctr))
Next
End Sub
Private Function GetCodePoint(ch As String) As String
Dim retVal As String = "u+"
Dim bytes() As Byte = Encoding.Unicode.GetBytes(ch)
For ctr As Integer = bytes.Length - 1 To 0 Step -1
retVal += bytes(ctr).ToString("X2")
Next
Return retVal
End Function
End Module
' The example displays the following output:
' Character Unicode Code Point Code Page 1253
' Α u+0391 C1
' α u+03B1 E1
' Β u+0392 C2
' β u+03B2 E2
' Γ u+0393 C3
' γ u+03B3 E3
' Δ u+0394 C4
' δ u+03B4 E4
' Ε u+0395 C5
' ε u+03B5 E5
' Ζ u+0396 C6
' ζ u+03B6 E6
' Η u+0397 C7
' η u+03B7 E7
' Θ u+0398 C8
' θ u+03B8 E8
' Ι u+0399 C9
' ι u+03B9 E9
' Κ u+039A CA
' κ u+03BA EA
' Λ u+039B CB
' λ u+03BB EB
' Μ u+039C CC
' μ u+03BC EC
' Ν u+039D CD
' ν u+03BD ED
' Ξ u+039E CE
' ξ u+03BE EE
' Ο u+039F CF
' ο u+03BF EF
' Π u+03A0 D0
' π u+03C0 F0
' Ρ u+03A1 D1
' ρ u+03C1 F1
' Σ u+03A3 D3
' σ u+03C3 F3
' ς u+03C2 F2
' Τ u+03A4 D4
' τ u+03C4 F4
' Υ u+03A5 D5
' υ u+03C5 F5
' Φ u+03A6 D6
' φ u+03C6 F6
' Χ u+03A7 D7
' χ u+03C7 F7
' Ψ u+03A8 D8
' ψ u+03C8 F8
' Ω u+03A9 D9
' ω u+03C9 F9
Si les données à convertir sont disponibles uniquement dans des blocs séquentiels (par exemple, les données lues à partir d’un flux) ou si la quantité de données est tellement importante qu’elles doivent être divisées en blocs plus petits, vous devez utiliser le Decoder ou le Encoder fourni par la GetDecoder méthode ou la GetEncoder méthode, respectivement, d’une classe dérivée.
Les encodeurs UTF-16 et UTF-32 peuvent utiliser l’ordre d’octet de poids fort (octet le plus significatif en premier) ou l’ordre de primauté des octets de poids faible (octet le moins significatif en premier). Par exemple, la lettre majuscule latine A (U + 0041) est sérialisée comme suit (au format hexadécimal) :
Ordre d’octet UTF-16 Big endian : 00 41
Ordre d’octet UTF-16 Little endian : 41 00
UTF-32 Big endian, ordre d’octet : 00 00 00 41
UTF-32 Little endian, ordre des octets : 41 00 00 00
Il est généralement plus efficace de stocker des caractères Unicode à l’aide de l’ordre d’octet natif. Par exemple, il est préférable d’utiliser l’ordre d’octet avec primauté des octets de poids faible sur les plateformes Little endian, comme les ordinateurs Intel.
La GetPreamble méthode récupère un tableau d’octets qui comprend la marque d’ordre d’octet (BOM). Si ce tableau d’octets est préfixé à un flux encodé, il aide le décodeur à identifier le format d’encodage utilisé.
Pour plus d’informations sur l’ordre d’octet et la marque d’ordre d’octet, consultez la norme Unicode sur la page d’hébergement Unicode.
Notez que les classes d’encodage autorisent les erreurs à :
Passez en mode silencieux à un caractère « ? ».
Utilisez un caractère « ajuster ».
Passez à un comportement spécifique à l’application par le biais de l’utilisation des EncoderFallbackDecoderFallback classes et avec le caractère de remplacement Unicode U + FFFD.
Vous devez lever une exception en cas d’erreur de flux de données. Une application utilise un indicateur « throwOnError » le cas échéant, ou utilise EncoderExceptionFallback les DecoderExceptionFallback classes et. L’option de secours la mieux adaptée est souvent déconseillée, car elle peut entraîner une perte de données ou une confusion et est plus lente que les remplacements de caractères simples. Pour les encodages ANSI, le comportement le mieux adapté est le comportement par défaut.
Constructeurs
Encoding() |
Initialise une nouvelle instance de la classe Encoding. |
Encoding(Int32) |
Initialise une nouvelle instance de la classe Encoding qui correspond à la page de codes spécifiée. |
Encoding(Int32, EncoderFallback, DecoderFallback) |
Initialise une nouvelle instance de la classe Encoding qui correspond à la page de code spécifiée avec les stratégies de secours d'encodeur et de décodeur spécifiées. |
Propriétés
ASCII |
Obtient un encodage pour le jeu de caractères ASCII (7 bits). |
BigEndianUnicode |
Obtient un encodage pour le format UTF-16 qui utilise l'ordre d'octet avec primauté des octets de poids fort (big-endian). |
BodyName |
En cas de substitution dans une classe dérivée, obtient un nom pour l’encodage actuel qui peut être utilisé avec les étiquettes de corps de texte de l’agent de messagerie. |
CodePage |
En cas de substitution dans une classe dérivée, obtient l'identificateur de la page de codes du Encoding actuel. |
DecoderFallback |
Obtient ou définit l'objet DecoderFallback actuel de l'objet Encoding actuel. |
Default |
Obtient l’encodage par défaut pour cette implémentation .NET. |
EncoderFallback |
Obtient ou définit l'objet EncoderFallback actuel de l'objet Encoding actuel. |
EncodingName |
En cas de substitution dans une classe dérivée, obtient la description explicite de l'encodage actuel. |
HeaderName |
En cas de substitution dans une classe dérivée, obtient un nom pour l’encodage actuel qui peut être utilisé avec les étiquettes d’en-tête de l’agent de messagerie. |
IsBrowserDisplay |
En cas de substitution dans une classe dérivée, obtient une valeur indiquant si l'encodage actuel peut être utilisé par les clients de navigation pour afficher le contenu. |
IsBrowserSave |
En cas de substitution dans une classe dérivée, obtient une valeur indiquant si l'encodage actuel peut être utilisé par les clients de navigation pour enregistrer du contenu. |
IsMailNewsDisplay |
En cas de substitution dans une classe dérivée, obtient une valeur indiquant si l'encodage actuel peut être utilisé par les clients de messagerie et de news pour afficher du contenu. |
IsMailNewsSave |
En cas de substitution dans une classe dérivée, obtient une valeur indiquant si l'encodage actuel peut être utilisé par les clients de messagerie et de news pour enregistrer du contenu. |
IsReadOnly |
En cas de substitution dans une classe dérivée, obtient une valeur indiquant si l'encodage actuel est en lecture seule. |
IsSingleByte |
En cas de substitution dans une classe dérivée, obtient une valeur indiquant si l'encodage actuel utilise des points de code codés sur un octet. |
Latin1 |
Obtient un encodage pour le jeu de caractères Latin1 (ISO-8859-1). |
Preamble |
En cas de substitution dans une classe dérivée, retourne une étendue contenant la séquence d'octets qui spécifie l'encodage utilisé. |
Unicode |
Obtient un encodage pour le format UTF-16 avec primauté des octets de poids faible (little-endian). |
UTF32 |
Obtient un encodage pour le format UTF-32 avec primauté des octets de poids faible (little-endian). |
UTF7 |
Obsolète.
Obtient un encodage pour le format UTF-7. |
UTF8 |
Obtient un encodage pour le format UTF-8. |
WebName |
En cas de substitution dans une classe dérivée, obtient le nom inscrit auprès de l'IANA (Internet Assigned Numbers Authority) pour l'encodage actuel. |
WindowsCodePage |
En cas de substitution dans une classe dérivée, obtient la page de codes du système d'exploitation Windows la plus proche de l'encodage actuel. |
Méthodes
Clone() |
En cas de substitution dans une classe dérivée, crée une copie superficielle de l'objet Encoding actuel. |
Convert(Encoding, Encoding, Byte[]) |
Convertit un tableau d'octets entier d'un encodage à un autre. |
Convert(Encoding, Encoding, Byte[], Int32, Int32) |
Convertit une plage d'octets d'un encodage à un autre dans un tableau d'octets. |
CreateTranscodingStream(Stream, Encoding, Encoding, Boolean) |
Crée un Stream qui sert à transcoder des données entre un Encoding interne et un Encoding externe, semblable à Convert(Encoding, Encoding, Byte[]). |
Equals(Object) |
Détermine si le Object spécifié est égal à l'instance actuelle. |
GetByteCount(Char*, Int32) |
En cas de substitution dans une classe dérivée, calcule le nombre d'octets produits par l'encodage d'un jeu de caractères commençant au pointeur de caractère spécifié. |
GetByteCount(Char[]) |
En cas de substitution dans une classe dérivée, calcule le nombre d'octets produits par l'encodage de tous les caractères du tableau de caractères spécifié. |
GetByteCount(Char[], Int32, Int32) |
En cas de substitution dans une classe dérivée, calcule le nombre d'octets produits par l'encodage d'un jeu de caractères du tableau de caractères spécifié. |
GetByteCount(ReadOnlySpan<Char>) |
En cas de substitution dans une classe dérivée, calcule le nombre d'octets produits par l'encodage de tous les caractères de l’étendue de caractères spécifiée. |
GetByteCount(String) |
En cas de substitution dans une classe dérivée, calcule le nombre d'octets produits par l'encodage des caractères de la chaîne spécifiée. |
GetByteCount(String, Int32, Int32) |
En cas de substitution dans une classe dérivée, calcule le nombre d'octets produits par l'encodage d'un jeu de caractères de la chaîne spécifiée. |
GetBytes(Char*, Int32, Byte*, Int32) |
En cas de substitution dans une classe dérivée, encode un jeu de caractères commençant au pointeur de caractère spécifié en une séquence d'octets stockés à partir du pointeur d'octet spécifié. |
GetBytes(Char[]) |
En cas de substitution dans une classe dérivée, encode tous les caractères du tableau de caractères spécifié en une séquence d'octets. |
GetBytes(Char[], Int32, Int32) |
En cas de substitution dans une classe dérivée, encode un jeu de caractères du tableau de caractères spécifié en une séquence d'octets. |
GetBytes(Char[], Int32, Int32, Byte[], Int32) |
En cas de substitution dans une classe dérivée, encode un jeu de caractères du tableau de caractères spécifié en tableau d'octets. |
GetBytes(ReadOnlySpan<Char>, Span<Byte>) |
En cas de substitution dans une classe dérivée, encode un jeu de caractères du tableau de caractères en lecture seule spécifié en séquence d'octets. |
GetBytes(String) |
En cas de substitution dans une classe dérivée, encode tous les caractères de la chaîne spécifiée en une séquence d'octets. |
GetBytes(String, Int32, Int32) |
En cas de substitution dans une classe dérivée, encode en un tableau d'octets le nombre de caractères spécifié par |
GetBytes(String, Int32, Int32, Byte[], Int32) |
En cas de substitution dans une classe dérivée, encode un jeu de caractères de la chaîne spécifiée en tableau d'octets spécifié. |
GetCharCount(Byte*, Int32) |
En cas de substitution dans une classe dérivée, calcule le nombre de caractères produits par le décodage d'une séquence d'octets commençant au pointeur d'octet spécifié. |
GetCharCount(Byte[]) |
En cas de substitution dans une classe dérivée, calcule le nombre de caractères produits par le décodage de tous les octets du tableau d'octets spécifié. |
GetCharCount(Byte[], Int32, Int32) |
En cas de substitution dans une classe dérivée, calcule le nombre de caractères produits par le décodage d'une séquence d'octets du tableau d'octets spécifié. |
GetCharCount(ReadOnlySpan<Byte>) |
En cas de substitution dans une classe dérivée, calcule le nombre de caractères produits par le décodage de l’étendue d’octets en lecture seule fournie. |
GetChars(Byte*, Int32, Char*, Int32) |
En cas de substitution dans une classe dérivée, décode une séquence d'octets commençant au pointeur d'octet spécifié en un jeu de caractères stockés à partir du pointeur de caractère spécifié. |
GetChars(Byte[]) |
En cas de substitution dans une classe dérivée, décode tous les octets du tableau d'octets spécifié en jeu de caractères. |
GetChars(Byte[], Int32, Int32) |
En cas de substitution dans une classe dérivée, décode une séquence d'octets du tableau d'octets spécifié en un jeu de caractères. |
GetChars(Byte[], Int32, Int32, Char[], Int32) |
En cas de substitution dans une classe dérivée, décode une séquence d'octets du tableau d'octets spécifié en tableau de caractères spécifié. |
GetChars(ReadOnlySpan<Byte>, Span<Char>) |
En cas de substitution dans une classe dérivée, décode tous les octets de l’étendue d’octets en lecture seule spécifiée en jeu de caractères. |
GetDecoder() |
En cas de substitution dans une classe dérivée, obtient un décodeur qui convertit une séquence d'octets encodée en séquence de caractères. |
GetEncoder() |
En cas de substitution dans une classe dérivée, obtient un encodeur qui convertit une séquence de caractères Unicode en séquence d'octets encodée. |
GetEncoding(Int32) |
Retourne l'encodage associé à l'identificateur de page de codes spécifié. |
GetEncoding(Int32, EncoderFallback, DecoderFallback) |
Retourne l'encodage associé à l'identificateur de page de codes spécifié. Les paramètres spécifient un gestionnaire d'erreurs pour les caractères qui ne peuvent pas être encodés et pour les séquences d'octets qui ne peuvent pas être décodées. |
GetEncoding(String) |
Retourne l'encodage associé au nom de la page de codes spécifiée. |
GetEncoding(String, EncoderFallback, DecoderFallback) |
Retourne l'encodage associé au nom de la page de codes spécifiée. Les paramètres spécifient un gestionnaire d'erreurs pour les caractères qui ne peuvent pas être encodés et pour les séquences d'octets qui ne peuvent pas être décodées. |
GetEncodings() |
Retourne un tableau qui contient tous les encodages. |
GetHashCode() |
Retourne le code de hachage pour l'instance actuelle. |
GetMaxByteCount(Int32) |
En cas de substitution dans une classe dérivée, calcule le nombre maximal d'octets produits par l'encodage du nombre de caractères spécifié. |
GetMaxCharCount(Int32) |
En cas de substitution dans une classe dérivée, calcule le nombre maximal de caractères produits par le décodage du nombre de caractères spécifié. |
GetPreamble() |
En cas de substitution dans une classe dérivée, retourne une séquence d'octets qui spécifie l'encodage utilisé. |
GetString(Byte*, Int32) |
En cas de substitution dans une classe dérivée, décode un nombre d'octets spécifié en commençant à une adresse spécifiée dans une chaîne. |
GetString(Byte[]) |
En cas de substitution dans une classe dérivée, décode tous les octets du tableau d'octets spécifié en chaîne. |
GetString(Byte[], Int32, Int32) |
En cas de substitution dans une classe dérivée, décode une séquence d'octets du tableau d'octets spécifié en chaîne. |
GetString(ReadOnlySpan<Byte>) |
En cas de substitution dans une classe dérivée, décode tous les octets de l’étendue d'octets spécifiée en chaîne. |
GetType() |
Obtient le Type de l'instance actuelle. (Hérité de Object) |
IsAlwaysNormalized() |
Obtient une valeur indiquant si l'encodage actuel est toujours normalisé en utilisant le formulaire de normalisation par défaut. |
IsAlwaysNormalized(NormalizationForm) |
En cas de substitution dans une classe dérivée, obtient une valeur indiquant si l'encodage actuel est toujours normalisé en utilisant le formulaire de normalisation spécifié. |
MemberwiseClone() |
Crée une copie superficielle du Object actuel. (Hérité de Object) |
RegisterProvider(EncodingProvider) |
Enregistre un fournisseur d'encodage. |
ToString() |
Retourne une chaîne qui représente l'objet actuel. (Hérité de Object) |