Encoding Classe
Définition
Important
Certaines informations portent sur la préversion du produit qui est susceptible d’être en grande partie modifiée avant sa publication. Microsoft exclut toute garantie, expresse ou implicite, concernant les informations fournies ici.
Représente un encodage de caractères.
public ref class Encoding abstract
public ref class Encoding abstract : ICloneable
public abstract class Encoding
public abstract class Encoding : ICloneable
[System.Serializable]
public abstract class Encoding
[System.Serializable]
[System.Runtime.InteropServices.ComVisible(true)]
public abstract class Encoding : ICloneable
type Encoding = class
type Encoding = class
interface ICloneable
[<System.Serializable>]
type Encoding = class
[<System.Serializable>]
[<System.Runtime.InteropServices.ComVisible(true)>]
type Encoding = class
interface ICloneable
Public MustInherit Class Encoding
Public MustInherit Class Encoding
Implements ICloneable
- Héritage
-
Encoding
- Dérivé
- Attributs
- Implémente
Exemples
L’exemple suivant convertit une chaîne d’un encodage en un autre.
Note
Le byte[] tableau est le seul type de cet exemple qui contient les données encodées. Les types .NET Char et String sont eux-mêmes Unicode. Par conséquent, l’appel GetChars décode les données en Unicode.
using System;
using System.Text;
class ConvertExample
{
static void Run()
{
string unicodeString = "This string contains the unicode character Pi (\u03a0)";
// Create two different encodings.
Encoding ascii = Encoding.ASCII;
Encoding unicode = Encoding.Unicode;
// Convert the string into a byte array.
byte[] unicodeBytes = unicode.GetBytes(unicodeString);
// Perform the conversion from one encoding to the other.
byte[] asciiBytes = Encoding.Convert(unicode, ascii, unicodeBytes);
// Convert the new byte[] into a char[] and then into a string.
char[] asciiChars = new char[ascii.GetCharCount(asciiBytes, 0, asciiBytes.Length)];
ascii.GetChars(asciiBytes, 0, asciiBytes.Length, asciiChars, 0);
string asciiString = new string(asciiChars);
// Display the strings created before and after the conversion.
Console.WriteLine("Original string: {0}", unicodeString);
Console.WriteLine("Ascii converted string: {0}", asciiString);
}
}
// The example displays the following output:
// Original string: This string contains the unicode character Pi (Π)
// Ascii converted string: This string contains the unicode character Pi (?)
Imports System.Text
Class Example1
Shared Sub Run()
Dim unicodeString As String = "This string contains the unicode character Pi (" & ChrW(&H03A0) & ")"
' Create two different encodings.
Dim ascii As Encoding = Encoding.ASCII
Dim unicode As Encoding = Encoding.Unicode
' Convert the string into a byte array.
Dim unicodeBytes As Byte() = unicode.GetBytes(unicodeString)
' Perform the conversion from one encoding to the other.
Dim asciiBytes As Byte() = Encoding.Convert(unicode, ascii, unicodeBytes)
' Convert the new byte array into a char array and then into a string.
Dim asciiChars(ascii.GetCharCount(asciiBytes, 0, asciiBytes.Length)-1) As Char
ascii.GetChars(asciiBytes, 0, asciiBytes.Length, asciiChars, 0)
Dim asciiString As New String(asciiChars)
' Display the strings created before and after the conversion.
Console.WriteLine("Original string: {0}", unicodeString)
Console.WriteLine("Ascii converted string: {0}", asciiString)
End Sub
End Class
' The example displays the following output:
' Original string: This string contains the unicode character Pi (Π)
' Ascii converted string: This string contains the unicode character Pi (?)
Remarques
La Encoding classe représente un encodage de caractères.
L’encodage est le processus de transformation d’un ensemble de caractères Unicode en une séquence d’octets. En revanche, le décodage est le processus de transformation d’une séquence d’octets encodés en un ensemble de caractères Unicode. Pour plus d’informations sur les formats de transformation Unicode (UTFs) et d’autres encodages pris en charge par Encoding, consultez Encodage de caractères dans .NET.
Encoding est destiné à fonctionner sur des caractères Unicode au lieu de données binaires arbitraires, telles que des tableaux d’octets. Si vous devez encoder des données binaires arbitraires en texte, vous devez utiliser un protocole tel que uuencode, qui est implémenté par des méthodes telles que Convert.ToBase64CharArray.
.NET fournit les implémentations suivantes de la Encoding classe pour prendre en charge les encodages Unicode actuels et d’autres encodages :
ASCIIEncoding encode les caractères Unicode en tant que caractères ASCII 7 bits uniques. Cet encodage prend uniquement en charge les valeurs de caractères comprises entre U+0000 et U+007F. Page de codes 20127. Disponible également via la propriété ASCII.
UTF7Encoding encode des caractères Unicode à l’aide de l’encodage UTF-7. Cet encodage prend en charge toutes les valeurs de caractères Unicode. Page de codes 65000. Disponible également via la propriété UTF7.
UTF8Encoding encode des caractères Unicode à l’aide de l’encodage UTF-8. Cet encodage prend en charge toutes les valeurs de caractères Unicode. Page de codes 65001. Disponible également via la propriété UTF8.
UnicodeEncoding encode des caractères Unicode à l’aide de l’encodage UTF-16. Les ordres des octets Little Endian et Big Endian sont pris en charge. Disponible également par le biais de la Unicode propriété et de la BigEndianUnicode propriété.
UTF32Encoding encode les caractères Unicode à l’aide de l’encodage UTF-32. Les ordres d’octets Little Endian (page de codes 12000) et Big Endian (page de codes 12001) sont pris en charge. Disponible également via la propriété UTF32.
La Encoding classe est principalement destinée à effectuer une conversion entre différents encodages et Unicode. Souvent, l’une des classes Unicode dérivées est le bon choix pour votre application.
Utilisez la GetEncoding méthode pour obtenir d’autres encodages et appelez la GetEncodings méthode pour obtenir la liste de tous les encodages.
Liste des encodages
Le tableau suivant répertorie les encodages pris en charge par .NET. Il répertorie le numéro de page de code de chaque encodage et les valeurs des propriétés EncodingInfo.Name et EncodingInfo.DisplayName de l’encodage. Une coche dans la prise en charge du .NET Framework, la prise en charge de .NET Core ou la prise en charge de .NET 5 et ultérieurs indique que la page de codes est prise en charge nativement par cette implémentation .NET, quelle que soit la plateforme sous-jacente. Pour .NET Framework, la disponibilité d’autres encodages répertoriés dans la table dépend du système d’exploitation. Pour .NET Core et .NET 5 et versions ultérieures, d’autres encodages sont disponibles à l’aide de la System.Text.CodePagesEncodingProvider classe ou en dérivant de la System.Text.EncodingProvider classe.
Note
Les pages de codes dont EncodingInfo.Name la propriété correspond à une norme internationale ne sont pas nécessairement conformes à cette norme.
| Page de codes | Nom | Nom d'affichage | Prise en charge du .NET Framework | Prise en charge de .NET Core | Prise en charge de .NET 5 et des versions ultérieures |
|---|---|---|---|---|---|
| 37 | IBM037 | IBM EBCDIC (US-Canada) | |||
| 437 | IBM437 | OEM États-Unis | |||
| 500 | IBM500 | IBM EBCDIC (International) | |||
| 708 | ASMO-708 | Arabe (ASMO 708) | |||
| 720 | DOS-720 | Arabe (DOS) | |||
| 7:37 | ibm737 | Grec (DOS) | |||
| 775 | ibm775 | Baltique (DOS) | |||
| 850 | ibm850 | Europe occidentale (DOS) | |||
| 852 | ibm852 | Europe centrale (DOS) | |||
| 855 | IBM855 | Cyrillique OEM | |||
| 857 | ibm857 | Turc (DOS) | |||
| 858 | IBM00858 | OEM Multilingue Latin I | |||
| 860 | IBM860 | Portugais (DOS) | |||
| 861 | ibm861 | Islandais (DOS) | |||
| 862 | DOS-862 | Hébreu (DOS) | |||
| 863 | IBM863 | Canadien français (DOS) | |||
| 864 | IBM864 | Arabe (864) | |||
| 865 | IBM865 | Nordique (DOS) | |||
| 866 | cp866 | Cyrillique (DOS) | |||
| 869 | ibm869 | Grec moderne (DOS) | |||
| 870 | IBM870 | IBM EBCDIC (Latin-2 multilingue) | |||
| 874 | windows-874 | Thaï (Windows) | |||
| 875 | cp875 | IBM EBCDIC (Grec Moderne) | |||
| 932 | shift_jis | Japonais (Shift-JIS) | |||
| 936 | gb2312 | Chinois simplifié (GB2312) | ✓ | ||
| 949 | ks_c_5601-1987 | Coréen | |||
| 950 | big5 | Chinois traditionnel (Big5) | |||
| 1026 | IBM1026 | IBM EBCDIC (Turc Latin-5) | |||
| 1047 | IBM01047 | IBM Latin-1 | |||
| 1140 | IBM01140 | IBM EBCDIC (US-Canada-Euro) | |||
| 1141 | IBM01141 | IBM EBCDIC (Germany-Euro) | |||
| 1142 | IBM01142 | IBM EBCDIC (Danemark-Norway-Euro) | |||
| 1143 | IBM01143 | IBM EBCDIC (Finlande-Sweden-Euro) | |||
| 1144 | IBM01144 | IBM EBCDIC (Italy-Euro) | |||
| 1145 | IBM01145 | IBM EBCDIC (Spain-Euro) | |||
| 1146 | IBM01146 | IBM EBCDIC (UK-Euro) | |||
| 1147 | IBM01147 | IBM EBCDIC (France-Euro) | |||
| 1148 | IBM01148 | IBM EBCDIC (International-Euro) | |||
| 1149 | IBM01149 | IBM EBCDIC (Icelandic-Euro) | |||
| 1 200 | utf-16 | Unicode | ✓ | ✓ | ✓ |
| 1201 | unicodeFFFE | Unicode (Big endian - ordonnancement des octets) | ✓ | ✓ | ✓ |
| 1250 | windows-1250 | Europe centrale (Windows) | |||
| 1251 | windows-1251 | Cyrillique (Windows) | |||
| 1252 | Windows-1252 | Europe occidentale (Windows) | ✓ | ||
| 1253 | windows-1253 | Grec (Windows) | |||
| 1254 | windows-1254 | Turc (Windows) | |||
| 1 255 | windows-1255 | Hébreu (Windows) | |||
| 1256 | windows-1256 | Arabe (Windows) | |||
| 1257 | windows-1257 | Baltique (Windows) | |||
| 1258 | windows-1258 | Vietnamien (Windows) | |||
| 1361 | Johab | Coréen (Johab) | |||
| 10000 | Macintosh | Europe occidentale (Mac) | |||
| 10001 | x-mac-japonais | Japonais (Mac) | |||
| 10002 | x-mac-chinoistrad | Chinois traditionnel (Mac) | |||
| 10003 | x-mac-coréen | Coréen (Mac) | ✓ | ||
| 10004 | x-mac-arabe | Arabe (Mac) | |||
| 10005 | x-mac-hébreu | Hébreu (Mac) | |||
| 10006 | x-mac-grec | Grec (Mac) | |||
| 10007 | x-mac-cyrillique | Cyrillique (Mac) | |||
| 10008 | x-mac-chinoissimp | Chinois simplifié (Mac) | ✓ | ||
| 10010 | x-mac-roumain | Roumain (Mac) | |||
| 10017 | x-mac-ukrainien | Ukrainien (Mac) | |||
| 10021 | x-mac-thaï | Thaï (Mac) | |||
| 10029 | x-mac-ce | Europe centrale (Mac) | |||
| 10079 | x-mac-islande | Islandais (Mac) | |||
| 10081 | x-mac-turc | Turc (Mac) | |||
| 10082 | x-mac-croatian | Croate (Mac) | |||
| 12 000 | utf-32 | Unicode (UTF-32) | ✓ | ✓ | ✓ |
| 12001 | utf-32BE | Unicode (UTF-32 Big endian) | ✓ | ✓ | ✓ |
| 20000 | x-Chinois-CNS | Chinois traditionnel (CNS) | |||
| 20001 | x-cp20001 | TCA Taïwan | |||
| 20002 | x-Chinois-Eten | Chinois traditionnel (Eten) | |||
| 20003 | x-cp20003 | IBM5550 Taïwan | |||
| 20004 | x-cp20004 | TeleText Taïwan | |||
| 20005 | x-cp20005 | Wang Taïwan | |||
| 20105 | x-IA5 | Europe occidentale (IA5) | |||
| 20106 | x-IA5-Allemand | Allemand (IA5) | |||
| 20107 | x-IA5-Suédois | Suédois (IA5) | |||
| 20108 | x-IA5-Norvégien | Norvégien (IA5) | |||
| 20127 | us-ascii | US-ASCII | ✓ | ✓ | ✓ |
| 20261 | x-cp20261 | T.61 | |||
| 20269 | x-cp20269 | ISO-6937 | |||
| 20273 | IBM273 | IBM EBCDIC (Allemagne) | |||
| 20277 | IBM277 | IBM EBCDIC (Denmark-Norway) | |||
| 20278 | IBM278 | IBM EBCDIC (Finland-Sweden) | |||
| 20280 | IBM280 | IBM EBCDIC (Italie) | |||
| 20284 | IBM284 | IBM EBCDIC (Espagne) | |||
| 20285 | IBM285 | IBM EBCDIC (Royaume-Uni) | |||
| 20290 | IBM290 | IBM EBCDIC (katakana japonais) | |||
| 20297 | IBM297 | IBM EBCDIC (France) | |||
| 20420 | IBM420 | IBM EBCDIC (arabe) | |||
| 20423 | IBM423 | IBM EBCDIC (Grec) | |||
| 20424 | IBM424 | IBM EBCDIC (hébreu) | |||
| 20833 | x-EBCDIC-CoréenÉtendu | IBM EBCDIC (coréen étendu) | |||
| 20838 | IBM-Thaï | IBM EBCDIC (Thaï) | |||
| 20866 | koi8-r | Cyrillique (KOI8-R) | |||
| 20871 | IBM871 | IBM EBCDIC (Islandais) | |||
| 20880 | IBM880 | IBM EBCDIC (Russe cyrillique) | |||
| 20905 | IBM905 | IBM EBCDIC (Turc) | |||
| 20924 | IBM00924 | IBM Latin-1 | |||
| 20932 | EUC-JP | Japonais (JIS 0208-1990 et 0212-1990) | |||
| 20936 | x-cp20936 | Chinois simplifié (GB2312-80) | ✓ | ||
| 20949 | x-cp20949 | Wansung coréen | ✓ | ||
| 21025 | cp1025 | IBM EBCDIC (Serbian-Bulgariancyrillique) | |||
| 21866 | koi8-u | Cyrillique (KOI8-U) | |||
| 28591 | iso-8859-1 | Europe occidentale (ISO) | ✓ | ✓ | ✓ |
| 28592 | iso-8859-2 | Europe centrale (ISO) | |||
| 28593 | iso-8859-3 | Latin 3 (ISO) | |||
| 28594 | iso-8859-4 | Baltique (ISO) | |||
| 28595 | iso-8859-5 | Cyrillique (ISO) | |||
| 28596 | iso-8859-6 | Arabe (ISO) | |||
| 28597 | iso-8859-7 | Grec (ISO) | |||
| 28598 | iso-8859-8 | Hébreu (ISO-Visual) | ✓ | ||
| 28599 | iso-8859-9 | Turc (ISO) | |||
| 28603 | iso-8859-13 | Estonien (ISO) | |||
| 28605 | iso-8859-15 | Latin 9 (ISO) | |||
| 29001 | x-Europa | Europe | |||
| 38598 | iso-8859-8-i | Hébreu (ISO-Logical) | ✓ | ||
| 50220 | iso-2022-jp | Japonais (JIS) | ✓ | ||
| 50221 | csISO2022JP | Japonais (JIS-Allow 1 octet Kana) | ✓ | ||
| 50222 | iso-2022-jp | Japonais (JIS-Allow 1 octet Kana - SO/SI) | ✓ | ||
| 50225 | iso-2022-kr | Coréen (ISO) | ✓ | ||
| 50227 | x-cp50227 | Chinois simplifié (ISO-2022) | ✓ | ||
| 51932 | euc-jp | Japonais (EUC) | ✓ | ||
| 51936 | EUC-CN | Chinois simplifié (EUC) | ✓ | ||
| 51949 | euc-kr | Coréen (EUC) | ✓ | ||
| 52,936 | hz-gb-2312 | Chinois simplifié (HZ) | ✓ | ||
| 54936 | GB18030 | Chinois simplifié (GB18030) | ✓ | ||
| 57002 | x-iscii-de | ISCII Devanagari | ✓ | ||
| 57003 | x-iscii-be | ISCII Bengali | ✓ | ||
| 57004 | x-iscii-ta | ISCII Tamoul | ✓ | ||
| 57005 | x-iscii-te | ISCII Telugu | ✓ | ||
| 57006 | x-iscii-as | ISCII Assamais | ✓ | ||
| 57007 | x-iscii-ou | ISCII Oriya | ✓ | ||
| 57008 | x-iscii-ka | ISCII Kannada | ✓ | ||
| 57009 | x-iscii-ma | ISCII Malayalam | ✓ | ||
| 57010 | x-iscii-gu | ISCII Gujarati | ✓ | ||
| 57011 | x-iscii-pa | norme de codage ISCII pour le pendjabi | ✓ | ||
| 65000 | utf-7 | Unicode (UTF-7) | ✓ | ✓ | |
| 65001 | utf-8 | Unicode (UTF-8) | ✓ | ✓ | ✓ |
L’exemple suivant appelle les méthodes GetEncoding(Int32) et GetEncoding(String) pour obtenir l’encodage de la page de codes grecque (Windows). Il compare les objets retournés par les appels de méthode Encoding pour montrer qu’ils sont égaux, puis affiche le point de code Unicode et la valeur de page de code correspondante pour chaque caractère de l’alphabet grec.
using System;
using System.Text;
public class GetEncodingExample
{
public static void Run()
{
Encoding enc = Encoding.GetEncoding(1253);
Encoding altEnc = Encoding.GetEncoding("windows-1253");
Console.WriteLine($"{enc.EncodingName} = Code Page {altEnc.CodePage}: {enc.Equals(altEnc)}");
string greekAlphabet = "Α α Β β Γ γ Δ δ Ε ε Ζ ζ Η η " +
"Θ θ Ι ι Κ κ Λ λ Μ μ Ν ν Ξ ξ " +
"Ο ο Π π Ρ ρ Σ σ ς Τ τ Υ υ " +
"Φ φ Χ χ Ψ ψ Ω ω";
Console.OutputEncoding = Encoding.UTF8;
byte[] bytes = enc.GetBytes(greekAlphabet);
Console.WriteLine("{0,-12} {1,20} {2,20:X2}", "Character",
"Unicode Code Point", "Code Page 1253");
for (int ctr = 0; ctr < bytes.Length; ctr++) {
if (greekAlphabet[ctr].Equals(' '))
continue;
Console.WriteLine("{0,-12} {1,20} {2,20:X2}", greekAlphabet[ctr],
GetCodePoint(greekAlphabet[ctr]), bytes[ctr]);
}
}
private static string GetCodePoint(char ch)
{
string retVal = "u+";
byte[] bytes = Encoding.Unicode.GetBytes(ch.ToString());
for (int ctr = bytes.Length - 1; ctr >= 0; ctr--)
retVal += bytes[ctr].ToString("X2");
return retVal;
}
}
// The example displays the following output:
// Character Unicode Code Point Code Page 1253
// Α u+0391 C1
// α u+03B1 E1
// Β u+0392 C2
// β u+03B2 E2
// Γ u+0393 C3
// γ u+03B3 E3
// Δ u+0394 C4
// δ u+03B4 E4
// Ε u+0395 C5
// ε u+03B5 E5
// Ζ u+0396 C6
// ζ u+03B6 E6
// Η u+0397 C7
// η u+03B7 E7
// Θ u+0398 C8
// θ u+03B8 E8
// Ι u+0399 C9
// ι u+03B9 E9
// Κ u+039A CA
// κ u+03BA EA
// Λ u+039B CB
// λ u+03BB EB
// Μ u+039C CC
// μ u+03BC EC
// Ν u+039D CD
// ν u+03BD ED
// Ξ u+039E CE
// ξ u+03BE EE
// Ο u+039F CF
// ο u+03BF EF
// Π u+03A0 D0
// π u+03C0 F0
// Ρ u+03A1 D1
// ρ u+03C1 F1
// Σ u+03A3 D3
// σ u+03C3 F3
// ς u+03C2 F2
// Τ u+03A4 D4
// τ u+03C4 F4
// Υ u+03A5 D5
// υ u+03C5 F5
// Φ u+03A6 D6
// φ u+03C6 F6
// Χ u+03A7 D7
// χ u+03C7 F7
// Ψ u+03A8 D8
// ψ u+03C8 F8
// Ω u+03A9 D9
// ω u+03C9 F9
Imports System.Text
Module Example2
Public Sub Run()
Dim enc As Encoding = Encoding.GetEncoding(1253)
Dim altEnc As Encoding = Encoding.GetEncoding("windows-1253")
Console.WriteLine("{0} = Code Page {1}: {2}", enc.EncodingName,
altEnc.CodePage, enc.Equals(altEnc))
Dim greekAlphabet As String = "Α α Β β Γ γ Δ δ Ε ε Ζ ζ Η η " +
"Θ θ Ι ι Κ κ Λ λ Μ μ Ν ν Ξ ξ " +
"Ο ο Π π Ρ ρ Σ σ ς Τ τ Υ υ " +
"Φ φ Χ χ Ψ ψ Ω ω"
Console.OutputEncoding = Encoding.UTF8
Dim bytes() As Byte = enc.GetBytes(greekAlphabet)
Console.WriteLine("{0,-12} {1,20} {2,20:X2}", "Character",
"Unicode Code Point", "Code Page 1253")
For ctr As Integer = 0 To bytes.Length - 1
If greekAlphabet(ctr).Equals(" "c) Then Continue For
Console.WriteLine("{0,-12} {1,20} {2,20:X2}", greekAlphabet(ctr),
GetCodePoint(greekAlphabet(ctr)), bytes(ctr))
Next
End Sub
Private Function GetCodePoint(ch As String) As String
Dim retVal As String = "u+"
Dim bytes() As Byte = Encoding.Unicode.GetBytes(ch)
For ctr As Integer = bytes.Length - 1 To 0 Step -1
retVal += bytes(ctr).ToString("X2")
Next
Return retVal
End Function
End Module
' The example displays the following output:
' Character Unicode Code Point Code Page 1253
' Α u+0391 C1
' α u+03B1 E1
' Β u+0392 C2
' β u+03B2 E2
' Γ u+0393 C3
' γ u+03B3 E3
' Δ u+0394 C4
' δ u+03B4 E4
' Ε u+0395 C5
' ε u+03B5 E5
' Ζ u+0396 C6
' ζ u+03B6 E6
' Η u+0397 C7
' η u+03B7 E7
' Θ u+0398 C8
' θ u+03B8 E8
' Ι u+0399 C9
' ι u+03B9 E9
' Κ u+039A CA
' κ u+03BA EA
' Λ u+039B CB
' λ u+03BB EB
' Μ u+039C CC
' μ u+03BC EC
' Ν u+039D CD
' ν u+03BD ED
' Ξ u+039E CE
' ξ u+03BE EE
' Ο u+039F CF
' ο u+03BF EF
' Π u+03A0 D0
' π u+03C0 F0
' Ρ u+03A1 D1
' ρ u+03C1 F1
' Σ u+03A3 D3
' σ u+03C3 F3
' ς u+03C2 F2
' Τ u+03A4 D4
' τ u+03C4 F4
' Υ u+03A5 D5
' υ u+03C5 F5
' Φ u+03A6 D6
' φ u+03C6 F6
' Χ u+03A7 D7
' χ u+03C7 F7
' Ψ u+03A8 D8
' ψ u+03C8 F8
' Ω u+03A9 D9
' ω u+03C9 F9
Si les données à convertir sont disponibles uniquement sous forme de blocs séquentiels (par exemple, les données lues à partir d'un flux) ou si la quantité de données est si importante qu'elle doit être divisée en blocs plus petits, vous devez utiliser la méthode Decoder ou la méthode Encoder fournie, respectivement, par la méthode GetDecoder ou la méthode GetEncoder d'une classe dérivée.
Les encodeurs UTF-16 et UTF-32 peuvent utiliser l’ordre d’octets big endian (octet le plus significatif en premier) ou l’ordre d’octets little endian (octet le moins significatif en premier). Par exemple, la lettre majuscule latine A (U+0041) est sérialisée comme suit (en hexadécimal) :
- Ordre des octets UTF-16 Big Endian : 00 41
- Ordre des octets UTF-16 Little Endian : 41 00
- Ordre des octets UTF-32 Big Endian : 00 00 00 41
- Ordre des octets UTF-32 Little Endian : 41 00 00 00
Il est généralement plus efficace de stocker des caractères Unicode à l’aide de l’ordre d’octet natif. Par exemple, il est préférable d’utiliser l’ordre d’octets little endian sur les plateformes little endian, telles que les ordinateurs Intel.
La GetPreamble méthode récupère un tableau d’octets qui inclut la marque d’ordre d’octets (BOM). Si ce tableau d’octets est précédé d’un flux encodé, il aide le décodeur à identifier le format d’encodage utilisé.
Pour plus d’informations sur l’ordre d’octet et la marque d’ordre d’octet, consultez la norme Unicode sur la page d’accueil Unicode.
Notez que les classes d’encodage autorisent les erreurs à :
- Modifier discrètement par un caractère « ? ».
- Utiliser le caractère « le plus adapté ».
- Changer pour un comportement spécifique à l'application en utilisant les classes EncoderFallback et DecoderFallback avec le caractère de remplacement Unicode U+FFFD.
Vous devez lever une exception sur toute erreur de flux de données. Une application utilise un indicateur « throwonerror » le cas échéant ou les classes EncoderExceptionFallback et DecoderExceptionFallback. La meilleure solution de secours n’est souvent pas recommandée, car elle peut entraîner une perte de données ou une confusion et est plus lente que les remplacements de caractères simples. Pour les encodages ANSI, le meilleur comportement d’ajustement est la valeur par défaut.
Constructeurs
| Nom | Description |
|---|---|
| Encoding() |
Initialise une nouvelle instance de la classe Encoding. |
| Encoding(Int32, EncoderFallback, DecoderFallback) |
Initialise une nouvelle instance de la Encoding classe qui correspond à la page de codes spécifiée avec les stratégies de secours de l’encodeur et du décodeur spécifiés. |
| Encoding(Int32) |
Initialise une nouvelle instance de la Encoding classe qui correspond à la page de codes spécifiée. |
Propriétés
| Nom | Description |
|---|---|
| ASCII |
Obtient un encodage pour le jeu de caractères ASCII (7 bits). |
| BigEndianUnicode |
Obtient un encodage pour le format UTF-16 qui utilise l’ordre d’octets big endian. |
| BodyName |
En cas de substitution dans une classe dérivée, obtient un nom pour l’encodage actuel qui peut être utilisé avec des balises de corps de l’agent de messagerie. |
| CodePage |
En cas de substitution dans une classe dérivée, obtient l’identificateur de la page de codes du fichier actif Encoding. |
| DecoderFallback |
Obtient ou définit l’objet DecoderFallback de l’objet actif Encoding . |
| Default |
Obtient l’encodage par défaut pour cette implémentation .NET. |
| EncoderFallback |
Obtient ou définit l’objet EncoderFallback de l’objet actif Encoding . |
| EncodingName |
En cas de substitution dans une classe dérivée, obtient la description lisible par l’homme de l’encodage actuel. |
| HeaderName |
En cas de substitution dans une classe dérivée, obtient un nom pour l’encodage actuel qui peut être utilisé avec les balises d’en-tête de l’agent de messagerie. |
| IsBrowserDisplay |
En cas de substitution dans une classe dérivée, obtient une valeur indiquant si l’encodage actuel peut être utilisé par les clients de navigateur pour afficher du contenu. |
| IsBrowserSave |
En cas de substitution dans une classe dérivée, obtient une valeur indiquant si l’encodage actuel peut être utilisé par les clients de navigateur pour enregistrer du contenu. |
| IsMailNewsDisplay |
En cas de substitution dans une classe dérivée, obtient une valeur indiquant si l’encodage actuel peut être utilisé par les clients de messagerie et d’actualités pour afficher du contenu. |
| IsMailNewsSave |
En cas de substitution dans une classe dérivée, obtient une valeur indiquant si l’encodage actuel peut être utilisé par les clients de messagerie et d’actualités pour enregistrer du contenu. |
| IsReadOnly |
En cas de substitution dans une classe dérivée, obtient une valeur indiquant si l’encodage actuel est en lecture seule. |
| IsSingleByte |
En cas de substitution dans une classe dérivée, obtient une valeur indiquant si l’encodage actuel utilise des points de code à octet unique. |
| Latin1 |
Obtient un encodage pour le jeu de caractères Latin1 (ISO-8859-1). |
| Preamble |
En cas de substitution dans une classe dérivée, retourne une étendue contenant la séquence d’octets qui spécifie l’encodage utilisé. |
| Unicode |
Obtient un encodage pour le format UTF-16 à l’aide de l’ordre d’octet petit endian. |
| UTF32 |
Obtient un encodage pour le format UTF-32 à l’aide de l’ordre d’octet petit endian. |
| UTF7 |
Obsolète.
Obtient un encodage pour le format UTF-7. |
| UTF8 |
Obtient un encodage pour le format UTF-8. |
| WebName |
En cas de substitution dans une classe dérivée, obtient le nom inscrit auprès de l’IANA (Internet Assigned Numbers Authority) pour l’encodage actuel. |
| WindowsCodePage |
En cas de substitution dans une classe dérivée, obtient la page de codes du système d’exploitation Windows qui correspond le plus étroitement à l’encodage actuel. |
Méthodes
| Nom | Description |
|---|---|
| Clone() |
En cas de substitution dans une classe dérivée, crée une copie superficielle de l’objet actuel Encoding . |
| Convert(Encoding, Encoding, Byte[], Int32, Int32) |
Convertit une plage d’octets dans un tableau d’octets d’un encodage à un autre. |
| Convert(Encoding, Encoding, Byte[]) |
Convertit un tableau d’octets entier d’un encodage en un autre. |
| CreateTranscodingStream(Stream, Encoding, Encoding, Boolean) |
Crée un Stream qui sert à transcoder des données entre un élément interne et un extérieur EncodingEncoding, similaire à Convert(Encoding, Encoding, Byte[]). |
| Equals(Object) |
Détermine si le spécifié Object est égal à l’instance actuelle. |
| GetByteCount(Char[], Int32, Int32) |
En cas de substitution dans une classe dérivée, calcule le nombre d’octets produits par l’encodage d’un jeu de caractères à partir du tableau de caractères spécifié. |
| GetByteCount(Char[]) |
En cas de substitution dans une classe dérivée, calcule le nombre d’octets produits par l’encodage de tous les caractères du tableau de caractères spécifié. |
| GetByteCount(Char*, Int32) |
En cas de substitution dans une classe dérivée, calcule le nombre d’octets produits par l’encodage d’un jeu de caractères commençant par le pointeur de caractères spécifié. |
| GetByteCount(ReadOnlySpan<Char>) |
En cas de substitution dans une classe dérivée, calcule le nombre d’octets produits par l’encodage des caractères dans l’étendue de caractères spécifiée. |
| GetByteCount(String, Int32, Int32) |
En cas de substitution dans une classe dérivée, calcule le nombre d’octets produits par l’encodage d’un jeu de caractères à partir de la chaîne spécifiée. |
| GetByteCount(String) |
En cas de substitution dans une classe dérivée, calcule le nombre d’octets produits par l’encodage des caractères dans la chaîne spécifiée. |
| GetBytes(Char[], Int32, Int32, Byte[], Int32) |
En cas de substitution dans une classe dérivée, encode un jeu de caractères du tableau de caractères spécifié dans le tableau d’octets spécifié. |
| GetBytes(Char[], Int32, Int32) |
En cas de substitution dans une classe dérivée, encode un jeu de caractères du tableau de caractères spécifié dans une séquence d’octets. |
| GetBytes(Char[]) |
En cas de substitution dans une classe dérivée, encode tous les caractères du tableau de caractères spécifié dans une séquence d’octets. |
| GetBytes(Char*, Int32, Byte*, Int32) |
En cas de substitution dans une classe dérivée, encode un jeu de caractères commençant par le pointeur de caractères spécifié dans une séquence d’octets stockées à partir du pointeur d’octet spécifié. |
| GetBytes(ReadOnlySpan<Char>, Span<Byte>) |
En cas de substitution dans une classe dérivée, encode dans une étendue d’octets un jeu de caractères de l’étendue en lecture seule spécifiée. |
| GetBytes(String, Int32, Int32, Byte[], Int32) |
En cas de substitution dans une classe dérivée, encode un jeu de caractères de la chaîne spécifiée dans le tableau d’octets spécifié. |
| GetBytes(String, Int32, Int32) |
En cas de substitution dans une classe dérivée, encode dans un tableau d’octets le nombre de caractères spécifié par |
| GetBytes(String) |
En cas de substitution dans une classe dérivée, encode tous les caractères de la chaîne spécifiée dans une séquence d’octets. |
| GetCharCount(Byte[], Int32, Int32) |
En cas de substitution dans une classe dérivée, calcule le nombre de caractères produits par le décodage d’une séquence d’octets à partir du tableau d’octets spécifié. |
| GetCharCount(Byte[]) |
En cas de substitution dans une classe dérivée, calcule le nombre de caractères produits par le décodage de tous les octets du tableau d’octets spécifié. |
| GetCharCount(Byte*, Int32) |
En cas de substitution dans une classe dérivée, calcule le nombre de caractères produits par le décodage d’une séquence d’octets commençant au pointeur d’octet spécifié. |
| GetCharCount(ReadOnlySpan<Byte>) |
En cas de substitution dans une classe dérivée, calcule le nombre de caractères produits par le décodage de l’étendue d’octets en lecture seule fournie. |
| GetChars(Byte[], Int32, Int32, Char[], Int32) |
En cas de substitution dans une classe dérivée, décode une séquence d’octets du tableau d’octets spécifié dans le tableau de caractères spécifié. |
| GetChars(Byte[], Int32, Int32) |
En cas de substitution dans une classe dérivée, décode une séquence d’octets du tableau d’octets spécifié en un ensemble de caractères. |
| GetChars(Byte[]) |
En cas de substitution dans une classe dérivée, décode tous les octets du tableau d’octets spécifié en un ensemble de caractères. |
| GetChars(Byte*, Int32, Char*, Int32) |
En cas de substitution dans une classe dérivée, décode une séquence d’octets commençant par le pointeur d’octet spécifié dans un ensemble de caractères stockés à partir du pointeur de caractères spécifié. |
| GetChars(ReadOnlySpan<Byte>, Span<Char>) |
En cas de substitution dans une classe dérivée, décode tous les octets de l’étendue d’octets en lecture seule spécifiée dans une étendue de caractères. |
| GetDecoder() |
En cas de substitution dans une classe dérivée, obtient un décodeur qui convertit une séquence codée d’octets en une séquence de caractères. |
| GetEncoder() |
En cas de substitution dans une classe dérivée, obtient un encodeur qui convertit une séquence de caractères Unicode en séquence codée d’octets. |
| GetEncoding(Int32, EncoderFallback, DecoderFallback) |
Retourne l’encodage associé à l’identificateur de page de codes spécifié. Les paramètres spécifient un gestionnaire d’erreurs pour les caractères qui ne peuvent pas être encodés et des séquences d’octets qui ne peuvent pas être décodées. |
| GetEncoding(Int32) |
Retourne l’encodage associé à l’identificateur de page de codes spécifié. |
| GetEncoding(String, EncoderFallback, DecoderFallback) |
Retourne l’encodage associé au nom de la page de codes spécifiée. Les paramètres spécifient un gestionnaire d’erreurs pour les caractères qui ne peuvent pas être encodés et des séquences d’octets qui ne peuvent pas être décodées. |
| GetEncoding(String) |
Retourne l’encodage associé au nom de la page de codes spécifiée. |
| GetEncodings() |
Retourne un tableau qui contient tous les encodages. |
| GetHashCode() |
Retourne le code de hachage de l’instance actuelle. |
| GetMaxByteCount(Int32) |
En cas de substitution dans une classe dérivée, calcule le nombre maximal d’octets générés par l’encodage du nombre spécifié de caractères. |
| GetMaxCharCount(Int32) |
En cas de substitution dans une classe dérivée, calcule le nombre maximal de caractères produits par le décodage du nombre spécifié d’octets. |
| GetPreamble() |
En cas de substitution dans une classe dérivée, retourne une séquence d’octets qui spécifie l’encodage utilisé. |
| GetString(Byte[], Int32, Int32) |
En cas de substitution dans une classe dérivée, décode une séquence d’octets du tableau d’octets spécifié dans une chaîne. |
| GetString(Byte[]) |
En cas de substitution dans une classe dérivée, décode tous les octets du tableau d’octets spécifié dans une chaîne. |
| GetString(Byte*, Int32) |
En cas de substitution dans une classe dérivée, décode un nombre spécifié d’octets à partir d’une adresse spécifiée dans une chaîne. |
| GetString(ReadOnlySpan<Byte>) |
En cas de substitution dans une classe dérivée, décode tous les octets de l’étendue d’octets spécifiée dans une chaîne. |
| GetType() |
Obtient la Type de l’instance actuelle. (Hérité de Object) |
| IsAlwaysNormalized() |
Obtient une valeur indiquant si l’encodage actuel est toujours normalisé, à l’aide du formulaire de normalisation par défaut. |
| IsAlwaysNormalized(NormalizationForm) |
En cas de substitution dans une classe dérivée, obtient une valeur indiquant si l’encodage actuel est toujours normalisé, à l’aide du formulaire de normalisation spécifié. |
| MemberwiseClone() |
Crée une copie superficielle du Objectactuel. (Hérité de Object) |
| RegisterProvider(EncodingProvider) |
Inscrit un fournisseur d’encodage. |
| ToString() |
Retourne une chaîne qui représente l’objet actuel. (Hérité de Object) |
| TryGetBytes(ReadOnlySpan<Char>, Span<Byte>, Int32) |
Encode dans une étendue d’octets un jeu de caractères de l’étendue en lecture seule spécifiée si la destination est suffisamment grande. |
| TryGetChars(ReadOnlySpan<Byte>, Span<Char>, Int32) |
Décode dans une étendue de caractères un ensemble d’octets de l’étendue en lecture seule spécifiée si la destination est suffisamment grande. |
Méthodes d’extension
| Nom | Description |
|---|---|
| GetBytes(Encoding, ReadOnlySequence<Char>, IBufferWriter<Byte>) |
Décode la valeur spécifiée ReadOnlySequence<T> à |
| GetBytes(Encoding, ReadOnlySequence<Char>, Span<Byte>) |
Encode le paramètre spécifié ReadOnlySequence<T> à |
| GetBytes(Encoding, ReadOnlySequence<Char>) |
Encode le spécifié ReadOnlySequence<T> dans un Byte tableau à l’aide de l’élément spécifié Encoding. |
| GetBytes(Encoding, ReadOnlySpan<Char>, IBufferWriter<Byte>) |
Encode le contenu spécifié ReadOnlySpan<T> à l’aide du résultat spécifié |
| GetChars(Encoding, ReadOnlySequence<Byte>, IBufferWriter<Char>) |
Décode la valeur spécifiée ReadOnlySequence<T> à |
| GetChars(Encoding, ReadOnlySequence<Byte>, Span<Char>) |
Décode les valeurs spécifiées ReadOnlySequence<T> à |
| GetChars(Encoding, ReadOnlySpan<Byte>, IBufferWriter<Char>) |
Décode la valeur spécifiée ReadOnlySpan<T> à |
| GetString(Encoding, ReadOnlySequence<Byte>) |
Décode le spécifié ReadOnlySequence<T> en String utilisant le fichier spécifié Encoding. |