Partilhar via


IdnMapping.GetAscii Método

Definição

Codifica uma cadeia de caracteres de rótulos de nome de domínio que incluem caracteres Unicode fora do intervalo de caracteres US-ASCII para uma cadeia de caracteres Unicode exibivel no intervalo de caracteres US-ASCII (U+0020 a U+007E). A cadeia de caracteres é formatada de acordo com o padrão IDNA.

Sobrecargas

Nome Description
GetAscii(String)

Codifica uma cadeia de caracteres de rótulos de nome de domínio que consistem em caracteres Unicode em uma cadeia de caracteres Unicode exibivel no intervalo de caracteres US-ASCII. A cadeia de caracteres é formatada de acordo com o padrão IDNA.

GetAscii(String, Int32)

Codifica uma subcadeia de caracteres de rótulos de nome de domínio que incluem caracteres Unicode fora do intervalo de caracteres US-ASCII. A subcadeia de caracteres é convertida em uma cadeia de caracteres Unicode exibivel no intervalo de caracteres US-ASCII e é formatada de acordo com o padrão IDNA.

GetAscii(String, Int32, Int32)

Codifica o número especificado de caracteres em uma subcadeia de caracteres de rótulos de nome de domínio que incluem caracteres Unicode fora do intervalo de caracteres US-ASCII. A subcadeia de caracteres é convertida em uma cadeia de caracteres Unicode exibivel no intervalo de caracteres US-ASCII e é formatada de acordo com o padrão IDNA.

GetAscii(String)

Origem:
IdnMapping.cs
Origem:
IdnMapping.cs
Origem:
IdnMapping.cs
Origem:
IdnMapping.cs
Origem:
IdnMapping.cs

Codifica uma cadeia de caracteres de rótulos de nome de domínio que consistem em caracteres Unicode em uma cadeia de caracteres Unicode exibivel no intervalo de caracteres US-ASCII. A cadeia de caracteres é formatada de acordo com o padrão IDNA.

public:
 System::String ^ GetAscii(System::String ^ unicode);
public string GetAscii(string unicode);
member this.GetAscii : string -> string
Public Function GetAscii (unicode As String) As String

Parâmetros

unicode
String

A cadeia de caracteres a ser convertida, que consiste em um ou mais rótulos de nome de domínio delimitados com separadores de rótulo.

Retornos

O equivalente da cadeia de caracteres especificada pelo unicode parâmetro, que consiste em caracteres Unicode exibiveis no intervalo de caracteres US-ASCII (U+0020 a U+007E) e formatado de acordo com o padrão IDNA.

Exceções

unicode é null.

unicode é inválido com base nas AllowUnassigned propriedades e UseStd3AsciiRules no padrão IDNA.

Exemplos

O exemplo a seguir usa o GetAscii(String) método para converter uma matriz de nomes de domínio internacionalizados em Punycode, que é um equivalente codificado que consiste em caracteres no intervalo de caracteres US-ASCII. Em GetUnicode(String) seguida, o método converte o nome de domínio punycode de volta no nome de domínio original, mas substitui os separadores de rótulo originais pelo separador de rótulo padrão.

using System;
using System.Globalization;

public class Example
{
   public static void Main()
   {
      string[] names = { "bücher.com", "мойдомен.рф", "παράδειγμα.δοκιμή",
                         "mycharity\u3002org",
                         "prose\u0000ware.com", "proseware..com", "a.org",
                         "my_company.com" };
      IdnMapping idn = new IdnMapping();

      foreach (var name in names) {
         try {
            string punyCode = idn.GetAscii(name);
            string name2 = idn.GetUnicode(punyCode);
            Console.WriteLine("{0} --> {1} --> {2}", name, punyCode, name2);
            Console.WriteLine("Original: {0}", ShowCodePoints(name));
            Console.WriteLine("Restored: {0}", ShowCodePoints(name2));
         }
         catch (ArgumentException) {
            Console.WriteLine("{0} is not a valid domain name.", name);
         }
         Console.WriteLine();
      }
   }

   private static string ShowCodePoints(string str1)
   {
      string output = "";
      foreach (var ch in str1)
         output += $"U+{(ushort)ch:X4} ";

      return output;
   }
}
// The example displays the following output:
//    bücher.com --> xn--bcher-kva.com --> bücher.com
//    Original: U+0062 U+00FC U+0063 U+0068 U+0065 U+0072 U+002E U+0063 U+006F U+006D
//    Restored: U+0062 U+00FC U+0063 U+0068 U+0065 U+0072 U+002E U+0063 U+006F U+006D
//
//    мойдомен.рф --> xn--d1acklchcc.xn--p1ai --> мойдомен.рф
//    Original: U+043C U+043E U+0439 U+0434 U+043E U+043C U+0435 U+043D U+002E U+0440 U+0444
//    Restored: U+043C U+043E U+0439 U+0434 U+043E U+043C U+0435 U+043D U+002E U+0440 U+0444
//
//    παράδειγμα.δοκιμή --> xn--hxajbheg2az3al.xn--jxalpdlp --> παράδειγμα.δοκιμή
//    Original: U+03C0 U+03B1 U+03C1 U+03AC U+03B4 U+03B5 U+03B9 U+03B3 U+03BC U+03B1 U+002E U+03B4 U+03BF U+03BA U+03B9 U+03BC U+03AE
//    Restored: U+03C0 U+03B1 U+03C1 U+03AC U+03B4 U+03B5 U+03B9 U+03B3 U+03BC U+03B1 U+002E U+03B4 U+03BF U+03BA U+03B9 U+03BC U+03AE
//
//    mycharity。org --> mycharity.org --> mycharity.org
//    Original: U+006D U+0079 U+0063 U+0068 U+0061 U+0072 U+0069 U+0074 U+0079 U+3002 U+006F U+0072 U+0067
//    Restored: U+006D U+0079 U+0063 U+0068 U+0061 U+0072 U+0069 U+0074 U+0079 U+002E U+006F U+0072 U+0067
//
//    prose ware.com is not a valid domain name.
//
//    proseware..com is not a valid domain name.
//
//    a.org --> a.org --> a.org
//    Original: U+0061 U+002E U+006F U+0072 U+0067
//    Restored: U+0061 U+002E U+006F U+0072 U+0067
//
//    my_company.com --> my_company.com --> my_company.com
//    Original: U+006D U+0079 U+005F U+0063 U+006F U+006D U+0070 U+0061 U+006E U+0079 U+002E U+0063 U+006F U+006D
//    Restored: U+006D U+0079 U+005F U+0063 U+006F U+006D U+0070 U+0061 U+006E U+0079 U+002E U+0063 U+006F U+006D
Imports System.Globalization

Module Example
   Public Sub Main()
      Dim names() As String = { "bücher.com", "мойдомен.рф", "παράδειγμα.δοκιμή",
                                "mycharity" + ChrW(&h3002) + "org",
                                "prose" + ChrW(0) + "ware.com", "proseware..com", "a.org", 
                                "my_company.com" }
      Dim idn As New IdnMapping()
      
      For Each name In names
         Try
            Dim punyCode As String = idn.GetAscii(name)
            Dim name2 As String = idn.GetUnicode(punyCode)
            Console.WriteLine("{0} --> {1} --> {2}", name, punyCode, name2) 
            Console.WriteLine("Original: {0}", ShowCodePoints(name))
            Console.WriteLine("Restored: {0}", ShowCodePoints(name2))
         Catch e As ArgumentException 
            Console.WriteLine("{0} is not a valid domain name.", name)
         End Try
         Console.WriteLine()
      Next   
   End Sub
   
   Private Function ShowCodePoints(str1 As String) As String
      Dim output As String = ""
      For Each ch In str1
         output += String.Format("U+{0} ", Convert.ToUInt16(ch).ToString("X4"))
      Next
      Return output
   End Function
End Module
' The example displays the following output:
'    bücher.com --> xn--bcher-kva.com --> bücher.com
'    Original: U+0062 U+00FC U+0063 U+0068 U+0065 U+0072 U+002E U+0063 U+006F U+006D
'    Restored: U+0062 U+00FC U+0063 U+0068 U+0065 U+0072 U+002E U+0063 U+006F U+006D
'    
'    мойдомен.рф --> xn--d1acklchcc.xn--p1ai --> мойдомен.рф
'    Original: U+043C U+043E U+0439 U+0434 U+043E U+043C U+0435 U+043D U+002E U+0440 U+0444
'    Restored: U+043C U+043E U+0439 U+0434 U+043E U+043C U+0435 U+043D U+002E U+0440 U+0444
'    
'    παράδειγμα.δοκιμή --> xn--hxajbheg2az3al.xn--jxalpdlp --> παράδειγμα.δοκιμή
'    Original: U+03C0 U+03B1 U+03C1 U+03AC U+03B4 U+03B5 U+03B9 U+03B3 U+03BC U+03B1 U+002E U+03B4 U+03BF U+03BA U+03B9 U+03BC U+03AE
'    Restored: U+03C0 U+03B1 U+03C1 U+03AC U+03B4 U+03B5 U+03B9 U+03B3 U+03BC U+03B1 U+002E U+03B4 U+03BF U+03BA U+03B9 U+03BC U+03AE
'    
'    mycharity。org --> mycharity.org --> mycharity.org
'    Original: U+006D U+0079 U+0063 U+0068 U+0061 U+0072 U+0069 U+0074 U+0079 U+3002 U+006F U+0072 U+0067
'    Restored: U+006D U+0079 U+0063 U+0068 U+0061 U+0072 U+0069 U+0074 U+0079 U+002E U+006F U+0072 U+0067
'    
'    prose ware.com is not a valid domain name.
'    
'    proseware..com is not a valid domain name.
'    
'    a.org --> a.org --> a.org
'    Original: U+0061 U+002E U+006F U+0072 U+0067
'    Restored: U+0061 U+002E U+006F U+0072 U+0067
'    
'    my_company.com --> my_company.com --> my_company.com
'    Original: U+006D U+0079 U+005F U+0063 U+006F U+006D U+0070 U+0061 U+006E U+0079 U+002E U+0063 U+006F U+006D
'    Restored: U+006D U+0079 U+005F U+0063 U+006F U+006D U+0070 U+0061 U+006E U+0079 U+002E U+0063 U+006F U+006D

Comentários

O unicode parâmetro especifica uma cadeia de caracteres de um ou mais rótulos que consistem em caracteres Unicode válidos. Os rótulos são separados por separadores de rótulo. O unicode parâmetro não pode começar com um separador de rótulo, mas pode incluir e, opcionalmente, terminar com um separador. Os separadores de rótulo são FULL STOP (period, U+002E), IDEOGRAPHIC FULL STOP (U+3002), FULLWIDTH FULL STOP (U+FF0E) e HALFWIDTH IDEOGRAPHIC FULL STOP (U+FF61). Por exemplo, o nome de domínio "www.adatum.com" consiste nos rótulos, "www", "adatum" e "com", separados por períodos.

Um rótulo não pode conter nenhum dos seguintes caracteres:

O GetAscii método converte todos os separadores de rótulo em FULL STOP (período, U+002E).

Se unicode não contiver caracteres fora do intervalo de caracteres US-ASCII e nenhum caractere dentro do intervalo de caracteres US-ASCII for proibido, o método retornará unicode inalterado.

Notas aos Chamadores

No .NET Framework 4.5, a IdnMapping classe dá suporte a diferentes versões do padrão IDNA, dependendo do sistema operacional em uso:

Consulte Unicode Technical Standard #46: Processamento de compatibilidade IDNA para obter as diferenças na maneira como esses padrões lidam com conjuntos específicos de caracteres.

Aplica-se a

GetAscii(String, Int32)

Origem:
IdnMapping.cs
Origem:
IdnMapping.cs
Origem:
IdnMapping.cs
Origem:
IdnMapping.cs
Origem:
IdnMapping.cs

Codifica uma subcadeia de caracteres de rótulos de nome de domínio que incluem caracteres Unicode fora do intervalo de caracteres US-ASCII. A subcadeia de caracteres é convertida em uma cadeia de caracteres Unicode exibivel no intervalo de caracteres US-ASCII e é formatada de acordo com o padrão IDNA.

public:
 System::String ^ GetAscii(System::String ^ unicode, int index);
public string GetAscii(string unicode, int index);
member this.GetAscii : string * int -> string
Public Function GetAscii (unicode As String, index As Integer) As String

Parâmetros

unicode
String

A cadeia de caracteres a ser convertida, que consiste em um ou mais rótulos de nome de domínio delimitados com separadores de rótulo.

index
Int32

Um deslocamento baseado em zero para unicode o qual especifica o início da subcadeia de caracteres a ser convertida. A operação de conversão continua até o final da cadeia de unicode caracteres.

Retornos

O equivalente da subcadeia de caracteres especificada pelos unicode parâmetros e index , consistindo em caracteres Unicode exibiveis no intervalo de caracteres US-ASCII (U+0020 a U+007E) e formatado de acordo com o padrão IDNA.

Exceções

unicode é null.

index é menor que zero.

- ou -

index é maior que o comprimento de unicode.

unicode é inválido com base nas AllowUnassigned propriedades e UseStd3AsciiRules no padrão IDNA.

Comentários

Os unicode parâmetros e index definem uma subcadeia de caracteres com um ou mais rótulos que consistem em caracteres Unicode válidos. Os rótulos são separados por separadores de rótulo. O primeiro caractere da subcadeia de caracteres não pode começar com um separador de rótulo, mas pode incluir e, opcionalmente, terminar com um separador. Os separadores de rótulo são FULL STOP (period, U+002E), IDEOGRAPHIC FULL STOP (U+3002), FULLWIDTH FULL STOP (U+FF0E) e HALFWIDTH IDEOGRAPHIC FULL STOP (U+FF61). Por exemplo, o nome de domínio "www.adatum.com" consiste nos rótulos, "www", "adatum" e "com", separados por períodos.

Um rótulo não pode conter nenhum dos seguintes caracteres:

O GetAscii método converte todos os separadores de rótulo em FULL STOP (período, U+002E).

Se unicode não contiver caracteres fora do intervalo de caracteres US-ASCII e nenhum caractere dentro do intervalo de caracteres US-ASCII for proibido, o método retornará unicode inalterado.

Notas aos Chamadores

No .NET Framework 4.5, a IdnMapping classe dá suporte a diferentes versões do padrão IDNA, dependendo do sistema operacional em uso:

Consulte Unicode Technical Standard #46: Processamento de compatibilidade IDNA para obter as diferenças na maneira como esses padrões lidam com conjuntos específicos de caracteres.

Aplica-se a

GetAscii(String, Int32, Int32)

Origem:
IdnMapping.cs
Origem:
IdnMapping.cs
Origem:
IdnMapping.cs
Origem:
IdnMapping.cs
Origem:
IdnMapping.cs

Codifica o número especificado de caracteres em uma subcadeia de caracteres de rótulos de nome de domínio que incluem caracteres Unicode fora do intervalo de caracteres US-ASCII. A subcadeia de caracteres é convertida em uma cadeia de caracteres Unicode exibivel no intervalo de caracteres US-ASCII e é formatada de acordo com o padrão IDNA.

public:
 System::String ^ GetAscii(System::String ^ unicode, int index, int count);
public string GetAscii(string unicode, int index, int count);
member this.GetAscii : string * int * int -> string
Public Function GetAscii (unicode As String, index As Integer, count As Integer) As String

Parâmetros

unicode
String

A cadeia de caracteres a ser convertida, que consiste em um ou mais rótulos de nome de domínio delimitados com separadores de rótulo.

index
Int32

Um deslocamento baseado em zero para unicode o qual especifica o início da subcadeia de caracteres.

count
Int32

O número de caracteres a serem convertidos na subcadeia de caracteres que começa na posição especificada pela index cadeia unicode de caracteres.

Retornos

O equivalente da subcadeia de caracteres especificada pelo unicode, indexe count parâmetros, consistindo de caracteres Unicode exibiveis no intervalo de caracteres US-ASCII (U+0020 a U+007E) e formatado de acordo com o padrão IDNA.

Exceções

unicode é null.

index ou count é menor que zero.

- ou -

index é maior que o comprimento de unicode.

- ou -

index é maior que o comprimento de unicode menos count.

unicode é inválido com base nas AllowUnassigned propriedades e UseStd3AsciiRules no padrão IDNA.

Exemplos

O exemplo a seguir usa o GetAscii(String, Int32, Int32) método para converter um nome de domínio internacionalizado em um nome de domínio que esteja em conformidade com o padrão IDNA. Em GetUnicode(String, Int32, Int32) seguida, o método converte o nome de domínio padronizado de volta no nome de domínio original, mas substitui os separadores de rótulo originais pelo separador de rótulo padrão.

// This example demonstrates the GetAscii and GetUnicode methods.
// For sake of illustration, this example uses the most complex
// form of those methods, not the most convenient.

using System;
using System.Globalization;

class Sample
{
    public static void Main()
    {
/*
   Define a domain name consisting of the labels: GREEK SMALL LETTER
   PI (U+03C0); IDEOGRAPHIC FULL STOP (U+3002); GREEK SMALL LETTER
   THETA (U+03B8); FULLWIDTH FULL STOP (U+FF0E); and "com".
*/
    string name = "\u03C0\u3002\u03B8\uFF0Ecom";
    string international;
    string nonInternational;

    string msg1 = "the original non-internationalized \ndomain name:";
    string msg2 = "Allow unassigned characters?:     {0}";
    string msg3 = "Use non-internationalized rules?: {0}";
    string msg4 = "Convert the non-internationalized domain name to international format...";
    string msg5 = "Display the encoded domain name:\n\"{0}\"";
    string msg6 = "the encoded domain name:";
    string msg7 = "Convert the internationalized domain name to non-international format...";
    string msg8 = "the reconstituted non-internationalized \ndomain name:";
    string msg9 = "Visually compare the code points of the reconstituted string to the " +
                  "original.\n" +
                  "Note that the reconstituted string contains standard label " +
                  "separators (U+002e).";
// ----------------------------------------------------------------------------
    CodePoints(name, msg1);
// ----------------------------------------------------------------------------

    IdnMapping idn = new IdnMapping();

    Console.WriteLine(msg2, idn.AllowUnassigned);
    Console.WriteLine(msg3, idn.UseStd3AsciiRules);
    Console.WriteLine();
// ----------------------------------------------------------------------------
    Console.WriteLine(msg4);
    international = idn.GetAscii(name, 0, name.Length);
    Console.WriteLine(msg5, international);
    Console.WriteLine();
    CodePoints(international, msg6);
// ----------------------------------------------------------------------------
    Console.WriteLine(msg7);
    nonInternational = idn.GetUnicode(international, 0, international.Length);
    CodePoints(nonInternational, msg8);
    Console.WriteLine(msg9);
    }
// ----------------------------------------------------------------------------
    static void CodePoints(string value, string title)
    {
    Console.WriteLine("Display the Unicode code points of {0}", title);
    foreach (char c in value)
        {
        Console.Write("{0:x4} ", Convert.ToInt32(c));
        }
        Console.WriteLine();
        Console.WriteLine();
    }
}
/*
This code example produces the following results:

Display the Unicode code points of the original non-internationalized
domain name:
03c0 3002 03b8 ff0e 0063 006f 006d

Allow unassigned characters?:     False
Use non-internationalized rules?: False

Convert the non-internationalized domain name to international format...
Display the encoded domain name:
"xn--1xa.xn--txa.com"

Display the Unicode code points of the encoded domain name:
0078 006e 002d 002d 0031 0078 0061 002e 0078 006e 002d 002d 0074 0078 0061 002e 0063 006f
006d

Convert the internationalized domain name to non-international format...
Display the Unicode code points of the reconstituted non-internationalized
domain name:
03c0 002e 03b8 002e 0063 006f 006d

Visually compare the code points of the reconstituted string to the original.
Note that the reconstituted string contains standard label separators (U+002e).

*/
' This example demonstrates the GetAscii and GetUnicode methods.
' For sake of illustration, this example uses the most complex
' form of those methods, not the most convenient.

Imports System.Globalization

Class Sample
    Public Shared Sub Main()

'   Define a domain name consisting of the labels: GREEK SMALL LETTER
'   PI (U+03C0); IDEOGRAPHIC FULL STOP (U+3002); GREEK SMALL LETTER
'   THETA (U+03B8); FULLWIDTH FULL STOP (U+FF0E); and "com".

        Dim name As String = "π。θ.com"
        Dim international As String
        Dim nonInternational As String

        Dim msg1 As String = "the original non-internationalized " & vbCrLf & "domain name:"
        Dim msg2 As String = "Allow unassigned characters?:     {0}"
        Dim msg3 As String = "Use non-internationalized rules?: {0}"
        Dim msg4 As String = "Convert the non-internationalized domain name to international format..."
        Dim msg5 As String = "Display the encoded domain name:" & vbCrLf & """{0}"""
        Dim msg6 As String = "the encoded domain name:"
        Dim msg7 As String = "Convert the internationalized domain name to non-international format..."
        Dim msg8 As String = "the reconstituted non-internationalized " & vbCrLf & "domain name:"
        Dim msg9 As String = "Visually compare the code points of the reconstituted string to the " & _
                             "original." & vbCrLf & _
                             "Note that the reconstituted string contains standard label " & _
                             "separators (U+002e)."
        ' ----------------------------------------------------------------------------
        CodePoints(name, msg1)
        ' ----------------------------------------------------------------------------
        Dim idn As New IdnMapping()

        Console.WriteLine(msg2, idn.AllowUnassigned)
        Console.WriteLine(msg3, idn.UseStd3AsciiRules)
        Console.WriteLine()
        ' ----------------------------------------------------------------------------
        Console.WriteLine(msg4)
        international = idn.GetAscii(name, 0, name.Length)
        Console.WriteLine(msg5, international)
        Console.WriteLine()
        CodePoints(international, msg6)
        ' ----------------------------------------------------------------------------
        Console.WriteLine(msg7)
        nonInternational = idn.GetUnicode(international, 0, international.Length)
        CodePoints(nonInternational, msg8)
        Console.WriteLine(msg9)
    End Sub

    ' ----------------------------------------------------------------------------
    Shared Sub CodePoints(ByVal value As String, ByVal title As String)
        Console.WriteLine("Display the Unicode code points of {0}", title)
        Dim c As Char
        For Each c In  value
            Console.Write("{0:x4} ", Convert.ToInt32(c))
        Next c
        Console.WriteLine()
        Console.WriteLine()

    End Sub
End Class
'
'This code example produces the following results:
'
'Display the Unicode code points of the original non-internationalized
'domain name:
'03c0 3002 03b8 ff0e 0063 006f 006d
'
'Allow unassigned characters?:     False
'Use non-internationalized rules?: False
'
'Convert the non-internationalized domain name to international format...
'Display the encoded domain name:
'"xn--1xa.xn--txa.com"
'
'Display the Unicode code points of the encoded domain name:
'0078 006e 002d 002d 0031 0078 0061 002e 0078 006e 002d 002d 0074 0078 0061 002e 0063 006f
'006d
'
'Convert the internationalized domain name to non-international format...
'Display the Unicode code points of the reconstituted non-internationalized
'domain name:
'03c0 002e 03b8 002e 0063 006f 006d
'
'Visually compare the code points of the reconstituted string to the original.
'Note that the reconstituted string contains standard label separators (U+002e).
'

Comentários

Os Unicodeparâmetros , indexe count definem uma subcadeia de caracteres com um ou mais rótulos que consistem em caracteres Unicode válidos. Os rótulos são separados por separadores de rótulo. O primeiro caractere da subcadeia de caracteres não pode começar com um separador de rótulo, mas pode incluir e, opcionalmente, terminar com um separador. Os separadores de rótulo são FULL STOP (period, U+002E), IDEOGRAPHIC FULL STOP (U+3002), FULLWIDTH FULL STOP (U+FF0E) e HALFWIDTH IDEOGRAPHIC FULL STOP (U+FF61). Por exemplo, o nome de domínio "www.adatum.com" consiste nos rótulos, "www", "adatum" e "com", separados por períodos.

Um rótulo não pode conter nenhum dos seguintes caracteres:

O GetAscii método converte todos os separadores de rótulo em FULL STOP (período, U+002E). Se a subcadeia de caracteres não contiver caracteres fora do intervalo de caracteres US-ASCII e nenhum caractere dentro do intervalo de caracteres US-ASCII for proibido, o método retornará a subcadeia de caracteres inalterada.

Notas aos Chamadores

No .NET Framework 4.5, a IdnMapping classe dá suporte a diferentes versões do padrão IDNA, dependendo do sistema operacional em uso:

Consulte Unicode Technical Standard #46: Processamento de compatibilidade IDNA para obter as diferenças na maneira como esses padrões lidam com conjuntos específicos de caracteres.

Aplica-se a