Aracılığıyla paylaş


StringInfo.ParseCombiningCharacters(String) Yöntem

Tanım

Belirtilen dize içindeki her bir temel karakterin, yüksek vekilin veya denetim karakterinin dizinlerini döndürür.

public:
 static cli::array <int> ^ ParseCombiningCharacters(System::String ^ str);
public static int[] ParseCombiningCharacters(string str);
static member ParseCombiningCharacters : string -> int[]
Public Shared Function ParseCombiningCharacters (str As String) As Integer()

Parametreler

str
String

Aranacak dize.

Döndürülenler

Int32[]

Belirtilen dize içindeki her bir temel karakterin, yüksek vekilin veya denetim karakterinin sıfır tabanlı dizinlerini içeren bir tamsayı dizisi.

Özel durumlar

str, null'e eşittir.

Örnekler

Aşağıdaki örnekte yönteminin çağrılması gösterilmektedir ParseCombiningCharacters . Bu kod örneği, sınıfı için StringInfo sağlanan daha büyük bir örneğin parçasıdır.

using System;
using System.Text;
using System.Globalization;

public sealed class App {
   static void Main() {
      // The string below contains combining characters.
      String s = "a\u0304\u0308bc\u0327";

      // Show each 'character' in the string.
      EnumTextElements(s);

      // Show the index in the string where each 'character' starts.
      EnumTextElementIndexes(s);
   }

   // Show how to enumerate each real character (honoring surrogates) in a string.
   static void EnumTextElements(String s) {
      // This StringBuilder holds the output results.
      StringBuilder sb = new StringBuilder();

      // Use the enumerator returned from GetTextElementEnumerator
      // method to examine each real character.
      TextElementEnumerator charEnum = StringInfo.GetTextElementEnumerator(s);
      while (charEnum.MoveNext()) {
         sb.AppendFormat(
           "Character at index {0} is '{1}'{2}",
           charEnum.ElementIndex, charEnum.GetTextElement(),
           Environment.NewLine);
      }

      // Show the results.
      Console.WriteLine("Result of GetTextElementEnumerator:");
      Console.WriteLine(sb);
   }

   // Show how to discover the index of each real character (honoring surrogates) in a string.
   static void EnumTextElementIndexes(String s) {
      // This StringBuilder holds the output results.
      StringBuilder sb = new StringBuilder();

      // Use the ParseCombiningCharacters method to
      // get the index of each real character in the string.
      Int32[] textElemIndex = StringInfo.ParseCombiningCharacters(s);

      // Iterate through each real character showing the character and the index where it was found.
      for (Int32 i = 0; i < textElemIndex.Length; i++) {
         sb.AppendFormat(
            "Character {0} starts at index {1}{2}",
            i, textElemIndex[i], Environment.NewLine);
      }

      // Show the results.
      Console.WriteLine("Result of ParseCombiningCharacters:");
      Console.WriteLine(sb);
   }
}

// This code produces the following output:
//
// Result of GetTextElementEnumerator:
// Character at index 0 is 'ā̈'
// Character at index 3 is 'b'
// Character at index 4 is 'ç'
//
// Result of ParseCombiningCharacters:
// Character 0 starts at index 0
// Character 1 starts at index 3
// Character 2 starts at index 4
Imports System.Text
Imports System.Globalization

Public Module Example
   Public Sub Main()
      ' The string below contains combining characters.
      Dim s As String = "a" + ChrW(&h0304) + ChrW(&h0308) + "bc" + ChrW(&h0327)

      ' Show each 'character' in the string.
      EnumTextElements(s)

      ' Show the index in the string where each 'character' starts.
      EnumTextElementIndexes(s)
   End Sub

   ' Show how to enumerate each real character (honoring surrogates) in a string.
   Sub EnumTextElements(s As String)
      ' This StringBuilder holds the output results.
      Dim sb As New StringBuilder()

      ' Use the enumerator returned from GetTextElementEnumerator 
      ' method to examine each real character.
      Dim charEnum As TextElementEnumerator = StringInfo.GetTextElementEnumerator(s)
      Do While charEnum.MoveNext()
         sb.AppendFormat("Character at index {0} is '{1}'{2}",
                         charEnum.ElementIndex, 
                         charEnum.GetTextElement(),
                         Environment.NewLine)
      Loop

      ' Show the results.
      Console.WriteLine("Result of GetTextElementEnumerator:")
      Console.WriteLine(sb)
   End Sub

   ' Show how to discover the index of each real character (honoring surrogates) in a string.
   Sub EnumTextElementIndexes(s As String)
      ' This StringBuilder holds the output results.
      Dim sb As New StringBuilder()

      ' Use the ParseCombiningCharacters method to 
      ' get the index of each real character in the string.
      Dim textElemIndex() As Integer = StringInfo.ParseCombiningCharacters(s)

      ' Iterate through each real character showing the character and the index where it was found.
      For i As Int32 = 0 To textElemIndex.Length - 1
         sb.AppendFormat("Character {0} starts at index {1}{2}",
                         i, textElemIndex(i), Environment.NewLine)
      Next

      ' Show the results.
      Console.WriteLine("Result of ParseCombiningCharacters:")
      Console.WriteLine(sb)
   End Sub
End Module
' The example displays the following output:
'
'       Result of GetTextElementEnumerator:
'       Character at index 0 is 'ā̈'
'       Character at index 3 is 'b'
'       Character at index 4 is 'ç'
'       
'       Result of ParseCombiningCharacters:
'       Character 0 starts at index 0
'       Character 1 starts at index 3
'       Character 2 starts at index 4

Açıklamalar

Unicode Standardı, bir vekil çifti, çiftin ilk biriminin yüksek vekil, ikincisinin ise düşük vekil olduğu iki kod birimi dizisini içeren tek bir soyut karakter için kodlanmış karakter gösterimi olarak tanımlar. Yüksek vekil U+D800 ile U+DBFF aralığındaki bir Unicode kod noktasıdır ve düşük vekil U+DC00 ile U+DFFF aralığındaki bir Unicode kod noktasıdır.

Denetim karakteri, Unicode değerinin U+007F veya U+0000 ile U+001F veya U+0080 - U+009F aralığında yer aldığı bir karakterdir.

.NET, bir metin öğesini tek bir karakter, yani grafeme olarak görüntülenen bir metin birimi olarak tanımlar. Metin öğesi bir temel karakter, vekil çift veya birleşen karakter dizisi olabilir. Unicode Standart, bir birleştirme karakter dizisini bir temel karakter ve bir veya daha fazla birleştirme karakterinin birleşimi olarak tanımlar. Vekil çift, bir temel karakteri veya birleşen karakteri temsil edebilir.

Bir birleştirme karakter dizisi geçersizse, bu dizideki her bir birleştirme karakteri de döndürülür.

Sonuçta elde edilen dizideki her dizin, bir metin öğesinin başlangıcıdır, yani temel karakterin dizini veya yüksek vekildir.

Her öğenin uzunluğu, ardışık dizinler arasındaki fark olarak kolayca hesaplanır. Dizinin uzunluğu her zaman dizenin uzunluğuna eşit veya daha küçük olur. Örneğin, "\u4f00\u302a\ud800\udc00\u4f01" dizesi göz önüne alındığında, bu yöntem 0, 2 ve 4 dizinlerini döndürür.

Eşdeğer Üyeler

.NET Framework'ün 2.0 sürümünden SubstringByTextElements başlayarak yöntemi ve LengthInTextElements özelliği, yöntemi tarafından ParseCombiningCharacters sunulan işlevselliğin kullanımı kolay bir şekilde uygulanmasını sağlar.

Şunlara uygulanır

Ayrıca bkz.