StringInfo Třída
Definice
Důležité
Některé informace platí pro předběžně vydaný produkt, který se může zásadně změnit, než ho výrobce nebo autor vydá. Microsoft neposkytuje žádné záruky, výslovné ani předpokládané, týkající se zde uváděných informací.
Poskytuje funkce pro rozdělení řetězce na textové prvky a iterace prostřednictvím těchto textových prvků.
public ref class StringInfo
public class StringInfo
[System.Serializable]
public class StringInfo
[System.Serializable]
[System.Runtime.InteropServices.ComVisible(true)]
public class StringInfo
type StringInfo = class
[<System.Serializable>]
type StringInfo = class
[<System.Serializable>]
[<System.Runtime.InteropServices.ComVisible(true)>]
type StringInfo = class
Public Class StringInfo
- Dědičnost
-
StringInfo
- Atributy
Příklady
Tento příklad používá GetTextElementEnumerator a ParseCombiningCharacters metody StringInfo třídy k manipulaci s řetězcem, který obsahuje náhradní a kombinující znaky.
using System;
using System.Text;
using System.Globalization;
public sealed class App {
static void Main() {
// The string below contains combining characters.
String s = "a\u0304\u0308bc\u0327";
// Show each 'character' in the string.
EnumTextElements(s);
// Show the index in the string where each 'character' starts.
EnumTextElementIndexes(s);
}
// Show how to enumerate each real character (honoring surrogates) in a string.
static void EnumTextElements(String s) {
// This StringBuilder holds the output results.
StringBuilder sb = new StringBuilder();
// Use the enumerator returned from GetTextElementEnumerator
// method to examine each real character.
TextElementEnumerator charEnum = StringInfo.GetTextElementEnumerator(s);
while (charEnum.MoveNext()) {
sb.AppendFormat(
"Character at index {0} is '{1}'{2}",
charEnum.ElementIndex, charEnum.GetTextElement(),
Environment.NewLine);
}
// Show the results.
Console.WriteLine("Result of GetTextElementEnumerator:");
Console.WriteLine(sb);
}
// Show how to discover the index of each real character (honoring surrogates) in a string.
static void EnumTextElementIndexes(String s) {
// This StringBuilder holds the output results.
StringBuilder sb = new StringBuilder();
// Use the ParseCombiningCharacters method to
// get the index of each real character in the string.
Int32[] textElemIndex = StringInfo.ParseCombiningCharacters(s);
// Iterate through each real character showing the character and the index where it was found.
for (Int32 i = 0; i < textElemIndex.Length; i++) {
sb.AppendFormat(
"Character {0} starts at index {1}{2}",
i, textElemIndex[i], Environment.NewLine);
}
// Show the results.
Console.WriteLine("Result of ParseCombiningCharacters:");
Console.WriteLine(sb);
}
}
// This code produces the following output:
//
// Result of GetTextElementEnumerator:
// Character at index 0 is 'ā̈'
// Character at index 3 is 'b'
// Character at index 4 is 'ç'
//
// Result of ParseCombiningCharacters:
// Character 0 starts at index 0
// Character 1 starts at index 3
// Character 2 starts at index 4
Imports System.Text
Imports System.Globalization
Public Module Example
Public Sub Main()
' The string below contains combining characters.
Dim s As String = "a" + ChrW(&h0304) + ChrW(&h0308) + "bc" + ChrW(&h0327)
' Show each 'character' in the string.
EnumTextElements(s)
' Show the index in the string where each 'character' starts.
EnumTextElementIndexes(s)
End Sub
' Show how to enumerate each real character (honoring surrogates) in a string.
Sub EnumTextElements(s As String)
' This StringBuilder holds the output results.
Dim sb As New StringBuilder()
' Use the enumerator returned from GetTextElementEnumerator
' method to examine each real character.
Dim charEnum As TextElementEnumerator = StringInfo.GetTextElementEnumerator(s)
Do While charEnum.MoveNext()
sb.AppendFormat("Character at index {0} is '{1}'{2}",
charEnum.ElementIndex,
charEnum.GetTextElement(),
Environment.NewLine)
Loop
' Show the results.
Console.WriteLine("Result of GetTextElementEnumerator:")
Console.WriteLine(sb)
End Sub
' Show how to discover the index of each real character (honoring surrogates) in a string.
Sub EnumTextElementIndexes(s As String)
' This StringBuilder holds the output results.
Dim sb As New StringBuilder()
' Use the ParseCombiningCharacters method to
' get the index of each real character in the string.
Dim textElemIndex() As Integer = StringInfo.ParseCombiningCharacters(s)
' Iterate through each real character showing the character and the index where it was found.
For i As Int32 = 0 To textElemIndex.Length - 1
sb.AppendFormat("Character {0} starts at index {1}{2}",
i, textElemIndex(i), Environment.NewLine)
Next
' Show the results.
Console.WriteLine("Result of ParseCombiningCharacters:")
Console.WriteLine(sb)
End Sub
End Module
' The example displays the following output:
'
' Result of GetTextElementEnumerator:
' Character at index 0 is 'ā̈'
' Character at index 3 is 'b'
' Character at index 4 is 'ç'
'
' Result of ParseCombiningCharacters:
' Character 0 starts at index 0
' Character 1 starts at index 3
' Character 2 starts at index 4
Poznámky
.NET definuje textový prvek jako jednotku textu, která se zobrazí jako jeden znak, tj. grafeme. Textový prvek může být základní znak, náhradní dvojice nebo kombinace sekvence znaků. Standard Unicode definuje náhradní dvojici jako kódovanou znakovou reprezentaci pro jeden abstraktní znak, který se skládá ze sekvence dvou jednotek kódu, kde první jednotka páru je vysoká náhrada a druhá je nízká náhrada. Standard Unicode definuje kombinování sekvence znaků jako kombinaci základního znaku a jednoho nebo více kombinujících znaků. Náhradní dvojice může představovat základní znak nebo kombinační znak.
Třída StringInfo umožňuje pracovat s řetězcem jako řadou textových prvků, nikoli s jednotlivými Char objekty.
Pokud chcete vytvořit instanci objektu StringInfo , který představuje zadaný řetězec, můžete provést jednu z následujících akcí:
StringInfo(String) Zavolejte konstruktor a předejte ho řetězci, který StringInfo má objekt představovat jako argument.
Zavolejte výchozí StringInfo() konstruktor a přiřaďte řetězec, který StringInfo má objekt představovat vlastnosti String .
Jednotlivé textové prvky v řetězci můžete pracovat dvěma způsoby:
Výčet každého textového prvku Chcete-li to provést, zavoláte metodu GetTextElementEnumerator a pak opakovaně volat metodu MoveNext na vrácený TextElementEnumerator objekt, dokud metoda nevrátí
false.ParseCombiningCharacters Voláním metody načíst pole, které obsahuje počáteční index každého textového prvku. Jednotlivé textové prvky pak můžete načíst předáním těchto indexů metodě SubstringByTextElements .
Následující příklad ukazuje oba způsoby práce s textovými prvky v řetězci. Vytvoří dva řetězce:
strCombining, což je řetězec arabských znaků, který obsahuje tři textové prvky s více Char objekty. První textový prvek je základní znak ARABIC LETTER ALEF (U+0627) následovaný ARABIC HAMZA BELOW (U+0655) a ARABIC KASRA (U+0650). Druhý textový prvek je ARABIC LETTER HEH (U+0647) následovaný ARABIC FATHA (U+064E). Třetí textový prvek je ARABIC LETTER BEH (U+0628) následovaný ARABIC DAMMATAN (U+064C).strSurrogates, což je řetězec, který obsahuje tři náhradní páry: GREEK ACROPHONIC FIVE TALENTS (U+10148) z doplňkové vícejazyčné roviny, U+20026 z doplňkové ideografické roviny a U+F1001 z privátní uživatelské oblasti. Kódování UTF-16 každého znaku je náhradní dvojice, která se skládá z vysoké náhrady následované nízkou náhradou.
Každý řetězec se parsuje jednou metodou ParseCombiningCharacters a pak metodou GetTextElementEnumerator . Obě metody správně parsují textové prvky ve dvou řetězcích a zobrazují výsledky operace analýzy.
using System;
using System.Globalization;
public class Example
{
public static void Main()
{
// The Unicode code points specify Arabic base characters and
// combining character sequences.
string strCombining = "\u0627\u0655\u0650\u064A\u0647\u064E" +
"\u0627\u0628\u064C";
// The Unicode code points specify private surrogate pairs.
string strSurrogates = Char.ConvertFromUtf32(0x10148) +
Char.ConvertFromUtf32(0x20026) + "a" +
Char.ConvertFromUtf32(0xF1001);
EnumerateTextElements(strCombining);
EnumerateTextElements(strSurrogates);
}
public static void EnumerateTextElements(string str)
{
// Get the Enumerator.
TextElementEnumerator teEnum = null;
// Parse the string using the ParseCombiningCharacters method.
Console.WriteLine("\nParsing with ParseCombiningCharacters:");
int[] teIndices = StringInfo.ParseCombiningCharacters(str);
for (int i = 0; i < teIndices.Length; i++) {
if (i < teIndices.Length - 1)
Console.WriteLine("Text Element {0} ({1}..{2})= {3}", i,
teIndices[i], teIndices[i + 1] - 1,
ShowHexValues(str.Substring(teIndices[i], teIndices[i + 1] -
teIndices[i])));
else
Console.WriteLine("Text Element {0} ({1}..{2})= {3}", i,
teIndices[i], str.Length - 1,
ShowHexValues(str.Substring(teIndices[i])));
}
Console.WriteLine();
// Parse the string with the GetTextElementEnumerator method.
Console.WriteLine("Parsing with TextElementEnumerator:");
teEnum = StringInfo.GetTextElementEnumerator(str);
int teCount = - 1;
while (teEnum.MoveNext()) {
// Displays the current element.
// Both GetTextElement() and Current retrieve the current
// text element. The latter returns it as an Object.
teCount++;
Console.WriteLine("Text Element {0} ({1}..{2})= {3}", teCount,
teEnum.ElementIndex, teEnum.ElementIndex +
teEnum.GetTextElement().Length - 1, ShowHexValues((string)(teEnum.Current)));
}
}
private static string ShowHexValues(string s)
{
string hexString = "";
foreach (var ch in s)
hexString += $"{(ushort)ch:X4} ";
return hexString;
}
}
// The example displays the following output:
// Parsing with ParseCombiningCharacters:
// Text Element 0 (0..2)= 0627 0655 0650
// Text Element 1 (3..3)= 064A
// Text Element 2 (4..5)= 0647 064E
// Text Element 3 (6..6)= 0627
// Text Element 4 (7..8)= 0628 064C
//
// Parsing with TextElementEnumerator:
// Text Element 0 (0..2)= 0627 0655 0650
// Text Element 1 (3..3)= 064A
// Text Element 2 (4..5)= 0647 064E
// Text Element 3 (6..6)= 0627
// Text Element 4 (7..8)= 0628 064C
//
// Parsing with ParseCombiningCharacters:
// Text Element 0 (0..1)= D800 DD48
// Text Element 1 (2..3)= D840 DC26
// Text Element 2 (4..4)= 0061
// Text Element 3 (5..6)= DB84 DC01
//
// Parsing with TextElementEnumerator:
// Text Element 0 (0..1)= D800 DD48
// Text Element 1 (2..3)= D840 DC26
// Text Element 2 (4..4)= 0061
// Text Element 3 (5..6)= DB84 DC01
Imports System.Globalization
Public Module Example
Public Sub Main()
' The Unicode code points specify Arabic base characters and
' combining character sequences.
Dim strCombining As String = ChrW(&H627) & ChrW(&h0655) + ChrW(&H650) &
ChrW(&H64A) & ChrW(&H647) & ChrW(&H64E) & ChrW(&H627) &
ChrW(&H628) & ChrW(&H64C)
' The Unicode code points specify private surrogate pairs.
Dim strSurrogates As String = Char.ConvertFromUtf32(&h10148) +
Char.ConvertFromUtf32(&h20026) + "a" +
Char.ConvertFromUtf32(&hF1001)
EnumerateTextElements(strCombining)
EnumerateTextElements(strSurrogates)
End Sub
Public Sub EnumerateTextElements(str As String)
' Get the Enumerator.
Dim teEnum As TextElementEnumerator = Nothing
' Parse the string using the ParseCombiningCharacters method.
Console.WriteLine()
Console.WriteLine("Parsing with ParseCombiningCharacters:")
Dim teIndices As Integer() = StringInfo.ParseCombiningCharacters(str)
For i As Integer = 0 To teIndices.Length - 1
If i < teIndices.Length - 1 Then
Console.WriteLine("Text Element {0} ({1}..{2})= {3}", i,
TEIndices(i), TEIndices((i + 1)) - 1,
ShowHexValues(str.Substring(TEIndices(i), TEIndices((i + 1)) -
teIndices(i))))
Else
Console.WriteLine("Text Element {0} ({1}..{2})= {3}", i,
teIndices(i), str.Length - 1,
ShowHexValues(str.Substring(teIndices(i))))
End If
Next
Console.WriteLine()
' Parse the string with the GetTextElementEnumerator method.
Console.WriteLine("Parsing with TextElementEnumerator:")
teEnum = StringInfo.GetTextElementEnumerator(str)
Dim TECount As Integer = - 1
While teEnum.MoveNext()
' Prints the current element.
' Both GetTextElement() and Current retrieve the current
' text element. The latter returns it as an Object.
TECount += 1
Console.WriteLine("Text Element {0} ({1}..{2})= {3}", teCount,
teEnum.ElementIndex, teEnum.ElementIndex +
teEnum.GetTextElement().Length - 1, ShowHexValues(CStr(teEnum.Current)))
End While
End Sub
Private Function ShowHexValues(s As String) As String
Dim hexString As String = ""
For Each ch In s
hexString += String.Format("{0:X4} ", Convert.ToUInt16(ch))
Next
Return hexString
End Function
End Module
' The example displays the following output:
' Parsing with ParseCombiningCharacters:
' Text Element 0 (0..2)= 0627 0655 0650
' Text Element 1 (3..3)= 064A
' Text Element 2 (4..5)= 0647 064E
' Text Element 3 (6..6)= 0627
' Text Element 4 (7..8)= 0628 064C
'
' Parsing with TextElementEnumerator:
' Text Element 0 (0..2)= 0627 0655 0650
' Text Element 1 (3..3)= 064A
' Text Element 2 (4..5)= 0647 064E
' Text Element 3 (6..6)= 0627
' Text Element 4 (7..8)= 0628 064C
'
' Parsing with ParseCombiningCharacters:
' Text Element 0 (0..1)= D800 DD48
' Text Element 1 (2..3)= D840 DC26
' Text Element 2 (4..4)= 0061
' Text Element 3 (5..6)= DB84 DC01
'
' Parsing with TextElementEnumerator:
' Text Element 0 (0..1)= D800 DD48
' Text Element 1 (2..3)= D840 DC26
' Text Element 2 (4..4)= 0061
' Text Element 3 (5..6)= DB84 DC01
Poznámky pro volající
Interně metody třídy volají metody StringInfoCharUnicodeInfo třídy k určení kategorií znaků. Počínaje rozhraním .NET Framework 4.6.2 je klasifikace znaků založená na standardu Unicode verze 8.0.0. Pro rozhraní .NET Framework 4 až .NET Framework 4.6.1 je založen na standardu Unicode verze 6.3.0. V .NET Core je založená na standardu Unicode verze 8.0.0.
Konstruktory
| Name | Description |
|---|---|
| StringInfo() |
Inicializuje novou instanci StringInfo třídy. |
| StringInfo(String) |
Inicializuje novou instanci StringInfo třídy na zadaný řetězec. |
Vlastnosti
| Name | Description |
|---|---|
| LengthInTextElements |
Získá počet text prvků v aktuálním StringInfo objektu. |
| String |
Získá nebo nastaví hodnotu aktuálního StringInfo objektu. |
Metody
| Name | Description |
|---|---|
| Equals(Object) |
Určuje, zda je aktuální StringInfo objekt roven zadanému objektu. |
| Equals(Object) |
Určuje, zda je zadaný objekt roven aktuálnímu objektu. (Zděděno od Object) |
| GetHashCode() |
Vypočítá kód hash pro hodnotu aktuálního StringInfo objektu. |
| GetHashCode() |
Slouží jako výchozí funkce hash. (Zděděno od Object) |
| GetNextTextElement(String, Int32) |
Získá textový prvek v zadaném indexu zadaného řetězce. |
| GetNextTextElement(String) |
Získá první textový prvek v zadaném řetězci. |
| GetNextTextElementLength(ReadOnlySpan<Char>) |
Vrátí délku prvního textového prvku (rozšířený cluster grapheme), který se vyskytuje ve vstupním rozsahu. |
| GetNextTextElementLength(String, Int32) |
Vrátí délku prvního textového prvku (rozšířený cluster grapheme), který se vyskytuje ve vstupním řetězci počínaje zadaným indexem. |
| GetNextTextElementLength(String) |
Vrátí délku prvního textového prvku (rozšířený cluster grapheme), který se vyskytuje ve vstupním řetězci. |
| GetTextElementEnumerator(String, Int32) |
Vrátí enumerátor, který iteruje textovými prvky řetězce počínaje zadaným indexem. |
| GetTextElementEnumerator(String) |
Vrátí enumerátor, který iteruje textovými prvky celého řetězce. |
| GetType() |
Získá Type aktuální instance. (Zděděno od Object) |
| MemberwiseClone() |
Vytvoří mělkou kopii aktuálního Object. (Zděděno od Object) |
| ParseCombiningCharacters(String) |
Vrátí indexy každého základního znaku, vysokého náhradního nebo řídicího znaku v zadaném řetězci. |
| SubstringByTextElements(Int32, Int32) |
Načte podřetězdí textových prvků z aktuálního StringInfo objektu počínaje zadaným textovým prvkem a pokračuje přes zadaný počet textových prvků. |
| SubstringByTextElements(Int32) |
Načte podřetězdí textových prvků z aktuálního StringInfo objektu počínaje zadaným textovým prvkem a pokračuje po posledním textovém prvku. |
| ToString() |
Vrátí řetězec, který představuje aktuální objekt. (Zděděno od Object) |