CharUnicodeInfo.GetUnicodeCategory Metódus
Definíció
Fontos
Egyes információk olyan, kiadás előtti termékekre vonatkoznak, amelyek a kiadásig még jelentősen módosulhatnak. A Microsoft nem vállal kifejezett vagy törvényi garanciát az itt megjelenő információért.
Egy Unicode-karakter Unicode-kategóriáját kapja meg.
Túlterhelések
| Name | Description |
|---|---|
| GetUnicodeCategory(Char) |
Lekéri a megadott karakter Unicode-kategóriáját. |
| GetUnicodeCategory(Int32) |
Lekéri a megadott karakter Unicode-kategóriáját. |
| GetUnicodeCategory(String, Int32) |
Lekéri a karakter Unicode-kategóriáját a megadott sztring megadott indexében. |
GetUnicodeCategory(Char)
- Forrás:
- CharUnicodeInfo.cs
- Forrás:
- CharUnicodeInfo.cs
- Forrás:
- CharUnicodeInfo.cs
- Forrás:
- CharUnicodeInfo.cs
- Forrás:
- CharUnicodeInfo.cs
Lekéri a megadott karakter Unicode-kategóriáját.
public:
static System::Globalization::UnicodeCategory GetUnicodeCategory(char ch);
public static System.Globalization.UnicodeCategory GetUnicodeCategory(char ch);
static member GetUnicodeCategory : char -> System.Globalization.UnicodeCategory
Public Shared Function GetUnicodeCategory (ch As Char) As UnicodeCategory
Paraméterek
- ch
- Char
A Unicode-kategória lekéréséhez használt Unicode-karakter.
Válaszok
A UnicodeCategory megadott karakter kategóriáját jelző érték.
Példák
Az alábbi példakód az egyes metódusok által visszaadott értékeket mutatja be a különböző karaktertípusokhoz.
using System;
using System.Globalization;
public class SamplesCharUnicodeInfo {
public static void Main() {
Console.WriteLine( " c Num Dig Dec UnicodeCategory" );
Console.Write( "U+0061 LATIN SMALL LETTER A " );
PrintProperties( 'a' );
Console.Write( "U+0393 GREEK CAPITAL LETTER GAMMA " );
PrintProperties( '\u0393' );
Console.Write( "U+0039 DIGIT NINE " );
PrintProperties( '9' );
Console.Write( "U+00B2 SUPERSCRIPT TWO " );
PrintProperties( '\u00B2' );
Console.Write( "U+00BC VULGAR FRACTION ONE QUARTER " );
PrintProperties( '\u00BC' );
Console.Write( "U+0BEF TAMIL DIGIT NINE " );
PrintProperties( '\u0BEF' );
Console.Write( "U+0BF0 TAMIL NUMBER TEN " );
PrintProperties( '\u0BF0' );
Console.Write( "U+0F33 TIBETAN DIGIT HALF ZERO " );
PrintProperties( '\u0F33' );
Console.Write( "U+2788 CIRCLED SANS-SERIF DIGIT NINE " );
PrintProperties( '\u2788' );
}
public static void PrintProperties( char c ) {
Console.Write( " {0,-3}", c );
Console.Write( " {0,-5}", CharUnicodeInfo.GetNumericValue( c ) );
Console.Write( " {0,-5}", CharUnicodeInfo.GetDigitValue( c ) );
Console.Write( " {0,-5}", CharUnicodeInfo.GetDecimalDigitValue( c ) );
Console.WriteLine( "{0}", CharUnicodeInfo.GetUnicodeCategory( c ) );
}
}
/*
This code produces the following output. Some characters might not display at the console.
c Num Dig Dec UnicodeCategory
U+0061 LATIN SMALL LETTER A a -1 -1 -1 LowercaseLetter
U+0393 GREEK CAPITAL LETTER GAMMA Γ -1 -1 -1 UppercaseLetter
U+0039 DIGIT NINE 9 9 9 9 DecimalDigitNumber
U+00B2 SUPERSCRIPT TWO ² 2 2 -1 OtherNumber
U+00BC VULGAR FRACTION ONE QUARTER ¼ 0.25 -1 -1 OtherNumber
U+0BEF TAMIL DIGIT NINE ௯ 9 9 9 DecimalDigitNumber
U+0BF0 TAMIL NUMBER TEN ௰ 10 -1 -1 OtherNumber
U+0F33 TIBETAN DIGIT HALF ZERO ༳ -0.5 -1 -1 OtherNumber
U+2788 CIRCLED SANS-SERIF DIGIT NINE ➈ 9 9 -1 OtherNumber
*/
Imports System.Globalization
Public Class SamplesCharUnicodeInfo
Public Shared Sub Main()
Console.WriteLine(" c Num Dig Dec UnicodeCategory")
Console.Write("U+0061 LATIN SMALL LETTER A ")
PrintProperties("a"c)
Console.Write("U+0393 GREEK CAPITAL LETTER GAMMA ")
PrintProperties(ChrW(&H0393))
Console.Write("U+0039 DIGIT NINE ")
PrintProperties("9"c)
Console.Write("U+00B2 SUPERSCRIPT TWO ")
PrintProperties(ChrW(&H00B2))
Console.Write("U+00BC VULGAR FRACTION ONE QUARTER ")
PrintProperties(ChrW(&H00BC))
Console.Write("U+0BEF TAMIL DIGIT NINE ")
PrintProperties(ChrW(&H0BEF))
Console.Write("U+0BF0 TAMIL NUMBER TEN ")
PrintProperties(ChrW(&H0BF0))
Console.Write("U+0F33 TIBETAN DIGIT HALF ZERO ")
PrintProperties(ChrW(&H0F33))
Console.Write("U+2788 CIRCLED SANS-SERIF DIGIT NINE ")
PrintProperties(ChrW(&H2788))
End Sub
Public Shared Sub PrintProperties(c As Char)
Console.Write(" {0,-3}", c)
Console.Write(" {0,-5}", CharUnicodeInfo.GetNumericValue(c))
Console.Write(" {0,-5}", CharUnicodeInfo.GetDigitValue(c))
Console.Write(" {0,-5}", CharUnicodeInfo.GetDecimalDigitValue(c))
Console.WriteLine("{0}", CharUnicodeInfo.GetUnicodeCategory(c))
End Sub
End Class
'This code produces the following output. Some characters might not display at the console.
'
' c Num Dig Dec UnicodeCategory
'U+0061 LATIN SMALL LETTER A a -1 -1 -1 LowercaseLetter
'U+0393 GREEK CAPITAL LETTER GAMMA Γ -1 -1 -1 UppercaseLetter
'U+0039 DIGIT NINE 9 9 9 9 DecimalDigitNumber
'U+00B2 SUPERSCRIPT TWO ² 2 2 -1 OtherNumber
'U+00BC VULGAR FRACTION ONE QUARTER ¼ 0.25 -1 -1 OtherNumber
'U+0BEF TAMIL DIGIT NINE ௯ 9 9 9 DecimalDigitNumber
'U+0BF0 TAMIL NUMBER TEN ௰ 10 -1 -1 OtherNumber
'U+0F33 TIBETAN DIGIT HALF ZERO ༳ -0.5 -1 -1 OtherNumber
'U+2788 CIRCLED SANS-SERIF DIGIT NINE ➈ 9 9 -1 OtherNumber
Megjegyzések
A Unicode-karakterek kategóriákba vannak osztva. Egy karakter kategóriája az egyik tulajdonsága. Egy karakter lehet például nagybetű, kisbetű, tizedesjegy, betűszám, összekötő írásjele, matematikai szimbólum vagy pénznemszimbólum. Az UnicodeCategory enumerálás egy Unicode-karakter kategóriáját határozza meg. További információ a Unicode-karakterekről: Unicode Standard.
A GetUnicodeCategory módszer feltételezi, hogy ch egyetlen nyelvi karakternek felel meg, és a kategóriáját adja vissza. Ez azt jelenti, hogy a helyettesítő párok esetében a helyettes kategória helyett azt a kategóriát adja vissza UnicodeCategory.Surrogate , amelyhez a helyettes tartozik. Az ugaritikus ábécé például az U+10380 és U+1039F kódpontokat foglalja el. Az alábbi példa egy UGARITIC LETTER ALPA (U+10380) sztring példányosítására használja a ConvertFromUtf32 metódust, amely az ugaritikus ábécé első betűje. Ahogy a példa kimenete is mutatja, a IsNumber(Char) metódus akkor ad vissza false értéket, ha a karakter magas helyettese vagy alacsony helyettese van.
int utf32 = 0x10380; // UGARITIC LETTER ALPA
string surrogate = Char.ConvertFromUtf32(utf32);
foreach (var ch in surrogate)
Console.WriteLine($"U+{(ushort)ch:X4}: {System.Globalization.CharUnicodeInfo.GetUnicodeCategory(ch):G}");
// The example displays the following output:
// U+D800: Surrogate
// U+DF80: Surrogate
Dim utf32 As Integer = &h10380 ' UGARITIC LETTER ALPA
Dim surrogate As String = Char.ConvertFromUtf32(utf32)
For Each ch In surrogate
Console.WriteLine("U+{0:X4}: {1:G}",
Convert.ToUInt16(ch),
System.Globalization.CharUnicodeInfo.GetUnicodeCategory(ch))
Next
' The example displays the following output:
' U+D800: Surrogate
' U+DF80: Surrogate
Ne feledje, hogy CharUnicodeInfo.GetUnicodeCategory nem mindig ugyanazt UnicodeCategory az értéket adja vissza, mint a Char.GetUnicodeCategory metódus, amikor adott karaktert ad át egy paraméternek. A CharUnicodeInfo.GetUnicodeCategory metódus úgy lett kialakítva, hogy tükrözze a Unicode szabvány aktuális verzióját. Ezzel szemben bár a Char.GetUnicodeCategory metódus általában a Unicode szabvány aktuális verzióját tükrözi, előfordulhat, hogy egy karakter kategóriáját adja vissza a szabvány egy korábbi verziója alapján, vagy az aktuális szabványtól eltérő kategóriát ad vissza a visszamenőleges kompatibilitás megőrzése érdekében.
Lásd még
A következőre érvényes:
GetUnicodeCategory(Int32)
- Forrás:
- CharUnicodeInfo.cs
- Forrás:
- CharUnicodeInfo.cs
- Forrás:
- CharUnicodeInfo.cs
- Forrás:
- CharUnicodeInfo.cs
- Forrás:
- CharUnicodeInfo.cs
Lekéri a megadott karakter Unicode-kategóriáját.
public:
static System::Globalization::UnicodeCategory GetUnicodeCategory(int codePoint);
public static System.Globalization.UnicodeCategory GetUnicodeCategory(int codePoint);
static member GetUnicodeCategory : int -> System.Globalization.UnicodeCategory
Public Shared Function GetUnicodeCategory (codePoint As Integer) As UnicodeCategory
Paraméterek
- codePoint
- Int32
A Unicode karakter 32 bites kódpontértékét képviselő szám.
Válaszok
A UnicodeCategory megadott karakter kategóriáját jelző érték.
A következőre érvényes:
GetUnicodeCategory(String, Int32)
- Forrás:
- CharUnicodeInfo.cs
- Forrás:
- CharUnicodeInfo.cs
- Forrás:
- CharUnicodeInfo.cs
- Forrás:
- CharUnicodeInfo.cs
- Forrás:
- CharUnicodeInfo.cs
Lekéri a karakter Unicode-kategóriáját a megadott sztring megadott indexében.
public:
static System::Globalization::UnicodeCategory GetUnicodeCategory(System::String ^ s, int index);
public static System.Globalization.UnicodeCategory GetUnicodeCategory(string s, int index);
static member GetUnicodeCategory : string * int -> System.Globalization.UnicodeCategory
Public Shared Function GetUnicodeCategory (s As String, index As Integer) As UnicodeCategory
Paraméterek
- index
- Int32
Annak a Unicode-karakternek az indexe, amelynek a Unicode-kategóriát le kell szereznie.
Válaszok
A UnicodeCategory karakter kategóriáját jelző érték a megadott sztring megadott indexében.
Kivételek
s az null.
index az érvényes indexek tartományán kívül esik a következőben s: .
Példák
Az alábbi példakód az egyes metódusok által visszaadott értékeket mutatja be a különböző karaktertípusokhoz.
using System;
using System.Globalization;
public class SamplesCharUnicodeInfo {
public static void Main() {
// The String to get information for.
String s = "a9\u0393\u00B2\u00BC\u0BEF\u0BF0\u2788";
Console.WriteLine( "String: {0}", s );
// Print the values for each of the characters in the string.
Console.WriteLine( "index c Num Dig Dec UnicodeCategory" );
for ( int i = 0; i < s.Length; i++ ) {
Console.Write( "{0,-5} {1,-3}", i, s[i] );
Console.Write( " {0,-5}", CharUnicodeInfo.GetNumericValue( s, i ) );
Console.Write( " {0,-5}", CharUnicodeInfo.GetDigitValue( s, i ) );
Console.Write( " {0,-5}", CharUnicodeInfo.GetDecimalDigitValue( s, i ) );
Console.WriteLine( "{0}", CharUnicodeInfo.GetUnicodeCategory( s, i ) );
}
}
}
/*
This code produces the following output. Some characters might not display at the console.
String: a9Γ²¼௯௰➈
index c Num Dig Dec UnicodeCategory
0 a -1 -1 -1 LowercaseLetter
1 9 9 9 9 DecimalDigitNumber
2 Γ -1 -1 -1 UppercaseLetter
3 ² 2 2 -1 OtherNumber
4 ¼ 0.25 -1 -1 OtherNumber
5 ௯ 9 9 9 DecimalDigitNumber
6 ௰ 10 -1 -1 OtherNumber
7 ➈ 9 9 -1 OtherNumber
*/
Imports System.Globalization
Public Class SamplesCharUnicodeInfo
Public Shared Sub Main()
' The String to get information for.
Dim s As [String] = "a9\u0393\u00B2\u00BC\u0BEF\u0BF0\u2788"
Console.WriteLine("String: {0}", s)
' Print the values for each of the characters in the string.
Console.WriteLine("index c Num Dig Dec UnicodeCategory")
Dim i As Integer
For i = 0 To s.Length - 1
Console.Write("{0,-5} {1,-3}", i, s(i))
Console.Write(" {0,-5}", CharUnicodeInfo.GetNumericValue(s, i))
Console.Write(" {0,-5}", CharUnicodeInfo.GetDigitValue(s, i))
Console.Write(" {0,-5}", CharUnicodeInfo.GetDecimalDigitValue(s, i))
Console.WriteLine("{0}", CharUnicodeInfo.GetUnicodeCategory(s, i))
Next i
End Sub
End Class
'This code produces the following output. Some characters might not display at the console.
'
'String: a9Γ²¼௯௰➈
'index c Num Dig Dec UnicodeCategory
'0 a -1 -1 -1 LowercaseLetter
'1 9 9 9 9 DecimalDigitNumber
'2 Γ -1 -1 -1 UppercaseLetter
'3 ² 2 2 -1 OtherNumber
'4 ¼ 0.25 -1 -1 OtherNumber
'5 ௯ 9 9 9 DecimalDigitNumber
'6 ௰ 10 -1 -1 OtherNumber
'7 ➈ 9 9 -1 OtherNumber
Megjegyzések
A Unicode-karakterek kategóriákba vannak osztva. Egy karakter kategóriája az egyik tulajdonsága. Egy karakter lehet például nagybetű, kisbetű, tizedesjegy, betűszám, összekötő írásjele, matematikai szimbólum vagy pénznemszimbólum. Az UnicodeCategory enumerálás egy Unicode-karakter kategóriáját határozza meg. További információ a Unicode-karakterekről: Unicode Standard.
Ha a Char pozícióban index lévő objektum egy érvényes helyettesítő pár első karaktere, a metódus a GetUnicodeCategory(String, Int32) helyettesítő pár Unicode kategóriáját adja vissza a visszatérés UnicodeCategory.Surrogatehelyett. Az ugaritikus ábécé például az U+10380 és U+1039F kódpontokat foglalja el. Az alábbi példa egy UGARITIC LETTER ALPA (U+10380) sztring példányosítására használja a ConvertFromUtf32 metódust, amely az ugaritikus ábécé első betűje. Ahogy a példa kimenete is mutatja, a GetUnicodeCategory(String, Int32) metódus akkor ad vissza UnicodeCategory.OtherLetter , ha a karakter magas helyettesítője van, ami azt jelzi, hogy a helyettesítő párt veszi figyelembe. Azonban, ha át az alacsony helyettes, úgy véli, csak az alacsony helyettes elszigetelten és visszatér UnicodeCategory.Surrogate.
int utf32 = 0x10380; // UGARITIC LETTER ALPA
string surrogate = Char.ConvertFromUtf32(utf32);
for (int ctr = 0; ctr < surrogate.Length; ctr++)
Console.WriteLine($"U+{(ushort)surrogate[ctr]:X4}: {System.Globalization.CharUnicodeInfo.GetUnicodeCategory(surrogate, ctr):G}");
// The example displays the following output:
// U+D800: OtherLetter
// U+DF80: Surrogate
Dim utf32 As Integer = &h10380 ' UGARITIC LETTER ALPA
Dim surrogate As String = Char.ConvertFromUtf32(utf32)
For ctr As Integer = 0 To surrogate.Length - 1
Console.WriteLine("U+{0:X4}: {1:G}",
Convert.ToUInt16(surrogate(ctr)),
System.Globalization.CharUnicodeInfo.GetUnicodeCategory(surrogate, ctr))
Next
' The example displays the following output:
' U+D800: OtherLetter
' U+DF80: Surrogate
Vegye figyelembe, hogy CharUnicodeInfo.GetUnicodeCategory a metódus nem mindig ugyanazt UnicodeCategory az értéket adja vissza, mint a Char.GetUnicodeCategory metódus, amikor adott karaktert ad át egy paraméternek. A CharUnicodeInfo.GetUnicodeCategory metódus úgy lett kialakítva, hogy tükrözze a Unicode szabvány aktuális verzióját. Ezzel szemben bár a Char.GetUnicodeCategory metódus általában a Unicode szabvány aktuális verzióját tükrözi, előfordulhat, hogy egy karakter kategóriáját adja vissza a szabvány egy korábbi verziója alapján, vagy az aktuális szabványtól eltérő kategóriát ad vissza a visszamenőleges kompatibilitás megőrzése érdekében.