UnicodeCategory-Enumeration
Definiert die Unicode-Kategorie eines Zeichens.
Namespace: System.Globalization
Assembly: mscorlib (in mscorlib.dll)
Syntax
'Declaration
<SerializableAttribute> _
<ComVisibleAttribute(True)> _
Public Enumeration UnicodeCategory
'Usage
Dim instance As UnicodeCategory
[SerializableAttribute]
[ComVisibleAttribute(true)]
public enum UnicodeCategory
[SerializableAttribute]
[ComVisibleAttribute(true)]
public enum class UnicodeCategory
/** @attribute SerializableAttribute() */
/** @attribute ComVisibleAttribute(true) */
public enum UnicodeCategory
SerializableAttribute
ComVisibleAttribute(true)
public enum UnicodeCategory
Member
Membername | Beschreibung | |
---|---|---|
ClosePunctuation | Gibt an, dass das Zeichen das schließende Zeichen eines Satzzeichenpaares ist, beispielsweise von einfachen, eckigen oder geschweiften Klammern. Dargestellt wird es durch die Unicode-Bezeichnung "Pe" (Punctuation, Close, d. h. Interpunktion, schließen). Der Wert ist 21. | |
ConnectorPunctuation | Gibt an, dass das Zeichen ein Verbindungssatzzeichen ist, das zwei Zeichen miteinander verbindet. Dargestellt wird es durch die Unicode-Bezeichnung "Pc" (Punctuation, Connector, d. h. Interpunktion, Verbindung). Der Wert ist 18. | |
Control | Gibt an, dass das Zeichen Steuerzeichencode ist, dessen Unicode-Wert U+007F ist oder im Bereich zwischen U+0000 und U+001F bzw. U+0080 und U+009F liegt. Dargestellt wird es durch die Unicode-Bezeichnung "Cc" (Other, Control, d. h. Andere, Steuerzeichen). Der Wert ist 14. | |
CurrencySymbol | Gibt an, dass das Zeichen ein Währungssymbol ist. Dargestellt wird es durch die Unicode-Bezeichnung "Sc" (Symbol, Currency, d. h. Symbol, Währung). Der Wert ist 26. | |
DashPunctuation | Gibt an, dass das Zeichen ein Gedanken- oder Bindestrich ist. Dargestellt wird es durch die Unicode-Bezeichnung "Pd" (Punctuation, Dash, d. h. Interpunktion, Bindestrich). Der Wert ist 19. | |
DecimalDigitNumber | Gibt an, dass das Zeichen eine Dezimalziffer ist, d. h. eine Ziffer zwischen 0 und 9. Dargestellt wird diese durch die Unicode-Bezeichnung "Nd" (Number, Decimal Digit, d. h. Zahl, dezimale Ziffer). Der Wert ist 8. | |
EnclosingMark | Gibt an, dass das Zeichen ein einschließendes Zeichen ist, d. h. ein Kombinationszeichen ohne horizontalen Vorschub, das alle vorhergehenden Zeichen bis einschließlich eines Basiszeichens umgibt. Dargestellt wird es durch die Unicode-Bezeichnung "Me" (Mark, Enclosing, d. h. Satzzeichen, einschließend). Der Wert ist 7. | |
FinalQuotePunctuation | Gibt an, dass das Zeichen ein schließendes bzw. am Ende stehendes Anführungszeichen ist. Dargestellt wird es durch die Unicode-Bezeichnung "Pf" (Punctuation, Final Quote, d. h. Interpunktion, schließendes Anführungszeichen). Der Wert ist 23. | |
Format | Gibt an, dass das Zeichen ein Formatzeichen ist. Dieses wird i. d. R. nicht dargestellt, wirkt sich jedoch auf das Textlayout oder die Textverarbeitungsvorgänge aus. Dargestellt wird es durch die Unicode-Bezeichnung "Cf" (Other, Format, d. h. Andere, Format). Der Wert ist 15. | |
InitialQuotePunctuation | Gibt an, dass das Zeichen ein öffnendes bzw. einleitendes Anführungszeichen ist. Dargestellt wird es durch die Unicode-Bezeichnung "Pi" (Punctuation, Initial Quote, d. h. Interpunktion, öffnendes Anführungszeichen). Der Wert ist 22. | |
LetterNumber | Gibt an, dass das Zeichen eine Zahl ist, die anstelle einer Dezimalziffer durch einen Buchstaben dargestellt wird, z. B. "V", die römische Ziffer Fünf. Dargestellt wird es durch die Unicode-Bezeichnung "Nl " (Number, Letter, d. h. Zahl, Buchstabe). Der Wert ist 9. | |
LineSeparator | Gibt an, dass das Zeichen zum Trennen von Textzeilen verwendet wird. Dargestellt wird es durch die Unicode-Bezeichnung "Zl" (Separator, Line, d. h. Trennzeichen, Zeile). Der Wert ist 12. | |
LowercaseLetter | Gibt an, dass das Zeichen ein Kleinbuchstabe ist. Dargestellt wird es durch die Unicode-Bezeichnung "Ll" (Letter, Lowercase, d. h. Buchstabe, Kleinschreibung). Der Wert ist 1. | |
MathSymbol | Gibt an, dass das ´Zeichen ein mathematisches Symbol ist, z. B. "+" oder "=". Dargestellt wird es durch die Unicode-Bezeichnung "Sm" (Symbol, Math, d. h. Symbol, Mathematik). Der Wert ist 25. | |
ModifierLetter | Gibt an, dass das Zeichen ein Modifiziererbuchstabe ist, d. h. ein allein stehendes Zeichen mit horizontalem Vorschub, das Änderungen an einem vorangehenden Buchstaben angibt. Dargestellt wird es durch die Unicode-Bezeichnung "Lm" (Letter, Modifier, d. h. Buchstabe, Modifizierer). Der Wert ist 3. | |
ModifierSymbol | Gibt an, dass das Zeichen ein Modifiziersymbol ist, das Änderungen an umgebenden Zeichen kennzeichnet. So gibt z. B. der Bruchstrich an, dass die links stehende Zahl der Zähler und die rechts stehende Zahl der Nenner ist. Dargestellt wird es durch die Unicode-Bezeichnung "Sk" (Symbol, Modifier, d. h. Symbol, Modifizierer). Der Wert ist 27. | |
NonSpacingMark | Gibt an, dass das Zeichen ein Zeichen ohne horizontalen Vorschub ist, das Änderungen eines Basiszeichens anzeigt. Dargestellt wird es durch die Unicode-Bezeichnung "Mn" (Mark, Nonspacing, d. h. Satzzeichen, ohne horizontalen Vorschub). Der Wert ist 5. | |
OpenPunctuation | Gibt an, dass das Zeichen das öffnende Zeichen eines Satzzeichenpaares ist, beispielsweise von einfachen, eckigen oder geschweiften Klammern. Dargestellt wird es durch die Unicode-Bezeichnung "Ps" (Punctuation, Open, d. h. Interpunktion, öffnend). Der Wert ist 20. | |
OtherLetter | Gibt an, dass das Zeichen ein Buchstabe ist, der kein Großbuchstabe, kein Kleinbuchstabe, kein Buchstabe für die Schreibung mit einem großen Anfangsbuchstaben (Titlecase) und kein Modifizierbuchstabe ist. Dargestellt wird es durch die Unicode-Bezeichnung "Lo" (Letter, Other, d. h. Buchstabe, andere). Der Wert ist 4. | |
OtherNotAssigned | Gibt an, dass das Zeichen keiner Unicode-Kategorie zugeordnet ist. Dargestellt wird dies durch die Unicode-Bezeichnung "Cn" (Other, Not Assigned, d. h. Andere, nicht zugeordnet). Der Wert ist 29. | |
OtherNumber | Gibt an, dass das Zeichen eine Zahl ist, die weder eine Dezimalzahl noch eine durch einen Buchstaben dargestellte Zahl ist, z. B. die Bruchzahl 1/2. Dargestellt wird es durch die Unicode-Bezeichnung "No" (Number, Other, d. h. Zahl, Andere). Der Wert ist 10. | |
OtherPunctuation | Gibt an, dass das Zeichen ein Interpunktionszeichen ist, das kein Verbindungssatzzeichen, kein Bindestrich, kein öffnendes Satzzeichen, kein schließendes Satzzeichen, kein öffnendes Anführungszeichen und kein schließendes Anführungszeichen ist. Dargestellt wird es durch die Unicode-Bezeichnung "Po" (Punctuation, Other, d. h. Interpunktion, Andere). Der Wert ist 24. | |
OtherSymbol | Gibt an, dass das Zeichen ein Symbol ist, das kein mathematisches Symbol, kein Währungssymbol und kein Modifiziersymbol ist. Dargestellt wird es durch die Unicode-Bezeichnung "So" (Symbol, Other, d. h. Symbol, Andere). Der Wert ist 28. | |
ParagraphSeparator | Gibt an, dass das Zeichen zum Trennen von Absätzen verwendet wird. Dargestellt wird es durch die Unicode-Bezeichnung "Zp" (Separator, Paragraph, d. h. Trennzeichen, Absatz). Der Wert ist 13. | |
PrivateUse | Gibt an, dass das Zeichen ein Zeichen für die persönliche Verwendung ist, dessen Unicode-Wert im Bereich von U+E000 bis U+F8FF liegt. Dargestellt wird es durch die Unicode-Bezeichnung "Co" (Other, Private Use, d. h. Andere, persönliche Verwendung). Der Wert ist 17. | |
SpaceSeparator | Gibt an, dass das Zeichen ein Leerzeichen ist, das durch kein Symbol dargestellt wird, jedoch weder ein Steuer- noch ein Formatzeichen ist. Dargestellt wird es durch die Unicode-Bezeichnung "Zs" (Separator, Space, d. h. Trennzeichen, Leerzeichen). Der Wert ist 11. | |
SpacingCombiningMark | Gibt an, dass das Zeichen ein Zeichen mit horizontalem Vorschub ist, das Änderungen eines Basiszeichens anzeigt und die Breite des Symbols für dieses Basiszeichen beeinflusst. Dargestellt wird es durch die Unicode-Bezeichnung "Mc" (Mark, Spacing Combining, d. h. Satzzeichen, Kombinationszeichen mit Vorschub). Der Wert ist 6. | |
Surrogate | Gibt an, dass das Zeichen ein hohes bzw. ein niedriges Ersatzzeichen ist. Die Codewerte für Ersatzzeichen liegen im Bereich von U+D800 bis U+DFFF. Dargestellt werden solche Zeichen durch die Unicode-Bezeichnung "Cs" (Other, Surrogate, d. h. Andere, Ersatzzeichen). Der Wert ist 16. | |
TitlecaseLetter | Gibt an, dass das Zeichen ein Buchstabe für die Schreibung mit einem großen Anfangsbuchstaben (Titlecase) ist. Dargestellt wird es durch die Unicode-Bezeichnung "Lt" (Letter, Titlecase, d. h. Buchstabe, großer Anfangsbuchstabe). Der Wert ist 2. | |
UppercaseLetter | Gibt an, dass das Zeichen ein Großbuchstabe ist. Dargestellt wird es durch die Unicode-Bezeichnung "Lu" (Letter, Uppercase, d. h. Buchstabe, Großbuchstabe). Der Wert ist 0. |
Hinweise
Der Unicode-Standard definiert Folgendes:
Ein Ersatzzeichenpaar ist eine codierte Zeichendarstellung eines einzelnen abstrakten Zeichens, das aus einer Folge von zwei Codeeinheiten besteht. Dabei stellt die erste Einheit des Paares das hohe und die zweite Einheit das niedrige Ersatzzeichen dar. Ein hohes Ersatzzeichen ist ein Unicode-Codepunkt im Bereich von U+D800 bis U+DBFF, und ein niedriges Ersatzzeichen ist ein Unicode-Codepunkt im Bereich von U+DC00 bis U+DFFF.
Eine Kombinationszeichenfolge ist eine Kombination aus einem Basiszeichen und einem oder mehreren Kombinationszeichen. Ein Ersatzzeichenpaar kann ein Basiszeichen oder ein Kombinationszeichen darstellen. Ein Kombinationszeichen kann einen horizontalen Vorschub aufweisen. Ein Kombinationszeichen mit horizontalem Vorschub nimmt bei der Darstellung einen über die Breite des Basiszeichens hinausgehenden Platz ein, während dies bei einem Kombinationszeichen ohne horizontalen Vorschub nicht der Fall ist. Ein Beispiel für Kombinationszeichen ohne horizontalen Vorschub sind diakritische Zeichen.
Ein Modifiziererbuchstabe ist ein allein stehendes Zeichen mit horizontalem Vorschub, das wie ein Kombinationszeichen Änderungen an einem vorangehenden Buchstaben angibt.
Ein einschließendes Zeichen ist ein Kombinationszeichen ohne horizontalen Vorschub, das alle vorhergehenden Zeichen bis einschließlich eines Basiszeichens umgibt.
Ein Formatzeichen wird i. d. R. nicht dargestellt, wirkt sich jedoch auf das Textlayout oder die Textverarbeitungsvorgänge aus.
Der Unicode-Standard definiert mehrere Varianten einiger Satzzeichen. Ein Bindestrich kann beispielsweise einen von mehreren Codewerten haben, die einen Bindestrich darstellen, z. B. U+002D (Minuszeichen), U+00AD (bedingter Trennstrich), U+2010 (Bindestrich) oder U+2011 (geschützter Bindestrich). Dies gilt auch für Gedankenstriche, Leerzeichen und Anführungszeichen.
Außerdem ordnet der Unicode-Standard der Darstellung von Dezimalziffern Code zu,, die spezifisch für ein bestimmtes Schriftsystem oder eine Sprache sind, z. B. U+0030 (Ziffer Null) und U+0660 (arabisch-indische Ziffer Null).
Diese Enumeration basiert auf dem Unicode-Standard, Version 3.1.
Weitere Informationen finden Sie im Unicode-Standard unter http://www.unicode.org.
Mithilfe dieser Enumeration können Char-Methoden wie IsUpper unterstützt werden.
Plattformen
Windows 98, Windows 2000 SP4, Windows CE, Windows Millennium Edition, Windows Mobile für Pocket PC, Windows Mobile für Smartphone, Windows Server 2003, Windows XP Media Center Edition, Windows XP Professional x64 Edition, Windows XP SP2, Windows XP Starter Edition
.NET Framework unterstützt nicht alle Versionen sämtlicher Plattformen. Eine Liste der unterstützten Versionen finden Sie unter Systemanforderungen.
Versionsinformationen
.NET Framework
Unterstützt in: 2.0, 1.1, 1.0
.NET Compact Framework
Unterstützt in: 2.0, 1.0