UnicodeCategory 열거형

정의

문자의 유니코드 범주를 정의합니다.

public enum class UnicodeCategory
public enum UnicodeCategory
[System.Serializable]
public enum UnicodeCategory
[System.Serializable]
[System.Runtime.InteropServices.ComVisible(true)]
public enum UnicodeCategory
type UnicodeCategory = 
[<System.Serializable>]
type UnicodeCategory = 
[<System.Serializable>]
[<System.Runtime.InteropServices.ComVisible(true)>]
type UnicodeCategory = 
Public Enum UnicodeCategory
상속
UnicodeCategory
특성

필드

Name Description
UppercaseLetter 0

대문자. 유니코드 지정 "Lu"(문자, 대문자)로 표시됩니다. 값은 0입니다.

LowercaseLetter 1

소문자. 유니코드 지정 "Ll"(문자, 소문자)으로 표시됩니다. 값은 1입니다.

TitlecaseLetter 2

제목 문자입니다. 유니코드 지정 "Lt"(letter, titlecase)로 표시됩니다. 값은 2입니다.

ModifierLetter 3

이전 문자의 수정을 나타내는 자유 간격 문자인 한정자 문자입니다. 유니코드 지정 "Lm"(문자, 한정자)으로 표시됩니다. 값은 3입니다.

OtherLetter 4

대문자, 소문자, 제목 문자 또는 한정자가 아닌 문자입니다. 유니코드 지정 "Lo"(문자, 기타)로 표시됩니다. 값은 4입니다.

NonSpacingMark 5

기본 문자의 수정을 나타내는 간격이 없는 문자입니다. 유니코드 지정 "Mn"(mark, nonspacing)으로 표시됩니다. 값은 5입니다.

SpacingCombiningMark 6

기본 문자의 수정을 나타내고 해당 기본 문자의 문자 모양 너비에 영향을 주는 간격 문자입니다. 유니코드 지정 "Mc"(표시, 간격 결합)로 표시됩니다. 값은 6입니다.

EnclosingMark 7

바깥쪽 표시 문자- 기본 문자를 포함하여 모든 이전 문자를 둘러싸는 간격이 없는 결합 문자입니다. 유니코드 지정 "나"(표시, 바깥쪽)로 표시됩니다. 값은 7입니다.

DecimalDigitNumber 8

10진수 문자, 즉 0부터 9까지의 정수를 나타내는 문자입니다. 유니코드 지정 "Nd"(숫자, 소수 자릿수)로 표시됩니다. 값은 8입니다.

LetterNumber 9

10진수가 아닌 문자로 표현되는 숫자입니다( 예: "V"인 5인 로마 숫자). 표시기는 유니코드 지정 "Nl"(숫자, 문자)으로 표시됩니다. 값은 9입니다.

OtherNumber 10

소수 자릿수나 문자 번호가 없는 숫자(예: 소수 1/2)입니다. 표시기는 유니코드 지정 "아니요"(number, other)로 표시됩니다. 값은 10입니다.

SpaceSeparator 11

문자 모양이 없지만 컨트롤 또는 서식 문자가 아닌 공백 문자입니다. 유니코드 지정 "Zs"(구분 기호, 공백)로 표시됩니다. 값은 11입니다.

LineSeparator 12

텍스트 줄을 구분하는 데 사용되는 문자입니다. 유니코드 지정 "Zl"(구분 기호, 선)으로 표시됩니다. 값은 12입니다.

ParagraphSeparator 13

단락을 구분하는 데 사용되는 문자입니다. 유니코드 지정 "Zp"(구분 기호, 단락)로 표시됩니다. 값은 13입니다.

Control 14

유니코드 값이 U+007F이거나 U+0000~U+001F 또는 U+0080~U+009F 범위의 코드 문자를 제어합니다. 유니코드 지정 "참조"(기타, 컨트롤)로 표시됩니다. 값은 14입니다.

Format 15

텍스트 레이아웃이나 텍스트 프로세스 작업에 영향을 주지만 일반적으로 렌더링되지 않는 문자의 서식을 지정합니다. 유니코드 지정 "Cf"(기타, 형식)로 표시됩니다. 값은 15입니다.

Surrogate 16

서로게이트가 높거나 서로게이트 문자가 낮습니다. 서로게이트 코드 값은 U+D800~U+DFFF 범위에 있습니다. 유니코드 지정 "Cs"(기타, 서로게이트)로 표시됩니다. 값은 16입니다.

PrivateUse 17

U+E000~U+F8FF 범위의 유니코드 값이 있는 프라이빗 사용 문자입니다. 유니코드 지정 "Co"(기타 프라이빗 사용)로 표시됩니다. 값은 17입니다.

ConnectorPunctuation 18

두 문자를 연결하는 커넥터 문장 부호 문자입니다. 유니코드 지정 "Pc"(문장 부호, 커넥터)로 표시됩니다. 값은 18입니다.

DashPunctuation 19

대시 또는 하이픈 문자입니다. 유니코드 지정 "Pd"(문장 부호, 대시)로 표시됩니다. 값은 19입니다.

OpenPunctuation 20

쌍을 이루는 문장 부호 중 하나의 여는 문자(예: 괄호, 대괄호 및 중괄호)입니다. 유니코드 지정 "Ps"(문장 부호, 열기)로 표시됩니다. 값은 20입니다.

ClosePunctuation 21

쌍을 이루는 문장 부호 중 하나의 닫는 문자(예: 괄호, 대괄호 및 중괄호)입니다. 유니코드 지정 "Pe"(문장 부호, 닫기)로 표시됩니다. 값은 21입니다.

InitialQuotePunctuation 22

여는 문자 또는 초기 따옴표 문자입니다. 유니코드 지정 "Pi"(문장 부호, 초기 따옴표)로 표시됩니다. 값은 22입니다.

FinalQuotePunctuation 23

닫는 따옴표 문자 또는 마지막 따옴표 문자입니다. 유니코드 지정 "Pf"(문장 부호, 마지막 따옴표)로 표시됩니다. 값은 23입니다.

OtherPunctuation 24

연결선, 대시, 열린 문장 부호, 닫기 문장 부호, 초기 따옴표 또는 마지막 따옴표가 아닌 문장 부호 문자입니다. 유니코드 지정 "Po"(문장 부호, 기타)로 표시됩니다. 값은 24입니다.

MathSymbol 25

"+" 또는 "= "와 같은 수학 기호 문자입니다. 유니코드 지정 "Sm"(기호, 수학)으로 표시됩니다. 값은 25입니다.

CurrencySymbol 26

통화 기호 문자입니다. 유니코드 지정 "Sc"(기호, 통화)로 표시됩니다. 값은 26입니다.

ModifierSymbol 27

주변 문자의 수정을 나타내는 한정자 기호 문자입니다. 예를 들어 분수 슬래시는 왼쪽의 숫자가 숫자이고 오른쪽의 숫자는 분모임을 나타냅니다. 표시기는 유니코드 지정 "Sk"(기호, 한정자)로 표시됩니다. 값은 27입니다.

OtherSymbol 28

수학 기호, 통화 기호 또는 한정자 기호가 아닌 기호 문자입니다. 유니코드 지정 "So"(기호, 기타)로 표시됩니다. 값은 28입니다.

OtherNotAssigned 29

유니코드 범주에 할당되지 않은 문자입니다. 유니코드 지정 "Cn"(기타, 할당되지 않음)으로 표시됩니다. 값은 29입니다.

예제

다음은 UppercaseLetter 범주의 문자에 대한 문자 및 해당 코드 요소를 표시하는 예제입니다. 대문자Letter를 변수 할당에서 관심 있는 범주로 바꿔 다른 범주에 문자를 표시하도록 예제를 수정할 category 수 있습니다. 일부 범주의 출력은 광범위할 수 있습니다.

using System;
using System.Globalization;

public class Example
{
   public static void Main()
   {
      int ctr = 0;
      UnicodeCategory category = UnicodeCategory.UppercaseLetter;

      for (ushort codePoint = 0; codePoint < ushort.MaxValue; codePoint++) {
         Char ch = (char)codePoint;

         if (CharUnicodeInfo.GetUnicodeCategory(ch) == category) {
            if (ctr % 5 == 0)
               Console.WriteLine();
            Console.Write("{0} (U+{1:X4})     ", ch, codePoint);
            ctr++;
         }
      }
      Console.WriteLine();
      Console.WriteLine("\n{0} characters are in the {1:G} category",
                        ctr, category);
   }
}
Imports System.Globalization

Module Example
   Public Sub Main()
      Dim ctr As Integer = 0
      Dim category As UnicodeCategory = UnicodeCategory.UppercaseLetter
      
      For codePoint As UShort = 0 To UShort.MaxValue - 1
         Dim ch As Char = Convert.ToChar(codePoint)

         If CharUnicodeInfo.GetUnicodeCategory(ch) = category Then
            If ctr Mod 5 = 0 Then Console.WriteLine()
            Console.Write("{0} (U+{1:X4})     ", ch, codePoint)
            ctr += 1
         End If 
      Next
      Console.WriteLine()
      Console.WriteLine()
      Console.WriteLine("{0} characters are in the {1:G} category", 
                        ctr, category)   
   End Sub
End Module

설명

열거형의 UnicodeCategory 멤버는 및 CharUnicodeInfo.GetUnicodeCategory 메서드에 Char.GetUnicodeCategory 의해 반환됩니다. UnicodeCategory 열거형은 메서드(예: IsUpper(Char).)를 지원하는 Char 데도 사용됩니다. 이러한 메서드는 지정된 문자가 특정 유니코드 일반 범주의 멤버인지 여부를 결정합니다. 유니코드 일반 범주는 문자의 광범위한 분류, 즉 문자 유형, 소수 자릿수, 구분 기호, 수학적 기호, 문장 부호 등을 정의합니다.

이 열거형은 유니코드 표준 버전 5.0을 기반으로 합니다. 자세한 내용은 유니코드 문자 데이터베이스의 "UCD 파일 형식" 및 "일반 범주 값" 하위 항목을 참조하세요.

유니코드 표준은 다음을 정의합니다.

서로게이트 쌍은 두 코드 단위의 시퀀스로 구성된 단일 추상 문자에 대한 코딩된 문자 표현입니다. 여기서 쌍의 첫 번째 단위는 높은 서로게이트이고 두 번째는 낮은 서로게이트입니다. 상위 서로게이트는 U+D800~U+DBFF 범위의 유니코드 코드 지점이며 낮은 서로게이트는 U+DC00~U+DFFF 범위의 유니코드 코드 지점입니다.

결합 문자 시퀀스는 기본 문자와 하나 이상의 결합 문자의 조합입니다. 서로게이트 쌍은 기본 문자 또는 결합 문자를 나타냅니다. 결합 문자는 간격 또는 간격이 없습니다. 공백 결합 문자는 렌더링될 때 그 자체로 간격 위치를 차지하지만 간격이 없는 결합 문자는 그렇지 않습니다. Diacritics는 간격이 없는 결합 문자의 예입니다.

한정자 문자는 결합 문자와 마찬가지로 이전 문자의 수정 사항을 나타내는 자유 간격 문자입니다.

바깥쪽 표시는 기본 문자를 포함하여 모든 이전 문자를 둘러싸는 간격이 없는 결합 문자입니다.

서식 문자는 일반적으로 렌더링되지 않지만 텍스트 레이아웃 또는 텍스트 프로세스 작업에 영향을 주는 문자입니다.

유니코드 표준은 일부 문장 부호에 대한 몇 가지 변형을 정의합니다. 예를 들어 하이픈은 U+002D(하이픈-빼기) 또는 U+00AD(소프트 하이픈) 또는 U+2010(하이픈) 또는 U+2011(언브레이킹 하이픈)과 같이 하이픈을 나타내는 여러 코드 값 중 하나일 수 있습니다. 대시, 공백 문자 및 따옴표도 마찬가지입니다.

또한 유니코드 표준은 지정된 스크립트 또는 언어(예: U+0030(숫자 0) 및 U+0660(Arabic-Indic 숫자 0)과 같은 소수 자릿수 표현에 코드를 할당합니다.

적용 대상

추가 정보