次の方法で共有


StringInfo.ParseCombiningCharacters メソッド

指定した文字列の各基本文字、上位サロゲート、または制御文字のインデックスを返します。

Public Shared Function ParseCombiningCharacters( _
   ByVal str As String _) As Integer()
[C#]
public static int[] ParseCombiningCharacters(stringstr);
[C++]
public: static int ParseCombiningCharacters(String* str)  __gc[];
[JScript]
public static function ParseCombiningCharacters(
   str : String) : int[];

パラメータ

  • str
    検索対象の文字列。

戻り値

指定した文字列の各基本文字、上位サロゲート、または制御文字の、0 から始まるインデックス番号を格納している整数の配列。

例外

例外の種類 条件
ArgumentNullException str が null 参照 (Visual Basic では Nothing) です。

解説

Unicode Standard は、サロゲート ペアを 2 つのコード単位から成る単一の抽象文字を表すコード化文字表現として定義します。ペアの最初の単位が上位サロゲート、2 番目の単位が下位サロゲートとなります。上位サロゲートは U+D800 ~ U+DBFF の範囲の Unicode コード ポイントであり、下位サロゲートは U+DC00 ~ U+DFFF の範囲の Unicode コード ポイントです。

制御文字とは、Unicode 値が U+007F であるか、U+0000 ~ U+001F または U+0080 ~ U+009F の範囲の文字のことを指します。

.NET Framework は、単一の文字として表示されるテキストの単位、つまり書記素としてテキスト要素を定義します。テキスト要素は、基本文字、サロゲート ペア、または組み合わせた文字シーケンスの場合があります。Unicode Standard は、組み合わせ文字シーケンスを 1 つの基本文字と 1 つ以上の組み合わせ文字の組み合わせとして定義します。サロゲート ペアは、基本文字または組み合わせた文字を表すことができます。サロゲート ペアおよび組み合わせ文字シーケンスの詳細については、http://www.unicode.org の「The Unicode Standard」を参照してください。

組み文字シーケンスが無効な場合は、そのシーケンスのすべての組み文字も返されます。

結果として返される配列の各インデックスは、テキスト要素の先頭、つまり、基本文字または上位サロゲートのインデックスです。

各要素の長さは、連続するインデックス間の差として簡単に計算できます。配列の長さは、常に文字列の長さ以下になります。たとえば、文字列 "\u4f00\u302a\ud800\udc00\u4f01" では、このメソッドはインデックス 0、2、および 4 を返します。

必要条件

プラットフォーム: Windows 98, Windows NT 4.0, Windows Millennium Edition, Windows 2000, Windows XP Home Edition, Windows XP Professional, Windows Server 2003 ファミリ, .NET Compact Framework - Windows CE .NET

参照

StringInfo クラス | StringInfo メンバ | System.Globalization 名前空間