英語で読む

次の方法で共有


String.IsNormalized メソッド

定義

この文字列が、特定の Unicode 正規形であるかどうかを示します。

オーバーロード

IsNormalized()

この文字列が、Unicode 正規形 C であるかどうかを示します。

IsNormalized(NormalizationForm)

この文字列が、指定された Unicode 正規形であるかどうかを示します。

次の例では、文字列がさまざまな正規化形式に正常に正規化されるかどうかを判断します。

using System;
using System.Text;

class Example
{
    public static void Main()
    {
       // Character c; combining characters acute and cedilla; character 3/4
       string s1 = new String( new char[] {'\u0063', '\u0301', '\u0327', '\u00BE'});
       string s2 = null;
       string divider = new String('-', 80);
       divider = String.Concat(Environment.NewLine, divider, Environment.NewLine);

       Show("s1", s1);
       Console.WriteLine();
       Console.WriteLine("U+0063 = LATIN SMALL LETTER C");
       Console.WriteLine("U+0301 = COMBINING ACUTE ACCENT");
       Console.WriteLine("U+0327 = COMBINING CEDILLA");
       Console.WriteLine("U+00BE = VULGAR FRACTION THREE QUARTERS");
       Console.WriteLine(divider);

       Console.WriteLine("A1) Is s1 normalized to the default form (Form C)?: {0}",
                                    s1.IsNormalized());
       Console.WriteLine("A2) Is s1 normalized to Form C?:  {0}",
                                    s1.IsNormalized(NormalizationForm.FormC));
       Console.WriteLine("A3) Is s1 normalized to Form D?:  {0}",
                                    s1.IsNormalized(NormalizationForm.FormD));
       Console.WriteLine("A4) Is s1 normalized to Form KC?: {0}",
                                    s1.IsNormalized(NormalizationForm.FormKC));
       Console.WriteLine("A5) Is s1 normalized to Form KD?: {0}",
                                    s1.IsNormalized(NormalizationForm.FormKD));

       Console.WriteLine(divider);

       Console.WriteLine("Set string s2 to each normalized form of string s1.");
       Console.WriteLine();
       Console.WriteLine("U+1E09 = LATIN SMALL LETTER C WITH CEDILLA AND ACUTE");
       Console.WriteLine("U+0033 = DIGIT THREE");
       Console.WriteLine("U+2044 = FRACTION SLASH");
       Console.WriteLine("U+0034 = DIGIT FOUR");
       Console.WriteLine(divider);

       s2 = s1.Normalize();
       Console.Write("B1) Is s2 normalized to the default form (Form C)?: ");
       Console.WriteLine(s2.IsNormalized());
       Show("s2", s2);
       Console.WriteLine();

       s2 = s1.Normalize(NormalizationForm.FormC);
       Console.Write("B2) Is s2 normalized to Form C?: ");
       Console.WriteLine(s2.IsNormalized(NormalizationForm.FormC));
       Show("s2", s2);
       Console.WriteLine();

       s2 = s1.Normalize(NormalizationForm.FormD);
       Console.Write("B3) Is s2 normalized to Form D?: ");
       Console.WriteLine(s2.IsNormalized(NormalizationForm.FormD));
       Show("s2", s2);
       Console.WriteLine();

       s2 = s1.Normalize(NormalizationForm.FormKC);
       Console.Write("B4) Is s2 normalized to Form KC?: ");
       Console.WriteLine(s2.IsNormalized(NormalizationForm.FormKC));
       Show("s2", s2);
       Console.WriteLine();

       s2 = s1.Normalize(NormalizationForm.FormKD);
       Console.Write("B5) Is s2 normalized to Form KD?: ");
       Console.WriteLine(s2.IsNormalized(NormalizationForm.FormKD));
       Show("s2", s2);
       Console.WriteLine();
    }

    private static void Show(string title, string s)
    {
       Console.Write("Characters in string {0} = ", title);
       foreach(short x in s) {
           Console.Write("{0:X4} ", x);
       }
       Console.WriteLine();
    }
}
/*
This example produces the following results:

Characters in string s1 = 0063 0301 0327 00BE

U+0063 = LATIN SMALL LETTER C
U+0301 = COMBINING ACUTE ACCENT
U+0327 = COMBINING CEDILLA
U+00BE = VULGAR FRACTION THREE QUARTERS

--------------------------------------------------------------------------------

A1) Is s1 normalized to the default form (Form C)?: False
A2) Is s1 normalized to Form C?:  False
A3) Is s1 normalized to Form D?:  False
A4) Is s1 normalized to Form KC?: False
A5) Is s1 normalized to Form KD?: False

--------------------------------------------------------------------------------

Set string s2 to each normalized form of string s1.

U+1E09 = LATIN SMALL LETTER C WITH CEDILLA AND ACUTE
U+0033 = DIGIT THREE
U+2044 = FRACTION SLASH
U+0034 = DIGIT FOUR

--------------------------------------------------------------------------------

B1) Is s2 normalized to the default form (Form C)?: True
Characters in string s2 = 1E09 00BE

B2) Is s2 normalized to Form C?: True
Characters in string s2 = 1E09 00BE

B3) Is s2 normalized to Form D?: True
Characters in string s2 = 0063 0327 0301 00BE

B4) Is s2 normalized to Form KC?: True
Characters in string s2 = 1E09 0033 2044 0034

B5) Is s2 normalized to Form KD?: True
Characters in string s2 = 0063 0327 0301 0033 2044 0034

*/

IsNormalized()

ソース:
String.cs
ソース:
String.cs
ソース:
String.cs

この文字列が、Unicode 正規形 C であるかどうかを示します。

public bool IsNormalized ();

戻り値

この文字列が正規形 C である場合は true。それ以外の場合は false

例外

現在のインスタンスに、正しくない Unicode 文字が含まれています。

注釈

一部の Unicode 文字には、組み合わせや複合 Unicode 文字のセットで構成される複数の同等のバイナリ表現があります。 1 つの文字に対して複数の表現が存在すると、検索、並べ替え、照合、その他の操作が複雑になります。

Unicode 標準では、文字の同等のバイナリ表現のいずれかが指定されたときに 1 つのバイナリ表現を返す正規化と呼ばれるプロセスを定義します。 正規化は、さまざまなルールに従う正規化フォームと呼ばれるいくつかのアルゴリズムを使用して実行できます。 .NET では現在、正規化フォーム C、D、KC、KD がサポートされています。

サポートされている Unicode 正規化フォームの説明については、「」を参照してください System.Text.NormalizationForm

注意 (呼び出し元)

メソッドは IsNormalized 、文字列内で false 正規化されていない最初の文字が検出されるとすぐに を返します。 したがって、文字列に正規化されていない文字の後に無効な Unicode 文字が続く場合、 Normalize メソッドは を ArgumentException スローしますが、 は IsNormalized を返します false

こちらもご覧ください

適用対象

.NET 9 およびその他のバージョン
製品 バージョン
.NET Core 2.0, Core 2.1, Core 2.2, Core 3.0, Core 3.1, 5, 6, 7, 8, 9
.NET Framework 2.0, 3.0, 3.5, 4.0, 4.5, 4.5.1, 4.5.2, 4.6, 4.6.1, 4.6.2, 4.7, 4.7.1, 4.7.2, 4.8, 4.8.1
.NET Standard 2.0, 2.1

IsNormalized(NormalizationForm)

ソース:
String.cs
ソース:
String.cs
ソース:
String.cs

この文字列が、指定された Unicode 正規形であるかどうかを示します。

public bool IsNormalized (System.Text.NormalizationForm normalizationForm);

パラメーター

normalizationForm
NormalizationForm

Unicode 正規形。

戻り値

この文字列が true パラメーターに指定された正規形である場合は normalizationForm。それ以外の場合は false

例外

現在のインスタンスに、正しくない Unicode 文字が含まれています。

注釈

一部の Unicode 文字には、組み合わせや複合 Unicode 文字のセットで構成される複数の同等のバイナリ表現があります。 1 つの文字に対して複数の表現が存在すると、検索、並べ替え、照合、その他の操作が複雑になります。

Unicode 標準では、文字の同等のバイナリ表現のいずれかが指定されたときに 1 つのバイナリ表現を返す正規化と呼ばれるプロセスを定義します。 正規化は、さまざまなルールに従う正規化フォームと呼ばれるいくつかのアルゴリズムを使用して実行できます。 .NET では現在、正規化フォーム C、D、KC、KD がサポートされています。

サポートされている Unicode 正規化フォームの説明については、「」を参照してください System.Text.NormalizationForm

注意 (呼び出し元)

メソッドは IsNormalized 、文字列内で false 正規化されていない最初の文字が検出されるとすぐに を返します。 したがって、文字列に正規化されていない文字の後に無効な Unicode 文字が続く場合、 Normalize メソッドは を ArgumentException スローしますが、 は IsNormalized を返します false

こちらもご覧ください

適用対象

.NET 9 およびその他のバージョン
製品 バージョン
.NET Core 2.0, Core 2.1, Core 2.2, Core 3.0, Core 3.1, 5, 6, 7, 8, 9
.NET Framework 2.0, 3.0, 3.5, 4.0, 4.5, 4.5.1, 4.5.2, 4.6, 4.6.1, 4.6.2, 4.7, 4.7.1, 4.7.2, 4.8, 4.8.1
.NET Standard 2.0, 2.1