Bagikan melalui


NormalizationForm Enum

Definisi

Menentukan jenis normalisasi yang akan dilakukan.

public enum class NormalizationForm
public enum NormalizationForm
[System.Runtime.InteropServices.ComVisible(true)]
public enum NormalizationForm
type NormalizationForm = 
[<System.Runtime.InteropServices.ComVisible(true)>]
type NormalizationForm = 
Public Enum NormalizationForm
Warisan
NormalizationForm
Atribut

Bidang

Nama Nilai Deskripsi
FormC 1

Menunjukkan bahwa string Unicode dinormalisasi menggunakan dekomposisi kanonis penuh, diikuti dengan penggantian urutan dengan komposit utamanya, jika memungkinkan.

FormD 2

Menunjukkan bahwa string Unicode dinormalisasi menggunakan dekomosisi kanonis penuh.

FormKC 5

Menunjukkan bahwa string Unicode dinormalisasi menggunakan dekomposisi kompatibilitas penuh, diikuti dengan penggantian urutan dengan komposit utamanya, jika memungkinkan.

FormKD 6

Menunjukkan bahwa string Unicode dinormalisasi menggunakan penguraian kompatibilitas penuh.

Keterangan

Beberapa urutan Unicode dianggap setara karena mewakili karakter yang sama. Misalnya, berikut ini dianggap setara karena salah satu dari ini dapat digunakan untuk mewakili "αΊ―":

  • "\u1EAF" (U+1EAF LATIN SMALL LETTER A WITH BREVE AND ACUTE)

  • "\u0103\u0301" (U+0103 HURUF LATIN KECIL A DENGAN BREVE + U+0301 MENGGABUNGKAN AKSEN AKUT)

  • "\u0061\u0306\u0301" (U+0061 HURUF LATIN KECIL A + U+0306 MENGGABUNGKAN BREVE + U+0301 MENGGABUNGKAN AKSEN AKUT)

Namun, ordinal, yaitu biner, perbandingan menganggap urutan ini berbeda karena berisi nilai kode Unicode yang berbeda. Sebelum melakukan perbandingan ordinal, aplikasi harus menormalkan string ini untuk menguraikannya ke dalam komponen dasarnya.

Setiap karakter Unicode komposit dipetakan ke urutan yang lebih mendasar dari satu atau beberapa karakter. Proses dekomposisi menggantikan karakter komposit dalam string dengan pemetaan yang lebih mendasar. Penguraian penuh secara rekursif melakukan penggantian ini sampai tidak ada karakter dalam string yang dapat diurai lebih lanjut.

Unicode mendefinisikan dua jenis dekomosisi: penguraian kompatibilitas dan dekomosisi kanonis. Dalam penguraian kompatibilitas, informasi pemformatan mungkin hilang. Dalam dekomosisi kanonis, yang merupakan subset penguraian kompatibilitas, informasi pemformatan dipertahankan.

Dua set karakter dianggap memiliki kesetaraan kanonis jika dekomosisi kanonis penuh mereka identik. Demikian juga, dua set karakter dianggap memiliki kesetaraan kompatibilitas jika dekomporasi kompatibilitas penuhnya identik.

Untuk informasi selengkapnya tentang normalisasi, dekomosisi, dan kesetaraan, lihat Unicode Standard Annex #15: Formulir Normalisasi Unicode pada unicode.org.

Berlaku untuk

Lihat juga