NormalizationForm Enum
Definisi
Penting
Beberapa informasi terkait produk prarilis yang dapat diubah secara signifikan sebelum dirilis. Microsoft tidak memberikan jaminan, tersirat maupun tersurat, sehubungan dengan informasi yang diberikan di sini.
Menentukan jenis normalisasi yang akan dilakukan.
public enum class NormalizationForm
public enum NormalizationForm
[System.Runtime.InteropServices.ComVisible(true)]
public enum NormalizationForm
type NormalizationForm =
[<System.Runtime.InteropServices.ComVisible(true)>]
type NormalizationForm =
Public Enum NormalizationForm
- Warisan
- Atribut
Bidang
FormC | 1 | Menunjukkan bahwa string Unicode dinormalisasi menggunakan dekomposisi kanonis penuh, diikuti dengan penggantian urutan dengan komposit utamanya, jika memungkinkan. |
FormD | 2 | Menunjukkan bahwa string Unicode dinormalisasi menggunakan dekomosisi kanonis penuh. |
FormKC | 5 | Menunjukkan bahwa string Unicode dinormalisasi menggunakan dekomposisi kompatibilitas penuh, diikuti dengan penggantian urutan dengan komposit utamanya, jika memungkinkan. |
FormKD | 6 | Menunjukkan bahwa string Unicode dinormalisasi menggunakan penguraian kompatibilitas penuh. |
Keterangan
Beberapa urutan Unicode dianggap setara karena mewakili karakter yang sama. Misalnya, berikut ini dianggap setara karena salah satu dari ini dapat digunakan untuk mewakili "αΊ―":
"\u1EAF" (U+1EAF LATIN SMALL LETTER A WITH BREVE AND ACUTE)
"\u0103\u0301" (U+0103 HURUF LATIN KECIL A DENGAN BREVE + U+0301 MENGGABUNGKAN AKSEN AKUT)
"\u0061\u0306\u0301" (U+0061 HURUF LATIN KECIL A + U+0306 MENGGABUNGKAN BREVE + U+0301 MENGGABUNGKAN AKSEN AKUT)
Namun, ordinal, yaitu biner, perbandingan menganggap urutan ini berbeda karena berisi nilai kode Unicode yang berbeda. Sebelum melakukan perbandingan ordinal, aplikasi harus menormalkan string ini untuk menguraikannya ke dalam komponen dasarnya.
Setiap karakter Unicode komposit dipetakan ke urutan yang lebih mendasar dari satu atau beberapa karakter. Proses dekomposisi menggantikan karakter komposit dalam string dengan pemetaan yang lebih mendasar. Penguraian penuh secara rekursif melakukan penggantian ini sampai tidak ada karakter dalam string yang dapat diurai lebih lanjut.
Unicode mendefinisikan dua jenis dekomosisi: penguraian kompatibilitas dan dekomosisi kanonis. Dalam penguraian kompatibilitas, informasi pemformatan mungkin hilang. Dalam dekomosisi kanonis, yang merupakan subset penguraian kompatibilitas, informasi pemformatan dipertahankan.
Dua set karakter dianggap memiliki kesetaraan kanonis jika dekomosisi kanonis penuh mereka identik. Demikian juga, dua set karakter dianggap memiliki kesetaraan kompatibilitas jika dekomporasi kompatibilitas penuhnya identik.
Untuk informasi selengkapnya tentang normalisasi, dekomosisi, dan kesetaraan, lihat Unicode Standard Annex #15: Formulir Normalisasi Unicode pada unicode.org.