NormalizationForm Sabit listesi
Tanım
Önemli
Bazı bilgiler ürünün ön sürümüyle ilgilidir ve sürüm öncesinde önemli değişiklikler yapılmış olabilir. Burada verilen bilgilerle ilgili olarak Microsoft açık veya zımni hiçbir garanti vermez.
Gerçekleştirilecek normalleştirme türünü tanımlar.
public enum class NormalizationForm
public enum NormalizationForm
[System.Runtime.InteropServices.ComVisible(true)]
public enum NormalizationForm
type NormalizationForm =
[<System.Runtime.InteropServices.ComVisible(true)>]
type NormalizationForm =
Public Enum NormalizationForm
- Devralma
- Öznitelikler
Alanlar
FormC | 1 | Unicode dizesinin tam kurallı ayrıştırma kullanılarak normalleştirildiğini ve mümkünse sıraların birincil bileşikleriyle değiştirilmesini gösterir. |
FormD | 2 | Unicode dizesinin tam kurallı ayrıştırma kullanılarak normalleştirildiğini gösterir. |
FormKC | 5 | Unicode dizesinin tam uyumluluk ayrıştırması kullanılarak normalleştirildiğini ve mümkünse sıraların birincil bileşikleriyle değiştirilmesini gösterir. |
FormKD | 6 | Unicode dizesinin tam uyumluluk ayrıştırması kullanılarak normalleştirildiğini gösterir. |
Açıklamalar
Bazı Unicode dizileri aynı karakteri temsil ettiğinden eşdeğer olarak kabul edilir. Örneğin, bunlardan herhangi biri "ắ" temsil etmek için kullanılabildiğinden aşağıdakiler eşdeğer olarak kabul edilir:
"\u1EAF" (U+1EAF LATIN KÜÇÜK A HARFI BREVE VE AKUT)
"\u0103\u0301" (U+0103 LATIN KÜÇÜK HARF A WITH BREVE + U+0301 COMBINING AKUT VURGU)
"\u0061\u0306\u0301" (U+0061 LATIN KÜÇÜK HARF A + U+0306 BREVE BIRLEŞTIRILIYOR + U+0301 AKUT VURGU BIRLEŞTIRME)
Ancak, sıralı, yani ikili karşılaştırmalar, farklı Unicode kod değerleri içerdiği için bu dizileri farklı olarak kabul eder. Sıralı karşılaştırmalar yapmadan önce, uygulamaların bu dizeleri temel bileşenlerine ayırmak için normalleştirmesi gerekir.
Her bileşik Unicode karakteri, bir veya daha fazla karakterden oluşan daha temel bir diziyle eşlenir. Ayrıştırma işlemi, dizedeki bileşik karakterleri daha temel eşlemeleriyle değiştirir. Tam ayrıştırma, dizedeki karakterlerin hiçbiri daha fazla ayrıştırılmadan bu değişikliği yinelemeli olarak gerçekleştirir.
Unicode iki tür ayrıştırma tanımlar: uyumluluk ayrıştırma ve kurallı ayrıştırma. Uyumluluk ayrıştırmada biçimlendirme bilgileri kaybolabilir. Uyumluluk ayrıştırmasının bir alt kümesi olan kurallı ayrıştırmada biçimlendirme bilgileri korunur.
Tam kurallı ayrıştırmaları aynıysa, iki karakter kümesinin kuralsal eşitliği olduğu kabul edilir. Benzer şekilde, tam uyumluluk ayrıştırmaları aynıysa iki karakter kümesinin de uyumluluk eşdeğerliğine sahip olduğu kabul edilir.
Normalleştirme, ayrıştırmalar ve denklik hakkında daha fazla bilgi için bkz. unicode.org'da Unicode Standart Ek #15: Unicode Normalleştirme Formları .