Aracılığıyla paylaş


Belirteçler ve karakter kümeleri

C++ programının metni belirteçlerden ve boşluklardan oluşur. Bir belirteç C++ programının derleyicisi için anlamlı olan en küçük öğesidir. C++ ayrıştırıcısı şu belirteç türlerini tanır:

Belirteçler genellikle bir veya daha fazla boşlukla ayrılır:

  • Boşluklar
  • Yatay veya dikey sekmeler
  • Yeni satırlar
  • Form akışları
  • Açıklamalar

Temel kaynak karakter kümesi

C++ standardı, kaynak dosyalarda kullanılabilecek temel bir kaynak karakter kümesi belirtir. Bu kümenin dışındaki karakterleri temsil etmek için, evrensel karakter adı kullanılarak ek karakterler belirtilebilir. MSVC uygulaması ek karakterlere izin verir. Temel kaynak karakter kümesi , kaynak dosyalarda kullanılabilecek 96 karakterden oluşur. Bu küme boşluk karakterini, yatay sekmeyi, dikey sekmeyi, form akışını ve yeni satır denetimi karakterlerini ve bu grafik karakter kümesini içerir:

a b c d e f g h i j k l m n o p q r s t u v w x y z

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

0 1 2 3 4 5 6 7 8 9

_ { } [ ] # ( ) < > % : ; . ? * + - / ^ & | ~ ! = , \ " '

Microsoft'a Özgü

MSVC, karakteri temel kaynak karakter kümesinin bir üyesi olarak içerir $ . MSVC, dosya kodlamasına bağlı olarak kaynak dosyalarda ek bir karakter kümesinin kullanılmasına da izin verir. Varsayılan olarak, Visual Studio varsayılan kod sayfasını kullanarak kaynak dosyaları depolar. Kaynak dosyalar yerel ayara özgü bir kod sayfası veya Unicode kod sayfası kullanılarak kaydedildiğinde MSVC, temel kaynak karakter kümesinde açıkça izin verilmeyen denetim kodları dışında kaynak kodunuzda bu kod sayfasının karakterlerinden herhangi birini kullanmanıza olanak tanır. Örneğin, dosyayı Japonca bir kod sayfası kullanarak kaydederseniz açıklamalara, tanımlayıcılara veya dize değişmez değerlerine Japonca karakterler ekleyebilirsiniz. MSVC, geçerli çok baytlı karakterlere veya Unicode kod noktalarına çevrilemeyen karakter dizilerine izin vermez. Derleyici seçeneklerine bağlı olarak, tanımlayıcılarda izin verilen tüm karakterler görünmeyebilir. Daha fazla bilgi edinmek için bkz. Tanımlayıcılar.

END Microsoft'a Özgü

Evrensel karakter adları

C++ programları temel kaynak karakter kümesinde belirtilenlerden çok daha fazla karakter kullanabildiğinden, evrensel karakter adlarını kullanarak bu karakterleri taşınabilir bir şekilde belirtebilirsiniz. Evrensel karakter adı, Unicode kod noktasını temsil eden bir karakter dizisini içerir. Bunlar iki form alır. U+NNNNNNNNN formunun Unicode kod noktasını temsil etmek için kullanın \UNNNNNNNN ; burada NNNNNNNN, sekiz basamaklı onaltılık kod noktası numarasıdır. U+0000NNNNN formunun Unicode kod noktasını temsil etmek için dört basamaklı \uNNNN kullanın.

Evrensel karakter adları tanımlayıcılarda, dize ve karakter değişmez değerlerinde kullanılabilir. Evrensel karakter adı, 0xD800-0xDFFF aralığındaki bir vekil kod noktasını temsil etmek için kullanılamaz. Bunun yerine, istenen kod noktasını kullanın; derleyicisi gerekli vekilleri otomatik olarak oluşturur. Tanımlayıcılarda kullanılabilecek evrensel karakter adlarına ek kısıtlamalar uygulanır. Daha fazla bilgi için bkz . Tanımlayıcılar , Dize ve Karakter Değişmez Değerleri.

Microsoft'a Özgü

Microsoft C++ derleyicisi, bir karakteri evrensel karakter adı biçiminde ve değişmez değer biçiminde birbirinin yerine kullanır. Örneğin, evrensel karakter adı formunu kullanarak bir tanımlayıcı bildirebilir ve değişmez değer biçiminde kullanabilirsiniz:

auto \u30AD = 42; // \u30AD is 'キ'
if (キ == 42) return true; // \u30AD and キ are the same to the compiler

Windows panosundaki genişletilmiş karakterlerin biçimi uygulama yerel ayarı ayarlarına özgüdür. Bu karakterlerin başka bir uygulamadan kodunuzla kesilmesi ve yapıştırılması beklenmeyen karakter kodlamalarına neden olabilir. Bu, kodunuzda görünür bir neden olmadan ayrıştırma hatalarına neden olabilir. Genişletilmiş karakterleri yapıştırmadan önce kaynak dosya kodlamanızı unicode kod sayfasına ayarlamanızı öneririz. Ayrıca, genişletilmiş karakterler oluşturmak için bir IME veya Karakter Eşlemesi uygulaması kullanmanızı öneririz.

END Microsoft'a Özgü

Yürütme karakter kümeleri

Yürütme karakter kümeleri, derlenmiş bir programda görünebilen karakterleri ve dizeleri temsil eder. Bu karakter kümeleri bir kaynak dosyada izin verilen tüm karakterlerden ve uyarı, geri al, satır başı ve null karakteri temsil eden denetim karakterlerinden oluşur. Yürütme karakter kümesinin yerel ayara özgü bir gösterimi vardır.