Obsługa formatu Unicode w kompilatorze i konsolidatorze
Większość narzędzi kompilacji języka Microsoft C/C++ (MSVC) obsługuje dane wejściowe i wyjściowe Unicode.
Nazwy plików
Nazwy plików określone w wierszu polecenia lub w dyrektywach kompilatora (takich jak #include
) mogą zawierać znaki Unicode.
Pliki kodu źródłowego
Znaki Unicode są obsługiwane w identyfikatorach, makrach, literałach ciągów i znaków oraz w komentarzach. Obsługiwane są również nazwy znaków uniwersalnych.
Kod Unicode może być wejściowy do pliku kodu źródłowego w następujących kodowaniach:
UTF-16 little endian with or without byte order mark (BOM)
UTF-16 big endian z BOM lub bez
UTF-8 z BOM
W środowisku IDE programu Visual Studio można zapisywać pliki w kilku formatach kodowania, w tym w standardach Unicode. Zapisz je w oknie dialogowym Zapisz plik jako przy użyciu listy rozwijanej na przycisku Zapisz . Wybierz pozycję Zapisz z kodowaniem na liście rozwijanej. Następnie w oknie dialogowym Zaawansowane opcje zapisywania wybierz kodowanie z listy rozwijanej. Wybierz przycisk OK , aby zapisać plik.
Wyjście
Podczas kompilacji kompilator wyprowadza diagnostykę do konsoli w formacie UTF-16. Znaki, które można wyświetlić w konsoli, zależą od właściwości okna konsoli. Dane wyjściowe kompilatora przekierowane do pliku znajduje się na bieżącej stronie kodowej konsoli ANSI.
Pliki i pliki .DEF
odpowiedzi konsolidatora
Pliki odpowiedzi i .DEF
pliki mogą być utF-16 lub UTF-8 z BOM lub ANSI.
.asm
zrzuty i .cod
zrzuty
.asm
i .cod
zrzuty są domyślnie w ANSI pod kątem zgodności z masm. Użyj /FAu
polecenia , aby wyświetlić dane wyjściowe UTF-8.
Jeśli określisz /FAs
wartość , źródło połączone zostanie wydrukowane bezpośrednio. Może to wyglądać na niezwiązane, na przykład, gdy kod źródłowy to UTF-8 i nie określono /FAsu
wartości .