Utiliser des pages de codes UTF-8 dans des applications Windows

Utilisez l’encodage de caractères UTF-8 bits (Unicode Transformation Format 8 bits) pour optimiser la compatibilité entre les applications web et d’autres plateformes *nix (Unix, Linux et variantes), réduire les bogues de localisation et réduire la surcharge de test.

UTF-8 est la page de codes universelle pour l’internationalisation et est en mesure d’encoder l’ensemble du jeu de caractères Unicode. Il est largement utilisé sur le web et est l’encodage par défaut pour les plateformes XML et *nix.

Définir une page de codes de processus sur UTF-8

À compter de Windows Version 1903 (mise à jour de mai 2019), vous pouvez spécifier la propriété activeCodePage dans l’appxmanifest pour les applications empaquetées (ou le manifeste de fusion pour les applications non empaquetées) afin de forcer un processus à utiliser UTF-8 comme page de codes de processus.

Remarque

L’interface d’appareil graphique Windows (GDI) ne prend actuellement pas en charge la définition de la propriété activeCodePage par processus. Au lieu de cela, GDI est défini par défaut sur la page de codes système active. Pour configurer votre application pour afficher du texte UTF-8 via GDI, accédez à Windows Paramètres>Heure et langue>Langue et région>Paramétrage de langue administrative>Changer les paramètres régionaux système, et vérifier Bêta: Utilisez l'Unicode UTF-8 pour la prise en charge des langues dans le monde entier. Redémarrez ensuite l'ordinateur pour que les modifications soient prises en compte.

Vous pouvez déclarer la propriété activeCodePage et viser/exécuter sur des versions antérieures de Windows, mais vous devez gérer la détection et la conversion des pages de code héritées comme d’habitude. Avec une version cible minimale de Windows Version 1903, la page de codes de processus sera toujours UTF-8, de sorte que la détection et la conversion de pages de codes héritées peuvent être évitées.

Remarque

Dans UTF-8, un caractère encodé est représenté par une séquence de 1 à 4 octets. (Voir la définition D92 dans le chapitre 3 de la norme Unicode pour la spécification formelle.)

Exemples

Manifeste Appx pour une application empaquetée :

<?xml version="1.0" encoding="utf-8"?>
<Package xmlns="http://schemas.microsoft.com/appx/manifest/foundation/windows10"
         ...
         xmlns:uap7="http://schemas.microsoft.com/appx/manifest/uap/windows10/7"
         xmlns:uap8="http://schemas.microsoft.com/appx/manifest/uap/windows10/8"
         ...
         IgnorableNamespaces="... uap7 uap8 ...">

  <Applications>
    <Application ...>
      <uap7:Properties>
        <uap8:activeCodePage>UTF-8</uap8:activeCodePage>
      </uap7:Properties>
    </Application>
  </Applications>
</Package>

Manifeste fusion pour une application Win32 non empaquetée :

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<assembly manifestVersion="1.0" xmlns="urn:schemas-microsoft-com:asm.v1">
  <assemblyIdentity type="win32" name="..." version="6.0.0.0"/>
  <application>
    <windowsSettings>
      <activeCodePage xmlns="http://schemas.microsoft.com/SMI/2019/WindowsSettings">UTF-8</activeCodePage>
    </windowsSettings>
  </application>
</assembly>

Remarque

Ajoutez un manifeste à un exécutable existant à partir de la ligne de commande avec mt.exe -manifest <MANIFEST> -outputresource:<EXE>;#1.

-A et -W API

Les API Win32 prennent souvent en charge les variantes -A et -W.

-Les variantes reconnaissent la page de codes ANSI configurée sur le système et la prise en charge char*, tandis que les variantes -W fonctionnent dans UTF-16 et prennent en charge WCHAR.

Jusqu’à récemment, Windows a mis l’accent sur les variantes « Unicode » -W sur les API -A. Toutefois, les versions récentes ont utilisé la page de codes ANSI et les API -A comme moyen d’introduire la prise en charge de UTF-8 pour les applications. Si la page de codes ANSI est configurée pour UTF-8, les API -A fonctionnent généralement dans UTF-8. Ce modèle présente l’avantage de prendre en charge le code existant créé avec les API -A sans aucune modification de code.

Conversions de pages de code

Étant donné que Windows fonctionne en mode natif dans UTF-16 (WCHAR), vous devrez peut-être convertir des données UTF-8 en UTF-16 (ou vice versa) pour interagir avec les API Windows.

MultiByteToWideChar et WideCharToMultiByte vous permettent de convertir entre UTF-8 et UTF-16 (WCHAR) (et d’autres pages de codes). Cela est particulièrement utile lorsqu’une API Win32 héritée peut uniquement comprendre WCHAR. Ces fonctions vous permettent de convertir l’entrée UTF-8 pour WCHAR passer dans une API -W, puis de convertir les résultats si nécessaire.

Utilisez dwFlags de 0 ou MB_ERR_INVALID_CHARS lorsque vous utilisez ces fonctions et que CodePage est réglé sur CP_UTF8 (sinon un ERROR_INVALID_FLAGS se produit).

Remarque

CP_ACP équivaut à CP_UTF8 uniquement s’il s’exécute sur Windows Version 1903 (mise à jour de mai 2019) ou ultérieure et que la propriété activeCodePage décrite ci-dessus est définie sur UTF-8. Sinon, il respecte la page de codes système héritée. Nous vous recommandons d’utiliser CP_UTF8 explicitement.

Commentaires

Cette page a-t-elle été utile ?

Last updated on 2025-07-18

Utiliser des pages de codes UTF-8 dans des applications Windows

Définir une page de codes de processus sur UTF-8

Exemples

-A et -W API

Conversions de pages de code

Rubriques connexes

Commentaires

Ressources supplémentaires