Qu’est-ce que Windows AI APIs?

Image montrant les icônes pour différentes applications Windows AI APIs.

Windows AI Foundry fournit une variété de fonctionnalités d’intelligence artificielle (IA) grâce à une suite de fonctionnalités Windows AI APIs et à des capacités d’inférence de l’IA abstraites du matériel, rendues possibles par Windows Machine Learning (ML). Windows AI active les fonctionnalités d’IA APIs sans avoir à rechercher, exécuter ou optimiser votre propre modèle Machine Learning (ML). Les modèles qui alimentent Windows AI Foundry s’exécutent localement sur des appareils Windows 11 pris en charge, notamment Copilot+ PCs avec des processeurs npus, des appareils avec des GPU pris en charge et des appareils qui répondent aux spécifications de processeur recommandées et peuvent s’exécuter en continu en arrière-plan.

Matériel pris en charge

Windows IA APIs s’étendent au-delà de Copilot+ PCs pour prendre en charge un plus large éventail de matériels. Le tableau suivant présente la prise en charge matérielle actuelle pour chaque API.

Note

Sur un PC Copilot+, les fonctionnalités prises en charge APIs s’exécutent toujours sur le NPU. Les colonnes GPU et CPU décrivent l’expansion vers des appareils non Copilot+, ce ne sont pas des back-ends alternatifs que vous pouvez opter pour un Copilot+ PC.

API NPU (Copilot+ PC) Unité de traitement graphique (GPU) CPU (Unité centrale de traitement)
Phi Silicon ✅ Disponible ✅ Disponible (sélectionner des GPU) ❌ Non pris en charge
Reconnaissance de texte (OCR) ✅ Disponible ❌ Non pris en charge ❌ Non pris en charge
Reconnaissance vocale ✅ Disponible ❌ Non pris en charge ✅ Disponible (facultatif, amovible)
Super résolution vidéo ✅ Disponible ❌ Non pris en charge ✅ Disponible
Super résolution d’image ✅ Disponible ❌ Non pris en charge ❌ Non pris en charge
Description de l’image ✅ Disponible ❌ Non pris en charge ❌ Non pris en charge
Segmentation d’images ✅ Disponible ❌ Non pris en charge ❌ Non pris en charge
Effacement de l’objet ✅ Disponible ❌ Non pris en charge ❌ Non pris en charge
Génération d’images ✅ Disponible (facultatif, amovible) ❌ Non pris en charge ❌ Non pris en charge

Note

La prise en charge du GPU pour Phi Silicon est actuellement disponible sur les GPU NVIDIA (série RTX 30 et versions ultérieures avec une vRAM de 6 Go). La prise en charge du GPU AMD est bientôt disponible. L’inférence GPU nécessite l’activation du mode développeur (Système de paramètres>>pour les développeurs) et le dernier pilote GPU installé directement à partir du fabricant (voir Phi Silicon — Configuration requise du pilote GPU). La reconnaissance vocale et la résolution vidéo s’exécutent sur n’importe quel processeur, mais fonctionnent le mieux sur les appareils qui répondent aux spécifications recommandées (4 cœurs physiques , 3 GHz ou une horloge de base supérieure, 32 Mo ou plus du cache L3). Consultez les pages individuelles API pour plus d’informations et une vérification du runtime.

Disponibilité du modèle

La façon dont le modèle IA sous-jacent atteint un appareil dépend des APIéléments suivants :

  • Phi Silicon — Sur Copilot+ PCs le modèle est preinstallé sur le NPU. Sur les appareils GPU et processeur, le modèle n’est pas préinstallé : il est téléchargé à la demande la première fois que votre application appelle EnsureReadyAsync. Les téléchargements peuvent être de plusieurs Go et s’exécuter en arrière-plan via Windows Update. Les utilisateurs finaux peuvent supprimer ou réinstaller le modèle dans Paramètres>Système>Composants d’IA. Les applications doivent d’abord vérifier GetReadyState et afficher une boîte de dialogue de consentement avant de déclencher le téléchargement. Consultez Phi Silicon — Disponibilité du modèle et téléchargement pour le modèle d’expérience utilisateur recommandé.
  • Génération d’images IA : s’exécute uniquement sur le NPU, mais le modèle n’est pas préinstallé en raison de sa taille d’installation. Il est téléchargé à la demande, la première fois que votre application appelle EnsureReadyAsync, et les utilisateurs peuvent ensuite le supprimer dans Paramètres>Système>Composants IA. Les applications doivent d’abord vérifier GetReadyState et afficher une boîte de dialogue de consentement avant de déclencher le téléchargement. Consultez génération d’images IA : disponibilité et téléchargement des modèles pour le modèle d’expérience utilisateur recommandé.
  • Video Super Resolution — Le modèle VSR est fourni avec SDK d'application Windows pour toutes les configurations matérielles prises en charge. Il n’y a pas de téléchargement au premier lancement, d’étape de consentement ni de modèle amovible. Voir Vidéo Super Resolution : spécifications d’UC recommandées.
  • Speech Recognition : sur Copilot+ PCs le modèle est preinstallé sur le NPU. Sur les appareils processeur uniquement, le modèle n’est pas préinstallé : il est téléchargé à la demande la première fois que votre application appelleEnsureReadyAsync, et les utilisateurs peuvent le supprimer ultérieurement dans lescomposants IA>>. Les applications doivent d’abord vérifier GetReadyState et afficher une boîte de dialogue de consentement avant de déclencher le téléchargement sur le processeur. Consultez Reconnaissance vocale : disponibilité du modèle et téléchargement pour le modèle d’expérience utilisateur recommandé.

Consultez l’exemple d’application Windows AI APIs avec WinUI pour savoir comment utiliser Microsoft Foundry on Windows avec WinUI.

Important

Voici une liste des fonctionnalités Windows AI et de la version du Kit de développement logiciel (SDK) d’application Windows dans laquelle elles sont actuellement prises en charge. Consultez la vue d’ensemble disponible APIs plus loin dans cette rubrique pour obtenir de brèves descriptions.

[Version 2.2.2-experimental9 (juin 2026 expérimental)] - Phi Silica sur le GPU (nécessite une build Windows Insider du canal Experimental)

Version 1.8.0 (1.8.250907003) - Phi Silicon (fonctionnalité d’accès limité), synthèse de conversation (text intelligence), effacement d’objet

Version 1.8 Preview (1.8.0-preview) - Optimisation de LoRA pour Phi Silicon, Text Rewriter Tone (Text Intelligence)

Accès anticipé privé - Recherche sémantique

Version 1.7.1 (1.7.250401001) - Tous les autres APIs

Créer votre première application Windows basée sur l’IA

Conseil / Astuce

Pour améliorer l’accessibilité et la lisibilité, cette page affiche toujours des images par défaut. Dans certains cas, vous pouvez cliquer sur une image pour voir une version animée.

Pour créer votre première application Windows avec Visual Studio et une application Windows AI APIssimple, répondez simplement aux prérequis et utilisez l’exemple de code fourni dans Get started building an app with Windows AI APIs.

À partir de là, vous pouvez accéder à des tutoriels courts qui créent une application utilisant une IA Windows APIs spécifique, par exemple Présentation Phi Silica, Présentation Imaging et Présentation OCR.

Essayez les APIs et les modèles sur votre PC

AI Dev Gallery est une application de démonstration disponible à partir du Microsoft Store, qui vous permet de télécharger, tester et utiliser rapidement l’IA APIs Windows et les modèles.

Dans AI Dev Gallery, sélectionnez l’élément de menu onglet Windows AIAPIs, puis sélectionnez l’exemple Phi Silicon. Si le modèle est déjà disponible sur votre appareil, cet exemple s’exécute immédiatement. Sinon, sélectionnez Demander un modèle pour télécharger le modèle. Une fois téléchargé, cet exemple sera activé. En savoir plus sur le AI Dev Gallery dans Qu'est-ce que le AI Dev Gallery ?.

Vue d’ensemble de la disponibilité APIs

Voici quelques fonctionnalités d’IA prêtes à l’emploi que vous pouvez exploiter à partir de votre application Windows :

Phi Silicon

Comme pour les modèles de langage volumineux (LLM), Phi Silicon est un SLM (Small Language Model) développé par Microsoft Research pour effectuer des tâches de traitement linguistique sur un appareil local (voir Get a commencé avec Phi Silicon). Phi Silicon est conçu pour les appareils Windows avec une unité de traitement neuronal (NPU) ou un GPU pris en charge, ce qui permet aux fonctionnalités de génération de texte et de conversation de s’exécuter de manière à hautes performances et à accélération matérielle directement sur l’appareil. Phi Silicon n’est pas disponible en Chine.

Un gif animé montrant une invite de conversation IA intitulée

Reconnaissance de texte

La reconnaissance de texte permet la reconnaissance APIs du texte dans une image et la conversion sur un appareil local de différents types de documents (tels que les documents papier numérisés, les fichiers PDF et les images capturés par une caméra numérique) en données modifiables et pouvant faire l’objet d’une recherche (voir Prise en main de la reconnaissance de texte IA).

Gif animé montrant des mots dans une capture d’écran avec des superpositions de texte reconnues qui peuvent être copiées dans un fichier ou un presse-papiers à l’aide de la fonctionnalité de reconnaissance de texte.

Imagerie

Mettez à l’échelle et aiguisez les images (Résolution super d’image), identifiez les objets dans une image (Extracteur d’objets image), générez des descriptions en langage naturel des images (Description de l’image) et supprimez des objets des images (Effacement d’objet). Voir Démarrage avec AI imaging.

Super résolution d’image

La fonction Super résolution de l'image APIs permet d'améliorer la netteté et la mise à l'échelle des images.

Un GIF animé montrant une image avec un mélange de mots et d’images qui est améliorée et mise à l’échelle à l’aide de la fonctionnalité Super Résolution d’Image.

Voir également La super résolution d’image.

Extracteur d’objets image

L’extracteur APIs d’objets image permet d’identifier des objets dans des images.

Image gif animée montrant un homme soulever un pied au sol, puis en sélectionnant Supprimer l’arrière-plan pour isoler l’image de l’homme sur un arrière-plan blanc à l’aide de la fonctionnalité Extracteur d’objet image.

Consultez également l’extracteur d’objet Image.

Description de l’image

La description d'image APIs décrit les images en langage naturel.

Note

Les fonctionnalités description de l’image ne sont pas disponibles en Chine.

Une image GIF animée représentant un chien endormi, accompagnée d'une fenêtre contextuelle contenant une description de l'image rédigée en langage naturel. Cette description indique qu'il s'agit d'un chien à poil long et touffu, allongé confortablement sur un canapé, grâce à la fonctionnalité Description de l'image.

Voir également la description de l’image

Effacement de l’objet

Vous pouvez utiliser l’effacement APIs d’objet pour supprimer des objets d’images.

Image gif animée montrant une image dans laquelle l’utilisateur supprime des objets à l’aide de la fonctionnalité d’effacement d’objet.

Voir également l’effacement d’objet

Fonctionnalités d’IA supplémentaires

  • Traduction en direct (non encore prise en charge). Aidez tout le monde à utiliser Windows, y compris ceux qui sont sourds ou difficiles à entendre, mieux comprendre l’audio en affichant des sous-titres de contenu parlé (même lorsque le contenu audio se trouve dans une langue différente de la langue préférée du système).

Modération du contenu

Découvrez comment le contenu est modéré par l'IA APIs Windows et comment vous pouvez ajuster les filtres de sensibilité. Consultez la modération de la sécurité du contenu avec Windows AI APIs.

Lorsque vous utilisez des fonctionnalités IA, nous vous recommandons de vous référer à l’article suivant : Développement d’applications et de fonctionnalités d’IA générative responsable sur Windows.

Ressources supplémentaires

Voir aussi