Types de services d’API Vision

Azure Cognitive Service for Vision est l’une des catégories les plus larges de Cognitive Services. Vous pouvez utiliser les API pour incorporer des fonctionnalités de vision telles que l’analyse d’images, la détection des visages, l’analyse spatiale et la reconnaissance optique de caractères (OCR) dans vos applications, même si vous avez une connaissance limitée du Machine Learning.

Services

Voici quelques grandes catégories d’API de vision :

  • Vision par ordinateur vous donne accès à des algorithmes avancés permettant de traiter des images et de retourner des informations en fonction des caractéristiques visuelles qui vous intéressent. Il fournit quatre services : OCR, service Visage, Analyse d’images et Analyse spatiale. Form Recognizer est une version avancée de l’OCR.
  • Custom Vision est un service de reconnaissance d’image qui vous permet de créer, de déployer et d’améliorer vos propres modèles d’identificateurs d’images.
  • Le service Visage propose des algorithmes d’intelligence artificielle qui détectent, reconnaissent et analysent les visages humains dans des images.

Comment choisir un service

L’organigramme suivant peut vous aider à choisir un service de vision pour votre cas d’usage spécifique :

Diagram that shows how to choose a vision service.

Cas d’utilisation courants

  • Vision par ordinateur

    • Décrire une image. Analysez une image, évaluez les objets qui sont détectés et générez une expression ou une phrase explicite qui peut décrire l’image.
    • Identifier les composants visuels. Appliquez des balises basées sur un ensemble de milliers d’objets reconnaissables.
    • catégoriser une image Catégorisez des images en fonction de leur contenu.
    • Implémenter l’OCR. Détectez le texte imprimé et manuscrit dans les images.
    • Détecter les types d’images. Par exemple, identifiez les images clipart ou les dessins au trait.
    • Détecter les jeux de couleurs. Identifiez les couleurs dominantes de premier plan, d’arrière-plan, ainsi que les couleurs dominantes et d’accentuation dans une image.
    • Générer des miniatures. Créez de petites versions d’images.
    • Modérer du contenu. Détectez les images qui contiennent du contenu pour adultes ou des scènes sanglantes.
    • Détecter le contenu spécifique à un domaine. Utilisez deux modèles de domaine spécialisés :
      • Célébrités. Identifiez des milliers de célébrités des domaines du sport, du divertissement et des affaires.
      • Monuments et sites. Identifiez les monuments et sites célèbres, comme le Taj Mahal et la statue de la Liberté.
    • Détectez les objets. Identifiez les objets courants et retournez les coordonnées d’un cadre englobant.
    • Détecter les marques. Identifiez les logos à partir d’une base de données existante de milliers de logos de produits mondialement reconnus.
    • Détecter les visages. Détectez et analysez les visages humains dans une image. Vous pouvez déterminer l’âge du sujet et retourner un cadre englobant qui spécifie les emplacements des visages. Les fonctionnalités d’analyse faciale du service Vision par ordinateur sont un sous-ensemble de celles fournies par le service Visage dédié.
  • Custom Vision

    • Classifier des images. Prédisez une catégorie, ou une classe, en fonction d’un ensemble d’entrées, appelées fonctionnalités. Calculez un score de probabilité pour chaque classe possible et retournez une étiquette qui indique la classe à laquelle l’objet appartient probablement. Pour utiliser ce modèle, il vous faut des données constituées de caractéristiques et de leurs étiquettes.
    • Détectez les objets. Obtenir les coordonnées d’un objet dans une image. Pour utiliser ce modèle, il vous faut des données constituées de caractéristiques et de leurs étiquettes.
  • Services Visage

    • Détecter les visages. Identifiez les régions d’une image contenant un visage humain, généralement en retournant les coordonnées du cadre englobant qui forment un rectangle autour du visage, comme ceci.
    • Analyser les visages. Retournez des informations, telles que les points de repère du visage (nez, yeux, sourcils, lèvres, etc.). Vous pouvez utiliser ces repères faciaux comme fonctionnalités pour entraîner un modèle de Machine Learning qui peut déduire des informations sur les personnes, comme leur âge perçu ou leur état émotionnel.
    • Reconnaître des visages. Effectuez l'apprentissage d’un modèle Machine Learning pour identifier les individus connus à partir des traits de leur visage.

Contributeurs

Cet article est géré par Microsoft. Il a été écrit à l’origine par les contributeurs suivants.

Auteurs principaux :

Autres contributeurs :

Pour afficher les profils LinkedIn non publics, connectez-vous à LinkedIn.

Étapes suivantes