Extraction de mots-clés

Important

En raison de l’annonce de mise hors service d’Azure Media Services, Azure AI Video Indexer annonce les ajustements des fonctionnalités d’Azure AI Video Indexer. Consultez les modifications relatives à la mise hors service Azure Media Service (AMS) pour comprendre ce que cela signifie pour votre compte Azure AI Video Indexer. Consultez le guide de préparation de la mise hors service AMS : Mise à jour et migration vi.

L’extraction de mots clés est une fonctionnalité IA d’Azure AI Video Indexer qui détecte automatiquement des insights sur les différentes mot clé décrites dans les fichiers multimédias. L’extraction de mots clés peut extraire des insights dans des fichiers multimédias à langage unique et en plusieurs langues. Le nombre total d’mot clé extraits et de leurs catégories sont répertoriés sous l’onglet Recommandations, où cliquez sur un mot clé, puis sur Lire la lecture précédente ou lire suivant passe à l’mot clé dans le fichier multimédia.

Prérequis

Vue d’ensemble de la note de transparence

Principes généraux

Cet article décrit les mots clés et les principales considérations relatives à l’utilisation de cette technologie de manière responsable. Il existe de nombreuses choses à prendre en compte lors du choix de l’utilisation et de l’implémentation d’une fonctionnalité optimisée par l’IA :

  • Cette fonctionnalité s’exécutera-t-elle correctement dans mon scénario ? Avant de déployer l’extraction de mots clés dans votre scénario, testez son fonctionnement à l’aide de données réelles et assurez-vous qu’il peut fournir la précision dont vous avez besoin.
  • Sommes-nous équipés pour identifier les erreurs et y répondre ? Les produits et fonctionnalités optimisés par l’IA ne sont pas précis à 100 %, donc réfléchissez à la façon dont vous identifierez et répondez aux erreurs qui peuvent se produire.

Afficher l’insight

Lorsque vous travaillez sur le site web, les insights sont affichés sous l’onglet Recommandations. Ils peuvent également être générés dans une liste classées dans un fichier JSON qui inclut l’ID, le texte du mot clé, ainsi que l’heure de début et le score de confiance spécifiques de chaque mot clé.

Pour afficher les instances dans un fichier JSON, procédez comme suit :

  1. Cliquez sur Télécharger, puis Recommandations (JSON).

  2. Copiez le texte et collez-le dans votre visionneuse JSON en ligne.

    "keywords": [
      {
        "id": 1,
        "text": "office insider",
        "confidence": 1,
        "language": "en-US",
        "instances": [
          {
            "adjustedStart": "0:00:00",
            "adjustedEnd": "0:00:05.75",
            "start": "0:00:00",
            "end": "0:00:05.75"
          },
          {
            "adjustedStart": "0:01:21.82",
            "adjustedEnd": "0:01:24.7",
            "start": "0:01:21.82",
            "end": "0:01:24.7"
          },
          {
            "adjustedStart": "0:01:31.32",
            "adjustedEnd": "0:01:32.76",
            "start": "0:01:31.32",
            "end": "0:01:32.76"
          },
          {
            "adjustedStart": "0:01:35.8",
            "adjustedEnd": "0:01:37.84",
            "start": "0:01:35.8",
            "end": "0:01:37.84"
          }
        ]
      },
      {
        "id": 2,
        "text": "insider tip",
        "confidence": 0.9975,
        "language": "en-US",
        "instances": [
          {
            "adjustedStart": "0:01:14.91",
            "adjustedEnd": "0:01:19.51",
            "start": "0:01:14.91",
            "end": "0:01:19.51"
          }
        ]
      },
    
    

Pour télécharger le fichier JSON via l’API, utilisez le portail des développeurs Azure AI Video Indexer.

Remarque

L’extraction de mots clés est indépendante du langage.

Composants de mots clés

Pendant la procédure Mots clés, l’audio et les images d’un fichier multimédia sont traités comme suit :

Composant Définition
Langue source L’utilisateur charge le fichier source pour l’indexation.
Transcription API Le fichier audio est envoyé aux services Azure AI et la sortie transcrite traduite est retournée. Si une langue a été spécifiée, elle est traitée.
OCR de la vidéo Les images d’un fichier multimédia sont traitées à l’aide de l’API Lecture Vision Azure pour extraire du texte, son emplacement et d’autres insights.
Extraction de mots-clés Un algorithme d’extraction traite l’audio transcrit. Les résultats sont ensuite combinés avec les insights détectés dans la vidéo pendant le processus OCR. Les mot clé et leur emplacement dans les médias, puis détectés et identifiés.
Niveau de confiance Le niveau de confiance estimé de chaque mot clé est calculé sous la forme d’une plage de 0 à 1. Le score de confiance représente la certitude dans la précision du résultat. Par exemple, une certitude de 82 % sera représentée sous la forme d’un score de 0,82.

Exemples de cas d’utilisation

  • Personnalisation des mot clé pour correspondre aux intérêts des clients, par exemple des sites web sur l’Angleterre affichant des promotions sur les films ou festivals anglais.
  • Recherche approfondie d’archives pour obtenir des informations sur des mot clé spécifiques pour créer des histoires de fonctionnalités sur les entreprises, les personnages ou les technologies, par exemple par une agence de presse.

Considérations et limitations lors du choix d’un cas d’usage

Voici quelques considérations à prendre en compte lors de l’utilisation de l’extraction de mot clé s :

  • Lorsque vous chargez un fichier, utilisez toujours du contenu vidéo de haute qualité. La taille maximale recommandée d’images est HD et la fréquence d’images est de 30 FPS. Un cadre ne doit contenir plus de 10 personnes. Lorsque vous placez des images de vidéos vers des modèles IA, envoyez seulement environ 2 ou 3 images par seconde. Le traitement de 10 images et plus peut retarder le résultat de l’IA.
  • Lorsque vous chargez un fichier, utilisez toujours du contenu audio et vidéo de haute qualité. Au moins 1 minute de discours conversationnel spontané est nécessaire pour effectuer une analyse. Les effets audio sont détectés uniquement dans les segments non vocaux. La durée minimale d’une section non vocale est de 2 secondes. Les commandes vocales et le chant ne sont pas pris en charge. 

Lorsqu’ils sont utilisés de manière responsable et soigneusement, les mots clés constituent un outil précieux pour de nombreuses industries. Pour respecter la confidentialité et la sécurité des autres, et pour respecter les réglementations locales et globales, nous vous recommandons les éléments suivants :

  • Respectez toujours le droit d’une personne à la vie privée et ne ingère que les médias à des fins légitimes et justifiables.  
  • Ne pas divulguer de médias inappropriés montrant des jeunes enfants ou des membres de la famille de célébrités ou d’autres contenus susceptibles de nuire ou de poser une menace pour la liberté personnelle d’un individu.  
  • S’engager à respecter et à promouvoir les droits de l’homme dans la conception et le déploiement de vos médias analysés.  
  • Lorsque vous utilisez des documents tiers, tenez compte des droits d’auteur ou autorisations existants requis avant de distribuer du contenu dérivé de ces documents. 
  • Toujours demander des conseils juridiques lors de l’utilisation de médias provenant de sources inconnues. 
  • Obtenez toujours des conseils juridiques et professionnels appropriés pour vous assurer que votre média chargé est sécurisé et disposez de contrôles adéquats pour préserver l’intégrité de votre contenu et empêcher l’accès non autorisé.    
  • Fournissez un canal de commentaires qui permet aux utilisateurs et aux individus de signaler des problèmes avec le service.  
  • Tenez compte des lois ou réglementations applicables qui existent dans votre domaine en ce qui concerne le traitement, l’analyse et le partage de médias contenant des personnes. 
  • Gardez un humain dans la boucle. N’utilisez aucune solution pour remplacer la surveillance humaine et la prise de décision.  
  • Examinez et examinez entièrement le potentiel de n’importe quel modèle IA que vous utilisez pour comprendre ses fonctionnalités et ses limitations.