Extraction d’entités nommées

Article
03/23/2024

Important

En raison de l’annonce de mise hors service d’Azure Media Services, Azure AI Video Indexer annonce les ajustements des fonctionnalités d’Azure AI Video Indexer. Consultez les modifications relatives à la mise hors service Azure Media Service (AMS) pour comprendre ce que cela signifie pour votre compte Azure AI Video Indexer. Consultez le guide de préparation de la mise hors service AMS : Mise à jour et migration vi.

L’extraction d’entités nommées est une fonctionnalité IA d’Azure AI Video Indexer qui utilise le traitement du langage naturel (NLP) pour extraire des insights sur les emplacements, les personnes et les marques apparaissant dans des fichiers audio et images dans des fichiers multimédias. L’extraction d’entités nommées est automatiquement utilisée avec transcription et OCR et ses insights sont basés sur ceux extraits pendant ces processus. Les insights obtenus s’affichent sous l’onglet Recommandations et sont filtrés dans des emplacements, des personnes et des catégories de marque. En cliquant sur une entité nommée, affiche son instance dans le fichier multimédia. Il affiche également une description de l’entité et un lien Rechercher sur Bing d’entités reconnaissables.

Prérequis

Vue d’ensemble de la note de transparence

Principes généraux

Cet article traite des entités nommées et des considérations clés relatives à l’utilisation de cette technologie de manière responsable. Il existe de nombreuses choses à prendre en compte lors du choix de l’utilisation et de l’implémentation d’une fonctionnalité optimisée par l’IA :

Cette fonctionnalité s’exécutera-t-elle correctement dans mon scénario ? Avant de déployer l’extraction d’entités nommées dans votre scénario, testez son fonctionnement à l’aide de données réelles et assurez-vous qu’elle peut fournir la précision dont vous avez besoin.
Sommes-nous équipés pour identifier les erreurs et y répondre ? Les produits et fonctionnalités optimisés par l’IA ne sont pas précis à 100 %, donc réfléchissez à la façon dont vous identifierez et répondez aux erreurs qui peuvent se produire.

Afficher l’insight

Pour afficher les insights dans le site web, procédez comme suit :

Accédez à Afficher et case activée Entités nommées.
Accédez à Recommandations et faites défiler jusqu’aux entités nommées.

Pour afficher les insights d’extraction d’entités nommées dans un fichier JSON, procédez comme suit :

Cliquez sur Télécharger, puis Recommandations (JSON).
Les entités nommées sont divisées en trois :
- Marques
- Emplacement
- Personnes

Copiez le texte et collez-le dans votre visionneuse JSON.

namedPeople: [
{
referenceId: "Satya_Nadella",
referenceUrl: "https://en.wikipedia.org/wiki/Satya_Nadella",
confidence: 1,
description: "CEO of Microsoft Corporation",
seenDuration: 33.2,
id: 2,
name: "Satya Nadella",
appearances: [
{
startTime: "0:01:11.04",
endTime: "0:01:17.36",
startSeconds: 71,
endSeconds: 77.4
},
{
startTime: "0:01:31.83",
endTime: "0:01:37.1303666",
startSeconds: 91.8,
endSeconds: 97.1
},

Pour télécharger le fichier JSON via l’API, utilisez le portail des développeurs Azure AI Video Indexer.

Composants d’extraction d’entités nommées

Pendant la procédure d’extraction d’entités nommées, le fichier multimédia est traité comme suit :

Composant	Définition
Fichier source	L’utilisateur charge le fichier source pour l’indexation.
Extraction de texte	- Le fichier audio est envoyé à l’API Services Speech pour extraire la transcription. - Les images échantillonnées sont envoyées à l’API Azure AI Vision pour extraire l’OCR.
Analyse	Les insights sont ensuite envoyés à l’API Analyse de texte pour extraire les entités. Par exemple, Microsoft, Paris ou le nom d’une personne comme Paul ou Sarah.
Traitement et consolidation	Les résultats sont ensuite traités. Le cas échéant, les liens Wikipédia sont ajoutés et les marques sont identifiées via les listes de personnalisation intégrées et personnalisables video Indexer.
Valeur de confiance : le niveau de confiance estimé de chaque entité nommée est calculé sous la forme d’une plage de 0 à 1. Le score de confiance représente la certitude dans la précision du résultat. Par exemple, une certitude de 82 % est représentée sous la forme d’un score de 0,82.

Exemples de cas d’utilisation

Publicité contextuelle, par exemple, en plaçant une publicité pour une chaîne pizza suite à des séquences sur l’Italie.
Recherche approfondie d’archives multimédias pour obtenir des informations sur les personnes ou les emplacements afin de créer des récits de fonctionnalités pour les actualités.
Création d’une description verbale des images via le traitement OCR afin d’améliorer l’accessibilité pour les visuels altérés, par exemple un conteur d’arrière-plan dans les films.
Extraction d’insights sur la marque na

Considérations et limitations lors du choix d’un cas d’usage

Examinez attentivement la précision des résultats pour promouvoir des détections plus précises, case activée la qualité de l’audio et des images, l’audio et les images de faible qualité peut avoir un impact sur les insights détectés.
Les entités nommées détectent uniquement les insights dans l’audio et les images. Les logos d’un nom de marque peuvent ne pas être détectés.
Considérez attentivement que lorsque vous utilisez des entités nommées de l’application de la loi, il est possible que les parties de l’audio ne soient pas toujours détectées. Pour garantir des décisions équitables et de haute qualité, combinez des entités nommées avec une surveillance humaine.
N’utilisez pas d’entités nommées pour les décisions susceptibles d’avoir des répercussions négatives graves. Les modèles Machine Learning qui extraient du texte peuvent entraîner une sortie de texte non détectée ou incorrecte. Les décisions basées sur une sortie incorrecte pourraient avoir de graves répercussions négatives. De plus, il est conseillé d’inclure l’examen humain des décisions susceptibles d’avoir des répercussions graves sur les individus.

Lorsqu’il est utilisé de manière responsable et soigneusement Azure AI Video Indexer est un outil précieux pour de nombreuses industries. Pour respecter la confidentialité et la sécurité des autres, et pour respecter les réglementations locales et globales, nous vous recommandons les éléments suivants :

Respectez toujours le droit d’une personne à la vie privée, et seulement ingérer des vidéos à des fins légitimes et justifiables.
Ne pas divulguer de contenu inapproprié concernant les jeunes enfants ou les membres de la famille de célébrités ou d’autres contenus susceptibles de nuire ou de poser une menace pour la liberté personnelle d’un individu.
S’engager à respecter et à promouvoir les droits de l’homme dans la conception et le déploiement de vos médias analysés.
Lorsque vous utilisez des documents tiers, tenez compte des droits d’auteur ou autorisations existants requis avant de distribuer du contenu dérivé de ces documents.
Demandez toujours des conseils juridiques lors de l’utilisation de contenu provenant de sources inconnues.
Obtenez toujours des conseils juridiques et professionnels appropriés pour vous assurer que vos vidéos téléchargées sont sécurisées et disposent de contrôles adéquats pour préserver l’intégrité de votre contenu et empêcher l’accès non autorisé.
Fournissez un canal de commentaires qui permet aux utilisateurs et aux individus de signaler des problèmes avec le service.
Tenez compte des lois ou réglementations applicables qui existent dans votre domaine en ce qui concerne le traitement, l’analyse et le partage de médias contenant des personnes.
Gardez un humain dans la boucle. N’utilisez aucune solution comme remplacement de la surveillance humaine et de la prise de décision.
Examinez et examinez entièrement le potentiel de n’importe quel modèle IA que vous utilisez pour comprendre ses fonctionnalités et ses limitations.