Partager via


Le guide de configuration de l’indexation

Il est important de comprendre les options de configuration permettant d’indexer efficacement tout en veillant à atteindre vos objectifs d’indexation. Lors de l’indexation de vidéos, les utilisateurs peuvent utiliser les paramètres par défaut ou ajuster de nombreux paramètres. Azure AI Video Indexer vous permet de choisir entre une plage de langage, d’indexation, de modèles personnalisés et de paramètres de streaming qui ont des implications sur les insights générés, les coûts et les performances.

Cet article explique chacune des options et l’impact de chaque option pour vous permettre de prendre des décisions éclairées lors de l’indexation. L’article décrit l’expérience du site web Azure AI Video Indexer, mais les mêmes options s’appliquent lors de l’envoi de travaux via l’API (consultez le guide de l’API). Lors de l’indexation de grands volumes, suivez le guide à l’échelle.

L’écran de chargement initial présente des options permettant de définir le nom de la vidéo, la langue source et les paramètres de confidentialité.

Capture d’écran montrant les options permettant de définir le nom de la vidéo, la langue source et les paramètres de confidentialité.

Toutes les autres options de paramètre s’affichent si vous sélectionnez Options avancées.

Capture d’écran montrant des options avancées pour définir le nom de la vidéo, la langue source et les paramètres de confidentialité.

Paramètres par défaut

Par défaut, Azure AI Video Indexer est configuré sur une langue de source vidéo de l’anglais, la confidentialité du paramètre audio et vidéo privé, standard et la qualité de diffusion en continu d’une vitesse de transmission unique.

Conseil

Cette rubrique décrit chaque option d’indexation en détail.

Voici quelques exemples où l’utilisation du paramètre par défaut peut ne pas convenir :

  • Si vous avez besoin d’insights sur les personnes observées ou la personne correspondante, ce qui est uniquement disponible via la vidéo avancée.
  • Si vous utilisez uniquement Azure AI Video Indexer pour la transcription et la traduction, l’indexation de l’audio et de la vidéo n’est pas requise, la base pour l’audio doit suffire.
  • Si vous consommez des insights Azure AI Video Indexer mais que vous n’avez pas besoin de générer un nouveau fichier multimédia, la diffusion en continu n’est pas nécessaire et aucune diffusion en continu ne doit être sélectionnée pour éviter le travail d’encodage et son coût associé.
  • Si une vidéo est principalement dans une langue qui n’est pas l’anglais.

Langue source de la vidéo

Si vous connaissez la langue parlée dans la vidéo, sélectionnez la langue dans la liste des langues sources de la vidéo. Si vous avez des doutes sur la langue de la vidéo, choisissez Détecter automatiquement une seule langue. Lors du chargement et de l’indexation de votre vidéo, Azure AI Video Indexer utilise l’identification de langue (LID) pour détecter la langue des vidéos et générer des transcriptions et des insights avec la langue détectée.

Si la vidéo peut contenir plusieurs langues et que vous ignorez lesquelles, sélectionnez Détecter automatiquement plusieurs langues. Dans ce cas, la détection multilingue (MLID) est appliquée lors du chargement et de l’indexation de votre vidéo.

Bien que la détection automatique soit une excellente option lorsque la langue de vos vidéos varie, il y a deux points à prendre en compte lors de l’utilisation de LID ou MLID :

  • LID/MLID ne prend pas en charge toutes les langues prises en charge par Azure AI Video Indexer.
  • La transcription est d’une qualité supérieure lorsque vous pré-sélectionnez la langue appropriée pour la vidéo.

En savoir plus sur la prise en charge des langues et les langues prises en charge.

Confidentialité

Cette option vous permet de déterminer si les insights ne doivent être accessibles qu’aux utilisateurs de votre compte Azure AI Video Indexer ou à toute personne disposant d’un lien.

Options d’indexation

Lors de l’indexation d’une vidéo avec les paramètres par défaut, les prix de chacune des options d’indexation audio et vidéo peuvent être différents. Pour plus d’informations, consultez la tarification d’Azure AI Video Indexer.

Vous trouverez ci-dessous les options de type d’indexation avec les détails de leurs insights fournis. Pour modifier le type d’indexation, sélectionnez Paramètres avancés.

Audio uniquement Vidéo uniquement Audio &vidéo
De base De base De base
standard standard standard
Avancé Avancé Avancé

Paramètres avancés

Audio uniquement

  • De base : Indexe et extrait des insights à l’aide de l’audio uniquement (en ignorant la vidéo) et fournit les insights suivants : transcription, traduction, mise en forme des légendes et sous-titres de sortie (sous-titres).
  • Standard : Indexe et extrait des insights à l’aide de l’audio uniquement (ignorant la vidéo) et fournit les insights suivants : transcription, traduction, mise en forme des légendes de sortie et sous-titres (sous-titres), détection automatique des langues, émotions, mots clés, entités nommées (marques, emplacements, personnes), sentiments, orateurs, extraction de rubriques et con mode tente ration textuelle.
  • Avancé : Indexe et extrait des insights à l’aide de l’audio uniquement (en ignorant la vidéo) et fournit les insights suivants : transcription, traduction, mise en forme des légendes et sous-titres de sortie (sous-titres), détection automatique des langues, détection d’événements audio, émotions, mots clés, entités nommées (marques, emplacements, personnes), sentiments, intervenants, extraction de rubriques et con mode tente ration textuelle.

Vidéo uniquement

  • De base : Indexe et extrait des insights à l’aide de la vidéo uniquement (ignorant l’audio) et fournit les insights suivants : étiquettes, détection d’objets, OCR, scènes (images clés et captures) et détection de trames noires.
  • Standard : Indexe et extrait des insights à l’aide de vidéos uniquement (ignorant l’audio) et fournit les insights suivants : étiquettes (OCR), entités nommées (OCR - marques, emplacements, personnes), OCR, personnes, scènes (images clés et images), images noires, con mode tente ration visuelle et extraction de rubriques (OCR).
  • Avancé : Indexe et extrait des insights à l’aide de la vidéo uniquement (en ignorant l’audio) et fournit les insights suivants : étiquettes (OCR), personne mise en correspondance, entités nommées (OCR - marques, emplacements, personnes), OCR, personnes observées, scènes (images clés et captures), détection de clapperboard, détection de modèles numériques, aperçu des vêtements, détection d’ardoise sans texte, détection de logo textuel, images noires, con mode tente ration et extraction de rubriques (OCR).

Audio et vidéo

  • De base : Indexe et extrait des insights à l’aide de l’audio et de la vidéo et fournit les insights suivants : transcription, traduction, mise en forme des légendes et sous-titres de sortie (sous-titres), détection d’objets, OCR, scènes (images clés et images) et images noires.
  • Standard : Indexe et extrait des insights à l’aide de l’audio et de la vidéo et fournit les insights suivants : transcription, traduction, mise en forme des légendes et sous-titres de sortie (sous-titres), détection automatique de la langue, émotions, mots clés, entités nommées (marques, emplacements, personnes), OCR, scènes (images clés et captures), images noires, con mode tente ration, personnes, sentiments, orateurs, extraction de rubriques et con textuelsmode tente ration.
  • Avancé : Indexe et extrait des insights à l’aide de l’audio et de la vidéo et fournit les insights suivants : transcription, traduction, mise en forme des légendes et sous-titres de sortie (sous-titres), détection automatique de la langue, con textuel mode tente ration, détection d’événements audio, émotions, mots clés, personne mise en correspondance, entités nommées (marques, emplacements, personnes), OCR, personnes observées, détection de clapperboard, détection de modèles numériques, vêtements recommandés insight, détection d’ardoise sans texte, sentiments, haut-parleurs, scènes (images clés et captures), détection de logo textuel, cadres noirs, con mode tente ration visuelle et extraction de rubriques.

Options de qualité de diffusion en continu

Il existe deux options pour la diffusion en continu de vidéos indexées :

  • Vitesse de transmission unique : si la hauteur vidéo est supérieure ou égale à 720p HD, Azure AI Video Indexer l’encode avec une résolution de 1280 x 720. Dans le cas contraire, la vidéo est encodée en 640 x 468.
  • Aucune diffusion en continu : les insights sont générés, mais aucune opération de diffusion en continu n’est effectuée et la vidéo n’est pas disponible sur le site web Azure AI Video Indexer. Lorsque l’option Aucune diffusion en continu est sélectionnée, vous n’êtes pas facturé pour l’encodage.

Personnalisation de modèles de contenu

Azure AI Video Indexer vous permet de personnaliser certains de ses modèles à adapter à votre cas d’usage spécifique. Ces modèles incluent les marques, la langue et la personne. Si vous avez des modèles personnalisés, cette section du portail web vous permet de configurer si l’un des modèles créés doit être utilisé pour l’indexation.