Partager via


Options de configuration d’indexation

Vous pouvez utiliser les paramètres d’indexation par défaut ou les ajuster. Vous pouvez choisir la langue, l’indexation, les modèles personnalisés et les paramètres de streaming qui ont des implications sur les insights générés, les coûts et les performances.

Cet article explique chacune des options. Les mêmes options s’appliquent lors de l’utilisation du site web Azure AI Video Indexer que pour l’utilisation de l’API (consultez le guide de l’API). Lors de l’indexation de grands volumes, suivez le guide à grande échelle.

Paramètres par défaut

Par défaut, Azure AI Video Indexer est configuré comme suit :

  • Langue source : Anglais
  • Confidentialité : privé
  • Paramètre audio et vidéo : standard
  • Qualité de streaming : débit binaire unique

Langue source de la vidéo

Si vous connaissez la langue parlée dans la vidéo, sélectionnez la langue dans la liste des langues sources de la vidéo. Si vous avez des doutes sur la langue de la vidéo, choisissez Détecter automatiquement une seule langue. Azure AI Video Indexer utilise l’identification de langue (LID) pour détecter la langue des vidéos et générer des transcriptions et des insights avec la langue détectée.

Si la vidéo contient plusieurs langues et que vous ne savez pas quelles langues, sélectionnez Détecter automatiquement plusieurs langues. Dans ce cas, la détection multi-langage (MLID) est appliquée lors du chargement et de l’indexation de votre vidéo.

Bien que la détection automatique soit une excellente option lorsque la langue de vos vidéos varie, il existe deux points à prendre en compte lors de l’utilisation de LID ou MLID :

  • LID/MLID ne prend pas en charge toutes les langues prises en charge par Azure AI Video Indexer.
  • La transcription est d’une qualité supérieure lorsque vous préélectionnez la langue appropriée de la vidéo.

En savoir plus sur la prise en charge des langues et les langues prises en charge.

Confidentialité

Cette option vous permet de déterminer si les insights ne doivent être accessibles qu’aux utilisateurs de votre compte Azure AI Video Indexer ou à toute personne disposant d’un lien.

Options d’indexation

Chacune des options d’indexation audio et vidéo peut être facturée différemment lorsque vous utilisez les paramètres d’indexation par défaut. Pour plus d’informations, consultez la tarification d’Azure AI Video Indexer.

Voici les options de type d’indexation avec les détails de leurs insights fournis. Pour modifier le type d’indexation, sélectionnez Paramètres avancés.

Remarque

La reconnaissance optique de caractères (OCR) est utilisée avec plusieurs types d’insights.

Paramètres avancés

Lorsque vous sélectionnez Paramètres avancés, vous pouvez choisir les options suivantes :

Audio uniquement

  • De base : Indexe et extrait des insights à l’aide de l’audio uniquement (en ignorant la vidéo) et fournit les insights suivants :
    • Transcription
    • Traduction
    • Mise en forme des légendes et sous-titres générés (sous-titres codés)
  • Standard : Indexe et extrait des insights à l’aide de l’audio uniquement (en ignorant la vidéo) et fournit les insights suivants :
    • Transcription
    • Traduction
    • Mise en forme des légendes et sous-titres générés (sous-titres codés)
    • Détection automatique de la langue
    • Émotions
    • Mots clés
    • Entités nommées (marques, emplacements, personnes)
    • Sentiments
    • Haut-parleurs
    • Extraction de sujets
    • Modération du contenu textuel
  • Avancé : Indexe et extrait des insights à l’aide de l’audio uniquement (en ignorant la vidéo) et fournit les insights suivants :
    • Transcription
    • Traduction
    • Mise en forme des légendes et sous-titres générés (sous-titres codés)
    • Détection automatique de la langue
    • Détection d’événements audio
    • Émotions
    • Mots clés
    • Entités nommées (marques, emplacements, personnes)
    • Sentiments
    • Haut-parleurs
    • Extraction de sujets
    • Modération du contenu textuel

Vidéo uniquement

  • De base : Indexe et extrait des insights à l’aide de la vidéo uniquement (ignorant l’audio) et fournit les insights suivants :
    • Étiquettes
    • Détection d’objets
    • reconnaissance optique de caractères (OCR)
    • Scènes (images clés et plans)
    • Détection d’images noires
  • Standard : Indexe et extrait des insights à l’aide de la vidéo uniquement (en ignorant l’audio) et fournit les insights suivants :
    • Étiquettes (OCR)
    • Entités nommées (OCR - marques, emplacements, personnes)
    • reconnaissance optique de caractères (OCR)
    • Personnes
    • Scènes (images clés et plans)
    • Cadres noirs
    • Modération du contenu visuel
    • Extraction de rubriques (OCR)
  • Avancé : Indexe et extrait des insights à l’aide de la vidéo uniquement (ignorant l’audio) et fournit les insights suivants :
    • Étiquettes (OCR)
    • Personne correspondante
    • Entités nommées (OCR - marques, emplacements, personnes)
    • reconnaissance optique de caractères (OCR)
    • Personnes observées
    • Personnes
    • Scènes (images clés et plans)
    • Détection du clap de synchronisation
    • Détection de modèles numériques
    • Aperçu des vêtements proposés
    • Détection de panneau sans texte
    • Détection de logo textuel
    • Cadres noirs
    • Modération du contenu visuel
    • Extraction de rubriques (OCR)

Audio et vidéo

  • De base : Indexe et extrait des insights à l’aide de l’audio et de la vidéo et fournit les insights suivants :
    • Transcription
    • Traduction
    • Mise en forme des légendes et sous-titres générés (sous-titres codés)
    • Détection d’objets
    • reconnaissance optique de caractères (OCR)
    • Scènes (images clés et plans)
    • Cadres noirs
  • Standard : Indexe et extrait des insights à l’aide de l’audio et de la vidéo et fournit les insights suivants :
    • Transcription
    • Traduction
    • Mise en forme des légendes et sous-titres générés (sous-titres codés)
    • Détection automatique de la langue
    • Émotions
    • Mots clés
    • Entités nommées (marques, emplacements, personnes)
    • reconnaissance optique de caractères (OCR)
    • Scènes (images clés et plans)
    • Cadres noirs
    • Modération du contenu visuel
    • Personnes
    • Sentiments
    • Haut-parleurs
    • Extraction de sujets
    • Modération du contenu textuel
  • Avancé : Indexe et extrait des insights à l’aide de l’audio et de la vidéo et fournit les insights suivants :
    • Transcription
    • Traduction
    • Mise en forme des légendes et sous-titres générés (sous-titres codés)
    • Détection automatique de la langue
    • Modération du contenu textuel
    • Détection d’événements audio
    • Émotions
    • Mots clés
    • Personne correspondante
    • Entités nommées (marques, emplacements, personnes)
    • reconnaissance optique de caractères (OCR)
    • Personnes observées
    • Personnes
    • Détection du clap de synchronisation
    • Détection de modèles numériques
    • Aperçu des vêtements proposés
    • Détection de panneau sans texte
    • Sentiments
    • Haut-parleurs
    • Scènes (images clés et plans)
    • Détection de logo textuel
    • Cadres noirs
    • Modération du contenu visuel
    • Extraction de sujets

Options de qualité de diffusion en continu

Il existe deux options pour la diffusion en continu de vidéos indexées :

  • Vitesse de transmission unique : si la hauteur vidéo est supérieure ou égale à 720p HD, Azure AI Video Indexer l’encode avec une résolution de 1280 x 720. Dans le cas contraire, la vidéo est encodée en 640 x 468.
  • Aucune diffusion en continu : les insights sont générés, mais aucune opération de diffusion en continu n’est effectuée et la vidéo n’est pas disponible sur le site web Azure AI Video Indexer. Lorsque l’option Aucune diffusion en continu est sélectionnée, vous n’êtes pas facturé pour l’encodage.

Exclure les modèles

Vous pouvez exclure des modèles lors de l’indexation via le site web VI et l’API. Lorsque vous chargez une vidéo pour indexer à l’aide du site web, sélectionnez Présélections d’indexation des paramètres>avancés, puis sélectionnez les modèles IA à exclure des résultats d’indexation. Il peut permettre une indexation plus efficace et offrir des résultats VI ne contenant que les informations qui vous intéressent.

Personnalisation de modèles de contenu

Azure AI Video Indexer vous permet de personnaliser certains de ses modèles à adapter à votre cas d’usage spécifique. Ces modèles incluent les marques, la langue, la personne et la parole.

Insights et stockage multimédia

Les sections suivantes expliquent comment les insights et les médias sont stockés dans Azure AI Video Indexer.

Stockage Insight

Toutes les informations et métadonnées d’indexation sont conservées dans les comptes de stockage gérés par VI et vous n’êtes pas facturé pour ce stockage.

Stockage multimédia

Votre compte VI est connecté à un compte Stockage Azure. Vous contrôlez et payez l’utilisation de ce compte de stockage. Les fichiers suivants sont stockés dans ce compte lorsqu’une vidéo est indexée :

  • Fichier source. Elle est conservée au cas où vous souhaitez réindexer la vidéo à l’avenir.
  • Un nouveau fichier encodé lorsque la qualité de diffusion en continu est définie sur un débit binaire unique.

Supprimer un média

Le média indexé et tous ses fichiers et insights associés peuvent être supprimés de trois façons :

  • Supprimez les fichiers avec le Portail Video Indexer.
  • Utilisez une demande d’API Supprimer une vidéo ou un fichier source vidéo.
  • Si vous n’avez pas besoin de conserver le fichier multimédia d’origine dans le stockage, lors de l’utilisation de l’API, définissez le retentionPeriod paramètre sur entre 1 et 7. La vidéo indexée et tout ce qui y est lié, le fichier source, insights, etc. sont supprimés 1 à 7 jours après l’indexation.