Partage via


Prise en charge linguistique dans Azure AI Video Indexer

Avertissement

Au cours de la dernière année, Azure AI Video Indexer (VI) a annoncé la suppression de sa dépendance vis-à-vis d’Azure Media Services (AMS) en raison de sa mise hors service. Les ajustements et modifications des fonctionnalités ont été annoncés et un guide de migration a été fourni.

L’échéance de la migration a été le 30 juin 2024. VI a étendu l’échéance de mise à jour/migration afin de pouvoir mettre à jour votre compte VI et opter pour la migration des ressources AMS VI jusqu’au 31 août 2024.

Toutefois, après le 30 juin, si vous n’avez pas mis à jour votre compte VI, vous ne pourrez pas indexer de nouvelles vidéos et vous serez en mesure de lire des vidéos qui n’ont pas été migrées. Si vous mettez à jour votre compte après le 30 juin, vous pouvez reprendre l’indexation immédiatement, mais vous ne pourrez pas lire les vidéos indexées avant la mise à jour du compte tant qu’ils ne sont pas migrés via la migration AMS VI.

Cet article explique les options de langue de Video Indexer et fournit une liste de prise en charge linguistique pour chacune d’elles. Il inclut la prise en charge des langues pour les fonctionnalités de Video Indexer, la traduction, l’identification de la langue, la personnalisation et les paramètres linguistiques du site web Video Indexer.

Langues prises en charge par scénario

Cette section explique les options de langue Video Indexer et présente une table des langues prises en charge pour chacune d’elles.

Important

Toutes les langues répertoriées prennent en charge la traduction lors de l’indexation via l’API.

Explications sur les colonnes

  • Langue source prise en charge : langue parlée dans le fichier multimédia prise en charge pour la transcription, la traduction et la recherche.

  • Identification de la langue : indique si la langue peut être détectée automatiquement par Video Indexer lorsque l’identification de langue est utilisée pour l’indexation. Pour plus d’informations, consultez Utiliser Azure AI Video Indexer pour identifier automatiquement les langues parlées et la section Identification de la langue.

  • Personnalisation (modèle de langage) : indique si la langue peut être utilisée lors de la personnalisation des modèles de langage dans Video Indexer. Pour plus d’informations, consultez Personnaliser un modèle de langage dans Azure AI Video Indexer.

  • Prononciation (modèle de langage) : indique si la langue peut être utilisée pour créer un jeu de données de prononciation dans le cadre d’un modèle vocal personnalisé. Pour plus d’informations, consultez Personnaliser un modèle speech avec Azure AI Video Indexer.

  • Traduction de site web : indique si la langue est prise en charge pour la traduction lors de l’utilisation du site web Azure AI Video Indexer. Sélectionnez la langue traduite dans le menu déroulant de la langue.

    Capture d’écran montrant un menu avec téléchargement, anglais et affichages en tant qu’éléments de menu. Une info-bulle s’affiche sous forme de souris sur l’élément anglais et indique que la traduction est définie sur l’anglais.

    Les insights suivants sont traduits :

    • Transcription
    • Mots clés
    • Rubriques
    • Étiquettes
    • Modèles de cadres (uniquement en hébreu pour le moment)

    Toutes les autres informations s’affichent en anglais lors de l’utilisation de la traduction.

  • Langue du site web : indique si la langue peut être sélectionnée pour une utilisation sur le site web Azure AI Video Indexer. Sélectionnez l’icôneParamètres, puis sélectionnez la langue dans la liste déroulante Paramètres de langue.

    Capture d’écran montrant un menu avec les paramètres utilisateur qui les affichent tous activés.

Language Code Supporté
langue source
Langue
identification
Personnalisation
(modèle de langage)
Prononciation
(modèle de langage)
Site internet
Traduction
Site internet
Langue
Afrikaans af-ZA
Arabe (Israël) ar-IL
Arabe (Irak) ar-IQ
Arabe (Jordanie) AR-JO
Arabe (Koweït) ar-KW
Arabe (Liban) ar-LB
Arabe (Oman) ar-OM
Arabe (Autorité palestinienne) ar-PS
Arabe (Qatar) ar-QA
Arabe (Arabie saoudite) ar-SA
Arabe (Émirats arabes unis) ar-AE
Arabe (Égypte) ar-EG
Arabe standard moderne (Bahreïn) ar-BH
Arabe (République arabe syrienne) ar-SY
Arménien hy-AM
Bangla bn-BD
Bosniaque bs-Latn
Bulgare bg-BG
Catalan ca-ES
Chinois (cantonais traditionnel) zh-HK
Chinois (simplifié) zh-Hans
Chinois (simplifié) zh-CK
Chinois (traditionnel) zh-Hant
Croate hr-HR
Tchèque cs-CZ
Danois da-DK
Néerlandais nl-NL
Anglais (Australie) en-AU
Anglais (Royaume-Uni) en-GB
Anglais (États-Unis) fr-FR
Estonien Et-EE
Fidjien en-FJ
Filipino fil-PH
Finnois fi-FI
Français fr-FR
Français (Canada) fr-CA
Allemand de-DE
Grec el-GR
Goudjrati gu-IN
Haïtien fr-HT
Hébreu he-IL
Hindi hi-IN
Hongrois hu-HU
Islandais is-IS
Indonésien id-ID
Irlandais ga-IE
Italien it-IT
Japonais ja-JP
Kannada kn-IN
Kiswahili sw-KE
Coréen ko-KR
Letton lv-LV
Lituanien lt-LT
Malgache mg-MG
Malais ms-MY
Malayalam ml-IN
Maltais mt-MT
Norvégien nb-NO
Persan fa-IR
Polonais pl-PL
Portugais pt-br
Portugais (Portugal) pt-PT
Roumain ro-RO
Russe ru-RU
Samoan en-WS
Serbe (Cyrillique) sr-Cyrl-RS
Serbe (latin) sr-Latn-RS
Slovaque sk-SK
Slovène sl-SI
Espagnol es-ES
Espagnol (Mexique) es-MX
Suédois sv-SE
Tamoul ta-IN
Télougou te-IN
Thaï th-TH
Tonga to-TO
Turc tr-TR
Ukrainien uk-UA
Ourdou ur-PK
Vietnamien vi-VN

Obtenir les langues prises en charge via l’API

Utilisez l’appel d’API Obtenir les langues prises en charge pour extraire une liste complète des langues prises en charge par zone. Pour plus d’informations, consultez Obtenir les langues prises en charge.

L’API retourne une liste de langues prises en charge avec les valeurs suivantes :

{
    "name": "Language",
    "languageCode": "Code",
    "isRightToLeft": true/false,
    "isSourceLanguage": true/false,
    "isAutoDetect": true/false
}
  • Langue source prise en charge :

    Si isSourceLanguage la valeur est false, la langue est prise en charge uniquement pour la traduction. Si isSourceLanguage la valeur est true, la langue est prise en charge comme source de transcription, de traduction et de recherche.

  • Identification de la langue (détection automatique) :

    Si isAutoDetect la valeur est true, la langue est prise en charge pour l’identification linguistique (LID) et l’identification multi-langues (MLID).

Identification linguistique

Lorsque vous chargez un fichier multimédia dans Video Indexer, vous pouvez spécifier la langue source du fichier multimédia. Si vous indexez un fichier via le site web Video Indexer, vous pouvez le faire en sélectionnant une langue pendant le chargement du fichier. Si vous soumettez la tâche d’indexation via l’API, elle est effectuée à l’aide du paramètre de langage. La langue sélectionnée est ensuite utilisée pour générer la transcription du fichier.

Si vous n’êtes pas sûr de la langue source du fichier multimédia ou qu’il peut contenir plusieurs langues, Video Indexer peut détecter les langues parlées. Si vous sélectionnez Détection automatique d’une langue unique (LID) ou multi-langues (MLID) pour la langue source du fichier multimédia, la langue ou les langues détectées sont utilisées pour transcrire le fichier multimédia. Pour en savoir plus sur LID et MLID, consultez Utiliser Azure AI Video Indexer pour identifier automatiquement les langues parlées, voir Identifier automatiquement la langue parlée avec le modèle d’identification de langue et identifier et transcrire automatiquement du contenu multilingue

Il existe une limite de 10 langues autorisées pour l’identification pendant l’indexation d’un fichier multimédia pour LID et MLID. Voici les 9 langues par défaut de l’identification linguistique (LID) et de l’identification multi-langues (MILD) :

  • Allemand (de-DE)
  • Anglais États-Unis (en-US)
  • Espagnol (es-ES)
  • Français (fr-FR)
  • Italien (it-IT)
  • Japonais (ja-JP)
  • Portugais (pt-BR)
  • Russe (ru-RU)
  • Chinois (simplifié) (zh-Hans)

Comment modifier la liste des langues par défaut

Si vous devez utiliser des langues pour l’identification qui ne sont pas utilisées par défaut, vous pouvez personnaliser la liste sur 10 langues qui prennent en charge la personnalisation via le site web ou l’API :

Utiliser le site web pour modifier la liste

  1. Sélectionnez l’onglet ID de langue sous Personnalisation du modèle. La liste des langues est spécifique au compte Video Indexer que vous utilisez et pour l’utilisateur connecté. La liste par défaut des langues est enregistrée par utilisateur sur son appareil local, par appareil et par navigateur. Par conséquent, chaque utilisateur peut configurer sa propre liste de langues identifiée par défaut.

  2. Utilisez Ajouter une langue pour rechercher et ajouter d’autres langues. Si 10 langues sont déjà sélectionnées, vous devez d’abord supprimer l’une des langues détectées existantes avant d’en ajouter une nouvelle.

    Capture d’écran montrant un tableau montrant toutes les langues sélectionnées.

Utiliser l’API pour modifier la liste

Lorsque vous chargez un fichier, le modèle de langue Video Indexer fait référence à 9 langues par défaut. S’il existe une correspondance, le modèle génère la transcription du fichier avec la langue détectée.

Utilisez le paramètre de langage pour spécifier multi des paramètres (MLID) ou auto (LID). Utilisez le customLanguages paramètre pour spécifier jusqu’à 10 langues. (Le paramètre est utilisé uniquement lorsque le paramètre de langue est défini multi sur ou auto.) Pour en savoir plus sur l’utilisation de l’API, consultez Utiliser l’API Azure AI Video Indexer.