Partager via


Qu’est-ce que la traduction vidéo (préversion)

Remarque

Cette fonctionnalité est actuellement disponible en préversion publique. Cette préversion est fournie sans contrat de niveau de service, nous la déconseillons dans des charges de travail de production. Certaines fonctionnalités peuvent être limitées ou non prises en charge. Pour plus d’informations, consultez Conditions d’Utilisation Supplémentaires relatives aux Évaluations Microsoft Azure.

La traduction vidéo est une fonctionnalité d’Azure AI Speech qui vous permet de traduire et de générer automatiquement et en toute transparence des vidéos dans plusieurs langues. Cette fonctionnalité est conçue pour vous aider à localiser votre contenu vidéo pour répondre à diverses audiences dans le monde entier. Vous pouvez créer efficacement des vidéos immersives localisées dans différents cas d’usage tels que les vlogs, l’éducation, les actualités, la formation d’entreprise, la publicité, le film, les émissions de télévision, etc.

Le processus de remplacement de la langue d’origine d’une vidéo par l’audio enregistré dans une autre langue est souvent basé sur la prise en charge de divers publics. Traditionnellement réalisée grâce à l’enregistrement humain et à la post-production manuelle, la traduction est essentielle pour s’assurer que les téléspectateurs peuvent profiter du contenu vidéo dans leur langue maternelle. Toutefois, ce processus est fourni avec des points de douleur clés, notamment son coût élevé, sa durée longue et son incapacité à répliquer la voix de l’orateur d’origine avec précision. La traduction de vidéos dans Azure AI Speech résout ces défis en fournissant une solution automatisée, efficace et économique pour créer des vidéos localisées.

Cas d’usage

La traduction vidéo fournie par Azure AI Speech offre un large éventail de cas d’usage dans différents secteurs d’activité et types de contenu. Voici quelques considérations majeures.

  • Nouvelles + entrevues: les organisations d’actualités peuvent traduire et dub des segments d’actualités et des entrevues pour fournir des informations précises et opportunes aux audiences dans le monde entier.

  • Publicité +marketing : les entreprises peuvent localiser leurs vidéos publicitaires et marketing pour résonner avec des publics cibles sur différents marchés, en améliorant la sensibilisation de la marque et l’engagement des clients.

  • Éducation + apprentissage: les établissements d’enseignement et les plateformes d’apprentissage électronique peuvent faire le doublage de leurs vidéos et conférences pédagogiques dans différentes langues, ce qui rend l’apprentissage plus accessible et inclusif.

  • Émission film + Show TV: les studios de cinéma et les sociétés de production peuvent faire le doublage de leurs films et émissions de télévision pour la distribution internationale, atteindre un public plus large et maximiser le potentiel de revenus.

  • Vlog + courte vidéo: les propriétaires de contenu peuvent facilement traduire et faire le doublage de leurs vlogs et courtes vidéos pour atteindre les audiences internationales, en développant leur visionneuse et leur engagement.

  • formation entreprise: les entreprises peuvent localiser leurs vidéos de formation pour les employés de différentes régions, garantissant ainsi une communication cohérente et efficace au sein de leur personnel.

Langues et régions prises en charge

Actuellement, la traduction vidéo dans Azure AI Speech est prise en charge uniquement dans la région USA Est.

Nous prenons en charge la traduction vidéo entre différentes langues, ce qui vous permet d’adapter votre contenu à des préférences linguistiques spécifiques. Pour connaître les langues prises en charge pour la traduction vidéo, reportez-vous aux langues sources et cibles prises en charge.

Fonctionnalités de base

  • Extraction audio des dialogues et transcription du contenu parlé.

    Extrait automatiquement le contenu audio du dialogue à partir de la vidéo source et transcrire le contenu parlé.

  • Traduction de la langue A vers la langue B et reformulation du grand modèle linguistique (LLM).

    Traduit le contenu transcrit de la langue d’origine (Langue A) vers la langue cible (Langue B) à l’aide de techniques avancées de traitement du langage. Améliore la qualité de la traduction et affine le texte traduit sensible au sexe par le biais de la reformulation LLM.

  • Traduction automatique : génération de voix dans d’autres langues.

    Utilise la technologie de synthèse vocale basée sur l’IA pour générer automatiquement des voix de type humain dans la langue cible. Ces voix sont précisément synchronisées avec la vidéo, ce qui garantit une expérience de traduction parfaite. Cela inclut l’utilisation de voix neuronales prédéfinies pour la sortie de haute qualité et l’offre d’options pour la voix personnelle.

  • Human dans la boucle pour la modification de contenu.

    Permet à l’intervention humaine de réviser et de modifier le contenu traduit, en garantissant la précision et la pertinence culturelle avant de finaliser la vidéo doublée.

  • Génération de sous-titres.

    Fournit la vidéo entièrement doublée avec un dialogue traduit, des sous-titres synchronisés et des voix générées, prêtes à être téléchargées et distribuées sur différentes plateformes. Vous pouvez également définir la longueur du sous-titre sur chaque écran pour un affichage optimal.

Bien démarrer

Pour commencer à utiliser la traduction vidéo, reportez-vous à traduction de vidéos dans le studio. L’API de traduction vidéo sera bientôt disponible.

Prix

Pour plus d’informations sur la tarification de la traduction vidéo, consultez la tarification du service Speech. Notez que la tarification de la traduction vidéo ne sera visible que pour les régions de service où la fonctionnalité est disponible.