Teilen über


Grundlegendes zur Videoübersetzung (Vorschau)

Hinweis

Dieses Feature ist zurzeit als öffentliche Preview verfügbar. Diese Vorschauversion wird ohne Vereinbarung zum Servicelevel bereitgestellt und sollte nicht für Produktionsworkloads verwendet werden. Manche Features werden möglicherweise nicht unterstützt oder sind nur eingeschränkt verwendbar. Weitere Informationen finden Sie unter Zusätzliche Nutzungsbestimmungen für Microsoft Azure-Vorschauen.

Die Videoübersetzung ist ein Feature in Azure KI Speech, mit dem Sie Videos nahtlos automatisch in mehrere Sprachen übersetzen und Videos in mehreren Sprachen generieren können. Diese Funktion soll Ihnen helfen, Ihre Videoinhalte zu lokalisieren, um ein breites Publikum auf der ganzen Welt anzusprechen. Sie können auf effiziente Weise beeindruckende, lokalisierte Videos für verschiedene Anwendungsbereiche wie Vlogs, Bildung, Nachrichten, Unternehmensschulungen, Werbung, Film, TV-Shows und mehr erstellen.

Das Verfahren, bei dem die Originalsprache eines Videos durch eine in einer anderen Sprache aufgenommene Tonspur ersetzt wird, wird häufig eingesetzt, um ein breites Publikum anzusprechen. Die Übersetzung, die traditionell durch menschliche Aufnahmen und manuelle Nachbearbeitung erfolgt, ist unerlässlich, um sicherzustellen, dass Zuschauer Videoinhalte in ihrer Muttersprache genießen können. Dieser Prozess ist jedoch mit einigen Problemen verbunden, z. B. den hohen Kosten, der langen Dauer und der Unfähigkeit, die Stimme des Originalsprechers genau wiederzugeben. Die Videoübersetzung in Azure KI Speech meistert diese Herausforderungen, indem eine automatisierte, effiziente und kostengünstige Lösung zum Erstellen lokalisierter Videos bereitgestellt wird.

Anwendungsfall

Das von Azure KI Speech bereitgestellte Videoübersetzung verfügt über eine Vielzahl von Anwendungsfällen in verschiedenen Branchen und Inhaltstypen. Im Anschluss finden Sie einige wichtige Anwendungen:

  • Nachrichten und Interviews: Nachrichtenorganisationen können Nachrichtensegmente und Interviews übersetzen und synchronisieren, um genaue und zeitnahe Informationen für eine weltweite Zielgruppe bereitzustellen.

  • Werbung und Marketing: Unternehmen können ihre Werbe- und Marketingvideos lokalisieren, um mit Zielgruppen in verschiedenen Märkten zu kommunizieren und das Markenbewusstsein und die Kundenbindung zu verbessern.

  • Bildung und Lernen: Bildungseinrichtungen und E-Learning-Plattformen können ihre Lehrvideos und Vorträge in verschiedene Sprachen synchronisieren und das Lernen barrierefreier und inklusiver gestalten.

  • Filme und Fernsehsendungen: Filmstudios und Produktionsunternehmen können ihre Filme und TV-Sendungen für den internationalen Vertrieb synchronisieren, ein breiteres Publikum erreichen und das Umsatzpotenzial maximieren.

  • Vlogs und kurze Videos: Inhaltsbesitzer können ihre Vlogs und kurzen Videos einfach übersetzen und synchronisieren, um internationale Zielgruppen zu erreichen und ihre Zuschauer und deren Bindung zu erweitern.

  • Unternehmensschulungen: Unternehmen können ihre Schulungsvideos für Mitarbeiter in verschiedenen Regionen lokalisieren, um eine konsistente und effektive Kommunikation für alle Mitarbeiter sicherzustellen.

Unterstützte Regionen und Sprachen

Derzeit wird die Videoübersetzung in Azure KI Speech nur in der Region „USA, Osten“ unterstützt.

Wir unterstützen die Videoübersetzung zwischen verschiedenen Sprachen, sodass Sie Ihre Inhalte an bestimmte sprachliche Vorlieben anpassen können. Informationen zu den Sprachen, die für die Videoübersetzung unterstützt werden, finden Sie unter unterstützte Quell- und Zielsprachen.

Wichtige Funktionen

  • Audioextraktion des Dialogs und Transkription gesprochener Inhalte

    Extrahiert automatisch Dialogaudio aus dem Quellvideo und transkribiert den gesprochenen Inhalt.

  • Übersetzung von Sprache A in Sprache B und Neuformulierung des großen Sprachmodells (Large Language Model, LLM)

    Übersetzt den transkribierten Inhalt aus der Originalsprache (Sprache A) in die Zielsprache (Sprache B) mit erweiterten Sprachverarbeitungstechniken. Verbessert die Übersetzungsqualität und optimiert geschlechtsspezifische übersetzten Text durch LLM-Neuformulierung.

  • Automatische Übersetzung – Sprachgenerierung in einer anderen Sprache.

    Nutzt KI-gestützte Text-zu-Sprache-Technologie, um automatisch menschenähnliche Stimmen in der Zielsprache zu generieren. Diese Stimmen werden genau mit dem Video synchronisiert und sorgen für eine einwandfreie Übersetzungserfahrung. Dies umfasst die Verwendung vordefinierter neuraler Stimmen für eine qualitativ hochwertige Ausgabe und bietet Optionen für personalisierte Stimme.

  • „Human in the Loop“ für die Inhaltsbearbeitung

    Ermöglicht menschliches Eingreifen, um die übersetzten Inhalte zu überprüfen und zu bearbeiten, damit die Genauigkeit und kulturelle Angemessenheit sichergestellt werden kann, bevor das synchronisierte Video fertig gestellt wird.

  • Generierung von Untertiteln

    Liefert das vollständig synchronisierte Video mit übersetzten Dialogen, synchronisierten Untertiteln und generierten Stimmen, bereit für den Download und die Verteilung auf verschiedenen Plattformen. Für eine optimale Anzeige können Sie auch die Untertitellänge auf jedem Bildschirm festlegen.

Erste Schritte

Informationen zu den ersten Schritten mit der Videoübersetzung finden Sie unter Videoübersetzung im Studio. Die Videoübersetzungs-API wird in Kürze verfügbar sein.

Preis

Einzelheiten zu den Preisen für Videoübersetzungen finden Sie unter Preise für den Speech-Dienst. Beachten Sie, dass die Preise für Videoübersetzungen nur für Dienstregionen sichtbar sind, in denen das Feature verfügbar ist.