Was ist Videoübersetzung?

2025-06-13

Die Videoübersetzung ist ein Feature in Azure KI Speech, mit dem Sie Videos nahtlos automatisch in mehrere Sprachen übersetzen und Videos in mehreren Sprachen generieren können. Diese Funktion soll Ihnen helfen, Ihre Videoinhalte zu lokalisieren, um ein breites Publikum auf der ganzen Welt anzusprechen. Sie können auf effiziente Weise beeindruckende, lokalisierte Videos für verschiedene Anwendungsbereiche wie Vlogs, Bildung, Nachrichten, Unternehmensschulungen, Werbung, Film, TV-Shows und mehr erstellen.

Der Prozess der Ersetzung der Originalsprache eines Videos durch die in einer anderen Sprache aufgezeichnete Sprache ist für die Bewirtung unterschiedlicher Zielgruppen von wesentlicher Bedeutung. Diese Methode, die in der Regel durch menschliche Aufzeichnung und manuelle Postproduktion erreicht wird, stellt sicher, dass Die Zuschauer Videoinhalte in ihrer Muttersprache genießen können. Es kommt jedoch mit wichtigen Schmerzpunkten:

Hohe Kosten: Herkömmliche Videoübersetzungsmethoden erfordern oft teure menschliche Sprachakteure und umfangreiche Postproduktionsarbeiten, was es zu einem kostspieligen Bemühen für Inhaltsersteller macht.
Zeitaufwendig: Der manuelle Prozess der Aufzeichnung und Bearbeitung übersetzter gesprochener Rede kann viel Zeit in Anspruch nehmen und die Veröffentlichung lokalisierter Inhalte verzögern.
Inkonsistente Qualität: Menschliche Sprachakteure replizieren möglicherweise nicht immer genau die Stimme des ursprünglichen Sprechers, was zu einer weniger immersiven Erfahrung für die Zuschauer führt.

Mit der Videoübersetzung in Azure AI Speech werden diese Herausforderungen effektiv behoben. Das Feature automatisiert den Übersetzungsprozess, reduziert die Kosten und die Produktionszeit erheblich und sorgt gleichzeitig für qualitativ hochwertige Ergebnisse. Durch die genaue Replikation der Stimme des ursprünglichen Sprechers entsteht ein nahtloses und immersives Anzeigeerlebnis für das Publikum weltweit.

Kostenwirksam: Reduziert den Bedarf an teuren menschlichen Sprachakteuren und manueller Postproduktion.
Zeiteffizient: Verkürzt deutlich die zeitaufwendige Zeit, die zum Produzieren lokalisierter Videos erforderlich ist.
Hohe Qualität: Repliziert genau die Stimme des ursprünglichen Lautsprechers, um eine nahtlose und immersive Anzeige zu gewährleisten.
Skalierbar: Ermöglicht die Produktion großer Mengen lokalisierter Inhalte schnell und effizient.

Anwendungsfall

Das von Azure KI Speech bereitgestellte Videoübersetzung verfügt über eine Vielzahl von Anwendungsfällen in verschiedenen Branchen und Inhaltstypen. Im Anschluss finden Sie einige wichtige Anwendungen:

Nachrichten und Interviews: Nachrichtenorganisationen können Nachrichtensegmente und Interviews übersetzen und synchronisieren, um genaue und zeitnahe Informationen für eine weltweite Zielgruppe bereitzustellen.
Werbung und Marketing: Unternehmen können ihre Werbe- und Marketingvideos lokalisieren, um mit Zielgruppen in verschiedenen Märkten zu kommunizieren und das Markenbewusstsein und die Kundenbindung zu verbessern.
Bildung und Lernen: Bildungseinrichtungen und E-Learning-Plattformen können ihre Lehrvideos und Vorträge in verschiedene Sprachen synchronisieren und das Lernen barrierefreier und inklusiver gestalten.
Filme und Fernsehsendungen: Filmstudios und Produktionsunternehmen können ihre Filme und TV-Sendungen für den internationalen Vertrieb synchronisieren, ein breiteres Publikum erreichen und das Umsatzpotenzial maximieren.
Vlogs und kurze Videos: Inhaltsbesitzer können ihre Vlogs und kurzen Videos einfach übersetzen und synchronisieren, um internationale Zielgruppen zu erreichen und ihre Zuschauer und deren Bindung zu erweitern.
Unternehmensschulungen: Unternehmen können ihre Schulungsvideos für Mitarbeiter in verschiedenen Regionen lokalisieren, um eine konsistente und effektive Kommunikation für alle Mitarbeiter sicherzustellen.

Wichtige Funktionen

Audioextraktion des Dialogs und Transkription gesprochener Inhalte

Extrahiert automatisch Dialogaudio aus dem Quellvideo und transkribiert den gesprochenen Inhalt.
Übersetzung von Sprache A in Sprache B und Neuformulierung des großen Sprachmodells (Large Language Model, LLM)

Übersetzt den transkribierten Inhalt aus der Originalsprache (Sprache A) in die Zielsprache (Sprache B) mit erweiterten Sprachverarbeitungstechniken. Verbessert die Übersetzungsqualität und verfeinert den übersetzten, geschlechtsspezifischen Text durch LLM-Neuformulierung.
Automatische Übersetzung – Sprachgenerierung in einer anderen Sprache.

Nutzt KI-gestützte Text-zu-Sprache-Technologie, um automatisch menschenähnliche Stimmen in der Zielsprache zu generieren. Diese Stimmen werden genau mit dem Video synchronisiert und sorgen für eine einwandfreie Übersetzungserfahrung. Dies umfasst die Verwendung von Standardstimmen für eine qualitativ hochwertige Ausgabe und bietet Optionen für persönliche Stimmen.
„Human in the Loop“ für die Inhaltsbearbeitung

Ermöglicht menschliches Eingreifen, um die übersetzten Inhalte zu überprüfen und zu bearbeiten, damit die Genauigkeit und kulturelle Angemessenheit sichergestellt werden kann, bevor das synchronisierte Video fertig gestellt wird.
Generierung von Untertiteln

Liefert das vollständig synchronisierte Video mit übersetzten Dialogen, synchronisierten Untertiteln und generierten Stimmen, bereit für den Download und die Verteilung auf verschiedenen Plattformen. Für eine optimale Anzeige können Sie auch die Untertitellänge auf jedem Bildschirm festlegen.

Funktionsweise

Dieses Diagramm bietet eine allgemeine Übersicht über den Workflow.

Diagramm des Videoübersetzungs-API-Workflows.

Sie laden die Videodatei hoch, die Sie in Azure Blob Storage übersetzen möchten.
Sie erstellen eine Übersetzung, indem Sie die URL der Videodatei angeben. Fügen Sie weitere Parameter ein, z. B. die Quell- und Zielsprachen, den Sprachtyp und die Angabe, ob Untertitel in das Video brennen sollen.

Hinweis

Durch das Erstellen einer Übersetzung wird der Übersetzungsprozess nicht initiiert.
Sie können mit der Übersetzung des Videos beginnen, indem Sie eine Iteration erstellen. Eine Iteration ist eine bestimmte Instanz des Übersetzungsprozesses. Sie können mehrere Iterationen für dieselbe Übersetzung erstellen, sodass Sie mit verschiedenen Einstellungen oder Parametern experimentieren können.
Nach der ersten Iteration können Sie die Untertiteldatei in nachfolgenden Iterationen verwenden. Laden Sie Ihre eigene Untertiteldatei hoch, oder nehmen Sie Änderungen an der automatisch generierten Untertiteldatei vor, und laden Sie die geänderte Untertiteldatei hoch.
Ruft in regelmäßigen Abständen den Status der Übersetzung und Iteration ab. Der Status gibt an, ob die Übersetzung ausgeführt, abgeschlossen oder fehlgeschlagen ist.
Sobald die Übersetzung abgeschlossen ist, können Sie das übersetzte Video und die Untertitel herunterladen. Das übersetzte Video hat die ursprüngliche Sprache durch die übersetzte Sprache ersetzt, und die Untertitel werden mit der übersetzten Sprache synchronisiert.
Sie können die Übersetzung und Iteration auch löschen, wenn Sie sie nicht mehr benötigen. Durch das Löschen einer Übersetzung werden alle zugehörigen Iterationen und Daten entfernt.

Unterstützte Regionen und Sprachen

Derzeit wird die Videoübersetzung in Azure KI Speech nur in der Region „USA, Osten“ unterstützt.

Wir unterstützen die Videoübersetzung zwischen verschiedenen Sprachen, sodass Sie Ihre Inhalte an bestimmte sprachliche Vorlieben anpassen können. Informationen zu den Sprachen, die für die Videoübersetzung unterstützt werden, finden Sie unter unterstützte Quell- und Zielsprachen.

Preisgestaltung

Einzelheiten zu den Preisen für Videoübersetzungen finden Sie unter Preise für den Speech-Dienst. Videoübersetzungspreise sind nur für Dienstregionen sichtbar, in denen das Feature verfügbar ist.

Informationen zu den ersten Schritten mit der Videoübersetzung finden Sie unter Verwendung der Videoübersetzung.

Freigeben über

Was ist Videoübersetzung?

Anwendungsfall

Wichtige Funktionen

Funktionsweise

Unterstützte Regionen und Sprachen

Preisgestaltung

Zugehöriger Inhalt

Feedback

Zusätzliche Ressourcen