Condividi tramite


Che cos'è la traduzione video?

Traduzione video è una funzionalità in Voce di Azure AI che consente di tradurre e generare video con facilità in più lingue automaticamente. Questa funzionalità è progettata per facilitare la localizzazione dei contenuti video allo scopo di soddisfare diversi gruppi di spettatori in tutto il mondo. È possibile creare video immersivi e localizzati per vari casi d'uso, ad esempio vlog, formazione, notizie, formazione aziendale, pubblicità, film, programmi televisivi e altro ancora.

Il processo di sostituzione della lingua originale di un video con una voce registrata in una lingua diversa è essenziale per soddisfare diversi destinatari. Questo metodo, in genere ottenuto tramite la registrazione umana e la post-produzione manuale, garantisce che gli spettatori possano godere di contenuti video nella loro lingua nativa. Tuttavia, viene fornito con punti critici principali:

  • Costo elevato: i metodi di traduzione video tradizionali spesso richiedono costosi attori vocali umani e un ampio lavoro post-produzione, rendendolo uno sforzo costoso per gli autori di contenuti.
  • Tempo necessario: il processo manuale di registrazione e modifica del parlato tradotto può richiedere una quantità significativa di tempo, ritardando il rilascio di contenuto localizzato.
  • Qualità incoerente: gli attori vocali umani potrebbero non sempre replicare con precisione la voce dell'altoparlante originale, portando a un'esperienza meno immersiva per gli spettatori.

Con la traduzione video in Riconoscimento vocale di Azure per intelligenza artificiale, queste sfide vengono affrontate in modo efficace. La funzionalità automatizza il processo di traduzione, riducendo significativamente i costi e il tempo di produzione garantendo risultati di alta qualità. La replica accurata della voce dell'altoparlante originale crea un'esperienza di visualizzazione trasparente e immersiva per i destinatari in tutto il mondo.

  • Economico: riduce la necessità di costosi attori vocali umani e del lavoro manuale di post-produzione.
  • Efficienza del tempo: riduce significativamente il tempo necessario per produrre video localizzati.
  • Alta qualità: replica accuratamente la voce dell'altoparlante originale, garantendo un'esperienza di visualizzazione trasparente e immersiva.
  • Scalabile: consente la produzione di grandi volumi di contenuti localizzati in modo rapido ed efficiente.

Caso d'uso

La funzionalità di traduzione video fornita da Voce di Azure AI offre un'ampia gamma di casi d'uso riferiti a diversi settori e tipi di contenuti. Ecco alcune applicazioni principali:

  • Notizie e interviste: le organizzazioni giornalistiche possono avere l’esigenza di tradurre e doppiare notizie e interviste per fornire informazioni accurate e tempestive al pubblico di tutto il mondo.

  • Pubblicità e marketing: le aziende possono dover localizzare i video pubblicitari e di marketing per soddisfare il pubblico di mercati diversi per migliorare la notorietà del marchio e l'engagement dei clienti.

  • Istruzione e apprendimento: gli istituti di istruzione e le piattaforme di e-learning hanno l’esigenza di doppiare i video didattici e le lezioni in lingue diverse per rendere l'apprendimento più accessibile e inclusivo.

  • Film e programmi televisivi: gli studi cinematografici e le società di produzione possono dover doppiare i film e programmi televisivi per la distribuzione internazionale per raggiungere un pubblico più ampio e massimizzare i potenziali ricavi.

  • Vlog e brevi video: i proprietari di contenuti possono facilmente tradurre e doppiare i propri vlog e brevi video per raggiungere il pubblico internazionale e aumentare così il numero di visualizzazioni e il coinvolgimento.

  • Formazione aziendale: le aziende possono avere l’esigenza di localizzare i video di formazione per i dipendenti di aree diverse per garantire comunicazioni coerenti ed efficaci a tutto il personale.

Funzionalità di base

  • Estrazione dell'audio del dialogo e trascrizione del contenuto parlato.

    Estrae automaticamente l'audio del dialogo dal video di origine e trascrive il contenuto parlato.

  • Traduzione dalla lingua A alla B e riformulazione LLM (modello linguistico di grandi dimensioni).

    Converte il contenuto trascritto dalla lingua originale (lingua A) alla lingua di destinazione (lingua B) usando tecniche avanzate di elaborazione del linguaggio. Migliora la qualità della traduzione e affina la sensibilità di genere nel testo tradotto tramite la riformulazione operata da LLM.

  • Traduzione automatica: generazione della voce in altre lingue.

    Usa la tecnologia di sintesi vocale basata sull'intelligenza artificiale per generare automaticamente voci simili a quella umana nella lingua di destinazione. Queste voci sono perfettamente sincronizzate con il video per garantire un'esperienza di traduzione impeccabile. Ciò include l'uso di voci standard per l'output di alta qualità e l'offerta di opzioni per la voce personale.

  • Intervento umano nel ciclo di modifica del contenuto.

    Consente a persone reali di rivedere e modificare il contenuto tradotto, garantendo l'accuratezza e l'adeguatezza culturale prima della finalizzazione del video doppiato.

  • Generazione di sottotitoli.

    Offre il video completamente doppiato con dialoghi tradotti, sottotitoli sincronizzati e voci generate, pronto per il download e la distribuzione su varie piattaforme. È anche possibile impostare la lunghezza dei sottotitoli in ogni schermata per una visualizzazione ottimale.

Come funziona

Questo diagramma offre una panoramica generale del flusso di lavoro.

Diagramma del flusso di lavoro dell'API di traduzione video.

  1. Carichi il file video che si vuole tradurre in Azure Blob Storage.
  2. Per creare una traduzione, specificare l'URL del file video. Includere altri parametri, ad esempio le lingue di origine e di destinazione, il tipo di voce e se masterizzare i sottotitoli nel video.

    Nota

    La creazione di una traduzione non avvia il processo di traduzione.

  3. È possibile iniziare a tradurre il video creando un'iterazione. Un'iterazione è un'istanza specifica del processo di traduzione. È possibile creare più iterazioni per la stessa traduzione, consentendo di sperimentare impostazioni o parametri diversi.
  4. Dopo la prima iterazione, è possibile usare il file di sottotitolo nelle iterazioni successive. Caricare il proprio file di sottotitolo o apportare modifiche al file di sottotitolo generato automaticamente e caricare il file del sottotitolo modificato.
  5. Ottenere periodicamente lo stato della traduzione e dell'iterazione. Lo stato indica se la traduzione è in corso, completata o non riuscita.
  6. Una volta completata la traduzione, è possibile scaricare il video e i sottotitoli tradotti. Il video tradotto avrà il parlato originale sostituito con il parlato tradotto e i sottotitoli verranno sincronizzati con il parlato tradotto.
  7. È anche possibile eliminare la traduzione e l'iterazione se non sono più necessarie. L'eliminazione di una traduzione rimuoverà tutte le iterazioni e i dati associati.

Aree e lingue supportate

Attualmente, la traduzione video in Voce di Azure AI è supportata solo nell'area degli Stati Uniti orientali.

Supportiamo la traduzione video tra varie lingue per consentire la personalizzazione dei contenuti in base a specifiche preferenze linguistiche. Per le lingue supportate per la traduzione video, vedere le lingue di origine e di destinazione supportate.

Tariffazione

Per i dettagli sui prezzi di traduzione video, vedere Prezzi del servizio vocale. I prezzi della traduzione video sono visibili solo per le aree del servizio in cui è disponibile la funzionalità.