Che cos'è la traduzione di documenti?

Traduzione di documenti è una funzionalità di traduzione automatica basata sul cloud del servizio Traduttore per Azure AI. È possibile tradurre più documenti complessi in tutte le lingue e i dialetti supportati mantenendo al tempo stesso la struttura originale e il formato dei dati. L'API per la traduzione di documenti supporta due operazioni di traduzione:

  • La traduzione dei documenti batch asincrona supporta l'elaborazione asincrona di più documenti e file di grandi dimensioni. Il processo di traduzione batch richiede un account di Archiviazione BLOB di Azure con contenitori per i documenti di origine e tradotti.

  • La traduzione sincrona dei documenti supporta l'elaborazione sincrona di traduzioni di singoli file. Il processo di traduzione dei file non richiede un account di Archiviazione BLOB di Azure. La risposta finale contiene il documento tradotto e viene restituita direttamente al client chiamante.

Traduzione batch asincrona

Usare l'elaborazione asincrona dei documenti per convertire più documenti e file di grandi dimensioni.

Funzionalità principali batch

Funzionalità Descrizione
Tradurre file di grandi dimensioni Tradurre documenti interi in modo asincrono.
Tradurre numerosi file Tradurre più file in tutte le lingue e i dialetti supportati mantenendo al tempo stesso la struttura del documento e il formato dei dati.
Mantieni la presentazione dei file di origine Tradurre i file mantenendo il layout e il formato originali.
Applica traduzione personalizzata Tradurre i documenti usando modelli di traduzione generici e personalizzati.
Applicare glossari personalizzati Tradurre i documenti usando glossari personalizzati.
Rileva automaticamente lingua documento Consentire al servizio traduzione di documenti di determinare la lingua del documento.
Tradurre documenti con contenuto in più lingue Usare la funzionalità di correzione automatica per tradurre documenti con contenuto in più lingue nella lingua di destinazione.

Opzioni di sviluppo batch

È possibile aggiungere traduzione di documenti alle applicazioni usando l'API REST o un SDK della libreria client:

  • L'API REST. È un'interfaccia indipendente dal linguaggio che consente di creare richieste HTTP e intestazioni di autorizzazione per tradurre i documenti.

  • Gli SDK della libreria client sono classi, oggetti, metodi e codice specifici del linguaggio che è possibile usare rapidamente aggiungendo un riferimento nel progetto. Attualmente la traduzione di documenti include il supporto del linguaggio di programmazione per C#/.NET e Python.

Formati di documento supportati batch

Il metodo Get per ottenere i formati di documento supportati restituisce un elenco di formati di documento supportati dal servizio di traduzione di documenti. L'elenco include l'estensione di file comune e il tipo di contenuto, se si usa l'API di caricamento.

Tipo di file Estensione di file Descrizione
Adobe PDF pdf Portable document file format. Traduzione di documenti usa la tecnologia di riconoscimento ottico dei caratteri (OCR) per estrarre e tradurre il testo nel documento PDF scansionato mantenendo il layout originale.
Valori delimitati da virgole csv File di dati non elaborato delimitato da virgole usato dai programmi con fogli di calcolo.
HTML html, htm Hyper Text Markup Language.
Localization Interchange File Format xlf Formato di documento parallelo, esportazione di sistemi di memoria di traduzione. Le lingue usate vengono definite all'interno del file.
Markdown markdown, mdown, mkdn, md, mkd, mdwn, mdtxt, mdtext, rmd Linguaggio di markup leggero per la creazione di testo formattato.
M​HTML mthml, mht Formato di archivio di pagine Web usato per combinare il codice HTML e le relative risorse complementari.
Microsoft Excel xls, xlsx Un file di foglio di calcolo per l'analisi e la documentazione dei dati.
Microsoft Outlook msg Messaggio di posta elettronica creato o salvato in Microsoft Outlook.
Microsoft PowerPoint ppt, pptx File di presentazione utilizzato per visualizzare il contenuto in un formato di presentazione.
Microsoft Word doc, docx File di documento di testo.
Testo OpenDocument odt File di documento di testo open source.
Presentazione OpenDocument odp File di presentazione open source.
Foglio di calcolo OpenDocument ods Un file di foglio di calcolo open source.
Formato RTF rtf Documento di testo contenente formattazione.
Valori delimitati da tabulazioni/TAB tsv/tab File di dati non elaborato delimitato da tabulazioni usato dai programmi con fogli di calcolo.
Testo txt Documento di testo non formattato.

Tipi di file legacy batch

I tipi di file di origine vengono mantenuti durante la traduzione del documento con le eccezioni seguenti:

Estensione del file di origine Estensione file tradotto
.doc, .odt, .rtf, DOCX
.xls, .ods XLSX
.ppt, .odp PPTX

Formati di glossario supportati batch

La traduzione di documenti supporta i tipi di file di glossario seguenti:

Tipo di file Estensione di file Descrizione
Valori delimitati da virgole csv File di dati non elaborato delimitato da virgole usato dai programmi con fogli di calcolo.
Localization Interchange File Format xlf , xliff Formato di documento parallelo, esportazione dei sistemi di memoria di traduzione. Le lingue usate sono definite all'interno del file.
Valori delimitati da tabulazioni/TAB tsv, tab File di dati non elaborato delimitato da tabulazioni usato dai programmi con fogli di calcolo.

Transazione sincrona

Usare l'elaborazione sincrona della traduzione per inviare un documento come parte del corpo della richiesta HTTP e ricevere il documento tradotto nella risposta HTTP.

Funzioni chiave della traduzione sincrona

Funzionalità Descrizione
Tradurre file a pagina singola La richiesta sincrona accetta solo un singolo documento come input.
Mantieni la presentazione dei file di origine Tradurre i file mantenendo il layout e il formato originali.
Applica traduzione personalizzata Tradurre i documenti usando modelli di traduzione generici e personalizzati.
Applicare glossari personalizzati Tradurre i documenti usando glossari personalizzati.
Traduzione di lingua singola Tradurre in e da una lingua supportata.
Rileva automaticamente lingua documento Consentire al servizio traduzione di documenti di determinare la lingua del documento.
Applicare glossari personalizzati Tradurre un documento usando un glossario personalizzato.

Formati di documento supportati sincroni

Tipo di file Estensione di file Tipo di contenuto Descrizione
Testo normale .txt text/plain Documento di testo non formattato.
Valori delimitati da tabulazioni .txv
.tab
text/tab-separated-values Formato di file di testo che usa le schede per separare valori e righe nuove per separare i record.
Valori delimitati da virgole .csv text/csv Formato di file di testo che usa virgole come delimitatori tra i valori.
HyperText Markup Language .html
.htm
text/html HTML è un linguaggio di markup standard usato per strutturare pagine Web e contenuto.
M​HTML .mthml
.mht
message/rfc822
@application/x-mimearchive
@multipart/related
Formato di file di archivio di pagine Web.
Microsoft PowerPoint .pptx application/vnd.openxmlformats-officedocument.presentationml.presentation Formato di file basato su XML utilizzato per le presentazioni PowerPoint.
Microsoft Excel .xlsx application/vnd.openxmlformats-officedocument.spreadsheetml.sheet Formato di file basato su XML utilizzato per i fogli di calcolo di Excel.
Microsoft Word .docx application/vnd.openxmlformats-officedocument.wordprocessingml.document Formato di file basato su XML utilizzato per i documenti di Word.
Microsoft Outlook .msg application/vnd.ms-outlook Formato di file utilizzato per gli oggetti messaggio di posta di Outlook archiviati.
Xml Localization Interchange .xlf
.xliff
application/xliff+xml Formato di file basato su XML standardizzato ampiamente usato nell'elaborazione del software di traduzione e localizzazione.

Formati di glossario supportati sincroni

La traduzione di documenti supporta i tipi di file di glossario seguenti:

Tipo di file Estensione di file Descrizione
Valori delimitati da virgole csv File di dati non elaborato delimitato da virgole usato dai programmi con fogli di calcolo.
XmlLocalizationInterchange xlf , xliff Formato basato su XML, progettato per standardizzare la modalità di passaggio dei dati durante il processo di localizzazione.
TabSeparatedValues tsv, tab File di dati non elaborato delimitato da tabulazioni usato dai programmi con fogli di calcolo.

Limiti alle richieste di traduzione di documenti

Per informazioni dettagliate sui limiti delle richieste del servizio Traduttore per Azure AI, vedereLimiti delle richieste di traduzione di documenti.

Residenza dei dati di traduzione di documenti

La residenza dei dati di traduzione di documenti dipende dall'area di Azure in cui è stata creata la risorsa Traduttore:

  • Le risorse del traduttore create in qualsiasi area in Europa (ad eccezione della Svizzera) vengono elaborate nei data center in Europa settentrionale ed Europa occidentale.
  • Le risorse del traduttore create in qualsiasi area in Svizzera vengono elaborate nel data center in Svizzera settentrionale e Svizzera occidentale.
  • Le risorse di Traduttore create in qualsiasi area in Asia Pacifico o Australia vengono elaborate nel data center in Asia sud-orientale e Australia orientale.
  • Le risorse di Traduttore create in tutte le altre aree, tra cui Globale, America del Nord e America del Sud, vengono elaborate nel data center negli Stati Uniti orientali e negli Stati Uniti occidentali 2.

✔️ Funzionalità: Traduzione di documenti
✔️ Endpoint di servizio: Personalizzato:<name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1

Area della risorsa Data center di elaborazione della richiesta
Qualsiasi area all'interno dell'Europa (ad eccezione della Svizzera) Europa: Europa settentrionale • Europa occidentale
Svizzera Svizzera: Svizzera settentrionale • Svizzera occidentale
Qualsiasi area in Asia Pacifico e Australia Asia: Asia sud-orientale • Australia orientale
Tutte le altre aree, tra cui Globale, America del Nord e America del Sud Stati Uniti: Stati Uniti orientali • Stati Uniti occidentali 2

Passaggi successivi

Nella guida introduttiva si apprenderà come iniziare rapidamente a usare la traduzione di documenti. Per iniziare, è necessario un account Azure attivo. Se non si ha un account, è possibile crearne uno gratuito.