Che cos'è la traduzione di documenti?
Traduzione di documenti è una funzionalità di traduzione automatica basata sul cloud del servizio Traduttore per Azure AI. È possibile tradurre più documenti complessi in tutte le lingue e i dialetti supportati mantenendo al tempo stesso la struttura originale e il formato dei dati. L'API Traduzione di documenti supporta due processi di traduzione:
La traduzione in batch asincrona supporta l'elaborazione di più documenti e file di grandi dimensioni. Il processo di traduzione batch richiede un account di Archiviazione BLOB di Azure con contenitori di archiviazione per i documenti di origine e tradotti.
La modalità sincrona per file singolo supporta l'elaborazione di traduzioni di file singoli. Il processo di traduzione dei file non richiede un account di Archiviazione BLOB di Azure. La risposta finale contiene il documento tradotto e viene restituita direttamente al client chiamante.
Traduzione batch asincrona
Usare l'elaborazione asincrona dei documenti per convertire più documenti e file di grandi dimensioni.
Funzionalità principali batch
Funzionalità | Descrizione |
---|---|
Tradurre file di grandi dimensioni | Tradurre documenti interi in modo asincrono. |
Tradurre numerosi file | Tradurre più file in tutte le lingue e i dialetti supportati mantenendo al tempo stesso la struttura del documento e il formato dei dati. |
Mantieni la presentazione dei file di origine | Tradurre i file mantenendo il layout e il formato originali. |
Applica traduzione personalizzata | Tradurre i documenti usando modelli di traduzione generici e personalizzati. |
Applicare glossari personalizzati | Tradurre i documenti usando glossari personalizzati. |
Rileva automaticamente lingua documento | Consentire al servizio Traduzione di documenti di determinare la lingua del documento. |
Tradurre documenti con contenuto in più lingue | Usare la funzionalità di correzione automatica per tradurre documenti con contenuto in più lingue nella lingua di destinazione. |
Opzioni di sviluppo batch
È possibile aggiungere traduzione di documenti alle applicazioni usando l'API REST o un SDK della libreria client:
L'API REST. È un'interfaccia indipendente dal linguaggio che consente di creare richieste HTTP e intestazioni di autorizzazione per tradurre i documenti.
Gli SDK della libreria client sono classi, oggetti, metodi e codice specifici del linguaggio che è possibile usare rapidamente aggiungendo un riferimento nel progetto. Attualmente la traduzione di documenti include il supporto del linguaggio di programmazione per C#/.NET e Python.
Formati di documento supportati batch
Il metodo Get per ottenere i formati di documento supportati restituisce un elenco di formati di documento supportati dal servizio di traduzione di documenti. L'elenco include l'estensione di file comune e il tipo di contenuto, se si usa l'API di caricamento.
Tipo di file | Estensione di file | Descrizione |
---|---|---|
Adobe PDF | pdf |
Formato di file di documento portatile. Traduzione di documenti usa la tecnologia di riconoscimento ottico dei caratteri (OCR) per estrarre e tradurre il testo nel documento PDF scansionato mantenendo il layout originale. |
Valori delimitati da virgole | csv |
File di dati non elaborato delimitato da virgole usato dai programmi con fogli di calcolo. |
HTML | html , htm |
Hyper Text Markup Language. |
Localization Interchange File Format | xlf | Formato di documento parallelo, esportazione di sistemi di memoria di traduzione. Le lingue usate vengono definite all'interno del file. |
Markdown | markdown , mdown , mkdn , md , mkd , mdwn , mdtxt , mdtext , rmd |
Linguaggio di markup leggero per la creazione di testo formattato. |
MHTML | mthml , mht |
Formato di archivio di pagine Web usato per combinare il codice HTML e le relative risorse complementari. |
Microsoft Excel | xls , xlsx |
Un file di foglio di calcolo per l'analisi e la documentazione dei dati. |
Microsoft Outlook | msg |
Messaggio di posta elettronica creato o salvato in Microsoft Outlook. |
Microsoft PowerPoint | ppt , pptx |
File di presentazione utilizzato per visualizzare il contenuto in un formato di presentazione. |
Microsoft Word | doc , docx |
File di documento di testo. |
Testo OpenDocument | odt |
File di documento di testo open source. |
Presentazione OpenDocument | odp |
File di presentazione open source. |
Foglio di calcolo OpenDocument | ods |
Un file di foglio di calcolo open source. |
Formato RTF | rtf |
Documento di testo contenente formattazione. |
Valori delimitati da tabulazioni/TAB | tsv /tab |
File di dati non elaborato delimitato da tabulazioni usato dai programmi con fogli di calcolo. |
Testo | txt |
Documento di testo non formattato. |
Tipi di file legacy batch
I tipi di file di origine vengono mantenuti durante la traduzione del documento con le eccezioni seguenti:
Estensione del file di origine | Estensione file tradotto |
---|---|
.doc, .odt, .rtf, | DOCX |
.xls, .ods | XLSX |
.ppt, .odp | PPTX |
Formati di glossario supportati batch
La traduzione di documenti supporta i tipi di file di glossario seguenti:
Tipo di file | Estensione di file | Descrizione |
---|---|---|
Valori delimitati da virgole | csv |
File di dati non elaborato delimitato da virgole usato dai programmi con fogli di calcolo. |
Localization Interchange File Format | xlf , xliff |
Formato di documento parallelo, esportazione dei sistemi di memoria di traduzione. Le lingue usate sono definite all'interno del file. |
Valori delimitati da tabulazioni/TAB | tsv , tab |
File di dati non elaborato delimitato da tabulazioni usato dai programmi con fogli di calcolo. |
Transazione sincrona
Usare l'elaborazione sincrona della traduzione per inviare un documento come parte del corpo della richiesta HTTP e ricevere il documento tradotto nella risposta HTTP.
Funzioni chiave della traduzione sincrona
Funzionalità | Descrizione |
---|---|
Tradurre file a pagina singola | La richiesta sincrona accetta solo un singolo documento come input. |
Mantieni la presentazione dei file di origine | Tradurre i file mantenendo il layout e il formato originali. |
Applica traduzione personalizzata | Tradurre i documenti usando modelli di traduzione generici e personalizzati. |
Applicare glossari personalizzati | Tradurre i documenti usando glossari personalizzati. |
Traduzione di lingua singola | Tradurre in e da una lingua supportata. |
Rileva automaticamente lingua documento | Consentire al servizio traduzione di documenti di determinare la lingua del documento. |
Applicare glossari personalizzati | Tradurre un documento usando un glossario personalizzato. |
Formati di documento supportati sincroni
Tipo di file | Estensione di file | Tipo di contenuto | Descrizione |
---|---|---|---|
Testo normale | .txt |
text/plain |
Documento di testo non formattato. |
Valori delimitati da tabulazioni | .txv .tab |
text/tab-separated-values |
Formato di file di testo che usa le schede per separare valori e righe nuove per separare i record. |
Valori delimitati da virgole | .csv |
text/csv |
Formato di file di testo che usa virgole come delimitatori tra i valori. |
HyperText Markup Language | .html .htm |
text/html |
HTML è un linguaggio di markup standard usato per strutturare pagine Web e contenuto. |
MHTML | .mthml .mht |
message/rfc822 @ application/x-mimearchive @ multipart/related |
Formato di file di archivio di pagine Web. |
Microsoft PowerPoint | .pptx |
application/vnd.openxmlformats-officedocument.presentationml.presentation |
Formato di file basato su XML utilizzato per le presentazioni PowerPoint. |
Microsoft Excel | .xlsx |
application/vnd.openxmlformats-officedocument.spreadsheetml.sheet |
Formato di file basato su XML utilizzato per i fogli di calcolo di Excel. |
Microsoft Word | .docx |
application/vnd.openxmlformats-officedocument.wordprocessingml.document |
Formato di file basato su XML utilizzato per i documenti di Word. |
Microsoft Outlook | .msg |
application/vnd.ms-outlook |
Formato di file utilizzato per gli oggetti messaggio di posta di Outlook archiviati. |
Xml Localization Interchange | .xlf .xliff |
application/xliff+xml |
Formato di file basato su XML standardizzato ampiamente usato nell'elaborazione del software di traduzione e localizzazione. |
Formati di glossario supportati sincroni
La traduzione di documenti supporta i tipi di file di glossario seguenti:
Tipo di file | Estensione di file | Descrizione |
---|---|---|
Valori delimitati da virgole | csv |
File di dati non elaborato delimitato da virgole usato dai programmi con fogli di calcolo. |
XmlLocalizationInterchange | xlf , xliff |
Formato basato su XML, progettato per standardizzare la modalità di passaggio dei dati durante il processo di localizzazione. |
TabSeparatedValues | tsv , tab |
File di dati non elaborato delimitato da tabulazioni usato dai programmi con fogli di calcolo. |
Limiti alle richieste di traduzione di documenti
Per informazioni dettagliate sui limiti delle richieste del servizio Traduttore per Azure AI, vedere Limiti delle richieste di traduzione di documenti.
Residenza dei dati di traduzione di documenti
La residenza dei dati di traduzione di documenti dipende dall'area di Azure in cui è stata creata la risorsa Traduttore:
✔️ Funzionalità: Traduzione di documenti
✔️ Endpoint di servizio: Personalizzato: <name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1
Area creata dalla risorsa | Data center di elaborazione della richiesta |
---|---|
Global | Data center più vicino disponibile. |
Americhe | Stati Uniti orientali 2 • Stati Uniti occidentali 2 |
Asia/Pacifico | Giappone orientale • Asia sud-orientale |
Europa (ad eccezione della Svizzera) | Francia centrale • Europa occidentale |
Svizzera | Svizzera settentrionale • Svizzera occidentale |
Passaggi successivi
Nella guida introduttiva si apprenderà come iniziare rapidamente a usare la traduzione di documenti. Per iniziare, è necessario un account Azure attivo. Se non si ha un account, è possibile crearne uno gratuito.