Che cos'è la traduzione di documenti?
Traduzione di documenti è una funzionalità di traduzione automatica basata sul cloud del servizio Traduttore per Azure AI. È possibile tradurre più documenti complessi in tutte le lingue e i dialetti supportati mantenendo al tempo stesso la struttura originale e il formato dei dati. L'API per la traduzione di documenti supporta due operazioni di traduzione:
La traduzione dei documenti batch asincrona supporta l'elaborazione asincrona di più documenti e file di grandi dimensioni. Il processo di traduzione batch richiede un account di Archiviazione BLOB di Azure con contenitori per i documenti di origine e tradotti.
La traduzione sincrona dei documenti supporta l'elaborazione sincrona di traduzioni di singoli file. Il processo di traduzione dei file non richiede un account di Archiviazione BLOB di Azure. La risposta finale contiene il documento tradotto e viene restituita direttamente al client chiamante.
Traduzione batch asincrona
Usare l'elaborazione asincrona dei documenti per convertire più documenti e file di grandi dimensioni.
Funzionalità principali batch
Funzionalità | Descrizione |
---|---|
Tradurre file di grandi dimensioni | Tradurre documenti interi in modo asincrono. |
Tradurre numerosi file | Tradurre più file in tutte le lingue e i dialetti supportati mantenendo al tempo stesso la struttura del documento e il formato dei dati. |
Mantieni la presentazione dei file di origine | Tradurre i file mantenendo il layout e il formato originali. |
Applica traduzione personalizzata | Tradurre i documenti usando modelli di traduzione generici e personalizzati. |
Applicare glossari personalizzati | Tradurre i documenti usando glossari personalizzati. |
Rileva automaticamente lingua documento | Consentire al servizio traduzione di documenti di determinare la lingua del documento. |
Tradurre documenti con contenuto in più lingue | Usare la funzionalità di correzione automatica per tradurre documenti con contenuto in più lingue nella lingua di destinazione. |
Opzioni di sviluppo batch
È possibile aggiungere traduzione di documenti alle applicazioni usando l'API REST o un SDK della libreria client:
L'API REST. È un'interfaccia indipendente dal linguaggio che consente di creare richieste HTTP e intestazioni di autorizzazione per tradurre i documenti.
Gli SDK della libreria client sono classi, oggetti, metodi e codice specifici del linguaggio che è possibile usare rapidamente aggiungendo un riferimento nel progetto. Attualmente la traduzione di documenti include il supporto del linguaggio di programmazione per C#/.NET e Python.
Formati di documento supportati batch
Il metodo Get per ottenere i formati di documento supportati restituisce un elenco di formati di documento supportati dal servizio di traduzione di documenti. L'elenco include l'estensione di file comune e il tipo di contenuto, se si usa l'API di caricamento.
Tipo di file | Estensione di file | Descrizione |
---|---|---|
Adobe PDF | pdf |
Portable document file format. Traduzione di documenti usa la tecnologia di riconoscimento ottico dei caratteri (OCR) per estrarre e tradurre il testo nel documento PDF scansionato mantenendo il layout originale. |
Valori delimitati da virgole | csv |
File di dati non elaborato delimitato da virgole usato dai programmi con fogli di calcolo. |
HTML | html , htm |
Hyper Text Markup Language. |
Localization Interchange File Format | xlf | Formato di documento parallelo, esportazione di sistemi di memoria di traduzione. Le lingue usate vengono definite all'interno del file. |
Markdown | markdown , mdown , mkdn , md , mkd , mdwn , mdtxt , mdtext , rmd |
Linguaggio di markup leggero per la creazione di testo formattato. |
MHTML | mthml , mht |
Formato di archivio di pagine Web usato per combinare il codice HTML e le relative risorse complementari. |
Microsoft Excel | xls , xlsx |
Un file di foglio di calcolo per l'analisi e la documentazione dei dati. |
Microsoft Outlook | msg |
Messaggio di posta elettronica creato o salvato in Microsoft Outlook. |
Microsoft PowerPoint | ppt , pptx |
File di presentazione utilizzato per visualizzare il contenuto in un formato di presentazione. |
Microsoft Word | doc , docx |
File di documento di testo. |
Testo OpenDocument | odt |
File di documento di testo open source. |
Presentazione OpenDocument | odp |
File di presentazione open source. |
Foglio di calcolo OpenDocument | ods |
Un file di foglio di calcolo open source. |
Formato RTF | rtf |
Documento di testo contenente formattazione. |
Valori delimitati da tabulazioni/TAB | tsv /tab |
File di dati non elaborato delimitato da tabulazioni usato dai programmi con fogli di calcolo. |
Testo | txt |
Documento di testo non formattato. |
Tipi di file legacy batch
I tipi di file di origine vengono mantenuti durante la traduzione del documento con le eccezioni seguenti:
Estensione del file di origine | Estensione file tradotto |
---|---|
.doc, .odt, .rtf, | DOCX |
.xls, .ods | XLSX |
.ppt, .odp | PPTX |
Formati di glossario supportati batch
La traduzione di documenti supporta i tipi di file di glossario seguenti:
Tipo di file | Estensione di file | Descrizione |
---|---|---|
Valori delimitati da virgole | csv |
File di dati non elaborato delimitato da virgole usato dai programmi con fogli di calcolo. |
Localization Interchange File Format | xlf , xliff |
Formato di documento parallelo, esportazione dei sistemi di memoria di traduzione. Le lingue usate sono definite all'interno del file. |
Valori delimitati da tabulazioni/TAB | tsv , tab |
File di dati non elaborato delimitato da tabulazioni usato dai programmi con fogli di calcolo. |
Transazione sincrona
Usare l'elaborazione sincrona della traduzione per inviare un documento come parte del corpo della richiesta HTTP e ricevere il documento tradotto nella risposta HTTP.
Funzioni chiave della traduzione sincrona
Funzionalità | Descrizione |
---|---|
Tradurre file a pagina singola | La richiesta sincrona accetta solo un singolo documento come input. |
Mantieni la presentazione dei file di origine | Tradurre i file mantenendo il layout e il formato originali. |
Applica traduzione personalizzata | Tradurre i documenti usando modelli di traduzione generici e personalizzati. |
Applicare glossari personalizzati | Tradurre i documenti usando glossari personalizzati. |
Traduzione di lingua singola | Tradurre in e da una lingua supportata. |
Rileva automaticamente lingua documento | Consentire al servizio traduzione di documenti di determinare la lingua del documento. |
Applicare glossari personalizzati | Tradurre un documento usando un glossario personalizzato. |
Formati di documento supportati sincroni
Tipo di file | Estensione di file | Tipo di contenuto | Descrizione |
---|---|---|---|
Testo normale | .txt |
text/plain |
Documento di testo non formattato. |
Valori delimitati da tabulazioni | .txv .tab |
text/tab-separated-values |
Formato di file di testo che usa le schede per separare valori e righe nuove per separare i record. |
Valori delimitati da virgole | .csv |
text/csv |
Formato di file di testo che usa virgole come delimitatori tra i valori. |
HyperText Markup Language | .html .htm |
text/html |
HTML è un linguaggio di markup standard usato per strutturare pagine Web e contenuto. |
MHTML | .mthml .mht |
message/rfc822 @ application/x-mimearchive @ multipart/related |
Formato di file di archivio di pagine Web. |
Microsoft PowerPoint | .pptx |
application/vnd.openxmlformats-officedocument.presentationml.presentation |
Formato di file basato su XML utilizzato per le presentazioni PowerPoint. |
Microsoft Excel | .xlsx |
application/vnd.openxmlformats-officedocument.spreadsheetml.sheet |
Formato di file basato su XML utilizzato per i fogli di calcolo di Excel. |
Microsoft Word | .docx |
application/vnd.openxmlformats-officedocument.wordprocessingml.document |
Formato di file basato su XML utilizzato per i documenti di Word. |
Microsoft Outlook | .msg |
application/vnd.ms-outlook |
Formato di file utilizzato per gli oggetti messaggio di posta di Outlook archiviati. |
Xml Localization Interchange | .xlf .xliff |
application/xliff+xml |
Formato di file basato su XML standardizzato ampiamente usato nell'elaborazione del software di traduzione e localizzazione. |
Formati di glossario supportati sincroni
La traduzione di documenti supporta i tipi di file di glossario seguenti:
Tipo di file | Estensione di file | Descrizione |
---|---|---|
Valori delimitati da virgole | csv |
File di dati non elaborato delimitato da virgole usato dai programmi con fogli di calcolo. |
XmlLocalizationInterchange | xlf , xliff |
Formato basato su XML, progettato per standardizzare la modalità di passaggio dei dati durante il processo di localizzazione. |
TabSeparatedValues | tsv , tab |
File di dati non elaborato delimitato da tabulazioni usato dai programmi con fogli di calcolo. |
Limiti alle richieste di traduzione di documenti
Per informazioni dettagliate sui limiti delle richieste del servizio Traduttore per Azure AI, vedereLimiti delle richieste di traduzione di documenti.
Residenza dei dati di traduzione di documenti
La residenza dei dati di traduzione di documenti dipende dall'area di Azure in cui è stata creata la risorsa Traduttore:
- Le risorse del traduttore create in qualsiasi area in Europa (ad eccezione della Svizzera) vengono elaborate nei data center in Europa settentrionale ed Europa occidentale.
- Le risorse del traduttore create in qualsiasi area in Svizzera vengono elaborate nel data center in Svizzera settentrionale e Svizzera occidentale.
- Le risorse di Traduttore create in qualsiasi area in Asia Pacifico o Australia vengono elaborate nel data center in Asia sud-orientale e Australia orientale.
- Le risorse di Traduttore create in tutte le altre aree, tra cui Globale, America del Nord e America del Sud, vengono elaborate nel data center negli Stati Uniti orientali e negli Stati Uniti occidentali 2.
✔️ Funzionalità: Traduzione di documenti
✔️ Endpoint di servizio: Personalizzato:<name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1
Area della risorsa | Data center di elaborazione della richiesta |
---|---|
Qualsiasi area all'interno dell'Europa (ad eccezione della Svizzera) | Europa: Europa settentrionale • Europa occidentale |
Svizzera | Svizzera: Svizzera settentrionale • Svizzera occidentale |
Qualsiasi area in Asia Pacifico e Australia | Asia: Asia sud-orientale • Australia orientale |
Tutte le altre aree, tra cui Globale, America del Nord e America del Sud | Stati Uniti: Stati Uniti orientali • Stati Uniti occidentali 2 |
Passaggi successivi
Nella guida introduttiva si apprenderà come iniziare rapidamente a usare la traduzione di documenti. Per iniziare, è necessario un account Azure attivo. Se non si ha un account, è possibile crearne uno gratuito.