Wat is documentomzetting?

Documentomzetting is een cloudfunctie van de Azure Translator-service en maakt deel uit van de Azure Cognitive Service-familie van REST API's. De documentomzettings-API kan worden gebruikt om meerdere en complexe documenten te vertalen in alle ondersteunde talen en dialecten, terwijl de oorspronkelijke documentstructuur en gegevensindeling behouden blijven.

Deze documentatie bevat de volgende artikeltypen:

  • Quickstarts zijn aan de slag-instructies om u te begeleiden bij het indienen van aanvragen bij de service.
  • Instructies bevatten instructies voor het gebruik van de functie op specifiekere of aangepaste manieren.
  • Naslaginformatie biedt REST API-instellingen, waarden, trefwoorden en configuratie.

Belangrijke functies voor documentomzetting

Functie Beschrijving
Grote bestanden vertalen Hele documenten asynchroon vertalen.
Talloze bestanden vertalen Vertaal meerdere bestanden in alle ondersteunde talen en dialecten met behoud van documentstructuur en gegevensindeling.
Presentatie van bronbestand behouden Bestanden vertalen met behoud van de oorspronkelijke indeling en indeling.
Aangepaste vertaling toepassen Documenten vertalen met behulp van algemene en aangepaste vertaalmodellen .
Aangepaste woordenlijsten toepassen Documenten vertalen met aangepaste woordenlijsten.
Documenttaal automatisch detecteren Laat de service Documentomzetting de taal van het document bepalen.
Documenten vertalen met inhoud in meerdere talen Gebruik de functie voor automatisch detecteren om documenten te vertalen met inhoud in meerdere talen in uw doeltaal.

Notitie

Bij het vertalen van documenten met inhoud in meerdere talen is de functie bedoeld voor volledige zinnen in één taal. Als zinnen bestaan uit meer dan één taal, wordt de inhoud mogelijk niet allemaal omgezet in de doeltaal. Zie inhoudslimieten voor meer informatie over invoervereisten

Ontwikkelingsopties voor documentomzetting

U kunt documentomzetting toevoegen aan uw toepassingen met behulp van de REST API of een SDK voor clientbibliotheek:

  • De REST API. is een taalonafhankelijke interface waarmee u HTTP-aanvragen en autorisatieheaders kunt maken om documenten te vertalen.

  • De clientbibliotheek-SDK's zijn taalspecifieke klassen, objecten, methoden en code die u snel kunt gebruiken door een verwijzing in uw project toe te voegen. Documentomzetting biedt momenteel programmeertaalondersteuning voor C#/.NET en Python.

Aan de slag

In onze handleiding leert u hoe u snel aan de slag kunt met documentomzetting. Om te beginnen hebt u een actief Azure-account nodig. Als u er nog geen hebt, kunt u een gratis account maken.

Ondersteunde documentindelingen

De volgende documentbestandstypen worden ondersteund door documentomzetting:

Bestandstype Bestandsextensie Description
Adobe PDF pdf Draagbare documentbestandsindeling. Documentvertaling maakt gebruik van OCR-technologie (Optical Character Recognition) om tekst in gescand PDF-document te extraheren en te vertalen terwijl de oorspronkelijke indeling behouden blijft.
waarden Comma-Separated CSV Een bestand met door komma's gescheiden onbewerkte gegevens dat wordt gebruikt door spreadsheetprogramma's.
HTML html, htm Hyper Text Markup Language.
Localization Interchange-bestandsindeling Xlf Een parallelle documentindeling, export van Vertaalgeheugensystemen. De gebruikte talen worden gedefinieerd in het bestand.
Markdown markdown, mdown, mkdn, md, mkd, mdwn, mdtxt, mdtext, rmd Een lichtgewicht opmaaktaal voor het maken van opgemaakte tekst.
MHTML mthml, mht Een archiefindeling voor webpagina's die wordt gebruikt om HTML-code en de bijbehorende resources te combineren.
Microsoft Excel xls, xlsx Een spreadsheetbestand voor gegevensanalyse en documentatie.
Microsoft Outlook msg Een e-mailbericht dat is gemaakt of opgeslagen in Microsoft Outlook.
Microsoft PowerPoint ppt, pptx Een presentatiebestand dat wordt gebruikt om inhoud weer te geven in een diavoorstellingsindeling.
Microsoft Word doc, docx Een tekstbestand.
OpenDocument-tekst Odt Een opensource-tekstbestand.
OpenDocument-presentatie Odp Een opensource-presentatiebestand.
OpenDocument-spreadsheet Ods Een opensource-spreadsheetbestand.
Opmaak van rtf-tekst rtf Een tekstdocument met opmaak.
Door tabs gescheiden waarden/TAB tsv/tab Een met tabs gescheiden onbewerkt gegevensbestand dat wordt gebruikt door spreadsheetprogramma's.
Tekst Txt Een niet-opgemaakt tekstdocument.

Verouderde bestandstypen

Bronbestandstypen blijven behouden tijdens de documentomzetting met de volgende uitzonderingen:

Bronbestandsextensie Vertaalde bestandsextensie
.doc, .odt, .rtf, .docx
.xls, .ods .xlsx
.ppt, .odp .pptx

Ondersteunde woordenlijstindelingen

De volgende bestandstypen voor woordenlijsten worden ondersteund door documentomzetting:

Bestandstype Bestandsextensie Description
waarden Comma-Separated CSV Een bestand met door komma's gescheiden onbewerkte gegevens dat wordt gebruikt door spreadsheetprogramma's.
Localization Interchange-bestandsindeling xlf, xliff Een parallelle documentindeling, export van vertaalgeheugensystemen De gebruikte talen worden gedefinieerd in het bestand.
Tab-Separated waarden/TAB tsv, tabblad Een met tabs gescheiden onbewerkt gegevensbestand dat wordt gebruikt door spreadsheetprogramma's.

Volgende stappen