Cognitieve vaardigheid tekstomzetting
De vaardigheid Tekstvertaling evalueert tekst en retourneert voor elke record de tekst die naar de opgegeven doeltaal is vertaald. Deze vaardigheid maakt gebruik van de Translator Text-API v3.0 die beschikbaar is in Azure AI-services.
Deze mogelijkheid is handig als u verwacht dat uw documenten mogelijk niet allemaal in één taal staan. In dat geval kunt u de tekst normaliseren in één taal voordat u de zoekfunctie indexeert door deze te vertalen. Het is ook handig voor lokalisatiegebruiksvoorbeelden, waarbij u mogelijk kopieën wilt hebben van dezelfde tekst die beschikbaar is in meerdere talen.
De Translator Text-API v3.0 is een niet-regionale Azure AI-service, wat betekent dat uw gegevens niet gegarandeerd in dezelfde regio blijven als uw Azure AI Search-resource of gekoppelde Azure AI-servicesresource.
Notitie
Deze vaardigheid is gebonden aan Azure AI-services en vereist een factureerbare resource voor transacties die groter zijn dan 20 documenten per indexeerfunctie per dag. Voor de uitvoering van ingebouwde vaardigheden worden kosten in rekening gebracht voor de bestaande betalen per gebruik-prijs van Azure AI-services.
Wanneer u deze vaardigheid gebruikt, worden alle documenten in de bron verwerkt en gefactureerd voor vertaling, zelfs als de bron- en doeltalen hetzelfde zijn. Dit gedrag is handig voor ondersteuning in meerdere talen binnen hetzelfde document, maar dit kan leiden tot onnodige verwerking. Als u onverwachte factureringskosten wilt voorkomen voor documenten die geen verwerking nodig hebben, verplaatst u deze uit de gegevensbroncontainer voordat u de vaardigheid uitvoert.
@odata.type
Microsoft.Skills.Text.TranslationSkill
Gegevenslimieten
De maximale grootte van een record moet 50.000 tekens zijn, zoals gemeten door String.Length
. Als u uw gegevens wilt opsplitsen voordat u deze naar de vaardigheid tekstvertaling verzendt, kunt u overwegen de vaardigheid Tekst splitsen te gebruiken. Als u een vaardigheid voor tekstsplitsing gebruikt, stelt u de paginalengte in op 5000 voor de beste prestaties.
Vaardigheidsparameters
Parameters zijn hoofdlettergevoelig.
Invoerwaarden | Beschrijving |
---|---|
defaultToLanguageCode | (Vereist) De taalcode waarnaar documenten moeten worden vertaald voor documenten die niet expliciet de 'naar'-taal opgeven. Zie de volledige lijst met ondersteunde talen. |
defaultFromLanguageCode | (Optioneel) De taalcode waaruit documenten moeten worden vertaald voor documenten die niet expliciet de 'van'-taal opgeven. Als de defaultFromLanguageCode niet is opgegeven, wordt de automatische taaldetectie van de Translator Text-API gebruikt om de taal 'van' te bepalen. Zie de volledige lijst met ondersteunde talen. |
suggestedFrom | (Optioneel) De taalcode voor het vertalen van documenten van indien fromLanguageCode of defaultFromLanguageCode niet opgegeven, en de automatische taaldetectie is mislukt. Als de suggestedFrom-taal niet is opgegeven, wordt Engels (en) gebruikt als de suggestedFrom-taal. Zie de volledige lijst met ondersteunde talen. |
Invoer van vaardigheden
Invoernaam | Beschrijving |
---|---|
sms verzenden | De te vertalen tekst. |
toLanguageCode | Een tekenreeks die de taal aangeeft waarin de tekst moet worden vertaald. Als deze invoer niet is opgegeven, wordt de defaultToLanguageCode gebruikt om de tekst te vertalen. Zie de volledige lijst met ondersteunde talen. |
fromLanguageCode | Een tekenreeks die de huidige taal van de tekst aangeeft. Als deze parameter niet is opgegeven, wordt de defaultFromLanguageCode (of automatische taaldetectie als de defaultFromLanguageCode niet is opgegeven) gebruikt om de tekst te vertalen. Zie de volledige lijst met ondersteunde talen. |
Uitvoer van vaardigheden
Uitvoernaam | Beschrijving |
---|---|
vertaalde tekst | Het tekenreeksresultaat van de tekstomzetting van de vertaaldeFromLanguageCode naar de vertaaldeToLanguageCode. |
translatedToLanguageCode | Een tekenreeks die de taalcode aangeeft waarin de tekst is vertaald. Handig als u vertaalt naar meerdere talen en wilt kunnen bijhouden welke tekst welke taal is. |
translatedFromLanguageCode | Een tekenreeks die de taalcode aangeeft waaruit de tekst is vertaald. Handig als u hebt gekozen voor de optie voor automatische taaldetectie, omdat deze uitvoer u het resultaat van die detectie geeft. |
Voorbeelddefinitie
{
"@odata.type": "#Microsoft.Skills.Text.TranslationSkill",
"defaultToLanguageCode": "fr",
"suggestedFrom": "en",
"context": "/document",
"inputs": [
{
"name": "text",
"source": "/document/text"
}
],
"outputs": [
{
"name": "translatedText",
"targetName": "translatedText"
},
{
"name": "translatedFromLanguageCode",
"targetName": "translatedFromLanguageCode"
},
{
"name": "translatedToLanguageCode",
"targetName": "translatedToLanguageCode"
}
]
}
Voorbeeldinvoer
{
"values": [
{
"recordId": "1",
"data":
{
"text": "We hold these truths to be self-evident, that all men are created equal."
}
},
{
"recordId": "2",
"data":
{
"text": "Estamos muy felices de estar con ustedes."
}
}
]
}
Voorbeelduitvoer
{
"values": [
{
"recordId": "1",
"data":
{
"translatedText": "Nous tenons ces vérités pour évidentes, que tous les hommes sont créés égaux.",
"translatedFromLanguageCode": "en",
"translatedToLanguageCode": "fr"
}
},
{
"recordId": "2",
"data":
{
"translatedText": "Nous sommes très heureux d'être avec vous.",
"translatedFromLanguageCode": "es",
"translatedToLanguageCode": "fr"
}
}
]
}
Fouten en waarschuwingen
Als u een niet-ondersteunde taalcode opgeeft voor de taal 'naar' of 'van', wordt er een fout gegenereerd en wordt tekst niet vertaald. Als uw tekst leeg is, wordt er een waarschuwing gegenereerd. Als uw tekst groter is dan 50.000 tekens, worden alleen de eerste 50.000 tekens vertaald en wordt er een waarschuwing weergegeven.