Translator 3.0: Opzoeken in woordenlijst

Artikel
09/22/2023

Biedt alternatieve vertalingen voor een woord en een paar idiomatische zinnen. Elke vertaling heeft een deel van de spraak en een lijst met back-vertalingen. Met de back-vertalingen kan een gebruiker de vertaling in de context begrijpen. Met de bewerking Woordenlijstvoorbeeld kunt u verder inzoomen om het voorbeeld van elk vertaalpaar te bekijken.

Aanvraag-URL

Een aanvraag POST versturen naar:

https://api.cognitive.microsofttranslator.com/dictionary/lookup?api-version=3.0

ZieVirtual Network Support for Translator Service selected network and private endpoint configuration and support (Ondersteuning voor geselecteerde netwerk- en privé-eindpunten).

Aanvraagparameters

Aanvraagparameters die worden doorgegeven aan de querytekenreeks zijn:

Queryparameter	Description
api-versie	Vereiste parameter. Versie van de API die door de client is aangevraagd. Waarde moet zijn `3.0`
from	Vereiste parameter. Hiermee geeft u de taal van de invoertekst op. De brontaal moet een van de ondersteunde talen in het `dictionary` bereik zijn.
tot	Vereiste parameter. Hiermee geeft u de taal van de uitvoertekst op. De doeltaal moet een van de ondersteunde talen in het `dictionary` bereik zijn.

Aanvraagheaders zijn onder andere:

Kopteksten	Beschrijving
Verificatieheader(s)	Vereiste aanvraagheader. Zie Verificatie.
Content-Type	Vereiste aanvraagheader. Hiermee geeft u het inhoudstype van de payload op. Mogelijke waarden zijn: `application/json`.
Content-Length	Vereiste aanvraagheader. De lengte van de aanvraagtekst.
X-ClientTraceId	Optioneel. Een door de client gegenereerde GUID om de aanvraag op unieke wijze te identificeren. U kunt deze header weglaten als u de tracerings-id in de queryreeks opneemt middels een queryparameter met de naam `ClientTraceId`.

Aanvraagbody

De hoofdtekst van de aanvraag is een JSON-matrix. Elk matrixelement is een JSON-object met een tekenreekseigenschap met de naam Text, die de term vertegenwoordigt die moet worden opgezocht.

[
    {"Text":"fly"}
]

De volgende beperkingen zijn van toepassing:

De matrix kan maximaal 10 elementen bevatten.
De tekstwaarde van een matrixelement mag niet langer zijn dan 100 tekens, inclusief spaties.

Hoofdtekst van de reactie

Een geslaagd antwoord is een JSON-matrix met één resultaat voor elke tekenreeks in de invoermatrix. Een resultaatobject bevat de volgende eigenschappen:

normalizedSource: Een tekenreeks die de genormaliseerde vorm van de bronterm aangeeft. Als de aanvraag bijvoorbeeld is, is JOHNjohnde genormaliseerde vorm . De inhoud van dit veld wordt de invoer voor het opzoeken van voorbeelden.
displaySource: Een tekenreeks die de bronterm aangeeft in een vorm die het meest geschikt is voor weergave door eindgebruikers. Als de invoer bijvoorbeeld is, weerspiegelt JOHNhet weergaveformulier de gebruikelijke spelling van de naam: John.
translations: Een lijst met vertalingen voor de bronterm. Elk element van de lijst is een object met de volgende eigenschappen:
normalizedTarget: Een tekenreeks die de genormaliseerde vorm van deze term in de doeltaal aangeeft. Deze waarde moet worden gebruikt als invoer voor het opzoeken van voorbeelden.
displayTarget: Een tekenreeks die de term aangeeft in de doeltaal en in een vorm die het meest geschikt is voor weergave door eindgebruikers. Over het algemeen verschilt deze eigenschap alleen van de normalizedTarget in termen van hoofdlettergebruik. Een goed zelfstandig naamwoord als Juan heeft normalizedTarget = "juan" bijvoorbeeld en displayTarget = "Juan".

posTag: Een tekenreeks die deze term aan een deel-van-spraak-tag koppelen.

Tagnaam	Description
BN	Bijvoeglijke naamwoorden
ADV	Bewerkingsparameters
CONJ	Voegwoorden
DET	Bepaalers
MODALE	Werkwoorden
Zelfstandig naamwoord	Zelfstandige naamwoorden
PREP	Voorzetsels
UITSPR	Voornaamwoorden
WERKWOORD	Werkwoorden
ANDERE	Anders

Als een implementatienotitie zijn deze tags deel van spraak die aan de Engelse kant worden getagd en vervolgens de meest voorkomende tag voor elk bron-/doelpaar nemen. Dus als mensen vaak een Spaans woord vertalen naar een ander woord in het Engels, kunnen tags verkeerd zijn (met betrekking tot het Spaanse woord).

confidence: Een waarde tussen 0,0 en 1,0 die de 'betrouwbaarheid' (of nauwkeuriger' 'waarschijnlijkheid in de trainingsgegevens') van dat vertaalpaar vertegenwoordigt. De som van betrouwbaarheidsscores voor één bronwoord kan al dan niet 1,0 zijn.
prefixWord: Een tekenreeks die het woord aangeeft dat wordt weergegeven als een voorvoegsel van de vertaling. Momenteel is deze eigenschap de geslachtsbesturingselement van zelfstandige naamwoorden, in talen met geslachtsbesturingselementen. Het voorvoegsel van het Spaanse woord mosca is labijvoorbeeld , omdat mosca een vrouwelijk zelfstandig naamwoord in het Spaans is. Deze waarde is alleen afhankelijk van de vertaling en niet van de bron. Als er geen voorvoegsel is, is dit de lege tekenreeks.
backTranslations: Een lijst met 'back-vertalingen' van het doel. Bijvoorbeeld bronwoorden waarnaar het doel kan vertalen. De lijst bevat gegarandeerd het bronwoord dat is aangevraagd (als het bronwoord dat wordt opgezocht bijvoorbeeld is, is flyhet gegarandeerd dat fly het woord in de backTranslations lijst staat). Het is echter niet gegarandeerd op de eerste positie en vaak niet. Elk element van de backTranslations lijst is een object dat wordt beschreven door de volgende eigenschappen:
- normalizedText: Een tekenreeks die de genormaliseerde vorm van de bronterm geeft die een back-translation van het doel is. Deze waarde moet worden gebruikt als invoer voor het opzoeken van voorbeelden.
- displayText: Een tekenreeks die de bronterm aangeeft die een back-translation van het doel is in een vorm die het meest geschikt is voor weergave door de eindgebruiker.
- numExamples: Een geheel getal dat het aantal voorbeelden aangeeft dat beschikbaar is voor dit vertaalpaar. Werkelijke voorbeelden moeten worden opgehaald met een afzonderlijke aanroep om voorbeelden op te zoeken. Het getal is voornamelijk bedoeld om weergave in een UX te vergemakkelijken. Een gebruikersinterface kan bijvoorbeeld een hyperlink toevoegen aan de back-translation als het aantal voorbeelden groter is dan nul. Vervolgens wordt de back-translation weergegeven als tekst zonder opmaak als er geen voorbeelden zijn. Het werkelijke aantal voorbeelden dat wordt geretourneerd door een aanroep van opzoekvoorbeelden , kan kleiner zijn dan numExamples, omdat er meer filters kunnen worden toegepast om 'slechte' voorbeelden te verwijderen.
- frequencyCount: Een geheel getal dat de frequentie van dit vertaalpaar in de gegevens aangeeft. Het belangrijkste doel van dit veld is om een gebruikersinterface te bieden met een middel om terugvertalingen te sorteren, zodat de meest voorkomende termen eerst worden weergegeven.
  
  Notitie
  
  Als de term die wordt opgezoekd niet voorkomt in de woordenlijst, is het antwoord 200 (OK), maar is de translations lijst een lege lijst.

Voorbeelden

In dit voorbeeld ziet u hoe u alternatieve vertalingen in het Spaans van de Engelse term fly kunt opzoeken.

curl -X POST "https://api.cognitive.microsofttranslator.com/dictionary/lookup?api-version=3.0&from=en&to=es" -H "Ocp-Apim-Subscription-Key: <client-secret>" -H "Content-Type: application/json" -d "[{'Text':'fly'}]"

De antwoordtekst (voor de duidelijkheid afgekort) is:

[
    {
        "normalizedSource":"fly",
        "displaySource":"fly",
        "translations":[
            {
                "normalizedTarget":"volar",
                "displayTarget":"volar",
                "posTag":"VERB",
                "confidence":0.4081,
                "prefixWord":"",
                "backTranslations":[
                    {"normalizedText":"fly","displayText":"fly","numExamples":15,"frequencyCount":4637},
                    {"normalizedText":"flying","displayText":"flying","numExamples":15,"frequencyCount":1365},
                    {"normalizedText":"blow","displayText":"blow","numExamples":15,"frequencyCount":503},
                    {"normalizedText":"flight","displayText":"flight","numExamples":15,"frequencyCount":135}
                ]
            },
            {
                "normalizedTarget":"mosca",
                "displayTarget":"mosca",
                "posTag":"NOUN",
                "confidence":0.2668,
                "prefixWord":"",
                "backTranslations":[
                    {"normalizedText":"fly","displayText":"fly","numExamples":15,"frequencyCount":1697},
                    {"normalizedText":"flyweight","displayText":"flyweight","numExamples":0,"frequencyCount":48},
                    {"normalizedText":"flies","displayText":"flies","numExamples":9,"frequencyCount":34}
                ]
            },
            //
            // ...list abbreviated for documentation clarity
            //
        ]
    }
]

In dit voorbeeld ziet u wat er gebeurt wanneer de term die wordt opgezoekd niet bestaat voor het geldige woordenlijstpaar.

curl -X POST "https://api.cognitive.microsofttranslator.com/dictionary/lookup?api-version=3.0&from=en&to=es" -H "X-ClientTraceId: 875030C7-5380-40B8-8A03-63DACCF69C11" -H "Ocp-Apim-Subscription-Key: <client-secret>" -H "Content-Type: application/json" -d "[{'Text':'fly123456'}]"

Omdat de term niet wordt gevonden in de woordenlijst, bevat de antwoordtekst een lege translations lijst.

[
    {
        "normalizedSource":"fly123456",
        "displaySource":"fly123456",
        "translations":[]
    }
]

Share via