Taalondersteuning voor het begrijpen van gesprekstalen
Gebruik dit artikel voor meer informatie over de talen die momenteel worden ondersteund door de functie CLU.
Optie voor meerdere talen
Tip
Zie Hoe u een model traint voor informatie over welke trainingsmodus u moet gebruiken voor meertalige projecten.
Met het begrip van gesprekstaal kunt u een model trainen in één taal en gebruiken om intenties en entiteiten van uitingen in een andere taal te voorspellen. Deze functie is krachtig omdat het helpt tijd en moeite te besparen. In plaats van afzonderlijke projecten te bouwen voor elke taal, kunt u meerdere linguïsuele gegevenssets in één project afhandelen. Uw gegevensset hoeft niet volledig in dezelfde taal te staan, maar u moet de optie voor meerdere talen voor uw project inschakelen tijdens het maken of later in projectinstellingen. Als u merkt dat uw model slecht presteert in bepaalde talen tijdens het evaluatieproces, kunt u overwegen om meer gegevens in deze talen toe te voegen aan uw trainingsset.
U kunt uw project volledig trainen met Engelse uitingen en er query's op uitvoeren in: Frans, Duits, Mandarijn, Japans, Koreaans en anderen. Met gesprekstaalkennis kunt u uw projecten eenvoudig schalen naar meerdere talen met behulp van meertalige technologie om uw modellen te trainen.
Wanneer u identificeert dat een bepaalde taal niet goed presteert en andere talen, kunt u uitingen voor die taal toevoegen in uw project. Op de pagina tag-utterances in Language Studio kunt u de taal selecteren van de utterance die u toevoegt. Wanneer u voorbeelden voor die taal introduceert in het model, wordt deze geïntroduceerd in meer syntaxis van die taal en leert om deze beter te voorspellen.
U wordt niet verwacht hetzelfde aantal uitingen toe te voegen voor elke taal. U moet het merendeel van uw project in één taal bouwen en slechts een paar uitingen toevoegen in talen die u ziet, presteren niet goed. Als u een project maakt dat zich voornamelijk in het Engels bevindt en begint met het testen ervan in het Frans, Duits en Spaans, ziet u mogelijk dat Het Duits niet goed presteert en de andere twee talen. In dat geval kunt u 5% van uw oorspronkelijke Engelse voorbeelden in het Duits toevoegen, een nieuw model trainen en opnieuw testen in het Duits. U ziet betere resultaten voor Duitse query's. Hoe meer uitingen u toevoegt, hoe waarschijnlijker de resultaten worden.
Wanneer u gegevens in een andere taal toevoegt, moet u niet verwachten dat deze negatieve gevolgen hebben voor andere talen.
Vooraf samengestelde onderdelen in meerdere talen weergeven en maken
Met projecten waarvoor meerdere talen zijn ingeschakeld, kunt u synoniemen per taal opgeven voor elke lijstsleutel. Afhankelijk van de taal waarmee u uw project opvraagt, krijgt u alleen overeenkomsten voor het lijstonderdeel met synoniemen van die taal. Wanneer u een query op uw project uitvoert, kunt u de taal opgeven in de hoofdtekst van de aanvraag:
"query": "{query}"
"language": "{language code}"
Als u geen taal opgeeft, wordt deze teruggezet naar de standaardtaal van uw project.
Vooraf gebouwde onderdelen zijn vergelijkbaar, waarbij u kunt verwachten dat u voorspellingen krijgt voor vooraf gebouwde onderdelen die beschikbaar zijn in specifieke talen. De taal van de aanvraag bepaalt opnieuw welke onderdelen worden voorspeld.
Talen die worden ondersteund door het begrijpen van gesprekstalen
Begrip van gesprekstaal ondersteunt utterances in de volgende talen:
Taal | Taalcode |
---|---|
Afrikaans | af |
Amhaars | am |
Arabisch | ar |
Assamees | as |
Azerbeidzjaans | az |
Wit-Russisch | be |
Bulgaars | bg |
Bengaals | bn |
Bretons | br |
Bosnisch | bs |
Catalaans | ca |
Tsjechisch | cs |
Welsh | cy |
Deens | da |
Duits | de |
Grieks | el |
English (US) | en-us |
Engels (VK) | en-gb |
Esperanto | eo |
Spaans | es |
Ests | et |
Baskisch | eu |
Perzisch | fa |
Fins | fi |
Frans | fr |
West-Fries | fy |
Iers | ga |
Schots-Gaelisch | gd |
Galicisch | gl |
Gujarati | gu |
Hausa | ha |
Hebreeuws | he |
Hindi | hi |
Kroatisch | hr |
Hongaars | hu |
Armeens | hy |
Indonesisch | id |
Italiaans | it |
Japans | ja |
Javaans | jv |
Georgisch | ka |
Kazachs | kk |
Khmer | km |
Kannada | kn |
Koreaans | ko |
Koerdisch (Kurmanji) | ku |
Kirgizisch | ky |
Latijn | la |
Laotiaans | lo |
Litouws | lt |
Lets | lv |
Malagasy | mg |
Macedonisch | mk |
Malayalam | ml |
Mongools | mn |
Mahrati | mr |
Maleisisch | ms |
Birmaans | my |
Nepalees | ne |
Nederlands | nl |
Noors (Bokmal) | nb |
Odia | or |
Punjabi | pa |
Pools | pl |
Pasjtoe | ps |
Portugees (Brazilië) | pt-br |
Portugees (Portugal) | pt-pt |
Roemeens | ro |
Russisch | ru |
Sanskriet | sa |
Sindhi | sd |
Sinhala | si |
Slowaaks | sk |
Sloveens | sl |
Somali | so |
Albanees | sq |
Servisch | sr |
Soendanees | su |
Zweeds | sv |
Swahili | sw |
Tamil | ta |
Telugu | te |
Thai | th |
Filipino | tl |
Turks | tr |
Oeigoers | ug |
Oekraïens | uk |
Urdu | ur |
Oezbeeks | uz |
Vietnamees | vi |
Xhosa | xh |
Jiddisch | yi |
Chinees (Vereenvoudigd) | zh-hans |
Chinees (Traditioneel) | zh-hant |
Zulu | zu |