Taalondersteuning voor taalkennis van gesprekken
Gebruik dit artikel voor meer informatie over de talen die momenteel worden ondersteund door de CLU-functie.
Meertalige optie
Tip
Zie How to train a model (Een model trainen) voor informatie over de trainingsmodus die u moet gebruiken voor meertalige projecten.
Met taalkennis van gesprekken kunt u een model in één taal trainen en gebruiken om intenties en entiteiten te voorspellen op basis van uitingen in een andere taal. Deze functie is krachtig omdat het tijd en moeite bespaart. In plaats van afzonderlijke projecten te bouwen voor elke taal, kunt u meertalige gegevenssets in één project verwerken. Uw gegevensset hoeft niet volledig in dezelfde taal te zijn, maar u moet de meertalige optie voor uw project inschakelen tijdens het maken of later in projectinstellingen. Als u merkt dat uw model tijdens het evaluatieproces in bepaalde talen slecht presteert, kunt u overwegen om meer gegevens in deze talen toe te voegen aan uw trainingsset.
U kunt uw project volledig trainen met Engelse uitingen en er query's op uitvoeren in: Frans, Duits, Mandarijn, Japans, Koreaans en andere. Met taalkennis van gesprekken kunt u uw projecten eenvoudig schalen naar meerdere talen met behulp van meertalige technologie om uw modellen te trainen.
Wanneer u vaststelt dat een bepaalde taal niet zo goed presteert als andere talen, kunt u uitingen voor die taal toevoegen in uw project. Op de pagina tag-utterances in Language Studio kunt u de taal selecteren van de uiting die u toevoegt. Wanneer u voorbeelden voor die taal in het model introduceert, maakt het model kennis met meer syntaxis van die taal en leert deze beter te voorspellen.
U hoeft niet voor elke taal hetzelfde aantal utterances toe te voegen. U moet het grootste deel van uw project in één taal bouwen en slechts enkele uitingen toevoegen in talen waarvan u merkt dat ze niet goed presteren. Als u een project maakt dat voornamelijk in het Engels is en het gaat testen in het Frans, Duits en Spaans, ziet u mogelijk dat Duits niet zo goed presteert als de andere twee talen. In dat geval kunt u overwegen om 5% van uw oorspronkelijke Engelse voorbeelden in het Duits toe te voegen, een nieuw model te trainen en opnieuw in het Duits te testen. U ziet betere resultaten voor Duitse query's. Hoe meer uitingen u toevoegt, hoe groter de kans dat de resultaten beter worden.
Wanneer u gegevens in een andere taal toevoegt, moet u niet verwachten dat dit een negatieve invloed heeft op andere talen.
Vooraf samengestelde onderdelen weergeven in meerdere talen
Met projecten waarvoor meerdere talen zijn ingeschakeld, kunt u synoniemen per taal opgeven voor elke lijstsleutel. Afhankelijk van de taal waarmee u uw project opvraagt, krijgt u alleen overeenkomsten voor het lijstonderdeel met synoniemen van die taal. Wanneer u een query uitvoert op uw project, kunt u de taal in de aanvraagtekst opgeven:
"query": "{query}"
"language": "{language code}"
Als u geen taal opgeeft, wordt deze teruggezet naar de standaardtaal van uw project.
Vooraf samengestelde onderdelen zijn vergelijkbaar, waarbij u voorspellingen kunt verwachten voor vooraf samengestelde onderdelen die beschikbaar zijn in specifieke talen. De taal van de aanvraag bepaalt opnieuw welke onderdelen worden voorspeld.
Talen die worden ondersteund door conversationele taalkennis
Begrip van gesprekstaal ondersteunt uitingen in de volgende talen:
Taal | Taalcode |
---|---|
Afrikaans | af |
Amharic | am |
Arabisch | ar |
Assamees | as |
Azerbeidzjaanse | az |
Wit-Russisch | be |
Bulgaars | bg |
Bengaals | bn |
Breton | br |
Bosnisch | bs |
Catalaans | ca |
Tsjechisch | cs |
Welsh | cy |
Deens | da |
Duits | de |
Grieks | el |
Engels (VS) | en-us |
Engels (VK) | en-gb |
Esperanto | eo |
Spaans | es |
Ests | et |
Baskisch | eu |
Perzisch | fa |
Fins | fi |
Frans | fr |
West-Fries | fy |
Iers | ga |
Schots Gaelic | gd |
Galicisch | gl |
Gujarati | gu |
Hausa | ha |
Hebreeuws | he |
Hindi | hi |
Kroatisch | hr |
Hongaars | hu |
Armeens | hy |
Indonesisch | id |
Italiaans | it |
Japans | ja |
Javaans | jv |
Georgisch | ka |
Kazachs | kk |
Khmer | km |
Kannada | kn |
Koreaans | ko |
Koerdisch (Kurmanji) | ku |
Kirgizisch | ky |
Latijnse | la |
Lao | lo |
Litouws | lt |
Lets | lv |
Malagassisch | mg |
Macedonische | mk |
Malayalam | ml |
Mongools | mn |
Mahrati | mr |
Maleisisch | ms |
Birmese | my |
Nepalees | ne |
Nederlands | nl |
Noors (Bokmål) | nb |
Odia | or |
Punjabi | pa |
Pools | pl |
Pashto | ps |
Portugees (Brazilië) | pt-br |
Portugees (Portugal) | pt-pt |
Roemeens | ro |
Russisch | ru |
Sanskriet | sa |
Sindhi | sd |
Sinhala | si |
Slowaaks | sk |
Sloveens | sl |
Somalische | so |
Albanees | sq |
Servisch | sr |
Sundanese | su |
Zweeds | sv |
Swahili | sw |
Tamil | ta |
Telugu | te |
Thai | th |
Filipino | tl |
Turks | tr |
Uyghur | ug |
Oekraïens | uk |
Urdu | ur |
Oezbeeks | uz |
Vietnamees | vi |
Xhosa | xh |
Jiddisch | yi |
Chinees (Vereenvoudigd) | zh-hans |
Chinees (Traditioneel) | zh-hant |
Zulu | zu |
Volgende stappen
Feedback
https://aka.ms/ContentUserFeedback.
Binnenkort beschikbaar: In de loop van 2024 zullen we GitHub-problemen geleidelijk uitfaseren als het feedbackmechanisme voor inhoud en deze vervangen door een nieuw feedbacksysteem. Zie voor meer informatie:Feedback verzenden en weergeven voor