Taal- en regioondersteuning voor LUIS
Belangrijk
LUIS wordt op 1 oktober 2025 buiten gebruik gesteld en vanaf 1 april 2023 kunt u geen nieuwe LUIS-resources meer maken. We raden u aan uw LUIS-toepassingen te migreren naar conversationele taalbegrip om te profiteren van doorlopende productondersteuning en meertalige mogelijkheden.
LUIS heeft diverse functies binnen de service. Niet alle functies bevinden zich in dezelfde taalpariteit. Zorg ervoor dat de functies die u interesseren, worden ondersteund in de taalcultuur die u als doel heeft. Een LUIS-app is cultuurspecifiek en kan niet worden gewijzigd zodra deze is ingesteld.
Meertalige LUIS-apps
Als u een meertalige LUIS-clienttoepassing nodig hebt, zoals een chatbot, hebt u een aantal opties. Als LUIS alle talen ondersteunt, ontwikkelt u een LUIS-app voor elke taal. Elke LUIS-app heeft een unieke app-id en een eindpuntlogboek. Als u taalkennis moet bieden voor een taal die LUIS niet ondersteunt, kunt u de Translator-service gebruiken om de uiting te vertalen naar een ondersteunde taal, de utterance verzenden naar het LUIS-eindpunt en de resulterende scores ontvangen.
Notitie
Er is nu een nieuwere versie van Language Understanding mogelijkheden beschikbaar als onderdeel van Azure AI Language. Zie Azure AI Language Documentation (Taaldocumentatie voor Azure AI) voor meer informatie. Zie Conversational Language Understanding voor mogelijkheden voor taalkennis die ondersteuning bieden voor meerdere talen in de taalservice.
Ondersteunde talen
LUIS begrijpt uitingen in de volgende talen:
Taal | Landinstelling | Vooraf gedefinieerd domein | Vooraf gemaakte entiteit | Aanbevelingen voor de frasenlijst | **Sentimentanalyse en sleuteltermextractie |
---|---|---|---|---|---|
Arabisch (preview - modern standaard Arabisch) | ar-AR |
- | - | - | - |
*Chinees | zh-CN |
✔ | ✔ | ✔ | - |
Nederlands | nl-NL |
✔ | - | - | ✔ |
Engels (Verenigde Staten) | en-US |
✔ | ✔ | ✔ | ✔ |
Engels (VK) | en-GB |
✔ | ✔ | ✔ | ✔ |
Frans (Canada) | fr-CA |
- | - | - | ✔ |
Frans (Frankrijk) | fr-FR |
✔ | ✔ | ✔ | ✔ |
Duits | de-DE |
✔ | ✔ | ✔ | ✔ |
Gujarati (preview) | gu-IN |
- | - | - | - |
Hindi (preview) | hi-IN |
- | ✔ | - | - |
Italiaans | it-IT |
✔ | ✔ | ✔ | ✔ |
*Japans | ja-JP |
✔ | ✔ | ✔ | Alleen sleutelterm |
Koreaans | ko-KR |
✔ | - | - | Alleen sleutelterm |
Marathi (preview) | mr-IN |
- | - | - | - |
Portugees (Brazilië) | pt-BR |
✔ | ✔ | ✔ | niet alle subculturen |
Spaans (Mexico) | es-MX |
- | ✔ | ✔ | ✔ |
Spaans (Spanje) | es-ES |
✔ | ✔ | ✔ | ✔ |
Tamil (preview) | ta-IN |
- | - | - | - |
Telugu (preview) | te-IN |
- | - | - | - |
Turks | tr-TR |
✔ | ✔ | - | Alleen gevoel |
Taalondersteuning varieert voor vooraf gemaakte entiteiten en vooraf gemaakte domeinen.
*Chinese ondersteuningsopmerkingen
- In de
zh-CN
cultuur verwacht LUIS de tekenset vereenvoudigd Chinees in plaats van de traditionele tekenset. - De namen van intenties, entiteiten, kenmerken en reguliere expressies kunnen chinese of Romeinse tekens bevatten.
- Zie de verwijzing naar vooraf gemaakte domeinen voor informatie over welke vooraf gemaakte domeinen worden ondersteund in de
zh-CN
cultuur.
*Japanse ondersteuningsopmerkingen
- Omdat LUIS geen syntactische analyse biedt en het verschil tussen Keigo en informeel Japans niet begrijpt, moet u de verschillende niveaus van formaliteit opnemen als trainingsvoorbeelden voor uw toepassingen.
- でございます is niet hetzelfde als です.
- です is niet hetzelfde als だ.
**Ondersteuningsopmerkingen voor taalservice
De Language-service bevat vooraf gemaakte entiteit en sentimentanalyse met keyPhrase. Alleen Portugees wordt ondersteund voor subculturen: pt-PT
en pt-BR
. Alle andere culturen worden ondersteund op het niveau van de primaire cultuur.
Ondersteunde talen voor speech-API
Zie Talen die worden ondersteund voor spraak voor talen in de spraakdicteermodus.
Ondersteunde talen voor Bing Spellingcontrole
Zie Ondersteunde talen voor Bing Spellingcontrole voor een lijst met ondersteunde talen en status.
Zeldzame of vreemde woorden in een toepassing
In de en-us
cultuur leert LUIS de meeste Engelse woorden te onderscheiden, inclusief slang. In de zh-cn
cultuur leert LUIS de meeste Chinese karakters te onderscheiden. Als u een zeldzaam woord in en-us
of teken in zh-cn
gebruikt en u ziet dat LUIS dat woord of teken niet kan onderscheiden, kunt u dat woord of teken toevoegen aan een woordgroepenlijstfunctie. Woorden die buiten de cultuur van de toepassing staan, dat wil zeggen, vreemde woorden, moeten bijvoorbeeld worden toegevoegd aan een woordgroepenlijstfunctie.
Hybride talen
Hybride talen combineren woorden uit twee culturen, zoals Engels en Chinees. Deze talen worden niet ondersteund in LUIS omdat een app is gebaseerd op één cultuur.
Tokenisatie
Om machine learning uit te voeren, breekt LUIS een uiting in tokens op basis van cultuur.
Taal | elke ruimte of speciaal teken | tekenniveau | samengestelde woorden |
---|---|---|---|
Arabisch | ✔ | ||
Chinees | ✔ | ||
Nederlands | ✔ | ✔ | |
Engels (en-us) | ✔ | ||
Engels (en-GB) | ✔ | ||
Frans (fr-FR) | ✔ | ||
Frans (fr-CA) | ✔ | ||
Duits | ✔ | ✔ | |
Gujarati | ✔ | ||
Hindi | ✔ | ||
Italiaans | ✔ | ||
Japans | ✔ | ||
Koreaans | ✔ | ||
Mahrati | ✔ | ||
Portugees (Brazilië) | ✔ | ||
Spaans (es-ES) | ✔ | ||
Spaans (es-MX) | ✔ | ||
Tamil | ✔ | ||
Telugu | ✔ | ||
Turks | ✔ |
Aangepaste tokenizerversies
De volgende culturen hebben aangepaste tokenizerversies:
Cultuur | Versie | Doel |
---|---|---|
Duitsde-de |
1.0.0 | Tokeniseert woorden door ze te splitsen met behulp van een op machine learning gebaseerde tokenizer die probeert samengestelde woorden op te splitsen in hun afzonderlijke onderdelen. Als een gebruiker invoert Ich fahre einen krankenwagen als een utterance, wordt deze ingesteld op Ich fahre einen kranken wagen . Het markeren van kranken en wagen onafhankelijk als verschillende entiteiten toestaan. |
Duitsde-de |
1.0.2 | Tokeniseert woorden door ze op spaties te splitsen. Als een gebruiker invoert Ich fahre einen krankenwagen als een uiting, blijft het één token. Is dus krankenwagen gemarkeerd als één entiteit. |
Nederlandsnl-nl |
1.0.0 | Tokeniseert woorden door ze te splitsen met behulp van een op machine learning gebaseerde tokenizer die probeert samengestelde woorden op te splitsen in hun afzonderlijke onderdelen. Als een gebruiker invoert Ik ga naar de kleuterschool als een utterance, wordt deze ingesteld op Ik ga naar de kleuter school . Het markeren van kleuter en school onafhankelijk als verschillende entiteiten toestaan. |
Nederlandsnl-nl |
1.0.1 | Tokeniseert woorden door ze op spaties te splitsen. Als een gebruiker invoert Ik ga naar de kleuterschool als een uiting, blijft het één token. Is dus kleuterschool gemarkeerd als één entiteit. |
Migreren tussen tokenizerversies
Tokenisatie vindt plaats op app-niveau. Er is geen ondersteuning voor tokenisatie op versieniveau.
Importeer het bestand als een nieuwe app in plaats van een versie. Deze actie betekent dat de nieuwe app een andere app-id heeft, maar de tokenizer-versie gebruikt die is opgegeven in het bestand.