Stöd för språk och regioner för LUIS
Viktigt
LUIS dras tillbaka den 1 oktober 2025 och från och med 1 april 2023 kommer du inte att kunna skapa nya LUIS-resurser. Vi rekommenderar att du migrerar dina LUIS-program till förståelse för konversationsspråk för att dra nytta av fortsatt produktsupport och flerspråkiga funktioner.
Det finns flera olika funktioner i tjänsten LUIS. Vilka funktioner som stöds varierar mellan olika språk. Kontrollera att de funktioner som du är intresserad av stöds i målspråkkulturen. En LUIS-app är kulturspecifik och kan inte ändras när den har angetts.
Flerspråkiga LUIS-appar
Om du behöver ett flerspråkigt LUIS-klientprogram, till exempel en chattrobot, har du några alternativ. Om LUIS stöder alla språk utvecklar du en LUIS-app för varje språk. Varje LUIS-app har ett unikt app-ID och en slutpunktslogg. Om du behöver ge språkförstålelse för ett språk som LUIS inte stöder kan du använda Translator-tjänsten för att översätta yttrandet till ett språk som stöds, skicka yttrandet till LUIS-slutpunkten och få resultatet.
Anteckning
En nyare version av Language Understanding funktioner är nu tillgänglig som en del av Azure AI Language. Mer information finns i Dokumentation om Azure AI-språk. Information om funktioner för språktolkning som stöder flera språk i språktjänsten finns i Konversationsbaserade Language Understanding.
Språk som stöds
LUIS förstår yttranden på följande språk:
Språk | Nationell inställning | Fördefinierad domän | Fördefinierad entitet | Rekommendationer för fraslista | **Sentimentanalys och extrahering av diskussionsämne |
---|---|---|---|---|---|
Arabiska (förhandsversion – modern standard arabiska) | ar-AR |
- | - | - | - |
*Kinesiska | zh-CN |
✔ | ✔ | ✔ | - |
Nederländska | nl-NL |
✔ | - | - | ✔ |
Engelska (USA) | en-US |
✔ | ✔ | ✔ | ✔ |
Engelska (Storbritannien) | en-GB |
✔ | ✔ | ✔ | ✔ |
Franska (Kanada) | fr-CA |
- | - | - | ✔ |
Franska (Frankrike) | fr-FR |
✔ | ✔ | ✔ | ✔ |
Tyska | de-DE |
✔ | ✔ | ✔ | ✔ |
Gujarati (förhandsversion) | gu-IN |
- | - | - | - |
Hindi (förhandsversion) | hi-IN |
- | ✔ | - | - |
Italienska | it-IT |
✔ | ✔ | ✔ | ✔ |
*Japanska | ja-JP |
✔ | ✔ | ✔ | Endast nyckelfras |
Koreanska | ko-KR |
✔ | - | - | Endast nyckelfras |
Marathi (förhandsversion) | mr-IN |
- | - | - | - |
Portugisiska (Brasilien) | pt-BR |
✔ | ✔ | ✔ | inte alla underkulturer |
Spanska (Mexiko) | es-MX |
- | ✔ | ✔ | ✔ |
Spanska (Spanien) | es-ES |
✔ | ✔ | ✔ | ✔ |
Tamil (förhandsversion) | ta-IN |
- | - | - | - |
Telugu (förhandsversion) | te-IN |
- | - | - | - |
Turkiska | tr-TR |
✔ | ✔ | - | Endast sentiment |
Språkstöd varierar för fördefinierade entiteter och fördefinierade domäner.
*Kinesiska supportanteckningar
zh-CN
I kulturen förväntar sig LUIS den förenklade kinesiska teckenuppsättningen i stället för den traditionella teckenuppsättningen.- Namnen på avsikter, entiteter, funktioner och reguljära uttryck kan innehålla kinesiska eller romerska tecken.
- Se referensen för fördefinierade domäner för information om vilka fördefinierade domäner som stöds i
zh-CN
kulturen.
*Japanska supportanteckningar
- Eftersom LUIS inte tillhandahåller syntaktisk analys och inte förstår skillnaden mellan Keigo och informell japanska, måste du införliva de olika formalitetsnivåerna som utbildningsexempel för dina program.
- でございます är inte samma som です.
- です är inte samma som だ.
**Supportanteckningar för språktjänsten
Språktjänsten innehåller keyPhrase-fördefinierad entitets- och attitydanalys. Endast portugisiska stöds för subkulturer: pt-PT
och pt-BR
. Alla andra kulturer stöds på den primära kulturnivån.
Språk som stöds av Speech API
Se Språk som stöds av tal för språk i taldikteringsläge.
Språk som stöds i stavningskontroll i Bing
En lista över språk och status som stöds finns i Språk som stöds av stavningskontroll i Bing.
Sällsynta eller främmande ord i ett program
en-us
I kulturen lär sig LUIS att skilja de flesta engelska ord, inklusive slang. zh-cn
I kulturen lär sig LUIS att skilja de flesta kinesiska tecken. Om du använder ett sällsynt ord i en-us
eller tecken i zh-cn
, och du ser att LUIS inte verkar kunna särskilja det ordet eller tecknet, kan du lägga till ordet eller tecknet i en fraslista. Till exempel bör ord utanför programmets kultur , det vill säga främmande ord, läggas till i en fraslista.
Hybridspråk
Hybridspråk kombinerar ord från två kulturer som engelska och kinesiska. Dessa språk stöds inte i LUIS eftersom en app baseras på en enda kultur.
Tokenisering
För att utföra maskininlärning delar LUIS in ett yttrande i token baserat på kultur.
Språk | varje blanksteg eller specialtecken | teckennivå | sammansatta ord |
---|---|---|---|
Arabiska | ✔ | ||
Kinesiska | ✔ | ||
Nederländska | ✔ | ✔ | |
Engelska (en-us) | ✔ | ||
Engelska (en-GB) | ✔ | ||
Franska (fr-FR) | ✔ | ||
Franska (fr-CA) | ✔ | ||
Tyska | ✔ | ✔ | |
Gujarati | ✔ | ||
Hindi | ✔ | ||
Italienska | ✔ | ||
Japanska | ✔ | ||
Koreanska | ✔ | ||
Marathi | ✔ | ||
Portugisiska (Brasilien) | ✔ | ||
Spanska (es-ES) | ✔ | ||
Spanska (es-MX) | ✔ | ||
Tamilska | ✔ | ||
Telugu | ✔ | ||
Turkiska | ✔ |
Anpassade tokeniserarversioner
Följande kulturer har anpassade tokeniserarversioner:
Kultur | Version | Syfte |
---|---|---|
Tyskade-de |
1.0.0 | Tokeniserar ord genom att dela upp dem med hjälp av en maskininlärningsbaserad tokeniserare som försöker dela upp sammansatta ord i sina enskilda komponenter. Om en användare anger som ett yttrande omvandlas Ich fahre einen krankenwagen den till Ich fahre einen kranken wagen . Tillåta märkning av och wagen oberoende som kranken olika entiteter. |
Tyskade-de |
1.0.2 | Tokeniserar ord genom att dela upp dem på blanksteg. Om en användare anges Ich fahre einen krankenwagen som ett yttrande förblir det en enda token. Därför krankenwagen markeras som en enda entitet. |
Nederländskanl-nl |
1.0.0 | Tokeniserar ord genom att dela upp dem med hjälp av en maskininlärningsbaserad tokeniserare som försöker dela upp sammansatta ord i sina enskilda komponenter. Om en användare anger som ett yttrande omvandlas Ik ga naar de kleuterschool den till Ik ga naar de kleuter school . Tillåta märkning av och school oberoende som kleuter olika entiteter. |
Nederländskanl-nl |
1.0.1 | Tokeniserar ord genom att dela upp dem på blanksteg. Om en användare anges Ik ga naar de kleuterschool som ett yttrande förblir det en enda token. Därför kleuterschool markeras som en enda entitet. |
Migrera mellan tokenizer-versioner
Tokenisering sker på appnivå. Det finns inget stöd för tokenisering på versionsnivå.
Importera filen som en ny app i stället för en version. Den här åtgärden innebär att den nya appen har ett annat app-ID men använder den tokeniserarversion som anges i filen.