Stöd för språk och regioner för LUIS

Artikel
01/19/2024

Viktigt

LUIS dras tillbaka den 1 oktober 2025 och från och med 1 april 2023 kommer du inte att kunna skapa nya LUIS-resurser. Vi rekommenderar att du migrerar dina LUIS-program till förståelse för konversationsspråk för att dra nytta av fortsatt produktsupport och flerspråkiga funktioner.

Det finns flera olika funktioner i tjänsten LUIS. Vilka funktioner som stöds varierar mellan olika språk. Kontrollera att de funktioner som du är intresserad av stöds i målspråkkulturen. En LUIS-app är kulturspecifik och kan inte ändras när den har angetts.

Flerspråkiga LUIS-appar

Om du behöver ett flerspråkigt LUIS-klientprogram, till exempel en chattrobot, har du några alternativ. Om LUIS stöder alla språk utvecklar du en LUIS-app för varje språk. Varje LUIS-app har ett unikt app-ID och en slutpunktslogg. Om du behöver ge språkförstålelse för ett språk som LUIS inte stöder kan du använda Translator-tjänsten för att översätta yttrandet till ett språk som stöds, skicka yttrandet till LUIS-slutpunkten och få resultatet.

Anteckning

En nyare version av Language Understanding funktioner är nu tillgänglig som en del av Azure AI Language. Mer information finns i Dokumentation om Azure AI-språk. Information om funktioner för språktolkning som stöder flera språk i språktjänsten finns i Konversationsbaserade Language Understanding.

Språk som stöds

LUIS förstår yttranden på följande språk:

Språk	Nationell inställning	Fördefinierad domän	Fördefinierad entitet	Rekommendationer för fraslista	**Sentimentanalys och extrahering av diskussionsämne
Arabiska (förhandsversion – modern standard arabiska)	`ar-AR`	-	-	-	-
*Kinesiska	`zh-CN`	✔	✔	✔	-
Nederländska	`nl-NL`	✔	-	-	✔
Engelska (USA)	`en-US`	✔	✔	✔	✔
Engelska (Storbritannien)	`en-GB`	✔	✔	✔	✔
Franska (Kanada)	`fr-CA`	-	-	-	✔
Franska (Frankrike)	`fr-FR`	✔	✔	✔	✔
Tyska	`de-DE`	✔	✔	✔	✔
Gujarati (förhandsversion)	`gu-IN`	-	-	-	-
Hindi (förhandsversion)	`hi-IN`	-	✔	-	-
Italienska	`it-IT`	✔	✔	✔	✔
*Japanska	`ja-JP`	✔	✔	✔	Endast nyckelfras
Koreanska	`ko-KR`	✔	-	-	Endast nyckelfras
Marathi (förhandsversion)	`mr-IN`	-	-	-	-
Portugisiska (Brasilien)	`pt-BR`	✔	✔	✔	inte alla underkulturer
Spanska (Mexiko)	`es-MX`	-	✔	✔	✔
Spanska (Spanien)	`es-ES`	✔	✔	✔	✔
Tamil (förhandsversion)	`ta-IN`	-	-	-	-
Telugu (förhandsversion)	`te-IN`	-	-	-	-
Turkiska	`tr-TR`	✔	✔	-	Endast sentiment

Språkstöd varierar för fördefinierade entiteter och fördefinierade domäner.

*Kinesiska supportanteckningar

zh-CN I kulturen förväntar sig LUIS den förenklade kinesiska teckenuppsättningen i stället för den traditionella teckenuppsättningen.
Namnen på avsikter, entiteter, funktioner och reguljära uttryck kan innehålla kinesiska eller romerska tecken.
Se referensen för fördefinierade domäner för information om vilka fördefinierade domäner som stöds i zh-CN kulturen.

*Japanska supportanteckningar

Eftersom LUIS inte tillhandahåller syntaktisk analys och inte förstår skillnaden mellan Keigo och informell japanska, måste du införliva de olika formalitetsnivåerna som utbildningsexempel för dina program.
- でございます är inte samma som です.
- です är inte samma som だ.

**Supportanteckningar för språktjänsten

Språktjänsten innehåller keyPhrase-fördefinierad entitets- och attitydanalys. Endast portugisiska stöds för subkulturer: pt-PT och pt-BR. Alla andra kulturer stöds på den primära kulturnivån.

Språk som stöds av Speech API

Se Språk som stöds av tal för språk i taldikteringsläge.

Språk som stöds i stavningskontroll i Bing

En lista över språk och status som stöds finns i Språk som stöds av stavningskontroll i Bing.

Sällsynta eller främmande ord i ett program

en-us I kulturen lär sig LUIS att skilja de flesta engelska ord, inklusive slang. zh-cn I kulturen lär sig LUIS att skilja de flesta kinesiska tecken. Om du använder ett sällsynt ord i en-us eller tecken i zh-cn, och du ser att LUIS inte verkar kunna särskilja det ordet eller tecknet, kan du lägga till ordet eller tecknet i en fraslista. Till exempel bör ord utanför programmets kultur , det vill säga främmande ord, läggas till i en fraslista.

Hybridspråk

Hybridspråk kombinerar ord från två kulturer som engelska och kinesiska. Dessa språk stöds inte i LUIS eftersom en app baseras på en enda kultur.

Tokenisering

För att utföra maskininlärning delar LUIS in ett yttrande i token baserat på kultur.

Språk	varje blanksteg eller specialtecken	teckennivå	sammansatta ord
Arabiska	✔
Kinesiska		✔
Nederländska	✔		✔
Engelska (en-us)	✔
Engelska (en-GB)	✔
Franska (fr-FR)	✔
Franska (fr-CA)	✔
Tyska	✔		✔
Gujarati	✔
Hindi	✔
Italienska	✔
Japanska			✔
Koreanska		✔
Marathi	✔
Portugisiska (Brasilien)	✔
Spanska (es-ES)	✔
Spanska (es-MX)	✔
Tamilska	✔
Telugu	✔
Turkiska	✔

Anpassade tokeniserarversioner

Följande kulturer har anpassade tokeniserarversioner:

Kultur	Version	Syfte
Tyska `de-de`	1.0.0	Tokeniserar ord genom att dela upp dem med hjälp av en maskininlärningsbaserad tokeniserare som försöker dela upp sammansatta ord i sina enskilda komponenter. Om en användare anger som ett yttrande omvandlas `Ich fahre einen krankenwagen` den till `Ich fahre einen kranken wagen`. Tillåta märkning av och `wagen` oberoende som `kranken` olika entiteter.
Tyska `de-de`	1.0.2	Tokeniserar ord genom att dela upp dem på blanksteg. Om en användare anges `Ich fahre einen krankenwagen` som ett yttrande förblir det en enda token. Därför `krankenwagen` markeras som en enda entitet.
Nederländska `nl-nl`	1.0.0	Tokeniserar ord genom att dela upp dem med hjälp av en maskininlärningsbaserad tokeniserare som försöker dela upp sammansatta ord i sina enskilda komponenter. Om en användare anger som ett yttrande omvandlas `Ik ga naar de kleuterschool` den till `Ik ga naar de kleuter school`. Tillåta märkning av och `school` oberoende som `kleuter` olika entiteter.
Nederländska `nl-nl`	1.0.1	Tokeniserar ord genom att dela upp dem på blanksteg. Om en användare anges `Ik ga naar de kleuterschool` som ett yttrande förblir det en enda token. Därför `kleuterschool` markeras som en enda entitet.

Migrera mellan tokenizer-versioner

Tokenisering sker på appnivå. Det finns inget stöd för tokenisering på versionsnivå.

Importera filen som en ny app i stället för en version. Den här åtgärden innebär att den nya appen har ett annat app-ID men använder den tokeniserarversion som anges i filen.

Dela via