A LUIS nyelv- és régiótámogatása

Cikk
09/01/2024

Fontos

A LUIS 2025. október 1-jén megszűnik, és 2023. április 1-től nem hozhat létre új LUIS-erőforrásokat. Javasoljuk, hogy a LUIS-alkalmazásokat a beszélgetési nyelv megértésére migrálja, hogy kihasználhassa a terméktámogatás és a többnyelvű képességek előnyeit.

A LUIS számos funkciót biztosít a szolgáltatáson belül. Egyes funkciók azonban nem érhetők el bizonyos nyelveken. Ellenőrizze, hogy az Önt érdeklő funkciók támogatottak-e a használni kívánt nyelvkultúrában. A LUIS-alkalmazások kultúraspecifikusak, és a beállítás után nem módosíthatók.

Többnyelvű LUIS-alkalmazások

Ha többnyelvű LUIS-ügyfélalkalmazásra, például csevegőrobotra van szüksége, van néhány lehetősége. Ha a LUIS támogatja az összes nyelvet, minden nyelvhez fejleszthet LUIS-alkalmazást. Minden LUIS-alkalmazás egyedi alkalmazásazonosítóval és végpontnaplóval rendelkezik. Ha nyelvértelmezést kell biztosítania egy olyan nyelvhez, amelyet a LUIS nem támogat, a Translator szolgáltatással lefordíthatja a kimondott szöveget egy támogatott nyelvre, elküldheti a kimondott szöveget a LUIS-végpontnak, és megkaphatja az eredményül kapott pontszámokat.

Feljegyzés

A Language Understanding képességeinek újabb verziója már elérhető az Azure AI Language részeként. További információkért tekintse meg az Azure AI nyelvi dokumentációját. A Language Service-ben több nyelvet támogató nyelvfelismerési képességekért tekintse meg a Beszélgetési nyelv megértése című témakört.

Támogatott nyelvek

A LUIS a következő nyelveken értelmezi a kimondott szövegeket:

Nyelv	Területi beállítás	Előre összeállított tartomány	Előre összeállított entitás	Kifejezéslistára vonatkozó javaslatok	**Hangulatelemzés és kulcskifejezések kinyerése
Arab (előzetes verzió – modern standard arab)	`ar-AR`	-	-	-	-
*Kínai	`zh-CN`	✔	✔	✔	-
Holland	`nl-NL`	✔	-	-	✔
Angol (Egyesült Államok)	`en-US`	✔	✔	✔	✔
Angol (Egyesült Királyság)	`en-GB`	✔	✔	✔	✔
Francia (Kanada)	`fr-CA`	-	-	-	✔
Francia (Franciaország)	`fr-FR`	✔	✔	✔	✔
Német	`de-DE`	✔	✔	✔	✔
Gujarati (előzetes verzió)	`gu-IN`	-	-	-	-
Hindi (előzetes verzió)	`hi-IN`	-	✔	-	-
Olasz	`it-IT`	✔	✔	✔	✔
*japán	`ja-JP`	✔	✔	✔	Csak kulcskifejezés
Koreai	`ko-KR`	✔	-	-	Csak kulcskifejezés
Marathi (előzetes verzió)	`mr-IN`	-	-	-	-
Portugál (Brazília)	`pt-BR`	✔	✔	✔	nem minden alkultúrában
Spanyol (Mexikó)	`es-MX`	-	✔	✔	✔
Spanyol (Spanyolország)	`es-ES`	✔	✔	✔	✔
Tamil (előzetes verzió)	`ta-IN`	-	-	-	-
Telugu (előzetes verzió)	`te-IN`	-	-	-	-
Török	`tr-TR`	✔	✔	-	Csak hangulat

A nyelvi támogatás az előre összeállított entitások és az előre összeállított tartományok esetében eltérő.

*Kínai támogatási megjegyzések

A kultúrában a zh-CN LUIS a hagyományos karakterkészlet helyett az egyszerűsített kínai karakterkészletet várja.
A szándékok, entitások, funkciók és reguláris kifejezések neve lehet kínai vagy római karakter.
Az előre összeállított tartományokra vonatkozó hivatkozásból tájékozódhat arról, hogy mely előre összeállított tartományok támogatottak a zh-CN kultúrában.

*Japán támogatási megjegyzések

Mivel a LUIS nem biztosít szintaktikai elemzést, és nem fogja megérteni a Keigo és az informális japánok közötti különbséget, a különböző formalitási szinteket be kell építenie az alkalmazások képzési példái közé.
- でございます nem ugyanaz, mint です.
- です nem ugyanaz, mint だ.

**Nyelvi szolgáltatás támogatási megjegyzései

A Language szolgáltatás tartalmazza a keyPhrase előre összeállított entitást és hangulatelemzést. A szubkultúrák esetében csak a portugálok támogatottak: pt-PT és pt-BR. Minden más kultúrát az elsődleges kultúra szintjén támogatunk.

A Speech API által támogatott nyelvek

A Beszéd diktálási mód nyelveinek támogatott nyelvei című témakörben talál további információt.

A Bing Spell Check támogatott nyelvei

A támogatott nyelvek és állapotok listáját a Bing Spell Check támogatott nyelvei között találja.

Ritka vagy idegen szavak egy alkalmazásban

A kultúrában a en-us LUIS megtanulja megkülönböztetni a legtöbb angol szót, beleértve a szlenget is. A kultúrában a zh-cn LUIS megtanulja megkülönböztetni a legtöbb kínai karaktert. Ha egy ritka szót en-us vagy karaktert zh-cnhasznál, és úgy látja, hogy a LUIS nem tudja megkülönböztetni ezt a szót vagy karaktert, felveheti ezt a szót vagy karaktert egy kifejezéslista-funkcióba. Például az alkalmazás kultúráján kívüli szavakat – vagyis idegen szavakat – hozzá kell adni egy kifejezéslista-funkcióhoz.

Hibrid nyelvek

A hibrid nyelvek két kultúrából, például az angolból és a kínaiból származó szavakat kombinálják. Ezek a nyelvek nem támogatottak a LUIS-ban, mert egy alkalmazás egyetlen kultúrán alapul.

Jogkivonat-osítás

A gépi tanulás végrehajtásához a LUIS a beszédelemeket jogkivonatokra bontja a kultúra alapján.

Nyelv	minden szóköz vagy speciális karakter	karakterszint	összetett szavak
Arab	✔
Kínai		✔
Holland	✔		✔
Angol (en-us)	✔
Angol (en-GB)	✔
Francia (fr-FR)	✔
Francia (fr-CA)	✔
Német	✔		✔
Gudzsaráti	✔
Hindi	✔
Olasz	✔
Japán			✔
Koreai		✔
Marathi	✔
Portugál (Brazília)	✔
Spanyol (es-ES)	✔
Spanyol (es-MX)	✔
Tamil	✔
Telugu	✔
Török	✔

Egyéni tokenizer-verziók

A következő kultúrák egyéni tokenizer-verziókkal rendelkeznek:

Kulturális környezet	Verzió	Cél
Német `de-de`	1.0.0	Tokenizálja a szavakat úgy, hogy felosztja őket egy gépi tanuláson alapuló tokenizer használatával, amely megpróbálja az összetett szavakat egyetlen összetevőre bontani. Ha egy felhasználó kimondott szövegként adja meg `Ich fahre einen krankenwagen` a szöveget, a rendszer a következőre `Ich fahre einen kranken wagen`vált: . Lehetővé teszi a különböző entitások megjelölését `kranken` és `wagen` egymástól függetlenül történő jelölését.
Német `de-de`	1.0.2	A szavakat szóközökre felosztva tokenizálja. Ha egy felhasználó kimondott szövegként lép be `Ich fahre einen krankenwagen` , az egyetlen jogkivonat marad. Így `krankenwagen` egyetlen entitásként van megjelölve.
Holland `nl-nl`	1.0.0	Tokenizálja a szavakat úgy, hogy felosztja őket egy gépi tanuláson alapuló tokenizer használatával, amely megpróbálja az összetett szavakat egyetlen összetevőre bontani. Ha egy felhasználó kimondott szövegként adja meg `Ik ga naar de kleuterschool` a szöveget, a rendszer a következőre `Ik ga naar de kleuter school`vált: . Lehetővé teszi a különböző entitások megjelölését `kleuter` és `school` egymástól függetlenül történő jelölését.
Holland `nl-nl`	1.0.1	A szavakat szóközökre felosztva tokenizálja. Ha egy felhasználó kimondott szövegként lép be `Ik ga naar de kleuterschool` , az egyetlen jogkivonat marad. Így `kleuterschool` egyetlen entitásként van megjelölve.

Migrálás a tokenizer-verziók között

A tokenizálás az alkalmazás szintjén történik. A verziószintű tokenizálás nem támogatott.

A fájl importálása új alkalmazásként verzió helyett. Ez a művelet azt jelenti, hogy az új alkalmazás más alkalmazásazonosítóval rendelkezik, de a fájlban megadott tokenizer-verziót használja.

Megosztás a következőn keresztül: