Megosztás a következőn keresztül:


A LUIS nyelv- és régiótámogatása

Fontos

A LUIS 2025. október 1-jén megszűnik, és 2023. április 1-től nem hozhat létre új LUIS-erőforrásokat. Javasoljuk, hogy a LUIS-alkalmazásokat a beszélgetési nyelv megértésére migrálja, hogy kihasználhassa a terméktámogatás és a többnyelvű képességek előnyeit.

A LUIS számos funkciót biztosít a szolgáltatáson belül. Egyes funkciók azonban nem érhetők el bizonyos nyelveken. Ellenőrizze, hogy az Önt érdeklő funkciók támogatottak-e a használni kívánt nyelvkultúrában. A LUIS-alkalmazások kultúraspecifikusak, és a beállítás után nem módosíthatók.

Többnyelvű LUIS-alkalmazások

Ha többnyelvű LUIS-ügyfélalkalmazásra, például csevegőrobotra van szüksége, van néhány lehetősége. Ha a LUIS támogatja az összes nyelvet, minden nyelvhez fejleszthet LUIS-alkalmazást. Minden LUIS-alkalmazás egyedi alkalmazásazonosítóval és végpontnaplóval rendelkezik. Ha nyelvértelmezést kell biztosítania egy olyan nyelvhez, amelyet a LUIS nem támogat, a Translator szolgáltatással lefordíthatja a kimondott szöveget egy támogatott nyelvre, elküldheti a kimondott szöveget a LUIS-végpontnak, és megkaphatja az eredményül kapott pontszámokat.

Feljegyzés

A Language Understanding képességeinek újabb verziója már elérhető az Azure AI Language részeként. További információkért tekintse meg az Azure AI nyelvi dokumentációját. A Language Service-ben több nyelvet támogató nyelvfelismerési képességekért tekintse meg a Beszélgetési nyelv megértése című témakört.

Támogatott nyelvek

A LUIS a következő nyelveken értelmezi a kimondott szövegeket:

Nyelv Területi beállítás Előre összeállított tartomány Előre összeállított entitás Kifejezéslistára vonatkozó javaslatok **Hangulatelemzés és kulcskifejezések kinyerése
Arab (előzetes verzió – modern standard arab) ar-AR - - - -
*Kínai zh-CN -
Holland nl-NL - -
Angol (Egyesült Államok) en-US
Angol (Egyesült Királyság) en-GB
Francia (Kanada) fr-CA - - -
Francia (Franciaország) fr-FR
Német de-DE
Gujarati (előzetes verzió) gu-IN - - - -
Hindi (előzetes verzió) hi-IN - - -
Olasz it-IT
*japán ja-JP Csak kulcskifejezés
Koreai ko-KR - - Csak kulcskifejezés
Marathi (előzetes verzió) mr-IN - - - -
Portugál (Brazília) pt-BR nem minden alkultúrában
Spanyol (Mexikó) es-MX -
Spanyol (Spanyolország) es-ES
Tamil (előzetes verzió) ta-IN - - - -
Telugu (előzetes verzió) te-IN - - - -
Török tr-TR - Csak hangulat

A nyelvi támogatás az előre összeállított entitások és az előre összeállított tartományok esetében eltérő.

*Kínai támogatási megjegyzések

  • A kultúrában a zh-CN LUIS a hagyományos karakterkészlet helyett az egyszerűsített kínai karakterkészletet várja.
  • A szándékok, entitások, funkciók és reguláris kifejezések neve lehet kínai vagy római karakter.
  • Az előre összeállított tartományokra vonatkozó hivatkozásból tájékozódhat arról, hogy mely előre összeállított tartományok támogatottak a zh-CN kultúrában.

*Japán támogatási megjegyzések

  • Mivel a LUIS nem biztosít szintaktikai elemzést, és nem fogja megérteni a Keigo és az informális japánok közötti különbséget, a különböző formalitási szinteket be kell építenie az alkalmazások képzési példái közé.
    • でございます nem ugyanaz, mint です.
    • です nem ugyanaz, mint だ.

**Nyelvi szolgáltatás támogatási megjegyzései

A Language szolgáltatás tartalmazza a keyPhrase előre összeállított entitást és hangulatelemzést. A szubkultúrák esetében csak a portugálok támogatottak: pt-PT és pt-BR. Minden más kultúrát az elsődleges kultúra szintjén támogatunk.

A Speech API által támogatott nyelvek

A Beszéd diktálási mód nyelveinek támogatott nyelvei című témakörben talál további információt.

A Bing Spell Check támogatott nyelvei

A támogatott nyelvek és állapotok listáját a Bing Spell Check támogatott nyelvei között találja.

Ritka vagy idegen szavak egy alkalmazásban

A kultúrában a en-us LUIS megtanulja megkülönböztetni a legtöbb angol szót, beleértve a szlenget is. A kultúrában a zh-cn LUIS megtanulja megkülönböztetni a legtöbb kínai karaktert. Ha egy ritka szót en-us vagy karaktert zh-cnhasznál, és úgy látja, hogy a LUIS nem tudja megkülönböztetni ezt a szót vagy karaktert, felveheti ezt a szót vagy karaktert egy kifejezéslista-funkcióba. Például az alkalmazás kultúráján kívüli szavakat – vagyis idegen szavakat – hozzá kell adni egy kifejezéslista-funkcióhoz.

Hibrid nyelvek

A hibrid nyelvek két kultúrából, például az angolból és a kínaiból származó szavakat kombinálják. Ezek a nyelvek nem támogatottak a LUIS-ban, mert egy alkalmazás egyetlen kultúrán alapul.

Jogkivonat-osítás

A gépi tanulás végrehajtásához a LUIS a beszédelemeket jogkivonatokra bontja a kultúra alapján.

Nyelv minden szóköz vagy speciális karakter karakterszint összetett szavak
Arab
Kínai
Holland
Angol (en-us)
Angol (en-GB)
Francia (fr-FR)
Francia (fr-CA)
Német
Gudzsaráti
Hindi
Olasz
Japán
Koreai
Marathi
Portugál (Brazília)
Spanyol (es-ES)
Spanyol (es-MX)
Tamil
Telugu
Török

Egyéni tokenizer-verziók

A következő kultúrák egyéni tokenizer-verziókkal rendelkeznek:

Kulturális környezet Verzió Cél
Német
de-de
1.0.0 Tokenizálja a szavakat úgy, hogy felosztja őket egy gépi tanuláson alapuló tokenizer használatával, amely megpróbálja az összetett szavakat egyetlen összetevőre bontani.
Ha egy felhasználó kimondott szövegként adja meg Ich fahre einen krankenwagen a szöveget, a rendszer a következőre Ich fahre einen kranken wagenvált: . Lehetővé teszi a különböző entitások megjelölését kranken és wagen egymástól függetlenül történő jelölését.
Német
de-de
1.0.2 A szavakat szóközökre felosztva tokenizálja.
Ha egy felhasználó kimondott szövegként lép be Ich fahre einen krankenwagen , az egyetlen jogkivonat marad. Így krankenwagen egyetlen entitásként van megjelölve.
Holland
nl-nl
1.0.0 Tokenizálja a szavakat úgy, hogy felosztja őket egy gépi tanuláson alapuló tokenizer használatával, amely megpróbálja az összetett szavakat egyetlen összetevőre bontani.
Ha egy felhasználó kimondott szövegként adja meg Ik ga naar de kleuterschool a szöveget, a rendszer a következőre Ik ga naar de kleuter schoolvált: . Lehetővé teszi a különböző entitások megjelölését kleuter és school egymástól függetlenül történő jelölését.
Holland
nl-nl
1.0.1 A szavakat szóközökre felosztva tokenizálja.
Ha egy felhasználó kimondott szövegként lép be Ik ga naar de kleuterschool , az egyetlen jogkivonat marad. Így kleuterschool egyetlen entitásként van megjelölve.

Migrálás a tokenizer-verziók között

A tokenizálás az alkalmazás szintjén történik. A verziószintű tokenizálás nem támogatott.

A fájl importálása új alkalmazásként verzió helyett. Ez a művelet azt jelenti, hogy az új alkalmazás más alkalmazásazonosítóval rendelkezik, de a fájlban megadott tokenizer-verziót használja.